simple

freq

##set_simple

Description

L'action simple.freq est le couteau suisse de l'analyse descriptive dans SAS Viya. Elle permet de générer des distributions de fréquences (comptages) pour une ou plusieurs variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. de manière ultra-rapide. C'est l'équivalent haute performance de la célèbre PROC FREQ , mais s'exécutant directement en mémoireGemini said

Espace de stockage temporaire (RAM) utilisé par le moteur CAS pour charger et traiter les données à haute vitesse, minimisant les accès disque pour optimiser les performances de SAS Viya.
sur le moteur distribué Cloud Analytic ServicesMoteur d'exécution in-memory de SAS Viya. Il assure le traitement massivement parallèle (MPP) et distribué des données pour optimiser les performances analytiques et le passage à l'échelle. (CAS). Elle est idéale pour explorer la répartition de vos données catégorielles sans avoir à trier la table au préalable (parce que le temps, c'est de l'argent, et on n'a pas toute la journée pour compter des lignes).

Syntaxe Officielle
simple.freq <result=results> <status=rc> /
attributes={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, ...},
casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1", ...}, label="string", name="table-name", ...},
descending=TRUE | FALSE,
groupByLimit=64-bit-integer,
groupbyTable={casLib="string", name="table-name", where="where-expression", ...},
includeMissing=TRUE | FALSE,
inputs={{name="variable-name", ...}, ...},
raw=TRUE | FALSE,
rawOrder=TRUE | FALSE,
table={caslib="string", name="table-name", where="where-expression", ...},
writePartOnTheFly=TRUE | FALSE;

Paramètres Clés

Nom du paramètre Description
table Spécifie la table CAS d'entrée à analyser. Vous pouvez y ajouter des filtres via le sous-paramètre 'where' .
inputs Liste des variables pour lesquelles vous souhaitez calculer la distribution de fréquences. Si non spécifié, l'action tente d'analyser toutes les variables compatibles.
casOut Permet de diriger les résultats des comptages vers une table de sortie CAS plutôt que de simplement les afficher dans les résultats .
includeMissing Booléen indiquant si les valeurs manquantes (nulles) doivent être comptabilisées comme un groupe distinct. Par défaut à True (parce que même le vide a son importance).
raw Si défini à True, l'action utilise les valeurs brutes des données. S'il est à False (par défaut), les formats SAS sont appliqués avant le comptage.
descending Trie les résultats par ordre décroissant des niveaux de groupe.
groupByLimit Limite le nombre de groupes autorisés. Très utile pour éviter de faire exploser la mémoire si vous lancez par erreur une fréquence sur une variable continue unique (comme un ID de transaction).

Préparation des données

Création du jeu de données de test 'VENTES'

Génération d'une table de ventes fictive avec des produits et des régions pour illustrer les comptages de fréquences.

1DATA casuser.ventes; LENGTH Produit $10 Region $10; INPUT Produit $ Region $ Ventes; DATALINES;
2Auto Nord 100
3Auto Sud 150
4Bateau Nord 50
5Avion Est 200
6Auto Nord 120
7Bateau Sud 80
8Avion Nord 300
9Auto . 90
10;
11RUN;

Exemples d'utilisation

Comptage de base par produit

Calculer la fréquence simple pour la variable 'Produit'.

1PROC CAS; SIMPLE.freq / TABLE="ventes", inputs={"Produit"}; RUN; QUIT;
Résultat Attendu :
Un tableau affichant le nombre d'occurrences pour chaque produit (Auto, Bateau, Avion).
Inclure les valeurs manquantes

Analyser les régions en s'assurant que les régions non renseignées apparaissent dans le rapport.

1PROC CAS; SIMPLE.freq / TABLE="ventes", inputs={"Region"}, includeMissing=true; RUN; QUIT;
Résultat Attendu :
Un tableau montrant les comptages pour Nord, Sud, Est et une ligne pour les valeurs manquantes (.)
Analyse filtrée avec sauvegarde en table

Calcul des fréquences pour les produits dont les ventes dépassent 80, en enregistrant le résultat dans une table CAS pour une utilisation ultérieure.

1PROC CAS; SIMPLE.freq / TABLE={name="ventes", where="Ventes > 80"}, inputs={"Produit", "Region"}, casOut={name="stats_frequences", replace=true}; RUN; QUIT;
Résultat Attendu :
La table 'stats_frequences' est créée dans la session CAS avec les colonnes de niveaux et de comptages correspondantes.
Fréquences sur valeurs brutes (Raw)

Forcer l'analyse sur les valeurs brutes même si des formats SAS sont appliqués aux colonnes.

1PROC CAS; SIMPLE.freq / TABLE="ventes", inputs={"Produit"}, raw=true; RUN; QUIT;
Résultat Attendu :
Calcul des fréquences ignorant les labels ou formats de présentation pour se baser uniquement sur les données de stockage.