Comment analyser instantanément la distribution de vos données massives sans saturer votre cluster SAS Viya ?

Pour obtenir une distribution de fréquences sur des millions ou milliards de lignes, l'action freq du jeu d'actions simple est votre meilleure alliée dans l'environnement CAS (Cloud Analytic ServicesMoteur d'exécution in-memory de SAS Viya. Il assure le traitement massivement parallèle (MPP) et distribué des données pour optimiser les performances analytiques et le passage à l'échelle.). Vous indiquez simplement votre source de données via le paramètre table. Pour protéger les ressources de votre infrastructure lors de l'utilisation de variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. de regroupement à très forte cardinalitéLa cardinalité représente le nombre de valeurs distinctes contenues dans une colonne. Une cardinalité élevée indique une grande diversité de données, influençant le choix des modèles dans CAS., il est vivement recommandé d'utiliser le paramètre groupByLimit, qui interrompt le calcul avant de saturer la mémoireGemini said
Espace de stockage temporaire (RAM) utilisé par le moteur CAS pour charger et traiter les données à haute vitesse, minimisant les accès disque pour optimiser les performances de SAS Viya.
vive du système.

Exemples pour l'action freq

Comptage de base par produit

Calculer la fréquence simple pour la variable 'Produit'.

Inclure les valeurs manquantes

Analyser les régions en s'assurant que les régions non renseignées apparaissent dans le rapport.

Analyse filtrée avec sauvegarde en table

Calcul des fréquences pour les produits dont les ventes dépassent 80, en enregistrant le résultat dans une table CAS pour une utilisation ultérieure.

Fréquences sur valeurs brutes (Raw)

Forcer l'analyse sur les valeurs brutes même si des formats SAS sont appliqués aux colonnes.

Vous pourriez aussi aimer...