Comment puis-je contrôler le calcul des statistiques d'agrégation pour des variables spécifiques?

Granularité et Contrôle via varSpecs

Le paramètre varSpecs est votre allié pour un contrôle granulaire. Il vous permet de spécifier la ou les variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. d'analyse et de définir des agrégateurs spécifiques pour chacune d'elles. Par exemple, vous pouvez calculer la moyenne d'une variable numérique, le nombre distinct d'une variable catégorielle, ou même des quantilesLes quantiles sont des valeurs divisant un jeu de données trié en intervalles égaux. Ils permettent d'analyser la distribution et la dispersion des données (ex: quartiles pour des segments de 25%). (percentiles) pour une autre. Chaque spécification peut inclure des options telles que agg pour le type d'agrégation, percentile pour des quantilesLes quantiles sont des valeurs divisant un jeu de données trié en intervalles égaux. Ils permettent d'analyser la distribution et la dispersion des données (ex: quartiles pour des segments de 25%). précis, ou weight pour appliquer une pondération.

Schéma : Comment puis-je contrôler le calcul des statistiques d'agrégation pour des variables spécifiques?

Exemples pour l'action aggregate

Agrégation globale des ventes
Schéma conceptuel de l'exemple : Agrégation globale des ventes

Cet exemple montre la réduction massive de données via varSpecs. Il parallélise le calcul de statistiques descriptives (SUM, MEAN) pour générer un snapshot analytique optimisé en mémoire CAS.

Agrégation temporelle par mois
Schéma conceptuel de l'exemple : Agrégation temporelle par mois

Cet exemple exploite le moteur temporel de CAS via id et interval. Il segmente les flux transactionnels en fenêtres mensuelles, optimisant le calcul parallèle de SUM/MAX par produit et période.