Le Big Data vous fait peur ? Voici comment SAS Viya analyse des milliards de lignes sans saturer votre infrastructure

Pour traiter des volumes de données massifs, l'action exploreCorrelation utilise des algorithmes de type sketching extrêmement économes en ressources. Lorsque le nombre de valeurs distinctes dépasse le seuil fixé par distinctCountLimit, le système peut basculer sur l'algorithme de Misra-Gries via le paramètre misraGries pour estimer la distribution des fréquences. De même, le paramètre ecdfTolerance permet d'ajuster la précision du calcul de la fonction de répartition empirique. Ces mécanismes garantissent des insights statistiques fiables sur des volumes massifs sans exiger les coûts d'infrastructure liés à un tri complet des données en mémoireGemini said
Espace de stockage temporaire (RAM) utilisé par le moteur CAS pour charger et traiter les données à haute vitesse, minimisant les accès disque pour optimiser les performances de SAS Viya.
vive.

Exemples pour l'action exploreCorrelation

Analyse de corrélation de base

Un exemple simple pour identifier les corrélations entre toutes les variables et une cible numérique.

Exploration exhaustive (Linéaire et Non-Linéaire)

Cet exemple force l'utilisation du coefficient de Pearson pour le linéaire et de l'Information Mutuelle pour le non-linéaire, tout en incluant les variables nominales.