Ce mardi 14 avril 2026, je me suis connecté par curiosité au webinaire "Boostez vos analyses Python avec la puissance de SAS Viya". N'étant pas développeur moi-même, ma motivation première était surtout le plaisir de revoir mes anciens collègues de chez SAS.
Animée par Xavier Bizoux (Advisory Technical Architect chez SAS France et membre de l'équipe Global Enablement and Learning), cette sessionInstance de connexion active entre un client et le serveur CAS (Cloud Analytic Services), isolant les ressources, les bibliothèques et les traitements d'un utilisateur au sein de SAS Viya. de 40 minutes tombait à pic pour moi.
En tant que référent technique, mon quotidien consiste notamment à déployer SAS Viya 4SAS Viya 4 est une plateforme d'IA, de data management et d'analytics de pointe, nativement conçue pour le Cloud (Cloud-Native). Contrairement aux versions précédentes, elle repose sur une architecture de microservices orchestrée par Kubernetes.
Elle permet de gérer l'intégralité du cycle de vie de la donnée — de l'ingestion à la mise en production des modèles (ModelOps) — en offrant une élasticité totale, une intégration transparente avec l'open-source (Python, R) et une interface unifiée pour les data scientists et les décideurs métiers. dans un environnement où nos utilisateurs jonglent entre SAS StudioInterface de développement Web intégrée à SAS Viya, SAS Studio permet d'écrire du code, de construire des flux visuels et d'analyser des données via un simple navigateur, sans installation locale. (pour coder en langage SAS classique) et JupyterHubJupyterHub est une plateforme multi-utilisateurs permettant d'héberger et gérer des notebooks Jupyter. Sous SAS Viya, il offre un accès partagé et sécurisé au moteur CAS pour coder en Python ou R. (pour coder en Python avec la librairie SWAT). Seulement voilà : ayant plutôt la tête dans l'infrastructure, j'ai très rarement l'occasion d'observer la réalité d'une mise en application concrète de ces outils.
Ça fait un bien fou de voir enfin de vrais cas d'usage à travers une démo de bout en bout ! Cela m'a offert un excellent aperçu de la manière dont les data scientistsExperts extrayant des connaissances via des méthodes statistiques, algorithmes et IA. Ils transforment les données brutes en insights stratégiques pour résoudre des problèmes métier complexes. d'aujourd'hui parviennent, sur le terrain, à marier la flexibilité de l'open source avec la puissance de calcul brute du moteur SAS
Même sans avoir les mains dans le code au quotidien, voici ce que j'ai retenu de cette plongée sous le capot !
Le pont entre deux mondes : la librairie SWAT
Le cœur de la démonstration reposait sur une librairie Python au nom plutôt percutant : SWAT (pour SAS Scripting Wrapper for Analytics TransferLe SAS SWAT est l'interface de programmation (API) Python, R, Lua ou Java qui permet de connecter directement vos langages open-source favoris au moteur de calcul ultra-rapide de SAS Viya 4.
Il agit comme un pont transparent : vous écrivez du code dans votre environnement habituel (ex: Jupyter Notebook, VS Code) et les calculs lourds sont exécutés "In-Memory" sur le moteur CAS (Cloud Analytic Services) de Viya. C'est l'outil ultime pour combiner la flexibilité de l'open-source et la puissance industrielle de SAS.).
Historiquement, on pouvait penser que le monde de l'open source (comme Python) et celui des logiciels d'entreprise (comme SAS) fonctionnaient en silos. Ce webinaire a prouvé tout le contraire. SWAT agit comme une passerelle transparente. Il permet à un utilisateur de rester dans son environnement Python favori (comme Visual Studio Code ou Jupyter), d'utiliser des structures de données qu'il connaît par cœur (comme les DataFramesStructure de données tabulaire (lignes/colonnes) en mémoire, optimisée pour le traitement distribué via les moteurs CAS ou Python, permettant une manipulation fluide et performante des données. de la librairie PandasBibliothèque Python incontournable pour la manipulation et l'analyse de données structurées via des DataFrames. Elle offre des performances optimales pour le nettoyage et l'exploration de données.), tout en déléguant les calculs lourds au serveur CASMoteur analytique "in-memory" de SAS Viya. Il traite les données en parallèle (MPP) sur plusieurs nœuds pour offrir une puissance de calcul massive et une exécution ultra-rapide des actions. (Cloud Analytic ServicesMoteur d'exécution in-memory de SAS Viya. Il assure le traitement massivement parallèle (MPP) et distribué des données pour optimiser les performances analytiques et le passage à l'échelle.), le moteur ultra-performant de SAS Viya.
En résumé : on écrit du Python, mais c'est le moteur SAS qui fait le gros du travail en tâche de fond.
De la préparation des données à la modélisationProcessus de création de structures mathématiques ou statistiques sur SAS Viya pour prédire des comportements, classifier des données ou identifier des tendances à partir de jeux de données CAS.
Xavier a illustré ses propos avec deux démonstrations très concrètes, en utilisant des jeux de données classiques (les caractéristiques de voitures et le célèbre dataset des passagers du Titanic).
1. La gestion et la persistance des données
Une notion intéressante abordée est la gestion de la mémoireGemini said
Espace de stockage temporaire (RAM) utilisé par le moteur CAS pour charger et traiter les données à haute vitesse, minimisant les accès disque pour optimiser les performances de SAS Viya.. Le serveur CASMoteur analytique "in-memory" de SAS Viya. Il traite les données en parallèle (MPP) sur plusieurs nœuds pour offrir une puissance de calcul massive et une exécution ultra-rapide des actions. traite les données en mémoireGemini said
Espace de stockage temporaire (RAM) utilisé par le moteur CAS pour charger et traiter les données à haute vitesse, minimisant les accès disque pour optimiser les performances de SAS Viya. vive (in-memoryTechnique stockant les données directement dans la RAM pour un accès ultra-rapide, permettant des analyses massives et calculs complexes en temps réel sans les latences liées aux disques durs.) pour une rapidité fulgurante. Cependant, pour éviter de recharger des fichiers massifs de plusieurs gigaoctets à chaque nouvelle sessionInstance de connexion active entre un client et le serveur CAS (Cloud Analytic Services), isolant les ressources, les bibliothèques et les traitements d'un utilisateur au sein de SAS Viya., Xavier a montré comment :
- Promouvoir une table : La rendre persistante et globale pour la partager avec d'autres utilisateurs.
- Sauvegarder sur disque : Utiliser le format de haute performance
.sashdatSASHDAT est le format de fichier propriétaire de SAS Viya optimisé pour Cloud Analytic Services (CAS). Il permet un chargement ultra-rapide des données en mémoire via un accès direct (memory-mapping).pour alléger la mémoireGemini said
Espace de stockage temporaire (RAM) utilisé par le moteur CAS pour charger et traiter les données à haute vitesse, minimisant les accès disque pour optimiser les performances de SAS Viya. vive tout en gardant un accès ultra-rapide aux données.
2. Le Machine LearningBranche de l'IA utilisant des algorithmes pour apprendre des modèles à partir de données. Il permet d'automatiser des prédictions ou des décisions sans programmation explicite de chaque règle. en action
La deuxième partie était orientée "Analytics". Toujours depuis Python, Xavier a utilisé des bibliothèquesPointeurs logiques (Libref) reliant SAS Viya à des sources de données physiques (dossiers, bases de données, CAS) pour lire, écrire et organiser les tables de manière structurée. visuelles comme SeabornBibliothèque Python de visualisation de données basée sur Matplotlib. Elle offre une interface de haut niveau pour créer des graphiques statistiques attrayants et informatifs, intégrés à SAS Viya. et MatplotlibBibliothèque Python incontournable pour la data science, permettant de générer des visualisations statiques, animées et interactives de haute qualité (graphiques, histogrammes, nuages de points). pour explorer les données du Titanic (qui a survécu ? selon quelle classe ? à quel âge ?). Après avoir nettoyé les données (notamment en imputant les âges manquants grâce au moteur SAS), il a lancé l'entraînement de trois modèles d'intelligence artificielle en parallèle :
- Decision TreeModèle de machine learning supervisé qui segmente les données via des règles logiques successives (nœuds) pour prédire une cible catégorielle ou numérique, optimisant ainsi la prise de décision. (Arbre de décision)
- Random ForestAlgorithme d'apprentissage supervisé combinant plusieurs arbres de décision indépendants pour améliorer la précision et réduire le surapprentissage via le bagging et la sélection aléatoire. (Forêt aléatoireAlgorithme d'apprentissage supervisé combinant plusieurs arbres de décision indépendants pour améliorer la précision et réduire le surapprentissage par agrégation de leurs prédictions.)
- Gradient BoostingMéthode d'apprentissage itérative créant une suite d'arbres de décision. Chaque nouvel arbre corrige les erreurs de prédiction des précédents pour minimiser globalement la fonction de perte.
Le serveur CASMoteur analytique "in-memory" de SAS Viya. Il traite les données en parallèle (MPP) sur plusieurs nœuds pour offrir une puissance de calcul massive et une exécution ultra-rapide des actions. a absorbé ces calculs complexes pour ensuite renvoyer les scores et évaluer le modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). le plus performant (via des analyses ROCLa courbe ROC (Receiver Operating Characteristic) mesure la performance d'un modèle de classification en traçant le taux de vrais positifs face au taux de faux positifs pour chaque seuil. et AUCL'AUC (Area Under the Curve) mesure la capacité d'un modèle à distinguer les classes. Comprise entre 0,5 et 1, plus elle est élevée, plus la performance de classification est robuste.) afin de prédire au mieux la survie des passagers.
SAS Innovate & Hackathon : Les prochains rendez-vous
Au-delà de la technique pure, Xavier a profité de ce moment pour annoncer les prochains événements incontournables de l'écosystème SAS, et cela promet d'être passionnant :
- SAS Innovate (9 juin) : L'événement majeur pour découvrir la feuille de route de l'entreprise, avec notamment la présence de Bryan Harris (Directeur de la R&D). C'est l'occasion idéale d'entendre les retours d'expérience des clients et de réseauter.
- SAS Hackathon Bootcamp : Intégré au SAS Innovate Home Tour, c'est un espace dédié à ceux qui veulent mettre les mains dans le cambouis (entre 11h et 14h). L'occasion parfaite pour tester les petites nouveautés basées sur l'IA générativeL'IA Générative est une branche de l'intelligence artificielle capable de créer de nouveaux contenus (textes, images, code, données synthétiques) en apprenant les structures statistiques de données existantes via des modèles de langage étendus (LLM).
Dans l'écosystème SAS Viya 4, l'IA Générative est intégrée pour augmenter la productivité analytique : elle permet de générer automatiquement du code Python/SAS, de synthétiser des rapports complexes et d'interagir avec les données en langage naturel via des orchestrateurs LLM sécurisés et éthiques. comme le SAS Copilot ou le SAS Data Maker, accompagné par des mentors sur place.
En conclusion
Même pour un profil non-developpeur Python comme le mien, voir ces outils en action est fascinant. L'ouverture de SAS vers l'open source n'est plus une promesse, c'est une réalité opérationnelle très fluide.
Pour les Data ScientistsExperts extrayant des connaissances via des méthodes statistiques, algorithmes et IA. Ils transforment les données brutes en insights stratégiques pour résoudre des problèmes métier complexes., ingénieurs IA ou architectes data qui chercheraient à industrialiser leurs workflows, c'est définitivement une technologie à creuser.






