Comment intégrer astore.check dans un workflow MLOps pour industrialiser l'usage de modèles open source ?

Industrialisation de l'Open Source via ASTORE

L'intégration de astoreFichier binaire compact contenant la logique d'un modèle entraîné (analytique de score). Il permet de déployer et d'exécuter des modèles complexes de manière portable et ultra-rapide dans SAS Viya..check est une pratique exemplaire pour sécuriser et automatiser le cycle de vie des modèles externes. Voici un scénario de pipelineChaîne de flux de données automatisée intégrant prétraitement, sélection de variables et modèles supervisés pour comparer leurs performances et déployer le meilleur candidat dans SAS Viya. CI/CD (Continuous Integration/Continuous Deployment) typique :

  1. Export & CommitAction validant et enregistrant de façon permanente les modifications apportées à une table (base de données) ou à un code (Git) au sein de l'architecture SAS Viya. : Un Data ScientistExpert exploitant SAS Viya pour extraire des connaissances via le Machine Learning et les statistiques, afin de résoudre des problèmes métier complexes à partir de données massives. entraîne un modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). dans un framework comme PyTorchPyTorch est un framework open source d'apprentissage profond (Deep Learning) facilitant la création de graphes de calcul dynamiques et l'entraînement de modèles de réseaux de neurones complexes. ou TensorFlow et l'exporte au format ONNX. Le fichier .onnx est ensuite versionné et poussé dans un dépôt Git (souvent avec Git LFS pour les fichiers volumineux).
  2. Déclenchement du PipelineChaîne de flux de données automatisée intégrant prétraitement, sélection de variables et modèles supervisés pour comparer leurs performances et déployer le meilleur candidat dans SAS Viya. : Le push déclenche un pipelineChaîne de flux de données automatisée intégrant prétraitement, sélection de variables et modèles supervisés pour comparer leurs performances et déployer le meilleur candidat dans SAS Viya. automatisé (ex: Jenkins, GitLab CI).
  3. Étape de Validation Statique : Une des premières étapes de ce pipelineChaîne de flux de données automatisée intégrant prétraitement, sélection de variables et modèles supervisés pour comparer leurs performances et déployer le meilleur candidat dans SAS Viya. est d'appeler l'action astoreFichier binaire compact contenant la logique d'un modèle entraîné (analytique de score). Il permet de déployer et d'exécuter des modèles complexes de manière portable et ultra-rapide dans SAS Viya..check. Un script (Python, CASLLangage de script de SAS Viya utilisé pour interagir avec le serveur CAS. Il permet de combiner des actions CAS, de gérer la logique de programmation et de manipuler les résultats en mémoire.) se connecte à une session CASConnexion temporaire entre un client et le serveur Cloud Analytic Services. Elle alloue des ressources dédiées pour l'exécution distribuée de tâches analytiques et la gestion des tables en mémoire., lit le fichier .onnx du dépôt et le soumet à l'action.
  4. Décision Go/No-Go :
    • Si l'action réussit, le modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). est considéré comme structurellement valide et compatible. Le pipelineChaîne de flux de données automatisée intégrant prétraitement, sélection de variables et modèles supervisés pour comparer leurs performances et déployer le meilleur candidat dans SAS Viya. peut alors procéder aux étapes suivantes : téléversement du modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). vers une caslibEspace de stockage logique dans SAS Viya. Elle définit l’accès aux données (source physique) et leur chargement en mémoire (serveur CAS) pour permettre des analyses distribuées haute performance. partagée avec aStoreFichier binaire compact contenant la logique d'un modèle entraîné (analytique de score). Il permet de déployer et d'exécuter des modèles complexes de manière portable et ultra-rapide dans SAS Viya..upload, exécution de tests de scoringProcessus d'application d'un modèle prédictif à de nouvelles données pour calculer une probabilité ou un score, permettant ainsi d'automatiser la prise de décision en temps réel sur SAS Viya. de performance, et enfin enregistrement dans SAS Model Manager.
    • Si l'action échoue, le pipelineChaîne de flux de données automatisée intégrant prétraitement, sélection de variables et modèles supervisés pour comparer leurs performances et déployer le meilleur candidat dans SAS Viya. s'arrête immédiatement. Une notification est envoyée à l'équipe, indiquant que le build a échoué en raison d'un modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). ONNX invalide. Cela empêche un modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). défectueux de polluer l'environnement SAS et permet une correction rapide à la source.

Cette approche garantit que tout modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). entrant dans l'écosystème SAS Viya a passé un premier contrôle de qualité essentiel, renforçant la fiabilité et la gouvernance du processus MLOpsLe MLOps (Machine Learning Operations) unit DevOps et IA pour automatiser, industrialiser et monitorer le cycle de vie des modèles, garantissant leur performance et leur gouvernance en production..

Exemples pour l'action check

Vérification basique d'un modèle

Cet exemple montre comment soumettre un modèle ONNX stocké dans une variable pour validation immédiate.

Lecture et validation complète en CASL

Voici comment automatiser la vérification d'un modèle en lisant le fichier directement depuis le disque via CASL et en affichant le résultat de l'inspection.

Vous pourriez aussi aimer...