Architecture et tracabilite : comment conserver le lien entre vos audios sources et les features generees dans votre plan de donnees en memoire ?

Maîtriser la Traçabilité Audio via copyVars

La traçabilité de bout en bout est un principe fondamental dans SAS Viya. Lorsque vous utilisez l'action pour transformer vos données volumineuses, il est impératif de conserver les identifiants ou les variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. cibles de la table d'entrée.

Pour ce faire, vous devez utiliser le paramètre copyVars. Il permet de spécifier une liste de variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. existantes à transférer telles quelles vers votre table de sortie définie dans le paramètre casOut. C'est grâce à cette jointure implicite que vous pourrez associer les matrices de caractéristiques audio avec les étiquettes de classification pour superviser l'apprentissage de votre algorithme. Par ailleurs, la définition de votre table en entrée via le paramètre table vous autorise à appliquer des filtres complexes à la volée, évitant ainsi la création de tables intermédiaires inutiles en mémoireGemini said
Espace de stockage temporaire (RAM) utilisé par le moteur CAS pour charger et traiter les données à haute vitesse, minimisant les accès disque pour optimiser les performances de SAS Viya.
.

Voici un exemple de paramétrage optimal que nous utilisons couramment en production :

1PROC CAS;
2 audio.computeFeatures /
3 TABLE={name="mes_audios", caslib="CASUSER"}
4 casOut={name="mes_features", replace=True}
5 copyVars={"audio_id", "target_label"}
6 featureScalingMethod="STANDARDIZATION"
7 mfccOptions={nCeps=13, useEnergy=True};
8RUN;
9QUIT;

Exemples pour l'action computeFeatures

Extraction basique de coefficients MFCC

Calcul des 13 coefficients MFCC par défaut sur une table audio chargée.

Extraction avancée avec normalisation et contexte

Configuration complète utilisant des banques de filtres logarithmiques, un fenêtrage de Hamming et une normalisation statistique avec contexte.