Comment extraire la substantifique moelle de vos fichiers vocaux pour booster vos modeles de Deep Learning avec SAS Viya ?

L'Art de la Transformation Spectro-Temporelle

Dans l'écosystème SAS Viya, l'analyse de données non structurées comme l'audio requiert une transformation mathématique robuste avant toute phase de modélisationProcessus de création de structures mathématiques ou statistiques sur SAS Viya pour prédire des comportements, classifier des données ou identifier des tendances à partir de jeux de données CAS.. C'est exactement le rôle de l'action computeFeatures du sous-ensemble audio.

En tant qu'architecte Data, je recommande cette action car elle permet de calculer des descripteurs de haut niveau essentiels pour la reconnaissance vocaleTechnologie SAS Viya transformant un signal audio en texte via des modèles de Deep Learning (RNN, CNN) pour l'analyse de conversations, le sous-titrage ou le contrôle par commandes vocales. ou la classification de sons. Elle va lire une table Cloud Analytic ServicesMoteur d'exécution in-memory de SAS Viya. Il assure le traitement massivement parallèle (MPP) et distribué des données pour optimiser les performances analytiques et le passage à l'échelle. contenant vos fichiers audios et générer une nouvelle table enrichie.

Vous pouvez extraire deux grandes familles de caractéristiques : les bancs de filtres Mel et les coefficients cepstraux. Ces matrices numériques sont parfaitement formatées pour alimenter vos réseaux de neurones ou vos algorithmes d'analyse avancée.

Exemples pour l'action computeFeatures

Extraction basique de coefficients MFCC

Calcul des 13 coefficients MFCC par défaut sur une table audio chargée.

Extraction avancée avec normalisation et contexte

Configuration complète utilisant des banques de filtres logarithmiques, un fenêtrage de Hamming et une normalisation statistique avec contexte.