Pourquoi privilégier la méthode approximative pour vos projets de Big Data ?

Le choix de la méthode via le paramètre method est déterminant pour vos performances :

  • EXACT : Cette méthode calcule la distance entre chaque point de la requête et chaque point de la table de référence. Bien qu'elle garantisse une précision absolue, son coût computationnel devient prohibitif sur des milliards de lignes.
  • APPROXIMATE : Elle s'appuie sur l'algorithme Hierarchical Navigable Small World (HNSWAlgorithme de recherche de plus proches voisins (ANN) utilisant des graphes hiérarchiques. Il permet une indexation ultra-rapide et une recherche vectorielle efficace sur des données massives.). Cette approche par graphes permet de trouver les voisins les plus proches avec une précision quasi parfaite mais une vitesse d'exécution drastiquement supérieure, ce qui est indispensable pour les applications analytiques à grande échelle.

Exemples pour l'action fastknn

Recherche exacte de base

Trouver les 3 voisins les plus proches de manière exacte pour chaque point de la table 'requete' en utilisant les points de 'reference'.

Recherche approximative haute performance avec distances

Utilise la méthode approximative (HNSW) pour aller plus vite que la lumière, calcule les distances cosinus, et sauvegarde les distances dans une table séparée.

Imputation de valeurs manquantes par k-NN

Cette option permet de nettoyer vos données en remplaçant les trous par la 'sagesse du voisinage'.