Quels sont les leviers de performance pour affiner la précision de votre recherche approximative ?

Pour optimiser l'algorithme HNSWAlgorithme de recherche de plus proches voisins (ANN) utilisant des graphes hiérarchiques. Il permet une indexation ultra-rapide et une recherche vectorielle efficace sur des données massives., l'architecte de données dispose de paramètres de réglage fins :

  • efConstruction : Ce paramètre définit la taille de la liste de candidats pendant la phase de création du graphe. Une valeur élevée (par défaut 200) construit un graphe plus dense et plus précis, mais augmente le temps de chargement initial.
  • efSearch : Il détermine le nombre de nœuds explorés lors de la phase de recherche. En augmentant cette valeur, vous améliorez la précision des résultats pour qu'ils se rapprochent de la méthode EXACT, tout en conservant les bénéfices de vitesse de l'approche approximative.

Exemples pour l'action fastknn

Recherche exacte de base

Trouver les 3 voisins les plus proches de manière exacte pour chaque point de la table 'requete' en utilisant les points de 'reference'.

Recherche approximative haute performance avec distances

Utilise la méthode approximative (HNSW) pour aller plus vite que la lumière, calcule les distances cosinus, et sauvegarde les distances dans une table séparée.

Imputation de valeurs manquantes par k-NN

Cette option permet de nettoyer vos données en remplaçant les trous par la 'sagesse du voisinage'.