Daily Shaarli

All links of one day in a single page.

August 20, 2024

Finding Trends With Approximate Embedding Clustering

Un article qui explique comment découvrir des tendances lorsque l'on manipule des embeddings.

Par exemple, si l'on a les embeddings des questions posées par les utilisateurs à un Assistant, on peut utiliser la technique de k-mean clustering pour trouver quels sont les sujets les plus abordés dans les questions.

L'article explique comment utiliser Clickhouse pour calculer les centroids de chaque cluster (et donc la meilleure "représentation" du concept) mais il est possible d'utiliser d'autres méthodes, l'algorithme k-mean est assez répandu et de nombreuses implémentations existent