Can Long-Context Language Models Subsume Retrieval, RAG, SQL, and More?

1370 shaares

Filters

Links per page

20 50 100

Can Long-Context Language Models Subsume Retrieval, RAG, SQL, and More?

Une étude sur les capacités des modèles ayant de grandes fenêtres de contexte à réaliser des tâches de type RAG.

Il apparaît que les modèles sont autant capable qu'un RAG lorsque l'on met tous les documents dans leur fenêtre de contexte.

A première vue, on pourrait se dire que les RAG sont obsolètes mais:

le nombre de tokens consommé est de 10 à 100x plus élevé
même 2 millions de tokens peuvent s'avérer insuffisant pour une grande base de connaissances

En général, les modèles se débrouillent aussi mieux lorsque l'on limite le nombre d'informations présentes dans leur prompt et sur des cas d'usages de raisonnement comme en SQL, cela peut améliorer les performances.

c-ai · retrieval-augmented-generation

June 23, 2024 at 17:36:25 UTC * · permalink

https://arxiv.org/html/2406.13121v1

Filters

Links per page

20 50 100