Daily Shaarli

All links of one day in a single page.

October 31, 2024

Mobile-Agent: The Powerful Mobile Device Operation Assistant Family
thumbnail

Un Assistant capable de manipuler cette fois-ci des interfaces de téléphone mobile.

C'est une équipe d'Alibaba qui a réalisé ce projet.

Apple travaille aussi sur des sujets similaires avec son modèle Ferret-UI

Reducto Document Ingestion API
thumbnail

Une solution qui permet de lire et découper des PDF avec un usage pensé pour le RAG.

Par exemple, ils vont inclure un résumé des tables en plus des données bruts.

Les chunks sur cette démo sont vraiment pas mal !

Les prix sont un peu cher par contre avec un prix d'entrée à 300$ pour 15 000 pages plutôt qu'un pay-as-you-go.