Berkeley Function Calling Leaderboard (BFCL)

1391 shaares

Filters

Links per page

20 50 100

Berkeley Function Calling Leaderboard (BFCL)

Ce benchmark est constitué de questions avec des descriptions de fonctions à utiliser récupérer des informations extérieures comme la météo par exemple.

Plusieurs capacités sont évaluées:

appels de fonctions Python, Java et Javascript pour résoudre des problèmes
utilisation d'API REST depuis une documentation
création de requêtes SQL
capacité à répondre "je ne sais pas" si aucune des fonctions ne convient

GPT-4 Turbo et Claude 3 sont au coude à coude dans le benchmark mais GPT-4 est 2x moins cher

c-ai · assistant-ai

May 13, 2024 at 07:37:33 UTC * · permalink

https://gorilla.cs.berkeley.edu/blogs/8_berkeley_function_calling_leaderboard.html

Filters

Links per page

20 50 100