1306 shaares
Un autre Agent capable de résoudre des issues GitHub.
Ils font mieux que Devin (13%) avec 22% des issues du SWE-bench-lite résolues
Sur le benchmark classique, ils sont à 16% vs le précédent SOTA, SWE-agent à 12.30
Un autre Agent capable de résoudre des issues GitHub.
Ils font mieux que Devin (13%) avec 22% des issues du SWE-bench-lite résolues
Sur le benchmark classique, ils sont à 16% vs le précédent SOTA, SWE-agent à 12.30