Daily Shaarli

All links of one day in a single page.

November 1, 2024

We raised $12M to build a text editor

Supermaven a levé 12 millions de dollars pour créer un éditeur de code.

Ils sont arrivés aux limites de ce qu'il est possible de faire via une extension alors ils veulent développer leur propre éditeur.

À voir si ils vont partir de VScode comme Cursor ou créer un Nouvel éditeur from scratch (j'espère qu'ils partiront de VScode)

En tout cas vu la qualité de leur outil d'autocomplétion, cela fera très certainement un sérieux concurrent à Cursor !

Model Distillation in the API

OpenAI propose un pipeline complet de fine tuning directement depuis son API.

Cela permet de fine tuné un modèle depuis les input/output d'un plus grand modèle.

Concrètement, cela peut permettre de spécialiser GPT-4o-mini avec GPT-4o voir o1 pour avoir un modèle rapide et pas cher spécialisé sur une tâche précise.

C'est assez simple d'utilisation car directement intégré:

  • on ajoute un paramètre store: true lors des appels API pour créer un dataset
  • on crée la baseline d'évaluation du dataset avec le modèle
  • on fine tune le plus petit modèle avec le dataset
  • on évalue le modèle fine tuné avec le dataset par rapport à la baseline
Claude 3.5 Sonnet on GitHub Copilot
thumbnail

Après OpenAI, c'est Anthropic qui devient partenaire de Github (Microsoft) pour proposer son modèle Claude 3.5 Sonnet dans Github Copilot.

Depuis la dernière mise à jour du modèle, Claude 3.5 Sonnet dépasse de loin GPT-4o dans la plupart des benchmark et s'offre surtout une place de choix dans le benchmark de référence pour les tâches de programmation, SWE Bench, avec 49% (SOTA 53% pour OpenHand, le successeur de OpenDevin)

Après avoir essayé, je dois dire que je préfère toujours Supermaven pour l'auto-complétion.

Leur modèle fournit les complétions beaucoup plus rapidement et beaucoup plus souvent que Copilot tout en étant généralement de meilleure qualité.

Le seul bémol du modèle c'est qu'il est moins "intelligent" que Claude 3.5 Sonnet derrière Copilot mais ce n'est pas grave car pour les tâches de génération de code compliqué j'utilise le chat de Cursor.

How I write code using Cursor: A review

Un article sur l'utilisation de Cursor pour le développement.

Plusieurs exemples concret d'utilisation de Cursor en vidéo, je trouve ce format très bien d'ailleurs car cela donne des idées d'utilisation de l'outil.

Je suis 100% d'accord avec certaines de ses conclusions:

  • j'utilise moins de lib externes car je peux recoder pleins d'utilitaires facilement avec l'aide du LLM
  • cela me dérange moins de dupliquer du code car je sais que je peux refactor très rapidement et sans trop d'efforts plus tard
  • je me dirige plus facilement vers des frameworks ou langages que je ne maitrise pas car le LLM génère une bonne partie du code pour moi

Les outils de GenAI pour le développement sont des précurseurs de l'écosystème en terme de profondeur des fonctionnalités, de gains de productivité et d'adoption.

Github Copilot existe depuis 2021 et à longtemps été l'application de GenAI la plus utilisée au monde avant de laisser cette place à ChatGPT.

Aujourd'hui, les outils GenAI pour développeurs sont impressionnants. Il devient de plus en plus difficile de s'en passer tant le gain de productivité est élevé !

Introducing ChatGPT search

Après 3 mois de bêta, OpenAI ouvre au grand publique la fonctionnalité de RAG à l'échelle d'internet de ChatGPT.

Cela fonctionne avec un nouveau type de crawler d'OpenAI qui récupère les info des pages web en permanence, comme ceux de Perplexity ou Google Search.

La recherche n'est pas faite avec un outil qui lit la page web à la demande comme c'était parfois le cas lors de requêtes.

Ils utilisent un modèle GPT-4o qu'ils ont fine tuné à partir de données générées par leur modèle o1.

C'est un concurrent directe à Perplexity qui était jusque là plutôt tranquille sur son segment.