Weekly - Week 04 (January 22, 2024) - Aschen

Delete Set public Set private

Weekly Shaarli

Previous week

All links of one week in a single page.

Next week

Week 04 (January 22, 2024)

excelCPU: 16-bit CPU for Excel, and related files

Un CPU réalisé en macro Excel

c-programmation cpu art

Poisoned AI went rogue during training and couldn't be taught to behave again in 'legitimately scary' study | Live Science

Dee recherches menées sur l'exploitation des LLMs en tant que vecteur d'attaque.

Des techniques similaire à de l'obfuscation permettent d'apprendre au modèle à cacher ses intention malicieuse.

Par exemple durant les phases de validation, le code généré sera normal puis à partir d'une certaine date le code généré sera malicieux.

Cela peut aussi être déclenché par une instruction spéciale dans le prompt

c-ai text-ai cybersecurite

Cachet - Status Page

Un outil Open Source pour créer des pages de suivi du status des services.

c-outils hebergement open-source

AlphaGeometry: An Olympiad-level AI system for geometry

Un modèle de type Transformers développé par Google pour résoudre des problèmes de géométrie.

Le modèle à résolu 25 problèmes sur 30, une personne ayant une médaille d'or en résout en moyenne 25.9.

c-ai text-ai

voyage-code-2: Elevate Your Code Retrieval

Voyage AI propose des modèles d'embeddings plus performants que ceux de OpenAI.

Ils sont premier du leaderboard MTEB avec leur modèle voyage-lite-02-instruct (67.13 vs 64.59 pour OpenAI), un benchmark qui mesure la performance de la recherche par embeddings.

Leur nouveau modèle d'embeddings, voyage-code-2, est meilleur que les précédents mais en plus à une fenêtre de contexte de 16K token!

Ce modèle est spécialisé pour le code mais offre aussi de très bonnes performances pour le texte normal

c-ai text-ai embeddings

Stop using Opera Browser and Opera GX

Le navigateur Opera qui avait la côte au début des années 2010, notamment sur mobile, ne serait plus que l'ombre de lui même.

Pire que ça, il est à fuir avec des dérives inquiétantes depuis son rachat par des entreprises chinoises avec notamment application de prêt à des taux >500% dans les pays en voie de développement.

c-societe navigateur

New embedding models and API updates

OpenAI dévoile plusieurs nouveautés et particulièrement un nouveau modèle d'embeddings (ada2 datait de fin 2022).

Le modèle est décliné en deux versions:

text-embedding-3-small: 1536 dimensions, 62.3 MTEB
text-embedding-3-large: 3072 dimensions, 64.6 MTEB

Le modèle large est en 4è position du classement MTEB. (Ada2 était à 61 MTEB)

Le prix du small est 5x moins cher que Ada2 (0.00002$ 1K token) et le large est ~ le même prix (0.00013$ pour 1K token)

La fenêtre de contexte est toujours de 8196 token, ce qui est toujours peu par rapport à celle des embeddings VoyageAI (16K) ou même de GPT4

c-ai text-ai embeddings

IA. Le bot du Pôle emploi autrichien refuse d’orienter les femmes vers l’informatique

Les biais des LLMs peuvent être très marqués et avoir des conséquences en fonction de l'utilisation faite du LLM.

c-ai text-ai