Aschen | Sharing the webz

Why I Prefer Trunk-Based Development

Un article sur le Trunk Based Development. C'est une méthode de gestion du code source où tout est continuellement mergé sur master.

Ça boost le déploiement en continue car chaque PR est sensée être deployable directement après avoir été mergé.

Par contre il faut prévoir un CI solide avec suffisamment de tests ainsi que des features flag pour éviter d'exposer des features incomplètes aux utilisateurs

c-programmation · git · integration-continue

November 12, 2023 at 00:15:01 UTC * · permalink

·

https://koenvangilst.nl/blog/trunkbased-development

Cloudron - App Store

Une solution Open Source pour installer tout un tas d'application en self hosting sur un serveur.

Ils ont vraiment de tout:

wordpress
shaarli
gitlab
openvpn
transmissions
et tellement d'autres!

c-devops · auto-hebergement

November 11, 2023 at 21:13:15 UTC * · permalink

·

https://www.cloudron.io/store/index.html

Filtrable HNSW - Qdrant

Une explication détaillée de l'algorithme HNSW pour la recherche vectorielle.

J'ai beaucoup l'analogie utilisée par Qdrant avec un voyage.

Quand vous voyagez d'un petit village à un autre:

bus pour Lyon
train pour Paris
avion pour Berlin
train Hambourg
bus pour Lüneburg

Chaque étape utilise un moyen de transport ayant moins de hub et capable de faire de plus grandes distances

L'algorithme HNSW fonctionne selon ce principe, le plan vectoriel est découpé en couches. Plus on est dans une couche haute, moins il y a de vecteurs et plus les vecteurs sont éloignés les uns des autres.

Au fur et à mesure de la recherche, on va de plus en plus bas dans les couches jusqu'à arriver à la dernière et on peut donc récupérer tous les vecteurs les plus proches en un minimum d'opérations.

c-ai · text-ai · embeddings

November 11, 2023 at 18:44:46 UTC * · permalink

·

https://qdrant.tech/articles/filtrable-hnsw/

RunwayML introduce Motion Brush

Une nouvelle technique à base d'IA générative pour faire bouger des parties d'une photo

c-ai · image-ai

November 11, 2023 at 12:42:46 UTC * · permalink

·

https://twitter.com/runwayml/status/1723033256067489937

Sulfur Selenium Solid-State Battery From NASA Breaks Energy Storage Boundaries

Un nouveau type de batterie à base d'un couple soufre / sélénium qui serait 2 fois plus efficace que les batteries au Lithium

c-science · batterie

November 11, 2023 at 09:38:57 UTC * · permalink

·

https://cleantechnica.com/2023/07/14/sulfur-selenium-solid-state-battery-from-nasa-breaks-energy-storage-boundaries/?amp=1

Asked to do something illegal at work? Here’s what these software engineers did

Des histoires d'ingénieurs à qui on demande de faire quelque chose d'illégal.

Moralité, si on vous demande de faire quelque chose d'illégale, documentez la demande et refusez.

c-autres · tech-lead

November 10, 2023 at 19:13:04 UTC * · permalink

·

https://newsletter.pragmaticengineer.com/p/asked-to-do-something-illegal-at

NVIDIA's Eos supercomputer just broke its own AI training benchmark record

Un super-calculateur de Nvidia avec 10000 carte graphiques H100 spécialisées pour les opérations sur les réseaux de neurones.

Ils ont pu entrainer un modèle GPT-3 en seulement 4 minutes alors qu'il a fallu plus de 30 jours pour l'entrainer il y a 3 ans (sur 1000 GPU)

c-ai · performance · gpu

November 10, 2023 at 07:44:35 UTC * · permalink

·

https://www.engadget.com/nvidias-eos-supercomputer-just-broke-its-own-ai-training-benchmark-record-170042546.html

Navigating RS256 and JWKS

Un article qui explique le fonctionnement de la signature asymétrique des tokens en OIDC

c-programmation · authentication · oidc

November 8, 2023 at 14:05:20 UTC * · permalink

·

https://auth0.com/blog/navigating-rs256-and-jwks/

SQL Indexing and Tuning e-Book for developers: Use The Index, Luke covers Oracle, MySQL, PostgreSQL, SQL Server, ...

Un site très complet pour apprendre à mieux utiliser sa DB et comprendre les problèmes de performances pour les régler.

c-architecture · database · postgresql · performance

November 7, 2023 at 20:28:12 UTC * · permalink

·

https://use-the-index-luke.com/

Prompt Engineering on OpenAI Platform

Le guide d'OpenAI sur le Prompt Engineering. Simple, clair et efficace.

c-ai · prompt-engineering · openai · text-ai

November 6, 2023 at 19:50:04 UTC * · permalink

·

https://platform.openai.com/docs/guides/prompt-engineering/

Google Calendar RAT is a PoC of Command&Control over Google Calendar Events

Une exploitation de Google Calender pour envoyer des commandes à un malware.

Du coup ça passe pour du trafic totalement légitime

c-securite · malware

November 6, 2023 at 17:46:32 UTC * · permalink

·

https://github.com/MrSaighnal/GCR-Google-Calendar-RAT

Neon — Serverless, Fault-Tolerant, Branchable Postgres

Un service d'hébergement Postgres moderne et à la demande

c-outils · database · postgresql

November 6, 2023 at 13:17:57 UTC * · permalink

·

https://neon.tech/

pgvector vs Pinecone: cost and performance

Un benchmark de requêtage sur des vecteurs d'embeddings dans Postgres avec l'addon pgvector et dans le pure player Pinecone.

Sur un setup équivalent en coût chez Supabase, Postgres est 10x plus rapide avec la même précision.

Donc si on héberge sa propre base Postgres c'est encore moins cher!

A noter que Postgres est beaucoup plus qu'une base vectorielle et qu'on va pouvoir filtrer les résultats avec des WHERE, faire des jointures, etc

c-ai · performance · embeddings · postgresql

November 6, 2023 at 08:47:43 UTC * · permalink

·

https://supabase.com/blog/pgvector-vs-pinecone

What Happened To Google Search?

Une vidéo très intéressante sur le déclin de l'hégémonie de Google.

Cela s'explique notamment par une part de plus en plus importante des recherches Instagram / TikTok qui proposent des résultats plus interactifs (images, vidéos)

Aussi le SEO à une grosse part de responsabilité dans la merdification des résultats avec des articles de plus en plus vides écrits par des IA dans le seul but de placer des mots-clés.

Finalement, on note la montée en puissance de Reddit pour du contenu certifié "User generated" et des réponses de qualité

c-societe · search-engine · google

November 5, 2023 at 14:55:40 UTC * · permalink

·

https://www.youtube.com/watch?v=48AOOynnmqU

Generative AI exists because of the transformer

Excellent article qui expliquer le fonctionnement des LLMs

c-ai · text-ai · vulgarisation

November 4, 2023 at 21:53:15 UTC * · permalink

·

https://ig.ft.com/generative-ai/

LLM Papers | Olivier Cavadenti

Un fil d'actualité sur les derniers papiers à propos des LLM

c-ai · text-ai

November 4, 2023 at 17:37:48 UTC * · permalink

·

https://oliviercavadenti.github.io/jekyll/update/2023/11/04/LLM-papers.html

Bun hype. How we learned nothing from Yarn

Un article critique sur Bun.

Pas mal de bashing un peu gratuit et de demi vérité:

performances: tout ce qui est lancé en local avec Bun est instant vs plusieurs secondes avec une stack Typescript standard
pas de version manager: Bun vient d'être release et il y a litéralement 3 versions donc pas vraiment besoin, be patient ^^
moins de backward compat que Node: en même temps on attends pas la même chose de Bun, et au moins les features sortent :)

Bref en tout cas je ne pense pas que Bun puisse un jour remplacer Node côté serveur car il y fallut plusieurs années pour que l'industrie fasse confiance à Node et que Node se montre suffisamment mature.

Par contre en local il n'y a rien à dire, bosser dans l'écosystème actuel c'est juste HORRIBLE entre les bundler, les builders, les compilers et les fichiers de config de la mort j'étais à la limite de craquer et heureusement Bun vient régler tout ça.

En plus bonus: c'est instantané de lancer un script ou de run +100 tests unitaires

c-programmation · nodejs · bun · backend

November 4, 2023 at 17:35:54 UTC * · permalink

·

https://dev.to/thejaredwilcurt/bun-hype-how-we-learned-nothing-from-yarn-2n3j

Large Language Models Understand and Can Be Enhanced by Emotional Stimuli

Une étude qui démontre des amélioration des performances des LLMs lorsque l'on inclut un enjeu émotionnel dans les questions.

Par exemple: "Rédige un compte rendu sur la RGPD, c'est très important pour ma carrière"

La fin de la phrase va améliorer la qualité de la réponse fournie par le LLM.

c-ai · prompt-engineering · text-ai

November 3, 2023 at 13:38:18 UTC * · permalink

·

https://arxiv.org/pdf/2307.11760.pdf

Introducing PlayHT 2.0 Turbo ⚡️ - The Fastest Generative AI Text-to-Speech API

Une API de Text-to-Speech avec une latence très basse (300ms).

Ça veut dire que l'on peut envoyer du texte en streaming et recevoir de l'audio en streaming en pluguant GPT4 directement sur Turbo par exemple.

C'est la porte ouvertes aux conversations quasi temps réel (reste encore le Speech-to-Text et surtout l'envoi du prompt à GPT4 qu'il ne sera pas possible de streamer par contre)

c-ai · audio-ai

November 3, 2023 at 09:49:06 UTC * · permalink

·

https://news.play.ht/post/introducing-playht-2-0-turbo-the-fastest-generative-ai-text-to-speech-api

Clean API with Next.js Middleware Pipes

Une technique pour wrapper les handler API dégueulasses forcés par l'utilisation de Express en quelque chose d'un peu plus moderne.

Next.js encore sur Express en 2023 :(

c-programmation · framework · backend · typescript

November 2, 2023 at 13:17:55 UTC * · permalink

·

https://giancarlobuomprisco.com/next/middleware-pipes-nextjs