Par2 est un logiciel de protection de fichiers.
Il est capable de:
- détecter les fichiers corrompus
- corriger les fichiers corrompus (moyennant ~10% d'espace disque en plus)
Une lib pour manipuler des données tabulaires (vectors, matrices) de la même manière qu'avec Panda.
Celle la est écrite en Rust donc on peut s'attendre des à des performances ~7x plus rapide que Panda. (Benchmarks)
(Via Alex)
Un article coup de gueule pour expliquer la différence entre un supplier et un volunteer.
Le supplier est payé pour son travail et fournit des garanties de service, le volunteer travaille bénévolement et il n'a aucune garantie à fournir
Sous le coude
Un REX sur les limites de MongoDB.
Concrètement dans le cas de Malt, MongoDB leur a permis d'itérer rapidement au début mais par la suite son utilisation a ralenti les développements et le fonctionnement de l'application.
A noter que l'article porte beaucoup sur les anciennes versions de MongoDB, sans les transactions ou le mot clé $lookup
.
Dans les problèmes rencontrés:
- le langage de requête en JSON qui n'est pas aussi clair que du SQL
- la modélisation nosql qui implique beaucoup de dénormalisation et de duplication
- la cohérence des données et les jointures qui doivent se faire dans le code
Bref, comme d'habitude il faut utiliser la bonne base de donnée pour le bon problème et lorsqu'il s'agit de la modélisation d'un système relationnel (90% des applications) alors une base de données relationnel est de mise.
CLIP Interrogator est une utilisation d'une IA pour générer un prompt à partir d'une photo.
Ensuite on peut utiliser ce prompt dans DALL-E ou autre pour générer une image qui ressemble à l'original
Un point sur les UUID v7 et les ULID qui sont tous deux des améliorations de la spec UUID v4 en incluant un timestamp afin d'obtenir des identifiants ordonnés.
Je trouve les ULID moins lisible que les UUID 0GWWXY2G84DFMRVWQNJ1SRYCMC
par contre les UUID v7 ne sont pas encore très répandus.
Autre chose, les UUID v7 par le même processus auront un compteur auto-incrémenté pour rester séquentiels alors que les ULID auront simplement un bit aléatoire de modifié.
Discussion sur ULID vs ID + sortable created_at (pas de consensus): https://news.ycombinator.com/item?id=28089498
Aussi, les UUID v4 sont très mal compressable donc ça peut rapidement prendre de la place.
La Quadrature du Net a demandé à la CAF les sources de son algorithme sensé détecter les profils "à risque" pour les contrôler "plus efficacement"
Exemple de profils "à risque"
le fait de disposer de faibles revenus, d’habiter dans un quartier défavorisé, d’être une mère célibataire ou encore d’être né·e hors de France.
Ils ont fourni un code en renommant toutes les variables soit disant pour éviter que des fraudeurs tentent de profiter du système.
Pour rappel, aux Pays-Bas le scandale de l'algorithme de contrôle des aides sociales a carrément causé la démission du gouvernement.
Un REX sur la gestion des pics d'affluence à L'Équipe pendant les coupes du monde.
Plusieurs conseils:
- code freeze: aucun déploiement avant la coupe de monde
- auto-scaling: entre 10 et 120 pods sur leur cluster Kubernetes
- observabilité: Application Performance Management (APM) et une suite Elasticsearch, Logstash, Kibana (ELK)
A certains moments, ils ont encaissé plus de 1 million de pages vues à la minutes!
Un image upscaler basée sur une IA.
Ça permet d'augmenter la qualité d'une image
Une application de tableau blanc collaborative infini.
Un très bon article qui résume la situation actuel dans le monde des IA spécialisées dans le langage naturelle comme GPT3 et bien sur son accolyte ChatGPT.
Au délà de l'effet whaou (mérité!), l'auteur cite notamment 4 limites:
- pas de véritable compréhension des réponses par l'IA ce qui engendre des contresens, non-senses et autres incohérences
- pas de notion d'éthique
- difficulté de contextualisation, même dans le cadre d'un chatbot d'entreprise, ChatGPT se fera une joie de répondre à n'importe quelle question (sauf si on lui indique de ne pas le faire)
- le coût économique et écologique
Je pense qu'il y a d'autres choses à prendre en compte, typiquement si le contenu est généré par des IA (DALL-E et ChatGPT) alors ces mêmes IA s'entraineront sur ce contenu, ce qui entrainera potentiellement un affaiblissement des modèles (voir https://links.aschen.tech/shaare/40uSng)
Des activistes "écologistes" se font passer pour Dargaud, la maison d'édition de la bande dessinée "Le Monde Sans Fin" co-réalisée par Jean Marc Jancovici et Christophe Blain, et demande aux libraires d'insérer un pamphlet aggressif et mensonger dans chaque exemplaire.
Un outil open source pour gérer ses secrets en remplacement de Hashicorp Vault ou autre.
Il y a un backend et un frontend complet pour créer des projets et ajouter des secrets.
Ensuite une clé d'API est générée pour récupérer ces secrets depuis une application.
Ils ont déjà des intégrations automatiques avec la plupart des framework mais aussi directement Docker, Kubernetes, Github Actions et des cloud type Heroku, Vercal.
Par contre ils sont toujours en alpha donc à voir
La ville de Montpellier interdit la reconnaissance faciale.
Pour appuyer cette décision, la mairie a demander à ChatGPT des arguments en faveur de chaque camp puis à pris une décision en fonction des réponses.
LastPass se sont fait sévèrement piraté juste avant Noël.
Les pirates ont mis la main sur le backup chiffré des coffre-forts des clients.
C'est juste dingue car dans ces backups il y a toutes les info stockées par un client sur LastPass avec notamment:
- URL des sites internet (non chiffré)
- username et password (chiffré)
Ils ont aussi mis la main sur les métadonnées des clients.
company names, end-user names, billing addresses, email addresses, telephone numbers, and the IP addresses
En gros toutes les données clients de LastPass ont fuité. Toutes les personnes qui n'avaient pas choisi un mot de passe fort doivent changer leur mot de passe sur tous les sites qu'ils avaient enregistrés.
Sinon LastPass peut juste fermer boutique maintenant 🤡
Un thread qui explique pourquoi le pari de 100% renouvelable est une illusion.
Ce territoire, l'île de El Hierro dans les canaries avait pourtant tout pour plaire, une île avec beaucoup d'ensoleillement, du vent car en mer et un cratère naturelle pour construire le réservoir d'eau servant de batterie naturelle (STEP)
Quelques points clés :
- solaire et éolien nécessite du stockage et ce stockage coûte très cher (batteries ou STEP)
- la stabilité de la grille énergétique est dur à maintenir avec des énergies soumises aux aléas naturelles
- l'investissement est 10 à 40x supérieur à l'investissement équivalent dans de l'énergie nucléaire
Il est maintenant possible de créer des "sous-élément" à partir des éléments d'une database.
Concrètement ça permet de créer un système de dépendances, par exemple pour construire un système de tâches et sous-tâches.
Il y a même un mode de visualisation interactif de ces dépendances!
Un guide alternative pour comprendre comment fonctionne les flexbox en CSS.
SPACE est un framework pour mesurer l'efficacité d'une équipe d'ingénieurs.
Il est découpé en 5 catégories qui doivent chacunes être évaluées avec différentes métriques:
- Satisfaction: rétention, satisfaction des développeurs
- Performance: vélocité code review, story point livrés, uptime
- Activity: lignes de codes, commits, fréquence déploiements
- Communication & Collaboration: time to merge, qualité des réunions, partage de la connaissance
- Efficiency: timing code reviews, nombre d'interruptions
Bien sur il n'est pas nécessaire de récolter des métriques pour chaques catégories et certaines métriques peuvent avoir moins de sens dans certaines équipes mais ça donne déjà de solides bases pour évoluer la performance d'une équipe.