Daily Shaarli

All links of one day in a single page.

March 27, 2023

Une introduction complète aux composants web en 2023
thumbnail

Un récapitulatif très complet sur les web component et ce qu'il est possible de faire avec.

scrapeghost

Une lib de scrapping qui utilise GPT pour extraire les informations voulues depuis une page web.

Ça fonctionne assez bien et ça permet de réduire le coût total en faisant un clean sur le HTML.

Un peut spécifier un budget de token et le scrapper s'arrête une fois le budget consommé.

The BigScience RAIL License for AI
thumbnail

Responsive AI Licence (RAIL) est une licence pour les modèles entraînés (weight) que l'ont pourrait considérer comme Open Source.

Elle permet la réutilisation, la modification, même dans un contexte commercial tout comme la licence Apache 2.

Néanmoins elle restreint l'usage du modèle à des utilisation "harmful" qui restent à la discrétion des créateurs en fonction des usages qui apparaîtront.

L'autre différence est son caractère copyleft (ou "viral") comme les licences GPL car un modèle dérivé doit reproduire la licence

Database-like ops benchmark

Un benchmark des librairies et bases de données (en RAM) pour traiter des données tabulaires dans le genre de Pandas.

Polars remporte haut la main le benchmark, c'est une lib écrite en Rust et qui utilise aussi le standard Arrow