Search: [ai-ops] - Aschen | Sharing the webz

1368 shaares

Filters

Links per page

20 50 100

3 results tagged ai-ops

Fireworks - AI Inference

Fireworks est un acteur majeur dans l'infrastructure d'inférence pour modèles Open Source.

Ils proposent la plupart des modèles existant comme Mistral, LlaMa, Qwen mais aussi DeepSeek v3 et R1.

Les prix sont très compétitifs avec seulement 0.9$/MTok (million de tokens) pour DeepSeek v3 qui offre de meilleures performances que GPT-4o (3$/MTok).

De nombreuses entreprises utilisent Fireworks, je l'ai découvert pendant que j’étudiai le fonctionnement de Cursor.

Ils utilisent notamment une version custom de LlaMa pour la partie "apply" des suggestions générées par des modèles plus performants.

c-ai · text-ai · ai-ops

January 24, 2025 at 14:47:41 UTC * · permalink

·

https://fireworks.ai/pricing

E2B - Code Interpreting for AI apps

E2B propose un service d'exécution de code dans des sandboxs.

C'est ciblé précisément pour les Agents LLM capable d'exécuter directement du code pour accomplir leur tâche.

Les fonctionnalités sont très complètes avec:

lecture/écriture de fichiers
accès au réseau de la sandbox (e.g. accéder un serveur web)
streaming de la sortie standard
paquets custom (npm, pip, etc)
Javascript, Python, R, Java, Bash

c-ai · assistant-ai · ai-ops

January 4, 2025 at 16:04:00 UTC * · permalink

·

https://e2b.dev/docs

jmorganca/ollama: Get up and running with large language models locally

Un wrapper pour utiliser les LLMs open source (LlaMa, Mistral, etc)

La CLI reprend l'interface de Docker avec des ollama pull llama2 ou ollama run llama2.

ça tourne dans le CPU et demande pas mal de RAM (32Go pour les modèles en version 13B)

c-ai · text-ai · ai-ops

July 26, 2023 at 14:45:11 UTC * · permalink

·

https://github.com/jmorganca/ollama