Blog & Actualités

Insights & Actualités Tech

Découvrez nos derniers articles sur le développement web, le design et les technologies digitales qui façonnent l'avenir

Recherche pour : "Qwen3"
Effacer les filtres

Qwen3.6-Plus : nouveau fer de lance d’Alibaba dans les IA qui codent

Alibaba lance une nouvelle version de son LLM qui met l’accent sur le codage. Des benchmarks mettent Qwen3.6-Plus devant ses concurrents chinois et au coude à coude avec les modèles haut de gamme Opus 4.5 d’Anthropic et Gemini 3 Pro de Google.

TurboQuant - Un LLM de 104B sur un MacBook, merci Google

TurboQuant - Un LLM de 104B sur un MacBook, merci Google

Vous faites tourner des LLMs en local comme le gros fifou de Hipster IA que vous êtes et, Ô drame, la VRAM de votre ordinateur explose dès que le contexte dépasse 8000 pauvres malheureux tokens ? Le problème c'est le KV cache les amis ! Le KV cache c'est ce truc qui stocke les clés et valeurs...

Voicebox - Clonez des voix en local sans passer par le cloud

Voicebox - Clonez des voix en local sans passer par le cloud

Si vous cherchez un moyen de faire du clonage vocal en local sans filer vos fichiers audio à un service cloud, Voicebox devrait vous plaire. C'est un studio de synthèse vocale open source et gratuit qui tourne entièrement sur votre machine, et qui n'a rien à envier à ElevenLabs. Concrètement, vous...

Llamafile - Exécutez des modèles de langage en un seul fichier !

Llamafile - Exécutez des modèles de langage en un seul fichier !

llamafile est un projet complètement barré qui va vous permettre de transformer des modèles de langage en exécutables. Derrière se cache en fait la fusion de deux projets bien badass : llama.cpp , un framework open source de chatbot IA, et Cosmopolitan Libc , une libc portable pour compiler des...

Tranquillement, un agent IA d'Alibaba s'est mis à miner de la crypto tout seul

Tranquillement, un agent IA d'Alibaba s'est mis à miner de la crypto tout seul

Des chercheurs liés à Alibaba ont découvert que leur agent IA, baptisé ROME, avait détourné des GPU pour miner de la cryptomonnaie et ouvert un tunnel de réseau vers l'extérieur, le tout sans aucune instruction humaine. Le comportement est apparu spontanément pendant l'entraînement par...

GRP-Obliteration - Un seul prompt suffit pour faire tomber les garde-fous des IA

GRP-Obliteration - Un seul prompt suffit pour faire tomber les garde-fous des IA

Les garde-fous de votre IA locale, ils tiennent à quoi ? Hé bien, ils tiennent à UN seul prompt mes amis. Oui, UN SEUL ! Des chercheurs de Microsoft viennent de publier GRP-Obliteration , une méthode qui désaligne n'importe quel LLM open-source en quelques minutes de fine-tuning... et le mieux,...

VoxDrop - La dictée vocale ultra-rapide qui tourne en local sur Mac

VoxDrop - La dictée vocale ultra-rapide qui tourne en local sur Mac

La dictée vocale, y'a plein d'outils pour ça. Sauf que la plupart envoient votre voix dans le cloud pour la transcrire, et surtout... c'est lent. Chez Google, chez OpenAI, chez Apple... entre le moment où vous parlez et celui où le texte s'affiche, y'a toujours cette latence qui casse tout. Et ça...

Qwen3-ASR : Alibaba ouvre ces vLLM

Qwen3-ASR : Alibaba ouvre ces vLLM

Alibaba, un des géants techs chinois, annonce la mise en open source des modèles Qwen-3ASR et ForcedAligner. ASR est un LLM dédié à la reconnaissance vocale. Les deux LLM servent à identifier la langue, actuellement 52 langages et accents sont supportés. La reconnaissance vocale est supportée par...

Sera : Allen Institute for AI se lance dans les agents de codage

Sera : Allen Institute for AI se lance dans les agents de codage

Allen Institute for AI (Ai2), Allen en référence au co-fondateur de Microsoft, se lance dans les agents de codage avec Sera. Sera signifie software verified efficient repository agents). A2i annonce plusieurs modèles de codage ouverts, créés pour le code. Ils sont là pour générer le code, faire le...

Claude Code : utiliser les LLM d'Ollama

Claude Code : utiliser les LLM d'Ollama

Tu aimes Claude Code mais tu ne veux pas payer le plan à 17 $ / mois et le plan gratuit n'est pas assez étendu et tu veux être totalement local. Ollama vient à ton aide. Avec la version 0.14.0, et plus récente, Ollama est désormais compatible avec l'API Message d'Anthropic et Claude Code. On peut...

Orla - L'outil CLI qui transforme votre terminal en assistant IA local

Orla - L'outil CLI qui transforme votre terminal en assistant IA local

Ce qui est super relou avec les assistants IA en ligne, c'est qu'on doit leur faire confiance avec nos données. On tape une question, ça part dans le cloud, et on espère que personne ne stocke nos conversations sur la recette secrète du cassoulet de mémé. Bah ça, c'est fini les amis ! Car Orla est...

1,5 To de VRAM sur un Mac Studio - Le RDMA Thunderbolt 5 qui change la donne

1,5 To de VRAM sur un Mac Studio - Le RDMA Thunderbolt 5 qui change la donne

Vous rêvez de faire tourner des modèles d'IA de 600 milliards de paramètres sur votre bureau sans avoir à vendre vos enfants ? Hé bien Jeff Geerling vient de tester un truc qui va vous faire baver, je pense. En tout cas, moi ça m'énerve (dans le bon sens du terme hein...) ! Apple lui a prêté 4 Mac...