Un agent IA a mené 700 expériences en deux jours pour améliorer un modèle de langage
Andrej Karpathy, ancien chercheur chez OpenAI et ex-responsable de l'IA chez Tesla, a laissé tourner un agent IA pendant 48 heures sur un petit modèle de langage. Résultat : 700 expériences, 20 optimisations retenues et un gain de 11 % sur le temps d'entraînement. Le principe d'autoresearch Mais...