Image de couverture : Command A+ : Cohere open-source un modèle de classe mondiale tournant sur 2 GPUs H100
tech

Command A+ : Cohere open-source un modèle de classe mondiale tournant sur 2 GPUs H100

23 May 2026
5 min de lecture
3 vues
Sébastien Muler

Command A+ : Cohere open-source un modèle de classe mondiale tournant sur 2 GPUs H100

L'open source dans le domaine des LLM vient de franchir un nouveau cap. Cohere, entreprise canadienne spécialisée dans l'IA enterprise, vient de publier Command A+ sous licence Apache 2.0 — son modèle le plus puissant à ce jour. Pour les équipes qui cherchent à déployer des capacités agentiques sur infrastructure privée, c'est une actualité à prendre au sérieux.

Source : The Decoder


Une architecture Mixture-of-Experts bien calibrée

Command A+ repose sur une architecture Mixture-of-Experts (MoE) avec 218 milliards de paramètres au total, dont seulement 25 milliards actifs à chaque inférence. Ce ratio est au cœur de l'intérêt du modèle.

Contrairement à un modèle dense classique qui mobilise l'intégralité de ses paramètres à chaque passage, le MoE n'active qu'un sous-ensemble d'"experts" spécialisés selon le contexte de la requête. Résultat : une empreinte computationnelle bien inférieure à ce que laisserait supposer la taille brute du modèle.

En pratique, cela se traduit par une compatibilité avec des infrastructures accessibles :

  • 2x Nvidia H100 (80 Go VRAM chacune)
  • 1x GPU Blackwell (architecture Ada Lovelace next-gen)

Pour une équipe disposant d'un cluster GPU on-premise ou d'une instance cloud haut de gamme, ce seuil est atteignable sans investissement exorbitant. C'est précisément ce qui différencie Command A+ des modèles fermés de même rang.


Des capacités taillées pour les workflows enterprise

Command A+ n'est pas un modèle généraliste de plus. Son design cible explicitement des cas d'usage professionnels structurés :

🤖 Tâches agentiques

Le modèle a été optimisé pour les workflows multi-étapes où un agent doit planifier, exécuter des outils et s'adapter aux résultats intermédiaires. Les benchmarks parlent d'eux-mêmes : sur τ²-Bench Telecom, le score passe de 37 % (Command A Reasoning) à 85 % avec Command A+. Une progression qui n'est pas anodine pour des use cases comme l'automatisation de processus ou les pipelines de traitement documentaire.

📚 RAG (Retrieval-Augmented Generation)

Avec une fenêtre de contexte de 128 000 tokens, Command A+ est conçu pour ingérer de larges corpus documentaires sans perte de cohérence. Pour des applications PHP/Symfony intégrant de la recherche sémantique ou du chat documentaire, c'est une capacité différenciante par rapport aux modèles à contexte réduit.

🌐 Multilinguisme et multimodalité

Le modèle supporte 48 langues et traite à la fois du texte et des images. Pour des projets à vocation internationale ou intégrant de l'analyse de documents mixtes, la couverture linguistique dépasse largement la plupart des alternatives open source.

💻 Coding

Sur le benchmark Terminal-Bench Hard, le score grimpe de 3 % à 25 %. La progression est significative même si le niveau absolu reste modeste sur cet exercice particulièrement exigeant — il donne une indication réaliste des capacités de génération de code dans des contextes non triviaux.


Positionnement dans l'écosystème open source

Sur l'Artificial Analysis Intelligence Index, Command A+ atteint environ 37 points — un niveau comparable à Claude 4.5 Haiku, Gemma 4 31B ou Mistral Medium 3.5. Ce positionnement est révélateur : on parle d'un modèle open source qui rivalise avec des offres commerciales récentes, tout en restant déployable sur hardware privé.

Les poids sont disponibles sur Hugging Face en plusieurs quantizations, ce qui permet d'ajuster le compromis performance/mémoire selon l'infrastructure disponible. Les formats Q4, Q8 ou FP16 offrent des points d'entrée flexibles selon les contraintes matérielles.


Ce que cela change concrètement pour un projet web

Pour une équipe PHP/Symfony qui évalue l'intégration d'un LLM dans son stack, Command A+ ouvre des scénarios jusqu'ici difficiles à mettre en œuvre avec des modèles open source :

  • Déploiement on-premise : données sensibles qui ne quittent pas l'infrastructure, conformité RGPD simplifiée
  • Coût maîtrisé : pas de facturation à l'usage, pas de dépendance à une API tierce
  • Personnalisation : fine-tuning possible sur données métier grâce à la licence Apache 2.0
  • Intégration API-first : via Ollama, vLLM ou LM Studio, l'exposition d'une API compatible OpenAI reste standard et s'intègre facilement dans un projet Symfony avec des librairies comme php-openai ou symfony/http-client

La licence Apache 2.0 est particulièrement importante : elle autorise l'usage commercial sans restriction, le dérivé et la redistribution, ce qui tranche avec certaines licences "open source" aux conditions d'utilisation plus restrictives.


Conclusion

Command A+ représente une étape significative dans la démocratisation des LLM enterprise-grade. L'architecture MoE à 25B paramètres actifs sur 218B totaux n'est pas un détail marketing — c'est le mécanisme qui rend possible le déploiement d'un modèle de premier rang sur une infrastructure à deux GPUs.

Pour les équipes qui travaillent sur des projets nécessitant de l'IA agentique, du RAG ou du traitement documentaire multilingue, et qui ont des contraintes de souveraineté des données, ce modèle mérite une évaluation sérieuse. Les benchmarks, la licence et les formats de quantization disponibles sur Hugging Face fournissent tout ce qu'il faut pour un proof of concept rapide.

L'open source de qualité enterprise n'est plus l'exception — il devient progressivement la norme.

Partager cet article