Veille & Recherche IA

NotebookLM + Antigravity : quand l'IA exécute du code dans sa propre sandbox cloud

12 juin 2026

6 min de lecture

172 vues

Sébastien Muler

#ia-generative #orchestration-agents #cloud #agentique #sandboxing

Google vient de franchir une étape importante avec la refonte de NotebookLM. L'outil de recherche IA ne se contente plus de prédire des tokens à partir de documents — il dispose désormais de sa propre machine virtuelle dans le cloud, capable d'écrire et d'exécuter du code. Derrière cette évolution se cache Antigravity, l'outil de coding interne de Google, qui change fondamentalement la nature de ce qu'un agent IA peut accomplir.

De la prédiction de tokens à l'exécution réelle

La majorité des LLMs fonctionnent selon un principe simple : à partir d'un contexte donné, ils prédisent le token le plus probable suivant. C'est puissant, mais fondamentalement limité : le modèle décrit ce qu'il ferait, sans jamais le faire.

Avec l'architecture Antigravity, NotebookLM bascule dans un autre paradigme. Chaque notebook instancie désormais son propre environnement cloud isolé — une sandbox — dans lequel l'IA peut :

Écrire du code (Python, JavaScript, formules de calcul...)
L'exécuter réellement et observer les résultats
Itérer en fonction des sorties obtenues
Produire des artefacts exploitables : graphiques, fichiers Excel, présentations PowerPoint, PDFs structurés

Ce n'est plus un assistant qui vous explique comment faire une analyse de données — c'est un agent qui la réalise, vérifie ses propres résultats et vous livre un rapport exportable.

Cette approche rejoint ce que l'on appelle en architecture logicielle le pattern Tool Use ou Function Calling, mais poussé à un niveau supérieur : l'outil n'est pas une API externe prédéfinie, c'est un interpréteur de code complet, dynamique et éphémère.

Une architecture agents + RAG repensée

NotebookLM tourne désormais sur Gemini 3.5 Flash, un modèle optimisé pour la vitesse et les tâches agentiques. Couplé à Antigravity, il alimente un pipeline en plusieurs couches :

1. Ingestion et indexation (RAG) Les sources uploadées par l'utilisateur sont découpées, vectorisées et stockées. C'est le socle RAG (Retrieval-Augmented Generation) classique.

2. Recherche autonome (Zero-source mode) Nouvelle fonctionnalité notable : si aucune source n'est fournie, NotebookLM peut désormais interroger Google Search pour trouver et intégrer automatiquement des sources pertinentes. Le modèle devient proactif dans la constitution de sa propre base de connaissances.

3. Planification et exécution agentique Pour les requêtes complexes, l'agent décompose la tâche en sous-objectifs, détermine quels outils utiliser (recherche, calcul, génération de code), les exécute séquentiellement dans la sandbox, et consolide les résultats.

4. Génération d'artefacts Le pipeline final produit des livrables directement utilisables : le code exécuté génère des visualisations ou des fichiers bureautiques, que l'utilisateur peut exporter sans post-traitement.

Selon Google, lors des tests internes, cette nouvelle architecture surpasse la précédente dans 65 % des cas. Un chiffre à nuancer — les benchmarks maison sont rarement neutres — mais qui traduit une amélioration substantielle sur les tâches de recherche longue et d'analyse documentaire.

Ce que ça change concrètement pour les développeurs

Pour les équipes techniques, cette évolution pose des questions d'architecture et d'inspiration directement applicables.

Le pattern sandbox comme brique fondamentale

L'idée d'allouer un environnement d'exécution isolé par session utilisateur est un pattern que l'on retrouve dans des outils comme GitHub Copilot Workspace, Devin ou encore OpenAI Code Interpreter. La tendance est claire : les agents IA sérieux ont besoin d'un espace d'exécution déterministe pour valider leurs propres sorties.

En PHP/Symfony, on peut imaginer des architectures similaires : un service qui orchestre un agent LLM via l'API Anthropic ou OpenAI, qui génère du code ou des requêtes SQL, les fait exécuter dans un container Docker éphémère, et retourne les résultats validés à l'utilisateur. Ce n'est plus de la science-fiction — c'est faisable aujourd'hui avec des outils open-source.

RAG + agents : la combinaison gagnante

NotebookLM illustre que le RAG seul ne suffit plus pour les cas d'usage avancés. L'ajout d'une couche agentique — capable de décider quand chercher, quoi calculer, et comment présenter — est ce qui fait passer un outil de "chatbot avec contexte" à "assistant de recherche opérationnel".

Pour les projets Symfony intégrant de l'IA, cela se traduit par une architecture en couches : une couche RAG (embedding + vector store), une couche orchestration (LangChain, LlamaIndex, ou implémentation custom), et une couche outils (APIs métier, exécuteurs de code, générateurs de documents).

La question de la sécurité des sandboxes

Exécuter du code généré par un LLM dans le cloud soulève des enjeux de sécurité non triviaux. Google gère cela avec des environnements isolés et éphémères — chaque notebook a sa propre instance. Pour toute implémentation similaire en production, les points de vigilance sont : isolation réseau stricte, limites de ressources (CPU, mémoire, temps d'exécution), et audit des artefacts générés avant exposition à l'utilisateur final.

Disponibilité et positionnement marché

La mise à jour est disponible mondialement pour les abonnés Google AI Ultra et les clients Workspace avec accès AI Ultra ou AI Expanded Access. Ce ciblage enterprise confirme que Google positionne NotebookLM comme un outil de productivité professionnelle, en concurrence directe avec des solutions comme Microsoft Copilot ou Notion AI.

L'export natif vers PowerPoint, Excel et PDF — des formats bureautiques standards en entreprise — est un signal fort : l'IA doit s'intégrer dans les workflows existants, pas les remplacer.

Conclusion

L'évolution de NotebookLM avec Antigravity marque un tournant architectural : l'IA passe du statut d'oracle textuel à celui d'agent exécutif capable de produire des résultats vérifiables. Pour les développeurs web, c'est une invitation à repenser l'intégration de l'IA dans leurs applications — non plus comme un simple endpoint de génération de texte, mais comme un orchestrateur capable d'agir, vérifier et livrer.

Les patterns utilisés par Google — sandbox isolée, RAG augmenté d'une recherche autonome, pipeline agentique multi-étapes — sont reproductibles avec les outils disponibles aujourd'hui. La vraie question n'est plus technique, elle est architecturale : comment concevoir des systèmes IA fiables quand l'agent peut modifier son propre environnement d'exécution ?

Source originale : The Decoder — Matthias Bastian, juin 2026.

Partager cet article

LinkedIn X Facebook Email

Article précédent

Claude Fable 5 : le coût de 10$/M tokens est-il rentable pour un senior dev ?

Retour à la liste

Article suivant

Fin du ZDR absolu pour les modèles Mythos d'Anthropic : ce que ça change pour vos applications IA