LLMs en avril 2026 : les annonces qui comptent

Le mois d’avril 2026 démarre sur un rythme difficile à suivre, même pour ceux qui passent leurs journées le nez dans les release notes. Entre le Claude Mythos Preview d’Anthropic, la rumeur persistante du “Spud” d’OpenAI, Gemini 3.1 Pro qui se déploie dans la foulée de Gemini 3, et la vague chinoise emmenée par Qwen 3.6 Plus et un DeepSeek V4 attendu d’un jour à l’autre — il y a de quoi s’y perdre.

On fait le point, calmement, sur ce qui compte vraiment pour qui travaille le GEO en France : qui a sorti quoi, qu’est-ce que ça change pour la visibilité dans les réponses IA, et quelles tendances se dessinent pour le printemps.

Anthropic : Mythos Preview et l’imminence de Claude Opus 4.7

Anthropic a pris tout le monde de court le 7 avril en dévoilant Claude Mythos Preview, un modèle généraliste particulièrement doué en cybersécurité. L’éditeur a lancé dans la foulée Project Glasswing, une initiative pour utiliser Mythos afin de sécuriser les logiciels critiques. Particularité intéressante : Anthropic a précisé que Mythos Preview ne serait pas rendu disponible au grand public. Une première dans la stratégie produit de l’entreprise, qui jusque-là assumait de pousser chaque modèle vers l’API.

Dans le même temps, la presse tech bruisse du lancement imminent de Claude Opus 4.7. Selon Dataconomy (avril 2026), Anthropic préparerait une sortie “dans la semaine”, accompagnée d’un nouvel outil pour concevoir sites web et présentations. Opus 4.7 serait une évolution incrémentale d’Opus 4.6, sorti en février.

Côté Claude Code, plusieurs nouveautés sont passées un peu inaperçues mais valent le détour : prompt caching forcé à 5 minutes ou 1 heure, récap de session, et accès aux skills depuis les slash commands natifs. Claude Cowork, lui, devient officiellement disponible sur macOS et Windows dans l’app desktop, avec analytics étendus, support OpenTelemetry et RBAC pour les plans Enterprise.

Ce que ça change pour le GEO

Claude n’est pas (encore) le moteur de recherche dominant en France, mais sa part dans les workflows des professionnels grimpe vite. Plus Anthropic pousse les capacités agentiques, plus la question “comment mon site est-il cité quand un agent Claude fait une recherche pour l’utilisateur” devient concrète.

OpenAI : GPT-5.4 installé, “Spud” dans les starting-blocks

OpenAI a publié GPT-5.4 le 5 mars 2026 en trois déclinaisons : standard, Thinking (raisonnement) et Pro (haute performance). Selon TechCrunch (mars 2026), le modèle affiche des scores records sur les benchmarks de computer use et 83 % sur le test GDPval d’OpenAI pour les tâches de knowledge work. Surtout, GPT-5.4 serait 33 % moins susceptible de faire des erreurs sur les affirmations individuelles comparé à GPT-5.2, et les réponses globales contiennent 18 % d’erreurs en moins.

La version API pousse le contexte jusqu’à 1 million de tokens, la plus grande fenêtre jamais proposée par OpenAI. Pour les équipes qui documentent des bases de connaissances entières en un seul appel, c’est un tournant.

En parallèle, GPT-5.3-Codex combine les stacks d’entraînement Codex et GPT-5, avec un gain de vitesse d’environ 25 % et de nouveaux sommets sur les benchmarks code. Et GPT-5.3 Instant Mini remplace désormais GPT-5 Instant Mini comme modèle de fallback.

Le modèle “Spud”

C’est LE dossier qui agite San Francisco. Le prochain grand modèle d’OpenAI, nom de code interne “Spud”, aurait terminé son pretraining autour du 24 mars 2026. Selon LumiChats et les marchés de prédiction Polymarket, la probabilité d’une sortie avant le 30 avril est estimée à 78 %, et au-delà de 95 % avant le 30 juin. Reste à voir s’il sera baptisé GPT-5.5 ou directement GPT-6 — le positionnement marketing n’est pas tranché.

Côté usage

Les chiffres parlent d’eux-mêmes : selon TechCrunch (février 2026), ChatGPT a dépassé 900 millions d’utilisateurs actifs hebdomadaires, contre 400 millions un an plus tôt. OpenAI revendique 50 millions d’abonnés payants et environ 2,5 milliards de prompts par jour à l’échelle mondiale. En matière de part de marché des chatbots IA, ChatGPT trusterait toujours les premiers rangs début 2026 selon DemandSage.

Google Gemini : 3.1 Pro, Gemma 4 et intégrations tous azimuts

Google ne ralentit pas. Après la sortie de Gemini 3, Gemini 3.1 Pro s’est déployé mondialement via l’app Gemini début avril, avec un focus sur le raisonnement complexe en code et analyse de données.

Dans la foulée, la famille open-weights Gemma 4 s’est enrichie de gemma-4-26b-a4b-it et gemma-4-31b-it, disponibles sur AI Studio et via l’API Gemini. Une réponse claire à la pression Llama / Mistral / Qwen sur le segment des modèles ouverts.

Côté fonctionnalités, la vraie nouveauté du mois est la combinaison Built-in Tools + Function Calling dans un même appel API — ce qui simplifie considérablement les architectures agentiques. Gemini in Chrome commence à se déployer sur Windows et macOS pour les abonnés Google AI Pro et Ultra aux États-Unis. Et les utilisateurs peuvent désormais importer leur historique d’autres chatbots directement dans Gemini.

Gemini aurait franchi la barre des 750 millions d’utilisateurs, selon Tech-Insider (avril 2026). Le rattrapage sur ChatGPT est net, tiré autant par l’intégration dans l’écosystème Google (Gmail, Calendar, Drive) que par la force de frappe Android.

L’accélération chinoise : Qwen 3.6 Plus et DeepSeek V4

Le duel sino-américain vire à l’offensive frontale. Alibaba a publié Qwen 3.6 Plus le 2 avril 2026, sur une architecture hybride mêlant attention linéaire efficace et mixture-of-experts sparse. C’est aujourd’hui un des modèles open-weights les plus performants.

DeepSeek V4 est annoncé comme imminent. Selon Reuters et BigGo Finance (avril 2026), le modèle tournerait sur les puces Huawei Ascend de dernière génération, afficherait un trillion de paramètres et une fenêtre de contexte d’un million de tokens. L’enjeu est autant géopolitique que technique : DeepSeek assume une stratégie “de-CUDAfication”, c’est-à-dire l’autonomie par rapport à l’écosystème NVIDIA.

Pour les équipes SEO/GEO francophones, la question n’est plus “est-ce que mes contenus sont vus par Qwen ou DeepSeek” — c’est “à quelle vitesse ces modèles vont-ils alimenter des moteurs de recherche utilisés par mes lecteurs”. La bascule arrive plus vite qu’on ne l’imagine.

Mistral : six releases en quinze jours

L’éditeur français a enchaîné à une cadence inédite. Selon son site et TechCrunch (mars 2026), entre le 16 et le 31 mars, Mistral a livré :

Mistral Small 4, qui fusionne Magistral (raisonnement), Pixtral (multimodal vision) et Devstral (agentic coding) en un seul modèle
Voxtral TTS, premier modèle text-to-speech multilingue de Mistral, open-weights, supportant 9 langues avec streaming faible latence et voix custom
Leanstral, agent open-source dédié à l’ingénierie de preuves formelles en Lean 4
Une plateforme d’entraînement entreprise, un CLI développeur, et un rôle fondateur dans la Nemotron Coalition de NVIDIA

Traduction pour l’écosystème : Mistral passe d’un éditeur “fast follower” à un acteur qui tient son propre calendrier. Pour la souveraineté IA européenne, c’est un signal positif.

Perplexity : l’agent “Computer” et le virage usage-based

Perplexity joue la carte agentique à fond. Perplexity Computer, lancé début 2026 et toujours en expansion en avril, est un agent capable d’exécuter des workflows complexes en autonomie en utilisant 19 modèles IA différents et en créant des sous-agents. Réservé au plan Perplexity Max à 200 $/mois.

Plus structurant : la plateforme bascule vers un modèle tarifaire à crédits, s’éloignant de l’abonnement forfaitaire. Un pari fort qui pourrait se généraliser au secteur.

Côté distribution, Snap et Perplexity ont intégré le moteur de réponse dans Snapchat, mettant les contenus cités directement devant près d’un milliard d’utilisateurs. Le navigateur Comet est désormais disponible gratuitement dans le monde entier. Et un partenariat avec PayPal ouvre le commerce agentique pour les utilisateurs Pro américains.

Google AI Overviews : l’impact sur le trafic se précise

Les données s’affinent, et elles font mal. Selon Stackmatix (2026), les AI Overviews de Google réduisent le CTR organique de 15 à 46 % selon le type de requête. Même en position #1, le CTR chute de 28,5 % à 11,2 % quand un AI Overview s’affiche au-dessus.

Autres chiffres clés à avoir en tête :

AI Overviews apparaissent dans 25,8 % des recherches US en janvier 2026 (Stackmatix)
39,4 % des requêtes informationnelles les déclenchent, contre 4 % des requêtes e-commerce
Le B2B tech est le secteur le plus exposé avec 70 % des requêtes affichant un AI Overview
Certains éditeurs ont vu leur CTR chuter jusqu’à 89 % sur leurs mots-clés historiques
À l’inverse, les sites cités comme sources dans un AI Overview voient leurs clics organiques grimper d’environ 35 %

Gartner projette qu’en fin d’année 2026, 25 % du trafic de recherche organique basculera vers des chatbots IA et assistants vocaux. Ce n’est plus une prévision de long terme — c’est le trimestre à venir.

AI Act : le calendrier pourrait bouger

Côté régulation, l’échéance du 2 août 2026 pour l’entrée en application des obligations sur les systèmes à haut risque reste officiellement en vigueur. Pour mémoire, elle implique documentation technique, système de gestion des risques, inscription à la base européenne, et marquage CE pour les systèmes commercialisés. Les sanctions peuvent atteindre 35 millions d’euros ou 7 % du chiffre d’affaires mondial.

Mais le 26 mars 2026, le Parlement européen a adopté le texte du Digital Omnibus sur l’IA, qui propose de reporter l’échéance au 2 décembre 2027 pour les systèmes autonomes. Rien n’est encore voté définitivement, mais la pression des industriels européens — dont Mistral, ASML et SAP — a manifestement porté. À suivre de près dans les prochaines semaines.

Ce qu’il faut retenir pour votre stratégie GEO

Trois signaux à ne pas manquer ce mois-ci.

Primo, la fragmentation s’installe. Il n’y a plus un moteur IA dominant, mais un écosystème où Claude, ChatGPT, Gemini, Perplexity et Copilot se partagent des parts croissantes. Optimiser pour un seul d’entre eux n’est plus une stratégie viable.

Secundo, la course aux citations est lancée. Les études convergent : être cité comme source dans un AI Overview ou une réponse ChatGPT ne compense pas entièrement la baisse de CTR organique, mais c’est la meilleure assurance-vie disponible. FAQ bien structurées, réponses directes en tête de section, schéma structuré — les fondamentaux restent les fondamentaux, simplement avec un ROI plus immédiat.

Tertio, les fenêtres de contexte d’un million de tokens changent la donne. Un agent peut désormais ingérer votre site entier en une seule requête. Ce qui veut dire que la cohérence de votre maillage interne, la clarté de vos pages piliers et la qualité de votre sitemap comptent plus que jamais — parce qu’ils sont évalués en bloc, pas page par page.

Le rythme ne va pas ralentir. La prochaine étape probable : la sortie de Spud chez OpenAI et de DeepSeek V4 dans la foulée, fin avril. On y revient dans le prochain point mensuel.

Sources : TechCrunch — OpenAI launches GPT-5.4, TechCrunch — ChatGPT reaches 900M weekly active users, Anthropic — Claude Mythos Preview, Dataconomy — Claude Opus 4.7, LumiChats — GPT-5.5 Spud release, Google — Gemini 3, Tech-Insider — Gemini 750M users, TechCrunch — Mistral Voxtral TTS, Mistral AI news, BigGo Finance — DeepSeek V4, TechCrunch — Perplexity Computer, Stackmatix — Google AI Overviews SEO Impact, Legiscope — EU AI Act compliance guide, A3 Web — AI Act août 2026.