Utilisé via l’endpoint compatible Anthropic de Z.ai dans Claude Code, GLM 5.2 commence à être perçu comme une alternative crédible à Claude Opus sur de vrais workflows de développement. Ce n’est pas encore une preuve définitive. Mais c’est peut-être un signal de marché à prendre au sérieux.
Les comparaisons entre modèles IA tournent souvent au match de supporters. Chacun a son favori, ses captures d’écran, son anecdote impossible à benchmarker. Mais de temps en temps, un retour utilisateur mérite qu’on s’y arrête. Non pas parce qu’il règle le débat une bonne fois pour toutes, mais parce qu’il révèle un déplacement plus profond du marché.
C’est exactement ce qui se passe avec GLM 5.2, le modèle de Z.ai. Un développeur senior explique l’avoir utilisé dans Claude Code via l’endpoint compatible Anthropic de Z.ai, sur des tâches très concrètes : développement base de données, API de paiement backend, débogage frontend et backend, projets Laravel, et interfaces React. Son verdict est net : avec un niveau de raisonnement réglé sur max, GLM 5.2 serait, selon lui, le premier modèle non-Claude à lui donner une sensation réellement proche de Claude Opus.
Ce n’est pas une preuve définitive. Ce n’est pas non plus un benchmark académique. Mais c’est peut-être le premier vrai signal psychologique indiquant que Claude Opus n’est plus seul dans la tête des développeurs.
Pourquoi ce témoignage compte
Le point important, ici, n’est pas de décréter que GLM 5.2 a dépassé Claude Opus. Rien de sérieux ne permet de l’affirmer à partir d’un seul témoignage. En revanche, ce retour terrain dit autre chose : la frontière de ce qui semble « assez bon pour rivaliser » est en train de bouger.
Jusqu’ici, beaucoup de modèles alternatifs étaient jugés utiles dans les interfaces de coding agent, mais souvent dans un rôle limité : produire vite, corriger localement, exécuter des tâches simples, écrire des blocs de code corrects. Dès qu’il fallait tenir une architecture, préserver les contraintes d’un dépôt, rédiger une spec propre ou rester stable dans une chaîne d’exécution longue, les développeurs les plus exigeants remontaient souvent vers Claude Opus.
Le témoignage ici change légèrement de catégorie. L’auteur explique qu’il utilisait déjà d’autres modèles, notamment DeepSeek V4 Pro, mais plutôt comme des implémenteurs. Pour lui, GLM 5.2 serait le premier à approcher le niveau « haut de pile » de Claude, non seulement pour coder, mais aussi pour planifier, structurer et tenir un raisonnement de développement.
- Ce n’est pas seulement une histoire de génération de code.
- C’est aussi une question de tenue dans le temps.
- Et surtout de crédibilité sur de vrais workflows de développement.
Ce que Z.ai promet avec GLM 5.2
Ce retour utilisateur arrive au moment où Z.ai pousse très fort son discours autour de GLM 5.2 comme modèle conçu pour les long-horizon tasks, en particulier sur les usages d’ingénierie logicielle. Dans sa documentation officielle, l’éditeur met en avant plusieurs arguments :
- 1 million de tokens de contexte
- 128K tokens de sortie
- un positionnement clair sur le coding agent et l’exécution multi-étapes
- la prise en charge du thinking mode, du function calling, du structured output et de MCP
Le message est limpide : il ne s’agit plus seulement de répondre à une requête ou d’écrire une fonction isolée. Il s’agit de tenir un travail logiciel long, de suivre des contraintes de dépôt, de respecter des standards d’ingénierie, et de rester cohérent jusqu’au bout.
Évidemment, cette communication reste celle du fournisseur. Il faut donc la lire avec un minimum de recul. Mais même avec cette prudence, le cadrage est cohérent avec ce que certains développeurs commencent à raconter : GLM 5.2 vise frontalement le terrain où Claude restait, jusqu’ici, très difficile à déloger.
Claude Code n’est plus seulement “pour Claude”
Il y a un deuxième sujet, presque plus important que le modèle lui-même. Ce qui rend GLM 5.2 intéressant, ce n’est pas seulement sa qualité supposée. C’est le fait qu’il puisse être branché dans Claude Code via un endpoint compatible Anthropic.
Autrement dit, la valeur n’est plus uniquement dans le moteur. Elle est aussi dans le harnais de travail :
- la manière d’explorer un dépôt
- la gestion du contexte
- les habitudes de travail du développeur
- les boucles de planification, d’exécution, de debug et de vérification
Sur ce point, la documentation officielle de Claude Code rappelle bien que l’outil est pensé comme un système capable de lire un codebase, modifier des fichiers, lancer des tests et automatiser une partie du travail logiciel. Si des modèles tiers peuvent désormais se glisser dans cette expérience avec peu de friction, alors la concurrence ne porte plus seulement sur les benchmarks. Elle porte sur l’interchangeabilité réelle des modèles dans les outils agentiques.
Le développeur à l’origine du témoignage a d’ailleurs publié un dépôt GitHub dédié à ses contournements et améliorations de workflow pour Claude Code, visible ici : phase3dev/claude-code-workarounds. Il a aussi partagé un launcher simplifié pour faire tourner GLM 5.2 dans le harnais Claude Code en redirigeant les variables d’environnement vers l’API compatible Anthropic de Z.ai.
Une menace sérieuse pour Anthropic ? Oui, mais pas de la manière la plus simple
La vraie question n’est pas : GLM 5.2 est-il déjà meilleur que Claude Opus ? La vraie question est plus pragmatique : à partir de quand un modèle légèrement moins bon devient-il suffisamment proche pour que l’écart de prix, d’accès ou de disponibilité change les arbitrages ?
C’est là que le sujet devient stratégique. Si un nombre croissant de développeurs estime que GLM 5.2 atteint une part significative de la valeur de Claude Opus, alors la domination psychologique des modèles premium américains peut commencer à s’éroder. Pas forcément partout. Pas forcément tout de suite. Mais assez pour modifier les usages, les tests, et les budgets.
Dans l’IA pour développeurs, les basculements commencent rarement par une proclamation officielle. Ils commencent souvent par une phrase plus modeste : « pour la première fois, j’ai eu l’impression que ça s’en approchait vraiment ».
Le point sensible que les entreprises ne pourront pas ignorer
Il y a évidemment une limite majeure à ce récit enthousiaste : GLM 5.2 est un modèle chinois, et ce point n’est pas secondaire. Pour beaucoup d’organisations, la performance brute n’est pas le seul critère. Il faut aussi regarder :
- la sensibilité des données
- la gouvernance
- la conformité
- la localisation des flux
- le risque géopolitique
Autrement dit, même si GLM 5.2 s’avère très solide dans Claude Code, cela ne suffit pas à en faire automatiquement un standard pour l’entreprise. En revanche, cela suffit largement à introduire une pression concurrentielle crédible sur les acteurs américains du secteur.
Ce qu’on peut conclure sans survendre l’histoire
Il faut éviter deux erreurs.
La première serait d’écrire que Claude Opus est déjà dépassé. Ce serait aller trop vite.
La seconde serait d’écarter le sujet au motif qu’il ne s’agit « que » d’un ressenti utilisateur. Ce serait une erreur aussi. Dans le logiciel, les grands déplacements de marché commencent souvent par des ressentis répétés avant d’être confirmés par des chiffres plus propres.
Aujourd’hui, la conclusion la plus honnête tient en une ligne : GLM 5.2 n’a pas encore officiellement détrôné Claude Opus, mais il est peut-être le premier modèle non-Claude à commencer sérieusement à menacer son monopole mental chez les développeurs.
Et dans un marché aussi rapide que celui des modèles IA pour développeurs, ce genre de signal finit rarement par rester anecdotique très longtemps.

Laisser un commentaire