En janvier 2025, une startup chinoise quasi inconnue a mis Silicon Valley en état de choc : DeepSeek a publié R1, un modèle de raisonnement open source rivalisant avec GPT-4 et Claude, pour un coût d’entraînement annoncé de seulement 6 millions de dollars. En quelques jours, les certitudes les mieux établies sur la domination occidentale dans l’IA volaient en éclats.


Le contexte : qui est DeepSeek ?

DeepSeek-R1 a été dévoilé le 20 janvier 2025 — coïncidence ou non, le jour même de l’investiture de Donald Trump et de l’annonce de Stargate. La startup est fondée par Liang Wenfeng, mathématicien et entrepreneur peu connu du grand public, qui dirige également le fonds spéculatif quantitatif High-Flyer Capital Management basé à Hangzhou. C’est précisément la capacité de calcul accumulée par High-Flyer pour ses algorithmes de trading à haute fréquence qui a permis à DeepSeek de disposer d’une infrastructure GPU conséquente — estimée à plusieurs milliers de puces Nvidia A100 et H800 — avant même que les restrictions américaines à l’exportation ne se durcissent.

Contrairement à OpenAI, Anthropic ou Mistral, DeepSeek n’a jamais cherché de levée de fonds externe ni de partenariat stratégique avec un géant industriel. La startup est intégralement financée par High-Flyer, ce qui lui confère une liberté opérationnelle et une discrétion inhabituelles dans le secteur.


Ce qu’il faut retenir : la prouesse technique

Un modèle de raisonnement de premier plan. R1 est un modèle dit de chain-of-thought : avant de répondre, il déroule explicitement un raisonnement intermédiaire, visible par l’utilisateur, avant de formuler sa réponse finale. Cette approche — popularisée par OpenAI avec o1 — permet d’obtenir des performances nettement supérieures sur des tâches complexes : mathématiques, logique, programmation. Sur le benchmark AIME 2024 (concours de mathématiques américain), R1 obtient des scores comparables à OpenAI o1, dépassant largement GPT-4o.

Une architecture d’une efficacité redoutable. R1 repose sur une architecture MoE (Mixture of Experts) : le modèle total compte 671 milliards de paramètres, mais seulement 37 milliards sont activés à chaque inférence. Concrètement, cela signifie que faire tourner R1 ne mobilise qu’une fraction de sa capacité totale à chaque requête — ce qui explique en grande partie pourquoi son coût d’utilisation est 10 à 30 fois inférieur à celui de ses équivalents américains. DeepSeek a également innové en remplaçant certaines techniques classiques d’apprentissage par renforcement (RLHF avec retour humain) par du GRPO (Group Relative Policy Optimization), une méthode moins gourmande en annotations humaines coûteuses.

Publié sous licence MIT. Ce choix est stratégique autant que philosophique. En rendant R1 entièrement open source — poids du modèle inclus — DeepSeek a immédiatement enclenché un effet de viralité mondiale. Des milliers de développeurs ont pu télécharger, tester, modifier et déployer le modèle dès sa publication. En quelques jours, l’application mobile DeepSeek devenait la plus téléchargée aux États-Unis sur l’App Store, devant ChatGPT — un symbole fort, même si l’usage quotidien réel reste difficile à mesurer.


L’onde de choc financière : un lundi noir pour Nvidia

L’annonce a déclenché une panique boursière immédiate et brutale. Le lundi 27 janvier 2025, Nvidia a perdu environ 589 milliards de dollars de capitalisation en une seule séance — la plus forte destruction de valeur en une journée jamais enregistrée dans l’histoire des marchés financiers pour une entreprise cotée, avec une chute du titre de près de 17%.

La logique des marchés était la suivante : si une startup chinoise peut entraîner un modèle de pointe avec 2 048 puces H800 — des GPU de milieu de gamme que Nvidia était encore autorisé à exporter vers la Chine avant les restrictions de 2024 — alors l’hypothèse centrale justifiant la valorisation stratosphérique de Nvidia (l’idée que la course à l’IA nécessite des dizaines de milliers de puces haut de gamme à 30 000 dollars l’unité) pourrait être fragilisée.

Cette panique s’est rapidement étendue à tout l’écosystème des fournisseurs de puces et d’infrastructure : Broadcom, ASML, TSMC ont toutes enregistré des baisses significatives le même jour. Le terme « DeepSeek moment » est entré dans le vocabulaire financier pour désigner ce type de rupture technologique capable de remettre en question une thèse d’investissement dominante du jour au lendemain.

Nuance importante : la panique s’est en partie dissipée dans les semaines suivantes. Jensen Huang, PDG de Nvidia, a défendu l’argument que des modèles plus efficaces génèrent davantage d’usages, ce qui crée en retour une demande accrue de calcul — la loi de Jevons appliquée à l’IA. Les commandes de puces n’ont pas fléchi. Mais l’épisode a durablement introduit le doute sur la soutenabilité des valorisations du secteur.


Un an plus tard : l’héritage et les zones d’ombre

Une influence durable sur l’écosystème open source. Début 2026, DeepSeek R1 reste le modèle open source le plus téléchargé et le plus « liké » sur Hugging Face. Sa publication a entraîné une vague de réplications, d’adaptations et de distillations par des équipes du monde entier. Des versions quantifiées (réduites en taille pour tourner sur du matériel grand public) ont été produites par des milliers de développeurs indépendants. DeepSeek a, en quelque sorte, démocratisé l’accès à un modèle de raisonnement performant sans qu’OpenAI ou Anthropic n’aient eu leur mot à dire.

DeepSeek V4 en préparation. La startup prépare un successeur multimodal, attendu pour 2026, qui serait optimisé pour fonctionner sur du matériel produit en Chine — une réponse directe aux restrictions américaines à l’exportation de puces. Si cette direction se confirme, DeepSeek pourrait accélérer la constitution d’un écosystème IA chinois autonome, moins dépendant de Nvidia et de TSMC.

La controverse de la distillation. Rapidement après la publication de R1, des chercheurs ont soulevé des soupçons : certaines capacités du modèle semblaient trop proches des sorties des modèles d’OpenAI pour être le fruit d’un entraînement indépendant. Les conditions d’utilisation d’OpenAI interdisent explicitement d’utiliser les outputs de ses modèles pour entraîner des systèmes concurrents. Microsoft affirme avoir détecté fin 2024 d’importants transferts de données inhabituels via des comptes développeurs présumés liés à DeepSeek. OpenAI a déclaré enquêter sur ces soupçons, sans apporter de preuves publiques définitives à ce stade.

Un signal politique majeur. Donald Trump, en réaction à l’émergence de DeepSeek, a qualifié cet épisode de « signal d’alarme » pour l’industrie américaine — et a en partie utilisé cet argument pour justifier l’urgence du projet Stargate. Paradoxalement, DeepSeek a donc à la fois effrayé Washington et servi de justification aux investissements massifs que l’administration souhaitait déjà promouvoir.


Ce que DeepSeek change vraiment

Au fond, l’onde de choc provoquée par DeepSeek R1 dépasse largement la question d’un modèle en particulier. Elle a posé une question fondamentale que le secteur ne pouvait plus éluder : la performance en IA est-elle vraiment proportionnelle aux milliards investis ? La réponse, nuancée, est que l’efficacité algorithmique peut dans certains cas compenser significativement les ressources matérielles. Ce n’est pas la fin du règne des grandes infrastructures — mais c’est la fin de leur monopole supposé sur l’innovation.

Pour les équipes de recherche en IA du monde entier, DeepSeek a aussi envoyé un message d’espoir : avec les bonnes techniques et une équipe compétente, il est possible de construire des modèles compétitifs sans les budgets astronomiques des grands labos américains. C’est peut-être là l’héritage le plus durable de ce « séisme de janvier 2025 ».


📌 Sources utilisées

Wikipedia FR — DeepSeek (historique complet, controverse, réactions)

https://fr.wikipedia.org/wiki/DeepSeek

ActuIA — DeepSeek-R1, le modèle open source chinois venu déstabiliser NVIDIA

https://www.actuia.com/actualite/deepseek-r1-le-modele-open-source-chinois-venu-destabiliser-nvidia-et-le-marche-de-lia/

BFM Bourse — Plombé par la tornade DeepSeek, Nvidia perd 589 Md$ en bourse (28 janv. 2025)

https://www.tradingsat.com/actualites/informations-societes/plombe-par-la-tornade-deepseek-nvidia-a-perdu-589-milliards-de-dollars-en-bourse-un-record-absolu-1131513.html

BFM Bourse — DeepSeek : Nvidia dévisse mais reste serein (janv. 2025)

https://www.tradingsat.com/nvidia-US67066G1040/actualites/nvidia-secouant-la-suprematie-americaine-dans-l-ia-le-chinois-deepseek-fait-chuter-les-actions-nvidia-et-broadcom-1131442.html

Cryptoast — Est-il possible d’acheter des actions DeepSeek ? (mars 2026)

https://cryptoast.fr/acheter-action-deepseek/

L’Usine Digitale — DeepSeek : Nvidia dévisse en Bourse mais reste serein

https://www.usine-digitale.fr/article/deepseek-nvidia-devisse-en-bourse-mais-reste-serein.N2226387

Catégories : Veille Technologique