Accueil > Ia Avignon > C'est quoi DeepSeek ?

DeepSeek : l'étoile montante (et encombrante) de l'IA chinoise qui redéfinit la course technologique

Née en 2023, DeepSeek, une firme chinoise d'IA, a déferlé sur la planète tech avec des modèles performants et une approche "open source". Championne en Chine, menace aux USA, elle incarne la nouvelle guerre froide technologique.

Alors, c'est quoi DeepSeek au juste ? À peine le temps de dire "algorithme" que voilà DeepSeek, ou plus formellement Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd., propulsée sur le devant de la scène IA mondiale depuis sa création. Imaginez une comète technologique : des avancées fulgurantes, une efficacité coût bluffante et une philosophie open source (c'est-à-dire dont le code est accessible et modifiable) qui bouscule les codes. Résultat ? En Chine, c'est la coqueluche, un véritable moteur d'innovation nationale. Aux États-Unis ? L'ambiance est plutôt à la soupe à la grimace, DeepSeek étant vue comme un risque potentiel pour la sécurité nationale. Alors, simple start-up survitaminée ou pion d'une stratégie bien plus vaste ? Plongeons dans les coulisses.

C'est quoi DeepSeek ?
10 Mai 2025 à 14h45 Par Jérôme
Prestations - Avignon et Moi - Format rectangulaire
Prestations - Avignon et Moi - Format carré

Des fonds spéculatifs aux réseaux de neurones : la genèse d'un géant

Derrière DeepSeek, on trouve Liang Wenfeng, PDG de l'entreprise et cofondateur de High-Flyer, un des principaux fonds spéculatifs chinois versé dans le trading quantitatif nourri à l'IA. Ce n'est pas un détail : High-Flyer a injecté au moins 420 millions de dollars comme capital de départ. Oubliez l'image de la start-up née dans un garage ; ici, on parle d'une incubation stratégique par une entité technologico-financière déjà bien rodée. Si en avril 2025, la base de données Tracxn la classait comme « non financée » par du capital-risque externe, c'est que DeepSeek a d'abord puisé dans ses fonds internes, lui permettant de se concentrer sur la R&D loin des pressions habituelles. Mais face à la demande croissante pour son chatbot, l'entreprise envisageait de s'ouvrir à des fonds externes.

La recette DeepSeek : un cocktail d'innovations piquantes

DeepSeek n'a pas chômé, sortant une ribambelle de Grands Modèles de Langage (LLM) en un temps record. C'est un peu comme un chef qui sortirait plusieurs plats étoilés en quelques mois :

  • Les généralistes (Série V) : Dès novembre 2023, un premier modèle de 67 milliards de paramètres faisait mieux que certains concurrents. Puis vint DeepSeek-V2 en mai 2024 (236 milliards de paramètres au total, dont 21 milliards actifs par « jeton » – l'unité de base du texte pour une IA), et enfin DeepSeek-V3 en décembre 2024, un monstre de 671 milliards de paramètres (dont 37 milliards actifs).
  • Les penseurs (Série R) : Le modèle R1, lancé en janvier 2025, a fait sensation avec ses capacités de raisonnement avancées, notamment en maths, se mesurant à l'o1 d'OpenAI. Son successeur, R2, attendu début 2025, promet encore plus : multilinguisme, génération de code et capacités multimodales (comprendre à la fois texte, image, son...). Des rumeurs évoquent même l'utilisation de puces chinoises Huawei Ascend 910B et 1,2 trillion de paramètres.
  • Les codeurs (Série Coder) : DeepSeek Coder (novembre 2023) jonglait déjà avec plus de 80 langages de programmation. Sa V2 (juillet 2024) est passée à 338 langages, avec 236 milliards de paramètres et une mémoire contextuelle de 128 000 jetons. Pratique pour les développeurs du monde entier !
  • Les touche-à-tout (Multimodal) : Avec DeepSeek-VL (Vision-Langage), et les capacités multimodales intégrées à DeepSeek-V2 et prévues pour R2, l'IA apprend à voir et entendre le monde en plus de le lire.

Le secret de cette efficacité ? Des choix architecturaux malins. DeepSeek utilise notamment une architecture de Mélange d'Experts (MoE): imaginez une équipe de spécialistes où seul l'expert pertinent est sollicité pour une tâche donnée. C'est plus efficace que de mobiliser toute l'équipe pour chaque question. DeepSeek-V3, par exemple, active « seulement » 37 milliards de ses 671 milliards de paramètres par jeton. Ajoutez à cela des techniques comme l'Attention Latente Multi-Têtes (MLA) pour améliorer l'efficacité de l'inférence (le moment où l'IA « réfléchit »), et l'entraînement en précision mixte FP8 pour économiser mémoire et calculs. Ces innovations sont une réponse astucieuse aux restrictions américaines sur l'exportation des puces les plus avancées.

L'entreprise ne s'arrête pas là et développe, en collaboration avec l'Université de Tsinghua, des techniques d'entraînement avant-gardistes comme la Modélisation Générative de Récompense (GRM), où le modèle génère son propre feedback, et le Réglage par Critique Auto-Principiée (SPCT), où il apprend à évaluer ses propres réponses. L'idée ? Des IA plus autonomes, nécessitant moins de supervision humaine pour s'améliorer.

Autre article : Trump en Pape : L'Image qui enflamme la toile

Open source et prix cassés : la potion magique ?

L'un des ingrédients clés du succès de DeepSeek, c'est son engagement envers l'open source. Le modèle R1, par exemple, a été publié sous la licence MIT, très permissive. Une stratégie qui vise à rendre l'IA plus accessible et qui contraste avec les modèles « fermés » de nombreux concurrents américains. Cette approche, combinée à une efficacité coût revendiquée comme remarquable (le coût d'entraînement du R1 aurait été de seulement 5,6 millions de dollars ), démocratise l'accès à l'IA avancée. C'est un peu comme proposer la recette d'un plat gastronomique avec des ingrédients bon marché : tout le monde peut essayer !

En Chine : standing ovation et tapis rouge

En Chine, DeepSeek est portée aux nues. L'application est devenue l'une des plus téléchargées sur l'App Store d'Apple peu après son lancement. En janvier 2025, elle comptait plus de 22,2 millions d'utilisateurs actifs quotidiens dans le pays, qui représente environ 30 à 39% de ses utilisateurs mondiaux. Célébrée comme un fleuron de l'innovation nationale, DeepSeek voit sa technologie intégrée par des entités publiques et même des concurrents.

Plusieurs gouvernements locaux (comme ceux de Pékin, Shenzhen, Chongqing...) l'utilisent pour la sécurité publique, la gestion urbaine, la surveillance de l'opinion publique ou encore la propagande. Le Groupe de Médias Internet de la Province du Shandong s'en sert pour la veille d'opinion. Ce soutien étatique est palpable : DeepSeek fait partie du Corridor d'Innovation Scientifique et Technologique de Hangzhou Chengxi, une agence de développement économique parrainée par l'État. Des rapports indiquent même un fort soutien et une influence du Parti Communiste Chinois via la SASAC (l'organe de supervision des biens de l'État) et des organisations militaires et de renseignement.

Cet adoubement s'inscrit dans un cadre réglementaire strict. Les « Mesures Provisoires pour l'Administration des Services d'Intelligence Artificielle Générative » de 2023, par exemple, exigent des évaluations de sécurité et une adhésion à la « direction politique correcte ». Les conditions d'utilisation de DeepSeek stipulent d'ailleurs qu'elles sont régies par les lois de la République Populaire de Chine. Cette intégration des mécanismes de censure est une des raisons de son succès en Chine.

L'entreprise est aussi un symbole du succès de la formation des talents locaux : une analyse de son équipe de recherche a révélé que la quasi-totalité de ses membres ont été formés en Chine, créant un « transfert de connaissances à sens unique » au profit du pays.

Autre article : Formation IA Avignon (150€ HT) : libérez la puissance du prompt parfait

Aux États-Unis : douche froide et grincements de dents

De l'autre côté du Pacifique, l'accueil est pour le moins frisquet. Le lancement du modèle R1 a été qualifié de « moment Spoutnik de l'IA » par le capital-risqueur Marc Andreessen, semant une certaine panique sur les marchés. Si l'application a connu un pic de téléchargements, l'adoption par les entreprises américaines reste anecdotique (0,2% en janvier 2025), plombée par des doutes sur la fiabilité et, surtout, par d'énormes préoccupations sécuritaires.

Un rapport d'avril 2025 (voir le rapport en anglais) du Comité Spécial de la Chambre des Représentants sur le Parti Communiste Chinois, a jeté un pavé dans la mare, accusant DeepSeek de :

  • Transférer les données des Américains vers la Chine via une infrastructure liée à China Mobile (désignée par Washington comme une société militaire chinoise).
  • Avoir probablement eu recours à des techniques illégales de « distillation de modèles » (copier les capacités de modèles concurrents) au détriment de modèles américains.
  • Contourner les contrôles à l'exportation sur les puces.
  • Censurer les opinions anti-PCC et aligner ses résultats sur la propagande du parti.

Conséquence : le comité a recommandé d'interdire aux agences fédérales d'utiliser des modèles d'IA chinois. Dans la foulée, la Marine américaine, la NASA, le Pentagone et plusieurs états comme la Virginie, le Texas et New York ont banni son usage sur les appareils et systèmes gouvernementaux.

Les problèmes de sécurité des données sont légion. La politique de confidentialité de DeepSeek indique un stockage des données en Chine sous loi chinoise. Des évaluations ont pointé un cryptage faible et des failles potentielles. Une étude de Cisco a montré que DeepSeek R1 n'a bloqué aucune requête nuisible, contre 14% pour GPT-4o d'OpenAI. Une fuite de données aurait même exposé plus d'un million d'enregistrements sensibles. L'entreprise a aussi été accusée d'avoir transféré des données d'utilisateurs sud-coréens vers la Chine et les États-Unis sans leur accord, ce à quoi DeepSeek a répondu que cela visait à améliorer l'expérience utilisateur et avait été stoppé. Éthiquement, DeepSeek permettrait la génération de logiciels malveillants et présenterait des biais pro-guerre dans des scénarios de politique étrangère.

Microsoft a toutefois créé la surprise en s'associant à DeepSeek pour intégrer R1 dans sa plateforme cloud Azure et pour un traitement local sur les PC Copilot+, une démarche peut-être pour diversifier ses offres ou répondre à des besoins spécifiques de confidentialité.

Le saviez-vous ?

DeepSeek, malgré son financement initial massif par High-Flyer Quant, est parvenue à développer son modèle R1 pour un coût d'entraînement estimé à seulement 5,6 millions de dollars. Une prouesse qui interroge sur les dépenses colossales habituellement associées à l'IA de pointe et qui montre que l'innovation algorithmique peut parfois peser aussi lourd que les montagnes de cash.

Autre article : IA au travail : la révolution annoncée fait-elle pschitt ?

l'IA prise entre deux feux géopolitiques

DeepSeek est bien plus qu'une simple entreprise technologique. Elle est le symbole des ambitions chinoises en IA, capable d'innover rapidement malgré les restrictions. Elle incarne aussi la méfiance occidentale face à des technologies potentiellement liées à un État rival. D'un côté, une innovation open source qui pourrait démocratiser l'IA. De l'autre, des alarmes de sécurité qui virent au rouge écarlate.

Son parcours illustre une possible « balkanisation » de l'IA mondiale, où les technologies se développeraient en silos, freinant la collaboration globale mais stimulant peut-être une compétition acharnée au sein de blocs distincts. L'affaire DeepSeek nous rappelle surtout que la course à l'intelligence artificielle est désormais indissociable des rapports de force planétaires.

Alors, au final, c'est quoi DeepSeek ? Un génie incompris, un loup déguisé en chatbot open source, ou peut-être un peu des deux ? Une chose est certaine : dans le grand cirque de l'IA, les numéros les plus surprenants viennent souvent bousculer le programme. Et pour nos neurones de spectateurs curieux, c'est plutôt excitant !

Auteur : Jérôme

Expert en développement web, référencement et en intelligence artificielle, mon expérience pratique dans la création de systèmes automatisés remonte à 2009. Aujourd'hui, en plus de rédiger des articles pour décrypter l'actualité et les enjeux de l'IA, je conçois des solutions sur mesure et j'interviens comme consultant et formateur pour une IA éthique, performante et responsable.

Voir mes formations

Partager sur : Facebook - X (Twitter) - Linkedin
Avignon et moi > Catégorie : Ia Avignon > C'est quoi DeepSeek ?