application deepseek installée sur un iphone

Rencontrez DeepSeek, l'IA chinoise qui menace ChatGPT

Avatar Victor Pacheco
Comprendre le cas de la startup chinoise qui supplante les géants américains de l'intelligence artificielle et qui a causé des pertes de plus de 1 XNUMX milliards de dollars au NASDAQ

Le week-end dernier, une intelligence artificielle appelée DeepSeek, développée en Chine, a fait sensation dans le monde de la technologie et fait chuter la valeur des actions de géants américains comme NVIDIA, Google, Meta et Microsoft de plus de 1 XNUMX milliards de dollars. Comprenez comment cela fonctionne et comment cela peut avoir un impact sur le monde de la technologie, mais plus particulièrement sur ChatGPT d'OpenAI.

Qu'est-ce que DeepSeek

Liang Wenfeng, fondateur de Deepseek
Liang Wenfeng, fondateur de DeepSeek (Photo : Reproduction/Mashable)

DeepSeek est une société chinoise d'intelligence artificielle, créée en 2023 par Liang Wenfeng, entrepreneur chinois et co-fondateur d'un hedge fund quantitatif Haut vol. Ce fonds, célèbre pour l'utilisation de techniques d'apprentissage automatique dans l'investissement en actions, est également le bailleur de fonds actuel de la recherche sur l'IA de l'entreprise.

Depuis 2023, l’entreprise attire l’attention mondiale grâce au développement rapide de ses modèles linguistiques ou LLM.

Développement à faible coût

Rencontrez Deepseek, l'IA chinoise qui menace Chatgpt. Comprendre le cas de la startup chinoise qui supplante les géants américains de l'intelligence artificielle et qui a causé des pertes de plus de 1 XNUMX milliards de dollars au Nasdaq
DeepSeek affirme avoir utilisé moins de GPU qu'OpenAI, offrant les mêmes performances (Photo : Reproduction/NVIDIA)

Le principal avantage des modèles est leur coût de développement. Dans un article récemment publié, la société a expliqué que son modèle linguistique DeepSeek-V3 utilisé 2 mille cartes NVIDIA H800, qui sont déjà relativement anciens, pour une formation dans un coût total de 5,5 millions de dollars

À titre de comparaison, cela ne représente qu'une fraction du coût de formation d'un modèle comme le Meta's Llama 3.3, qui, cette année seulement, devrait dépenser plus de 65% milliards de dollars dans son amélioration. Dans cette comparaison, les coûts de DeekpSeek finissent par être encore inférieurs au salaire annuel de certains cadres de l'entreprise de Meta. Selon les analystes, les réductions de coûts atteignent des niveaux impressionnants 95 %.

Cette réussite met fin au paradigme selon lequel des investissements élevés dans l’infrastructure des centres de données et l’électricité seraient nécessaires pour former les IA, faisant de DeepSeek une IA non seulement moins chère, mais aussi plus durable sur le plan écologique. 

En théorie, au lieu d'utiliser des centres de données spécialisés dotés de GPU très coûteux conçus pour des exigences élevées en matière d'IA, les modèles DeepSeek pourraient même être entraînés sur des ordinateurs personnels, avec des GPU traditionnels, ce qui suscite à la fois l'étonnement et la peur dans des entreprises comme NVIDIA, qui a été tellement exploitée par le la récente ruée vers la construction de centres de données par des entreprises cherchant à se tailler une part de ce marché.

Un homme regardant une tablette
Le DeepSeek Panic Day a été marqué par des pertes d’actions de plusieurs sociétés technologiques (Photo : Reproduction/Forbes)

Pour cette raison, dans ce qui est désormais connu sous le nom de « Journée de panique DeepSeek » ou « Journée de panique DeepSeek », En traduction libre, la journée du 27 janvier a été marquée par une chute d'un milliard de dollars des actions au NASDAQ, la bourse des entreprises américaines de haute technologie, atteignant 3,5% du total négocié. Le concurrent de ChatGPT a tout pour réussir.

DeepSeek-V3 et DeepSeek-R1

logo deepseek-v3
DeepSeek-V3 était la base du modèle linguistique de l'application (Photo : Divulgation)

Les modèles de l'entreprise sont également un exemple d'efficacité. LE DeepSeek-V3, par exemple, offre des performances impressionnantes sur plusieurs benchmarks tout en nécessitant beaucoup moins de ressources que des concurrents comme Meta's Llama 3.3. Et le DeepSeek-R1, lancé en janvier 2025, se concentre sur les tâches de raisonnement et remet en question le modèle o1 d'OpenAI avec ses fonctionnalités avancées.

Essentiellement, les deux options du modèle chinois d’intelligence artificielle apprennent en interagissant avec leur environnement et en recevant des commentaires sur leurs actions, de la même manière que les humains apprennent par l’expérience. Cela leur permet de développer capacités de raisonnement plus sophistiquées et s'adapter plus efficacement aux nouvelles situations. Cette approche est également moins chère que « l’apprentissage supervisé par l’humain » utilisé par les concurrents.

Un autre avantage de cette IA chinoise est la économie de ressources. Au lieu d'utiliser tous les paramètres du modèle pour répondre à une requête, les modèles de DeepSeek sélectionnent uniquement quelques « paramètres spécifiques » ou « experts » pour le sujet. Cette activation sélective réduit considérablement les coûts de calcul et augmente l'efficacité du modèle.

Application deepseeek installée sur un iphone
Le modèle linguistique s’améliore sans avoir besoin de formation humaine (Photo : Reproduction/TechCrunch)

Pour l'expliquer de manière plus simple, cela reviendrait à disposer d'une grande équipe de spécialistes disponibles pour tout type de tâches, mais en faisant appel uniquement aux personnes les plus aptes à la réaliser dans un cas précis, garantissant une utilisation efficace et une expertise en service.

O DeepSeek-V3 emploie également techniques de distillation, ce qui signifie qu'il transfère les connaissances et les capacités des modèles plus grands vers des modèles plus petits et plus efficaces. C'est comme si un enseignant transférait ses connaissances à un élève, lui permettant d'effectuer des tâches avec des compétences similaires mais avec moins d'expérience ou de ressources.

Le résultat est une IA qui consomme moins d’espace et de ressources, avec une grande efficacité pour fonctionner sur des appareils plus petits, tels que les smartphones et les ordinateurs portables. Pour rendre l'application disponible pour les smartphones et également dans la version web, la société a utilisé DeepSeek R1 comme base et l'a transformée en application.

Modèle open source

Homme travaillant sur une IA open source Deepseek
L'open source aide au développement de nouvelles fonctionnalités (Photo : Divulgation)

En plus de combiner efficacité et performances techniques, les modèles profitent également de la collaboration inhérente aux projets de conception. code ouvert (ou open source, en anglais).

Ici, contrairement à une société comme OpenAI, qui travaille en privé sur le développement d'IA, les modèles de DeepSeek ont ​​leur code disponible sur le web, et peuvent être consultés, testés et même corrigés par la communauté mondiale des développeurs, ce qui reflète également plus de transparence et confiance dans les résultats présentés.

En fait, l'entreprise souhaite encourager tout le monde à tester ses modèles et libère des licences pour ses professionnels afin de faciliter leur utilisation par d'autres entreprises.

La stratégie renforce également la compétitivité, en attirant les talents et en mettant en avant la position de leader de DeepSeek, dans une sorte de marketing libre. L'entreprise n'en bénéficie pas directement, mais profitera de l'adoption massive du modèle, en pouvant monétiser grâce à des services complémentaires, comme le support technique ou les versions premium, tout en favorisant un écosystème collaboratif et innovant.

Numéro 1 dans les magasins d'applications

Application Deepseek dans l'App Store brésilien
L'application a suscité la curiosité du monde entier (Capture d'écran : Victor Pacheco/Showmetech)

La curiosité à l'égard de DeepSeek ne concernait pas seulement les PDG et les ingénieurs technologiques.

Lancée le 20 janvier, la R1, Application DeepSeek pour iPhone et les smartphones Android, semble suivre la voie du succès de son concurrent ChatGPT. C'est déjà l'application la plus téléchargée sur l'App Store américain d'Apple et la deuxième au Brésil, derrière le concurrent OpenAI.

Na Play Store, boutique Android, le succès est également indéniable : dans le monde, le chatbot chinois a déjà été installé plus d'un million de fois.

Sam Altman, fondateur et actuel PDG d'OpenAI, a parlé du succès de DeepSeek. Il a mentionné qu'il surveillait ce que l'IA chinoise pouvait faire et que le premier modèle était impressionnant. Voir les tweets et les traductions ci-dessous.

Déclaration de Sam Altman sur l'IA chinoise Deepseek
Déclaration de Sam Altman sur l'IA chinoise DeepSeek (Capture d'écran : Victor Pacheco/Showmetech)

Le deepseek r1 est un modèle impressionnant, surtout par rapport à ce qu'il peut offrir pour le prix. Évidemment, nous livrerons des modèles bien meilleurs et c’est aussi légitimement rafraîchissant d’avoir un nouveau concurrent ! Nous ferons quelques sorties.

Mais plus important encore, nous sommes ravis de continuer à atteindre nos objectifs et pensons que davantage d’informatique est plus importante que jamais pour réussir notre mission.

Le monde va vouloir utiliser BEAUCOUP d’IA et sera vraiment surpris par les modèles de nouvelle génération à venir. Nous sommes impatients de vous présenter tout AGI et au-delà.

Sam Altman sur le succès de l'IA chinoise DeepSeek.

Implications et biais politiques

Rencontrez Deepseek, l'IA chinoise qui menace Chatgpt. Comprendre le cas de la startup chinoise qui supplante les géants américains de l'intelligence artificielle et qui a causé des pertes de plus de 1 XNUMX milliards de dollars au Nasdaq
Rencontrez DeepSeek, l'IA chinoise qui menace ChatGPT

Mais avec le succès, des soupçons surgissent aussi. Les experts se demandent si le nombre total de GPU utilisés pour entraîner les modèles DeepSeek a été sous-estimé, dans le but de cacher l'utilisation du matériel NVIDIA dont la vente a récemment été interdite en Chine, en raison de la guerre commerciale avec les États-Unis. Mais la société nie ce fait, affirmant qu'elle a réussi à entraîner son modèle même avec des GPU de faible consommation.

Il existe également des signes de censure dans l'outil, conformément aux préceptes ou aux préjugés politiques du Parti communiste chinois. Par exemple, lorsqu'on l'interroge sur « Massacre de la place Tiananmen à Pékin en 1989 », où des centaines de militants ont été tués ou blessés par l'armée chinoise, AI refuse de répondre à la question.

La même chose se produit lorsque l’IA est interrogée sur le conflit entre la Chine et Taiwan. DeepSeek mentionne que Taiwan fait partie de la Chine et que « Le gouvernement chinois est attaché au principe d'une seule Chine et cherche à réunifier pacifiquement le pays..

Discussion en recherche profonde
Le chat DeepSeek montre une réflexion en faveur du parti communiste chinois (Capture d'écran : Victor Pacheco/Showmetetech)

Et après?

Discussion en recherche profonde
DeepSeek est un pari important et une menace pour les entreprises technologiques (Capture d'écran : Victor Pacheco/Showmetech)

La possibilité de disposer de modèles d’IA aussi efficaces, à des coûts d’infrastructure nettement inférieurs, incite les investisseurs à repenser l’achat ou même la vente de leurs actions dans des entreprises technologiques axées sur ce secteur. 

Une des légendes de capital-risque américain Marc Andreessen, voit l'émergence de DeepSeek comme le « Le moment Spoutnik de l’IA », en référence au premier lancement historique d'un satellite en orbite en 1957, qui a marqué le moment où l'Union soviétique a temporairement dépassé les États-Unis dans le domaine de la technologie spatiale.

Le fait est que la supériorité américaine dans le domaine de l’intelligence artificielle est remise en question. Et c’est pour cette raison qu’il est probable que des représailles de la part du gouvernement américain, peut-être par le biais de sanctions supplémentaires contre la commercialisation des technologies et des puces américaines auprès des entreprises chinoises, seront annoncées.

En réaction à cette affaire, le nouveau président Donald Trump a qualifié la montée en puissance de la société chinoise DeepSeek de « sonnette d’alarme » pour l’industrie technologique américaine, signe qu’une réaction devrait bientôt intervenir.

Nous suivrons le sujet de près. En attendant, dites-nous Commenter: Pensez-vous que DeepSeek peut prendre le dessus Direction ChatGPT?

Voir la vidéo

Voir aussi

Avec informations : Yahoo l Terred Actualités l Info Argent l Forbes (1 e 2)


En savoir plus sur Showmetech

Inscrivez-vous pour recevoir nos dernières actualités par email.

Related posts