DeepSeek révolutionne l'IA avec de nouveaux modèles - Un concours pour OpenAI !
La startup chinoise DeepSeek présente de nouveaux modèles d'IA qui surpassent ses concurrents américains et démontrent des capacités de raisonnement innovantes.
DeepSeek révolutionne l'IA avec de nouveaux modèles - Un concours pour OpenAI !
Le 29 mai 2025, la startup chinoise DeepSeek a publié un nouveau FOCUS pour son modèle de raisonnement R1. Le modèle R1-0528 a été présenté sur la plateforme de développement Hugging Face, mais sans annonce officielle. Les détails sur le modèle lui-même, y compris sa comparaison avec d’autres modèles d’IA, n’ont pas encore été publiés. Dans le classement actuel de LiveCodeBench, le modèle d'inférence R1 de DeepSeek se classe troisième en matière de génération de code, juste derrière les modèles o4 mini et o3 d'OpenAI.
Le modèle R1 de DeepSeek surpasserait également ses concurrents, notamment le Grok 3 mini de xAI et le Qwen 3 d'Alibaba. Un représentant de DeepSeek a déclaré dans un groupe WeChat qu'une « petite mise à niveau test » du modèle était actuellement en cours. Malgré l’opinion largement répandue selon laquelle les contrôles américains à l’exportation entravent les progrès de la recherche chinoise sur l’IA, DeepSeek a souligné que ses nouveaux modèles d’IA sont égaux, voire supérieurs, à ceux des États-Unis, et à un coût inférieur.
Pertinence pour l'industrie technologique
Le lancement du modèle R1 en janvier a également entraîné une baisse des valeurs technologiques hors de Chine. De grandes entreprises chinoises comme Alibaba et Tencent ont depuis lancé 700 nouveaux modèles qui surpasseraient DeepSeek. Dans ce paysage concurrentiel, Google a réagi en introduisant des niveaux d'accès réduits à son modèle Gemini. OpenAI a également réduit les prix de ses services et introduit un modèle o3 Mini qui nécessite moins de puissance de calcul.
DeepSeek prévoit déjà de présenter son modèle successeur, le R2, dont la sortie était initialement prévue en mai 2025. La société avait déjà présenté une mise à niveau pour son grand modèle de langage V3 en mars de cette année.
Modèles d'IA innovants
En plus du modèle R1, DeepSeek a introduit deux nouveaux modèles d'IA : DeepSeek-R1-Zero et DeepSeek-R1. Le modèle R1-Zero a été formé exclusivement par apprentissage par renforcement (RL) sans recourir à des données supervisées. Cela montre que les modèles d’IA peuvent développer la capacité de raisonner sans intervention humaine.
Le modèle DeepSeek R1 exploite les données initiales et atteint des performances comparables aux modèles OpenAI en mathématiques, programmation et raisonnement. DeepSeek a également publié six modèles plus compacts qui héritent des connaissances des modèles plus grands grâce à la distillation. Parmi eux, le modèle 32B surpasse OpenAI-o1-mini dans divers benchmarks.
Tous les nouveaux modèles de DeepSeek sont open source et peuvent être utilisés via la plateforme DeepSeek ou localement, ce qui rend la technologie encore plus facile d'accès.
Pour plus d'informations, veuillez visiter Reuters ou Ville de Bremerhaven.