A DeepSeek új modellekkel forradalmasítja az AI-t – verseny az OpenAIért!

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

A kínai induló DeepSeek új mesterséges intelligencia modelleket mutat be, amelyek felülmúlják az amerikai versenytársakat, és innovatív érvelési képességeket mutatnak be.

A DeepSeek új modellekkel forradalmasítja az AI-t – verseny az OpenAIért!

2025. május 29-én a DeepSeek kínai startup új FOCUS-t adott ki az R1-es gondolkodási modelljéhez. Az R1-0528 modellt a Hugging Face fejlesztői platformon mutatták be, de hivatalos bejelentés nélkül. Magáról a modellről még nem tettek közzé részleteket, beleértve azt is, hogy hogyan viszonyul más AI-modellekhez. A jelenlegi LiveCodeBench rangsorban a DeepSeek R1 következtetési modellje a harmadik helyen áll a kódgenerálásban, közvetlenül az OpenAI o4 mini és o3 modelljei mögött.

A jelentések szerint a DeepSeek R1 modellje is felülmúlja versenytársait, köztük az xAI Grok 3 mini-t és az Alibaba Qwen 3-at. A DeepSeek képviselője egy WeChat csoportban elmondta, hogy a modell "kis tesztfrissítése" jelenleg folyamatban van. Annak ellenére, hogy széles körben elterjedt a vélekedés, hogy az Egyesült Államok exportellenőrzése hátráltatja a kínai mesterségesintelligencia-kutatás előrehaladását, a DeepSeek hangsúlyozta, hogy újonnan kiadott AI-modellei megegyeznek, vagy még jobbak is, mint az Egyesült Államokban, ráadásul alacsonyabb költséggel.

Relevancia a technológiai ipar számára

Az R1 modell januári piacra dobása a Kínán kívüli technológiai részvények csökkenéséhez is vezetett. A nagy kínai vállalatok, mint az Alibaba és a Tencent azóta 700 új modellt adtak ki, amelyek állítólag jobban teljesítenek, mint a DeepSeek. Ebben a versenyhelyzetben a Google úgy reagált, hogy kedvezményes hozzáférési szinteket vezetett be Gemini modelljéhez. Az OpenAI emellett csökkentette szolgáltatásai árait, és bevezetett egy kisebb számítási teljesítményt igénylő o3 Mini modellt.

A DeepSeek már tervezi utódmodelljének, az R2-nek a bemutatását, amelyet eredetileg 2025 májusára terveztek. A vállalat már ez év márciusában bemutatta a nagy nyelvű V3-as modelljének frissítését.

Innovatív AI modellek

Az R1 modellen kívül a DeepSeek két új AI modellt mutatott be: DeepSeek-R1-Zero és DeepSeek-R1. Az R1-Zero modellt kizárólag megerősítéses tanulással (RL) képezték, felügyelt adatokra támaszkodva. Ez azt mutatja, hogy az AI-modellek emberi beavatkozás nélkül is képesek okoskodni.

A DeepSeek R1 modell kihasználja a kezdeti adatokat, és az OpenAI modelljéhez hasonló teljesítményt ér el a matematika, a programozás és az érvelés terén. A DeepSeek hat további kompakt modellt is kiadott, amelyek desztillációval öröklik a nagyobb modellek tudását. Ezek közül a 32B modell felülmúlja az OpenAI-o1-minit különböző benchmarkokban.

A DeepSeek összes új modellje nyílt forráskódú, és a DeepSeek platformon keresztül vagy helyileg is használható, így a technológia még könnyebben elérhető.

További információért látogasson el a következő oldalra Reuters vagy Bremerhaven városa.