DeepSeek sukelia revoliuciją AI su naujais modeliais – OpenAI konkursas!

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Kinijos startuolis „DeepSeek“ pristato naujus AI modelius, kurie pranoksta JAV konkurentus ir demonstruoja naujoviškas argumentavimo galimybes.

DeepSeek sukelia revoliuciją AI su naujais modeliais – OpenAI konkursas!

2025 m. gegužės 29 d. Kinijos startuolis DeepSeek išleido naują FOCUS savo R1 samprotavimo modeliui. R1-0528 modelis buvo pristatytas kūrėjų platformoje Hugging Face, tačiau be oficialaus pranešimo. Išsami informacija apie patį modelį, įskaitant jo palyginimą su kitais AI modeliais, dar nepaskelbta. Dabartiniame „LiveCodeBench“ reitinge „DeepSeek“ R1 išvadų modelis užima trečią vietą pagal kodų generavimą, iškart po „OpenAI“ o4 mini ir o3 modelių.

Pranešama, kad DeepSeek R1 modelis taip pat lenkia savo konkurentus, įskaitant xAI Grok 3 mini ir Alibaba Qwen 3. DeepSeek atstovas WeChat grupėje teigė, kad šiuo metu vyksta „mažas bandomasis modelio atnaujinimas“. Nepaisant plačiai paplitusio įsitikinimo, kad JAV eksporto kontrolė trukdo Kinijos dirbtinio intelekto tyrimų pažangai, „DeepSeek“ pabrėžė, kad jos naujai išleisti dirbtinio intelekto modeliai yra lygūs ar net pranašesni už JAV modelius ir už mažesnę kainą.

Aktualumas technologijų pramonei

R1 modelio pristatymas sausį taip pat lėmė technologijų atsargų mažėjimą už Kinijos ribų. Didžiosios Kinijos kompanijos, tokios kaip „Alibaba“ ir „Tencent“, nuo tada išleido 700 naujų modelių, kurie, kaip teigiama, pranoksta „DeepSeek“. Esant tokiai konkurencinei aplinkai, „Google“ atsakė savo „Gemini“ modeliui suteikdama nuolaidų prieigos lygius. OpenAI taip pat sumažino savo paslaugų kainas ir pristatė o3 Mini modelį, kuriam reikia mažiau skaičiavimo galios.

„DeepSeek“ jau planuoja pristatyti savo įpėdinį R2, kuris iš pradžių turėjo būti išleistas 2025 m. gegužę. Šių metų kovą bendrovė jau pristatė savo didelio kalbinio modelio V3 atnaujinimą.

Inovatyvūs AI modeliai

Be R1 modelio, DeepSeek pristatė du naujus AI modelius: DeepSeek-R1-Zero ir DeepSeek-R1. R1-Zero modelis buvo apmokytas tik naudojant sustiprinimo mokymąsi (RL), nepasikliaujant prižiūrimais duomenimis. Tai rodo, kad AI modeliai gali ugdyti gebėjimą mąstyti be žmogaus indėlio.

„DeepSeek R1“ modelis naudoja pradinius duomenis ir pasiekia našumą, panašų į OpenAI modelius matematikos, programavimo ir samprotavimo srityse. „DeepSeek“ taip pat išleido dar šešis kompaktiškus modelius, kurie per distiliavimą paveldi žinias apie didesnius modelius. Tarp jų 32B modelis įvairiuose etalonuose lenkia OpenAI-o1-mini.

Visi nauji „DeepSeek“ modeliai yra atvirojo kodo ir gali būti naudojami per „DeepSeek“ platformą arba lokaliai, todėl technologija pasiekiama dar lengviau.

Norėdami gauti daugiau informacijos, apsilankykite Reuters arba Bremerhaveno miestas.