DeepSeek revolucionizē AI ar jauniem modeļiem — OpenAI konkurss!

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Ķīniešu jaunuzņēmums DeepSeek ievieš jaunus AI modeļus, kas pārspēj ASV konkurentus un demonstrē novatoriskas spriešanas spējas.

DeepSeek revolucionizē AI ar jauniem modeļiem — OpenAI konkurss!

2025. gada 29. maijā Ķīnas jaunuzņēmums DeepSeek izlaida jaunu FOCUS savam R1 spriešanas modelim. R1-0528 modelis tika prezentēts izstrādātāju platformā Hugging Face, taču bez oficiāla paziņojuma. Sīkāka informācija par pašu modeli, tostarp to, kā tas ir salīdzināms ar citiem AI modeļiem, vēl nav publicēts. Pašreizējā LiveCodeBench reitingā DeepSeek R1 secinājumu modelis ieņem trešo vietu kodu ģenerēšanā, tieši aiz OpenAI o4 mini un o3 modeļiem.

Tiek ziņots, ka DeepSeek R1 modelis arī pārspēj savus konkurentus, tostarp xAI Grok 3 mini un Alibaba Qwen 3. DeepSeek pārstāvis WeChat grupā sacīja, ka pašlaik notiek modeļa "neliels testa jauninājums". Neskatoties uz plaši izplatīto uzskatu, ka ASV eksporta kontrole kavē Ķīnas AI pētījumu progresu, DeepSeek ir uzsvēris, ka tā nesen izlaistie AI modeļi ir vienādi vai pat labāki par ASV modeļiem un par zemākām izmaksām.

Saistība ar tehnoloģiju nozari

R1 modeļa laišana klajā janvārī izraisīja arī tehnoloģiju krājumu samazināšanos ārpus Ķīnas. Lielākie Ķīnas uzņēmumi, piemēram, Alibaba un Tencent, kopš tā laika ir izlaiduši 700 jaunus modeļus, kas, domājams, pārspēj DeepSeek. Šajā konkurences situācijā Google ir reaģējusi, ieviešot savam Gemini modelim piekļuves līmeņus ar atlaidi. OpenAI arī pazemināja savu pakalpojumu cenas un ieviesa o3 Mini modeli, kas prasa mazāku skaitļošanas jaudu.

DeepSeek jau plāno ieviest savu pēcteci R2, kuru sākotnēji bija paredzēts izlaist 2025. gada maijā. Uzņēmums jau bija prezentējis jauninājumu savam lielajam valodas modelim V3 šī gada martā.

Inovatīvi AI modeļi

Papildus R1 modelim DeepSeek ir ieviesis divus jaunus AI modeļus: DeepSeek-R1-Zero un DeepSeek-R1. R1-Zero modelis tika apmācīts tikai, izmantojot pastiprināšanas mācīšanos (RL), nepaļaujoties uz uzraudzītiem datiem. Tas parāda, ka AI modeļi var attīstīt spēju spriest bez cilvēka ieguldījuma.

DeepSeek R1 modelis izmanto sākotnējos datus un nodrošina veiktspēju, kas salīdzināma ar OpenAI modeļiem matemātikā, programmēšanā un argumentācijā. DeepSeek ir arī izlaidis vēl sešus kompaktus modeļus, kas manto zināšanas par lielākiem modeļiem, izmantojot destilāciju. Tostarp 32B modelis dažādos etalonos pārspēj OpenAI-o1-mini.

Visi DeepSeek jaunie modeļi ir atvērtā koda, un tos var izmantot, izmantojot DeepSeek platformu vai lokāli, padarot tehnoloģiju vēl vieglāk pieejamu.

Lai iegūtu vairāk informācijas, lūdzu, apmeklējiet Reuters vai Brēmerhāfenes pilsēta.