DeepSeek revolucionira AI z novimi modeli - Tekmovanje za OpenAI!

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Kitajski startup DeepSeek predstavlja nove modele umetne inteligence, ki prekašajo ameriške konkurente in prikazujejo inovativne zmožnosti razmišljanja.

DeepSeek revolucionira AI z novimi modeli - Tekmovanje za OpenAI!

29. maja 2025 je kitajsko zagonsko podjetje DeepSeek izdalo nov FOCUS za svoj model razmišljanja R1. Model R1-0528 je bil predstavljen na razvijalski platformi Hugging Face, a brez uradne objave. Podrobnosti o samem modelu, vključno s tem, kako se primerja z drugimi modeli AI, še niso bile objavljene. Na trenutni lestvici LiveCodeBench je DeepSeekov inferenčni model R1 na tretjem mestu pri ustvarjanju kode, takoj za modeloma OpenAI o4 mini in o3.

DeepSeekov model R1 naj bi prav tako prekašal svoje konkurente, vključno z xAI-jevim Grok 3 mini in Alibabinim Qwen 3. Predstavnik DeepSeeka je v skupini WeChat dejal, da trenutno poteka "majhna testna nadgradnja" modela. Kljub razširjenemu prepričanju, da ameriški nadzor izvoza ovira napredek kitajskih raziskav AI, je DeepSeek poudaril, da so njegovi na novo izdani modeli AI enaki ali celo boljši od tistih iz ZDA in po nižji ceni.

Pomen za tehnološko industrijo

Lansiranje modela R1 januarja je povzročilo tudi upad tehnoloških zalog zunaj Kitajske. Večja kitajska podjetja, kot sta Alibaba in Tencent, so od takrat izdala 700 novih modelov, ki naj bi prekašali DeepSeek. V tej konkurenčni pokrajini se je Google odzval z uvedbo znižanih stopenj dostopa do svojega modela Gemini. OpenAI je znižal tudi cene svojih storitev in predstavil model o3 Mini, ki zahteva manj računalniške moči.

DeepSeek že načrtuje predstavitev svojega naslednika modela R2, ki je bil prvotno načrtovan za izid maja 2025. Podjetje je že marca letos predstavilo nadgradnjo za svoj veliki jezikovni model V3.

Inovativni modeli AI

Poleg modela R1 je DeepSeek predstavil dva nova modela AI: DeepSeek-R1-Zero in DeepSeek-R1. Model R1-Zero je bil usposobljen izključno z učenjem z okrepitvijo (RL) brez zanašanja na nadzorovane podatke. To kaže, da lahko modeli AI razvijejo sposobnost sklepanja brez človeškega vnosa.

Model DeepSeek R1 izkorišča začetne podatke in dosega zmogljivost, primerljivo z modeli OpenAI v matematiki, programiranju in sklepanju. DeepSeek je izdal tudi šest kompaktnejših modelov, ki z destilacijo podedujejo znanje večjih modelov. Med njimi je model 32B boljši od OpenAI-o1-mini v različnih merilih uspešnosti.

Vsi novi modeli DeepSeek so odprtokodni in jih je mogoče uporabljati prek platforme DeepSeek ali lokalno, zaradi česar je dostop do tehnologije še lažji.

Za več informacij obiščite Reuters oz Mesto Bremerhaven.