DeepSeek muudab AI uute mudelitega revolutsiooniliseks – OpenAI võistlus!
Hiina idufirma DeepSeek tutvustab uusi tehisintellekti mudeleid, mis edestavad USA konkurente ja demonstreerivad uuenduslikku arutlusvõimet.
DeepSeek muudab AI uute mudelitega revolutsiooniliseks – OpenAI võistlus!
29. mail 2025 avaldas Hiina idufirma DeepSeek oma R1 arutlusmudeli jaoks uue FOCUS. R1-0528 mudelit esitleti arendajaplatvormil Hugging Face, kuid ilma ametliku teadaandeta. Mudeli enda kohta üksikasju, sealhulgas selle võrdlust teiste AI mudelitega, pole veel avaldatud. Praeguses LiveCodeBenchi edetabelis on DeepSeeki R1 järeldusmudel koodi genereerimises kolmandal kohal, OpenAI o4 mini ja o3 mudelite järel.
Väidetavalt ületab DeepSeeki mudel R1 ka oma konkurente, sealhulgas xAI Grok 3 mini ja Alibaba Qwen 3. DeepSeeki esindaja ütles WeChati grupis, et praegu on käimas mudeli "väike testuuendus". Hoolimata laialt levinud arvamusest, et USA ekspordikontroll takistab Hiina tehisintellektiuuringute edenemist, on DeepSeek rõhutanud, et tema äsja välja antud tehisintellekti mudelid on samaväärsed või isegi paremad kui USA mudelid ja madalamate kuludega.
Asjakohasus tehnoloogiatööstuse jaoks
R1 mudeli turule toomine jaanuaris tõi kaasa ka tehnoloogiavarude languse väljaspool Hiinat. Suured Hiina ettevõtted, nagu Alibaba ja Tencent, on sellest ajast peale välja andnud 700 uut mudelit, mis väidetavalt ületavad DeepSeeki. Sellel konkurentsivõimelisel maastikul on Google reageerinud, lisades oma Gemini mudelile soodushinnaga juurdepääsutasemed. OpenAI alandas ka oma teenuste hindu ja tutvustas o3 Mini mudelit, mis nõuab vähem arvutusvõimsust.
DeepSeek plaanib juba tutvustada oma järeltulija mudelit R2, mis pidi algselt ilmuma 2025. aasta mais. Ettevõte esitles oma suurele keelemudelile V3 uuendust juba selle aasta märtsis.
Uuenduslikud AI mudelid
Lisaks mudelile R1 on DeepSeek tutvustanud kahte uut AI mudelit: DeepSeek-R1-Zero ja DeepSeek-R1. R1-Zero mudelit koolitati eranditult tugevdusõppe (RL) abil, ilma jälgitavatele andmetele tuginemata. See näitab, et tehisintellekti mudelid võivad arendada arutlusvõimet ilma inimliku panuseta.
DeepSeek R1 mudel kasutab algandmeid ja saavutab OpenAI mudelitega võrreldava jõudluse matemaatikas, programmeerimises ja arutluskäigus. DeepSeek on välja andnud ka kuus kompaktsemat mudelit, mis pärivad destilleerimise teel teadmised suurematest mudelitest. Nende hulgas ületab 32B mudel OpenAI-o1-mini erinevates võrdlusnäitajates.
Kõik DeepSeeki uued mudelid on avatud lähtekoodiga ja neid saab kasutada nii DeepSeeki platvormi kaudu kui ka kohapeal, muutes tehnoloogiale juurdepääsu veelgi lihtsamaks.
Lisateabe saamiseks külastage Reuters või Bremerhaveni linn.