DeepSeek mullistaa tekoälyn uusilla malleilla – kilpailu OpenAI:lle!
Kiinalainen startup DeepSeek esittelee uusia tekoälymalleja, jotka ylittävät yhdysvaltalaisia kilpailijoita ja osoittavat innovatiivisia päättelykykyjä.
DeepSeek mullistaa tekoälyn uusilla malleilla – kilpailu OpenAI:lle!
29. toukokuuta 2025 kiinalainen startup DeepSeek julkaisi uuden FOCUS:n R1-päättelymallilleen. R1-0528-malli esiteltiin Hugging Face -kehittäjäalustalla, mutta ilman virallista ilmoitusta. Yksityiskohtia itse mallista, mukaan lukien sen vertailu muihin tekoälymalleihin, ei ole vielä julkaistu. Nykyisessä LiveCodeBench-luokituksessa DeepSeekin R1-päätelmämalli on kolmannella sijalla koodisukupolvessa, heti OpenAI:n o4 mini- ja o3-mallien jälkeen.
DeepSeekin R1-mallin on myös raportoitu ylittävän kilpailijansa, mukaan lukien xAI:n Grok 3 mini ja Alibaban Qwen 3. DeepSeekin edustaja sanoi WeChat-ryhmässä, että mallin "pieni testipäivitys" on parhaillaan käynnissä. Huolimatta laajalle levinneestä uskomuksesta, että Yhdysvaltojen viennin valvonta haittaa kiinalaisen tekoälytutkimuksen edistymistä, DeepSeek on korostanut, että sen hiljattain julkaistut tekoälymallit ovat yhtäläisiä tai jopa parempia kuin yhdysvaltalaiset ja halvemmalla.
Relevanssi teknologia-alalle
R1-mallin lanseeraus tammikuussa johti myös teknologiaosakkeiden laskuun Kiinan ulkopuolella. Suuret kiinalaiset yritykset, kuten Alibaba ja Tencent, ovat sittemmin julkaisseet 700 uutta mallia, joiden sanotaan ylittävän DeepSeekin. Tässä kilpailutilanteessa Google on vastannut ottamalla käyttöön edullisia pääsytasoja Gemini-malliinsa. OpenAI alensi myös palveluidensa hintoja ja esitteli o3 Mini -mallin, joka vaatii vähemmän laskentatehoa.
DeepSeek suunnittelee jo seuraajamallinsa, R2:n esittelyä, joka alun perin oli tarkoitus julkaista toukokuussa 2025. Yritys oli jo esitellyt päivityksen suureen kielimalliinsa V3 tämän vuoden maaliskuussa.
Innovatiiviset AI-mallit
R1-mallin lisäksi DeepSeek on esitellyt kaksi uutta tekoälymallia: DeepSeek-R1-Zero ja DeepSeek-R1. R1-Zero-malli opetettiin yksinomaan vahvistusoppimisen (RL) avulla ilman, että turvauduttiin valvottuihin tietoihin. Tämä osoittaa, että tekoälymallit voivat kehittää kykyä päätellä ilman ihmisen panosta.
DeepSeek R1 -malli hyödyntää lähtötietoja ja saavuttaa suorituskyvyn, joka on verrattavissa OpenAI:n malleihin matematiikassa, ohjelmoinnissa ja päättelyssä. DeepSeek on myös julkaissut kuusi kompaktimpaa mallia, jotka perivät isompien mallien tietämyksen tislaamalla. Niistä 32B-malli ylittää OpenAI-o1-minin useissa vertailuissa.
Kaikki DeepSeekin uudet mallit ovat avoimen lähdekoodin, ja niitä voidaan käyttää DeepSeek-alustan kautta tai paikallisesti, mikä tekee tekniikasta entistä helpomman pääsyn.
Lisätietoja on osoitteessa Reuters tai Bremerhavenin kaupunki.