DeepSeek revoluționează AI cu noi modele - O competiție pentru OpenAI!
Startup-ul chinez DeepSeek introduce noi modele AI care depășesc concurenții din SUA și demonstrează capacități inovatoare de raționament.
DeepSeek revoluționează AI cu noi modele - O competiție pentru OpenAI!
Pe 29 mai 2025, startup-ul chinez DeepSeek a lansat un nou FOCUS pentru modelul său de raționament R1. Modelul R1-0528 a fost prezentat pe platforma de dezvoltare Hugging Face, dar fără un anunț oficial. Detaliile despre modelul în sine, inclusiv modul în care se compară cu alte modele AI, nu au fost încă publicate. În clasamentul actual LiveCodeBench, modelul de inferență R1 al DeepSeek ocupă locul trei în generarea de cod, chiar în urma modelelor o4 mini și o3 ale OpenAI.
Modelul R1 al DeepSeek este, de asemenea, raportat că își depășește concurenții, inclusiv Grok 3 mini de la xAI și Qwen 3 de la Alibaba. Un reprezentant DeepSeek a declarat într-un grup WeChat că o „mică actualizare de testare” a modelului este în curs de desfășurare. În ciuda credinței larg răspândite că controalele exporturilor din SUA împiedică progresul cercetării chineze în domeniul inteligenței artificiale, DeepSeek a subliniat că modelele sale AI recent lansate sunt egale sau chiar superioare celor din SUA și la un cost mai mic.
Relevanță pentru industria tehnologică
Lansarea modelului R1 în ianuarie a dus și la o scădere a stocurilor de tehnologie în afara Chinei. Marile companii chineze precum Alibaba și Tencent au lansat de atunci 700 de modele noi despre care se spune că o depășesc pe DeepSeek. În acest peisaj competitiv, Google a răspuns introducând niveluri de acces reduse la modelul său Gemini. De asemenea, OpenAI a scăzut prețurile pentru serviciile sale și a introdus un model o3 Mini care necesită mai puțină putere de calcul.
DeepSeek intenționează deja să introducă modelul său succesor, R2, care inițial era programat pentru lansare în mai 2025. Compania prezentase deja un upgrade pentru modelul său mare de limbă V3 în martie a acestui an.
Modele inovatoare AI
Pe lângă modelul R1, DeepSeek a introdus două noi modele AI: DeepSeek-R1-Zero și DeepSeek-R1. Modelul R1-Zero a fost antrenat exclusiv folosind învățarea prin întărire (RL), fără a se baza pe date supravegheate. Acest lucru arată că modelele AI pot dezvolta capacitatea de a raționa fără aportul uman.
Modelul DeepSeek R1 folosește datele inițiale și atinge performanțe comparabile cu modelele OpenAI în matematică, programare și raționament. DeepSeek a mai lansat șase modele compacte care moștenesc cunoștințele modelelor mai mari prin distilare. Printre acestea, modelul 32B depășește OpenAI-o1-mini în diferite benchmark-uri.
Toate noile modele DeepSeek sunt open source și pot fi utilizate prin intermediul platformei DeepSeek sau local, făcând tehnologia și mai ușor de accesat.
Pentru mai multe informații, vă rugăm să vizitați Reuters sau Orașul Bremerhaven.