DeepSeek революционизира AI с нови модели - Конкуренция за OpenAI!

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Китайският стартъп DeepSeek представя нови AI модели, които превъзхождат американските конкуренти и демонстрират иновативни способности за разсъждение.

DeepSeek революционизира AI с нови модели - Конкуренция за OpenAI!

На 29 май 2025 г. китайският стартъп DeepSeek пусна нов FOCUS за своя модел на разсъждение R1. Моделът R1-0528 беше представен на платформата за разработчици Hugging Face, но без официално съобщение. Подробности за самия модел, включително как се сравнява с други AI модели, все още не са публикувани. В текущата класация на LiveCodeBench моделът за извод R1 на DeepSeek се нарежда на трето място в генерирането на код, точно зад моделите o4 mini и o3 на OpenAI.

Съобщава се също, че моделът R1 на DeepSeek превъзхожда своите конкуренти, включително Grok 3 mini на xAI и Qwen 3 на Alibaba. Представител на DeepSeek каза в WeChat група, че в момента се извършва „малка тестова надстройка“ на модела. Въпреки широко разпространеното убеждение, че американският контрол върху износа възпрепятства напредъка на китайските изследвания на ИИ, DeepSeek подчерта, че неговите новоиздадени модели на ИИ са равни или дори по-добри от тези от САЩ и на по-ниска цена.

Съответствие с технологичната индустрия

Пускането на модела R1 през януари също доведе до спад в технологичните запаси извън Китай. Големи китайски компании като Alibaba и Tencent оттогава пуснаха 700 нови модела, за които се твърди, че надминават DeepSeek. В тази конкурентна среда Google отговори, като въведе нива на достъп с отстъпка за своя модел Gemini. OpenAI също така намали цените на услугите си и представи модел o3 Mini, който изисква по-малко изчислителна мощност.

DeepSeek вече планира да представи своя модел наследник, R2, който първоначално беше планиран за пускане през май 2025 г. Компанията вече беше представила надстройка за своя голям езиков модел V3 през март тази година.

Иновативни AI модели

В допълнение към модела R1, DeepSeek представи два нови AI модела: DeepSeek-R1-Zero и DeepSeek-R1. Моделът R1-Zero беше обучен изключително чрез обучение с подсилване (RL), без да се разчита на контролирани данни. Това показва, че AI моделите могат да развият способността за разсъждение без човешка намеса.

Моделът DeepSeek R1 използва първоначални данни и постига производителност, сравнима с моделите на OpenAI по математика, програмиране и мислене. DeepSeek също пусна шест по-компактни модела, които наследяват знанията на по-големите модели чрез дестилация. Сред тях моделът 32B превъзхожда OpenAI-o1-mini в различни бенчмаркове.

Всички нови модели на DeepSeek са с отворен код и могат да се използват чрез платформата DeepSeek или локално, което прави технологията още по-лесна за достъп.

За повече информация, моля посетете Ройтерс или Град Бремерхафен.