Главные новости » Эксклюзив » Почему китайская ИИ-модель от DeepSeek — это начало новой «гонки вооружений»
Эксклюзив

Почему китайская ИИ-модель от DeepSeek — это начало новой «гонки вооружений»

131
Почему китайская ИИ-модель от DeepSeek — это начало новой «гонки вооружений»

Анонс DeepSeek-R1, модель которой была представлена 20 января 2025 года, стал причиной паники на рынках. Новый продукт, созданный компанией DeepSeek-AI (深度求索), специализирующейся на разработке ИИ и конкурирующей с OpenAI, обучался на более доступных чипах, что ставит под сомнение необходимость использования дорогих решений в обучении нейросетей.

Причины переполоха


Открытое распределение кода и весов модели DeepSeek-R1 предоставляет возможность любому желающему использовать ее на собственных мощностях, что значительно снижает барьеры для входа на рынок ИИ. Западные инвесторы начинают осознавать, что успех DeepSeek может угрожать господству США в этой области, а также снизить спрос на продукцию их производителей чипов.

Капитализация IT-сектора уже снизилась на $1 трлн, при этом Nvidia ощутила наибольшие потери, потеряв $590 млрд в рыночной стоимости, что стало рекордом за один день.

С момента анонса, модель привлекла внимание исследователей и энтузиастов, что привело к бурному росту интереса в западных СМИ 25-26 января. В это же время мобильное приложение DeepSeek стало более популярным, чем ChatGPT от OpenAI, благодаря бесплатному доступу к нейросети. В ответ на эти события, 27 января рынки начали реагировать на новый тренд.


Последствия появления доступного ИИ


С появлением DeepSeek-R1 на рынке, традиционные модели от OpenAI и Anthropic сталкиваются с потенциальной угрозой. Однако некоторые аналитики полагают, что такие новшества могут стимулировать дальнейшие достижения в области технологий, что в конечном итоге будет выгодно для всей индустрии. Долгосрочное влияние доступных моделей может создать конкуренцию и побудить к улучшению существующих технологий.


Несмотря на негативные последствия для производителей чипов, компании, использующие нейросети, получают выгоду от нововведений. Николай Давыдов, венчурный капиталист из Davidovs VC, считает, что стартапы, работающие с API запросами, окажутся в выигрышной ситуации.

Марк Андриссен, известный венчурный капиталист, сравнил DeepSeek-R1 с запуском первого спутника СССР, назвав ее «спутником-моментом» в ИИ.

Для российских пользователей DeepSeek представляет собой очевидное преимущество, позволяя избежать сложных процедур и ограничений, связанных с другими сервисами ИИ. С доступом через Gmail и низкими ценами на API-запросы, использование нейросети становится доступным для более широкого круга пользователей.


Кроме того, открытый код и возможность дообучения DeepSeek-R1 делают ее идеальным инструментом для интеграции в корпоративные системы, что особенно актуально для бизнеса в России, стремящегося внедрять ИИ-технологии без значительных затрат.


Разработка reasoning моделей


С начала 2023 года появились слухи о новых архитектурах OpenAI, стремящихся к созданию общего искусственного интеллекта (AGI). Эти ожидания оправдались в конце 2024 года с выходом моделей o1 и o3, которые продемонстрировали выдающиеся результаты. Однако их высокая стоимость эксплуатации остается значительным препятствием для большинства пользователей.

В отличие от них, DeepSeek-R1 предлагает открытый доступ к reasoning моделям, что привело к первоначальному скептицизму со стороны экспертов, но последующие тесты подтвердили ее конкурентоспособность.

Личный опыт и независимые тесты


Я провел тестирование DeepSeek-R1, проверяя ее способности в математике, программировании и обработке текстов. По результатам сравнения с решениями OpenAI, модель DeepSeek показала сравнимые результаты, а в некоторых случаях даже превзошла их, решив сложные задачи быстрее.

Исследования DeepSeek также подтверждают ее конкурентоспособность на бенчмарках AIME 2024 и MATH-500, где результаты модели близки к результатам OpenAI.


  • AIME 2024: DeepSeek-R1 — 79,8%, OpenAI o1 — 79,2%.

  • MATH-500: DeepSeek-R1 — 97,3%, OpenAI o1 — 96,4%


В тестах на программирование и понимание алгоритмов модели показали очень близкие результаты:


  • Codeforces: DeepSeek-R1 — 96,3%, OpenAI o1 — 96,6%

  • SWE-bench Verified: DeepSeek-R1 — 49,2%, OpenAI o1 — 48,9%


На бенчмарках на общие знания и языковые способности результаты также сравнимы:


  • GPQA Diamond: DeepSeek-R1 — 71,5%, OpenAI o1 — 75,7%

  • MMLU: DeepSeek-R1 — 90,8%, OpenAI o1 — 91,8%


Эти результаты подтверждают, что DeepSeek-R1 практически не уступает конкурентам, а в некоторых аспектах даже превосходит их.

Функциональные особенности новой модели


Интерфейс DeepSeek-R1 напоминает ChatGPT, но предоставляет дополнительные функции.


Обработка текстов и изображений. Модель может работать с документами и изображениями, генерируя ответы на основе загруженных материалов.
Режим DeepThink R1. Аналог reasoning моделей, позволяющий нейросети сначала анализировать запрос, прежде чем предоставить ответ.
Поиск информации. DeepSeek-R1 умеет искать данные в интернете и использовать их для формирования ответов.
Комбинирование функций. Модель позволяет объединять различные функции, например, загрузить документ, выполнить поиск и затем сформулировать ответ.

Тем временем, DeepSeek анонсировала новую модель Janus-Pro-7B, которая, по их утверждениям, превосходит DALL-E 3 от OpenAI в задачах генерации изображений. Однако пока нет возможности провести независимые тесты.

Будущее разработки


28 января DeepSeek сообщила о временных ограничениях на регистрацию новых пользователей из-за атак на платформу. Ситуация наблюдается второй день подряд на фоне растущего интереса к их продукту.

Недавние события не только поспособствовали колебаниям на мировых рынках, но и поставили под сомнение доминирование западных гигантов в сфере технологий ИИ. Доступность более дешевых ресурсов для обучения и открытый исходный код делают новые решения крайне привлекательными для пользователей, включая российских клиентов, которые ранее сталкивались с ограничениями.

Несмотря на первоначальные опасения, эксперты отмечают, что эта конкуренция может стать катализатором для инноваций в индустрии, снизив затраты на разработку и внедрение ИИ и открыв новые возможности для стартапов и компаний.

Таким образом, DeepSeek ставит под сомнение традиционные подходы в индустрии и открывает новые горизонты для пользователей. Вопрос лишь в том, насколько быстро смогут адаптироваться западные компании к этим изменениям.
0 комментариев
Обсудим?
Смотрите также:
Продолжая просматривать сайт topnews.kg вы принимаете политику конфидициальности.
ОК