Почему китайская ИИ-модель от DeepSeek — это начало новой «гонки вооружений»

Анонс DeepSeek-R1, модель которой была представлена 20 января 2025 года, стал причиной паники на рынках. Новый продукт, созданный компанией DeepSeek-AI (深度求索), специализирующейся на разработке ИИ и конкурирующей с OpenAI, обучался на более доступных чипах, что ставит под сомнение необходимость использования дорогих решений в обучении нейросетей.
Причины переполоха
Открытое распределение кода и весов модели DeepSeek-R1 предоставляет возможность любому желающему использовать ее на собственных мощностях, что значительно снижает барьеры для входа на рынок ИИ. Западные инвесторы начинают осознавать, что успех DeepSeek может угрожать господству США в этой области, а также снизить спрос на продукцию их производителей чипов.
Капитализация IT-сектора уже снизилась на $1 трлн, при этом Nvidia ощутила наибольшие потери, потеряв $590 млрд в рыночной стоимости, что стало рекордом за один день.
С момента анонса, модель привлекла внимание исследователей и энтузиастов, что привело к бурному росту интереса в западных СМИ 25-26 января. В это же время мобильное приложение DeepSeek стало более популярным, чем ChatGPT от OpenAI, благодаря бесплатному доступу к нейросети. В ответ на эти события, 27 января рынки начали реагировать на новый тренд.
Последствия появления доступного ИИ
С появлением DeepSeek-R1 на рынке, традиционные модели от OpenAI и Anthropic сталкиваются с потенциальной угрозой. Однако некоторые аналитики полагают, что такие новшества могут стимулировать дальнейшие достижения в области технологий, что в конечном итоге будет выгодно для всей индустрии. Долгосрочное влияние доступных моделей может создать конкуренцию и побудить к улучшению существующих технологий.
Несмотря на негативные последствия для производителей чипов, компании, использующие нейросети, получают выгоду от нововведений. Николай Давыдов, венчурный капиталист из Davidovs VC, считает, что стартапы, работающие с API запросами, окажутся в выигрышной ситуации.
Марк Андриссен, известный венчурный капиталист, сравнил DeepSeek-R1 с запуском первого спутника СССР, назвав ее «спутником-моментом» в ИИ.
Для российских пользователей DeepSeek представляет собой очевидное преимущество, позволяя избежать сложных процедур и ограничений, связанных с другими сервисами ИИ. С доступом через Gmail и низкими ценами на API-запросы, использование нейросети становится доступным для более широкого круга пользователей.
Кроме того, открытый код и возможность дообучения DeepSeek-R1 делают ее идеальным инструментом для интеграции в корпоративные системы, что особенно актуально для бизнеса в России, стремящегося внедрять ИИ-технологии без значительных затрат.
Разработка reasoning моделей
С начала 2023 года появились слухи о новых архитектурах OpenAI, стремящихся к созданию общего искусственного интеллекта (AGI). Эти ожидания оправдались в конце 2024 года с выходом моделей o1 и o3, которые продемонстрировали выдающиеся результаты. Однако их высокая стоимость эксплуатации остается значительным препятствием для большинства пользователей.
В отличие от них, DeepSeek-R1 предлагает открытый доступ к reasoning моделям, что привело к первоначальному скептицизму со стороны экспертов, но последующие тесты подтвердили ее конкурентоспособность.
Личный опыт и независимые тесты
Я провел тестирование DeepSeek-R1, проверяя ее способности в математике, программировании и обработке текстов. По результатам сравнения с решениями OpenAI, модель DeepSeek показала сравнимые результаты, а в некоторых случаях даже превзошла их, решив сложные задачи быстрее.
Исследования DeepSeek также подтверждают ее конкурентоспособность на бенчмарках AIME 2024 и MATH-500, где результаты модели близки к результатам OpenAI.
- AIME 2024: DeepSeek-R1 — 79,8%, OpenAI o1 — 79,2%.
- MATH-500: DeepSeek-R1 — 97,3%, OpenAI o1 — 96,4%
В тестах на программирование и понимание алгоритмов модели показали очень близкие результаты:
- Codeforces: DeepSeek-R1 — 96,3%, OpenAI o1 — 96,6%
- SWE-bench Verified: DeepSeek-R1 — 49,2%, OpenAI o1 — 48,9%
На бенчмарках на общие знания и языковые способности результаты также сравнимы:
- GPQA Diamond: DeepSeek-R1 — 71,5%, OpenAI o1 — 75,7%
- MMLU: DeepSeek-R1 — 90,8%, OpenAI o1 — 91,8%
Эти результаты подтверждают, что DeepSeek-R1 практически не уступает конкурентам, а в некоторых аспектах даже превосходит их.
Функциональные особенности новой модели
Интерфейс DeepSeek-R1 напоминает ChatGPT, но предоставляет дополнительные функции.
Обработка текстов и изображений. Модель может работать с документами и изображениями, генерируя ответы на основе загруженных материалов.
Режим DeepThink R1. Аналог reasoning моделей, позволяющий нейросети сначала анализировать запрос, прежде чем предоставить ответ.
Поиск информации. DeepSeek-R1 умеет искать данные в интернете и использовать их для формирования ответов.
Комбинирование функций. Модель позволяет объединять различные функции, например, загрузить документ, выполнить поиск и затем сформулировать ответ.
Тем временем, DeepSeek анонсировала новую модель Janus-Pro-7B, которая, по их утверждениям, превосходит DALL-E 3 от OpenAI в задачах генерации изображений. Однако пока нет возможности провести независимые тесты.
Будущее разработки
28 января DeepSeek сообщила о временных ограничениях на регистрацию новых пользователей из-за атак на платформу. Ситуация наблюдается второй день подряд на фоне растущего интереса к их продукту.
Недавние события не только поспособствовали колебаниям на мировых рынках, но и поставили под сомнение доминирование западных гигантов в сфере технологий ИИ. Доступность более дешевых ресурсов для обучения и открытый исходный код делают новые решения крайне привлекательными для пользователей, включая российских клиентов, которые ранее сталкивались с ограничениями.
Несмотря на первоначальные опасения, эксперты отмечают, что эта конкуренция может стать катализатором для инноваций в индустрии, снизив затраты на разработку и внедрение ИИ и открыв новые возможности для стартапов и компаний.
Таким образом, DeepSeek ставит под сомнение традиционные подходы в индустрии и открывает новые горизонты для пользователей. Вопрос лишь в том, насколько быстро смогут адаптироваться западные компании к этим изменениям.
Обсудим?
Смотрите также: