Пока скептики продолжают утверждать, что искусственный интеллект никогда не обретёт сознание, небольшая китайская компания DeepSeek совершила невероятный прорыв. Она создала модель, которая соперничает с GPT-4, но при этом дешевле, открыта и доступна каждому.
Как за $5 млн сделать больше, чем OpenAI?
История DeepSeek – это настоящая «сказка про ботаников». Всё началось в хедж-фонде High-Flyer Quant, где в 2021 году предвидели, что GPU могут пригодиться не только для трейдинга. После введения американских санкций у компании оказалось 10 000 видеокарт, которые большую часть времени простаивали. Тогда глава фонда Лян Вэньфэн подумал: «А почему бы не попробовать создать ИИ? Это ведь круче, чем просто зарабатывать деньги».
Обычно обучение ИИ обходится в сотни миллионов долларов и требует тысяч серверных GPU. DeepSeek добилась аналогичных результатов с бюджетом в $5 млн, а их API стоит всего $0.14 за миллион токенов (в 17 раз дешевле, чем у OpenAI).
В чём секрет? Лень и математика.
1. Эффективная архитектура: Вместо традиционного подхода с миллионами GPU, их новая архитектура Multi-head Latent Attention (MLA) экономит 90% вычислений за счёт игнорирования 95% ненужных данных.
2. Экспертные системы: Вместо одной массивной модели работают специализированные модули, активирующиеся только по необходимости. 236 миллиардов параметров, но одновременно активны только 37 миллиардов. Это как нанять огромную команду экспертов, но вызывать только тех, кто нужен.
3. Оптимизация железа: DeepSeek сделала так, что их модели могут работать даже на игровых GPU, а не только на дорогих серверных.
Результат:
1. Стоимость разработки ИИ упала в 20 раз.
2. API в 95% дешевле.
3. Производительность на уровне GPT-4, но по доступной цене.
Почему это ломает индустрию?
Китай разрушает монополию западных корпораций на ИИ. Если раньше OpenAI и Meta могли требовать любые суммы за свои модели, то теперь DeepSeek с его ценниками заставляют задуматься, зачем платить больше.
Для Nvidia это проблема: Их бизнес строится на продаже дорогих серверных GPU, но если ИИ станет работать на дешёвом оборудовании, рынок ждёт встряска.
Американские корпорации уже в панике. Кто-то экстренно собирает совещания, кто-то снижает цены, а кто-то просто делает вид, что ничего не произошло. Но все понимают: это только начало, и придётся срочно реагировать.
Alibaba наносит второй удар: Qwen2.5
Если DeepSeek показала, что ИИ может быть дешевым, то Alibaba тоже не осталась в стороне и решила, что он может быть ещё и мощным. Их новая модель Qwen2.5-1M способна обрабатывать до миллиона токенов контекста. Для сравнения, ChatGPT Pro предлагает лишь 128 тысяч, и то за $200 в месяц.
Что может Qwen2.5-1M?
1. Работать с огромными текстами, базами данных и книгами без ограничений.
2. Обрабатывать информацию в 7 раз быстрее, чем ChatGPT.
3. Генерировать не только текст, но и изображения, и видео.
4. Работать бесплатно, без подписок и VPN.
5. И, конечно, всё это с открытым исходным кодом. Хотите создать свой стартап? Забирайте и используйте, как хотите.
Революция доступного ИИ
DeepSeek и Qwen2.5 – это не просто про технологии. Это про то, как несколько умных решений могут сломать монополию гигантов. Теперь ИИ перестаёт быть игрушкой для тех, у кого миллиарды, и становится инструментом, доступным каждому.
Китай больше не догоняет. Теперь другие страны начинают ломать голову над тем, как не отстать в этой гонке. А мы, кажется, начинаем наблюдать за чем-то очень интересным.
Итоги за день
1. Акции Nvidia упали на 8,5%.
2. ASML потеряла 9,5%.
Крипторынок тоже не спасся – Биткойн падал ниже $100 тыс, а альткоины просели на 10–20%.
Что думают аналитики?
Пока рынок штормит, крупные игроки пытаются оценить долгосрочное влияние DeepSeek:
1. Bernstein: Паника вокруг Nvidia и Broadcom преувеличена. Их позиции на рынке останутся сильными благодаря высокому спросу.
2. Citi: Да, Китай бросил вызов, но США сохраняют преимущество за счет доступа к передовым чипам Nvidia.
3. Raymond James: DeepSeek может перевернуть рынок, снизив потребность в огромных кластерах GPU. Это делает разработку AI-моделей дешевле и доступнее.
4. Cantor: Наоборот, хайп вокруг китайского стартапа подстегнет интерес к вычислительной технике.
5. JPMorgan: Технологии DeepSeek доказывают, что стоимость разработки ИИ можно снизить, а инвестиции в эту сферу часто переоценены.
6. Jefferies: Потенциал экономии от DeepSeek может проявиться уже к 2026 году – готовьтесь к новому витку конкуренции.
DeepSeek: слишком хорошо, чтобы быть правдой?
Тем временем, сервис DeepSeek не справился с наплывом пользователей. После стремительного роста популярности и выхода на первую строчку американского AppStore, платформа испытывает перебои в работе.
Это вызвало вопросы у экспертов: готова ли инфраструктура DeepSeek к массовому использованию, или перед нами всего лишь хайп с краткосрочным эффектом?
Что дальше?
Хотя DeepSeek наделал шума и потряс рынки, аналитики не спешат хоронить Nvidia и других гигантов. Стартап может ускорить развитие технологий, но глобальная инфраструктура GPU по-прежнему остается востребованной.
Что думаете? Это начало новой эры или просто вспышка, которая затухнет, не оставив следа?