در حالی که شکاکان همچنان استدلال می کنند که هوش مصنوعی هرگز به آگاهی نخواهد رسید، یک شرکت کوچک چینی DeepSeek یک پیشرفت باورنکردنی ایجاد کرد. او مدلی را ایجاد کرد که رقیب GPT-4 است، اما ارزان تر، باز و در دسترس همه است.
چگونه برای $5 میلیون بیشتر از OpenAI انجام دهیم؟
داستان DeepSeek یک داستان واقعی است. همه چیز از صندوق تامینی High-Flyer Quant شروع شد، جایی که در سال 2021 آنها پیش بینی کردند که GPU ها می توانند برای چیزی بیش از تجارت مفید باشند. پس از اعمال تحریم های آمریکا، این شرکت خود را با 10000 کارت گرافیک دید که بیشتر اوقات بیکار بودند. سپس رئیس بنیاد، لیانگ ونفنگ، فکر کرد: «چرا برای ایجاد هوش مصنوعی تلاش نکنیم؟ جالب تر از پول درآوردن است.»
آموزش هوش مصنوعی معمولاً صدها میلیون دلار هزینه دارد و به هزاران GPU سرور نیاز دارد. DeepSeek با بودجه $5 میلیون به نتایج مشابهی دست یافت و API آنها فقط $0.14 در هر میلیون توکن (17 برابر ارزانتر از OpenAI) هزینه دارد.
راز چیست؟ تنبلی و ریاضیات.
1. معماری کارآمد: به جای رویکرد سنتی میلیون ها پردازنده گرافیکی، معماری جدید توجه پنهان چند سر (MLA) آنها با نادیده گرفتن 95% داده های غیر ضروری، 90% محاسبات را ذخیره می کند.
2. سیستم های خبره: به جای یک مدل عظیم، ماژول های تخصصی وجود دارد که فقط در صورت لزوم فعال می شوند. 236 میلیارد پارامتر، اما تنها 37 میلیارد به طور همزمان فعال هستند. این مانند استخدام یک تیم عظیم از کارشناسان است، اما فقط با کسانی که نیاز دارند تماس بگیرید.
3. بهینه سازی سخت افزار: DeepSeek آن را به گونهای ساخته است که مدلهای آنها حتی میتوانند بر روی پردازندههای گرافیکی بازی اجرا شوند، و نه فقط بر روی پردازندههای گرافیکی سرور گران قیمت.
نتیجه:
1. هزینه توسعه هوش مصنوعی 20 برابر کاهش یافته است.
2. API در 95% ارزان تر است.
3. عملکرد در سطح GPT-4، اما با قیمت مقرون به صرفه.
چرا این صنعت را می شکند؟
چین در حال شکستن انحصار شرکت های غربی در زمینه هوش مصنوعی است. اگر قبلا OpenAI و Meta میتوانستند هر مبلغی را برای مدلهای خود مطالبه کنند، اکنون DeepSeek با برچسبهای قیمتی که دارد باعث میشود تعجب کنید که چرا بیشتر بپردازید.
برای Nvidia این یک مشکل است: تجارت آنها بر اساس فروش پردازنده های گرافیکی سرور گران قیمت است، اما اگر هوش مصنوعی شروع به کار با سخت افزار ارزان کند، بازار متزلزل خواهد شد.
شرکت های آمریکایی در حال حاضر وحشت زده شده اند. برخی از افراد جلسات فوری برگزار می کنند، برخی قیمت ها را کاهش می دهند و برخی به سادگی وانمود می کنند که هیچ اتفاقی نیفتاده است. اما همه میدانند: این تازه آغاز راه است و ما باید فوراً واکنش نشان دهیم.
علی بابا دوم شد: Qwen2.5
اگر DeepSeek نشان داد که هوش مصنوعی می تواند ارزان باشد، پس علی بابا نیز کنار نرفت و تصمیم گرفت که می تواند قدرتمند نیز باشد. مدل جدیدشون Qwen2.5-1M قادر به پردازش تا یک میلیون توکن زمینه است. برای مقایسه، ChatGPT Pro فقط 128 هزار و سپس $200 در ماه ارائه می دهد.
Qwen2.5-1M چه کاری می تواند انجام دهد؟
1. بدون محدودیت با متون، پایگاه داده ها و کتاب های عظیم کار کنید.
2. اطلاعات را 7 برابر سریعتر از ChatGPT پردازش کنید.
3. نه تنها متن، بلکه تصاویر و ویدیوها را نیز تولید کنید.
4. به صورت رایگان، بدون اشتراک یا VPN کار کنید.
5. و البته همه اینها متن باز هستند. آیا می خواهید استارت آپ خود را ایجاد کنید؟ آن را بگیرید و هر طور که می خواهید از آن استفاده کنید.
انقلاب هوش مصنوعی در دسترس
DeepSeek و Qwen2.5 - این فقط در مورد تکنولوژی نیست. این در مورد این است که چگونه چند راه حل هوشمند می توانند انحصار غول ها را بشکنند. اکنون هوش مصنوعی دیگر اسباب بازی آنهایی است که میلیاردها دلار دارند و به ابزاری در دسترس همه تبدیل شده است.
چین دیگر عقب نشینی نمی کند. اکنون کشورهای دیگر شروع به گیج شدن در مورد چگونگی ادامه دادن در این مسابقه کرده اند. و به نظر می رسد که ما شروع به مشاهده چیز بسیار جالبی کرده ایم.
نتایج روز
1. سهام Nvidia 8.5% سقوط کرد.
2. ASML 9.5% را از دست داد.
بازار کریپتو نیز نجات پیدا نکرد - بیت کوین کاهش یافت $100 هزار و آلت کوین ها 10–20% کاهش یافتند.
تحلیلگران چه فکر می کنند؟
در حالی که بازار طوفانی است، بازیگران اصلی سعی در ارزیابی تأثیر بلندمدت DeepSeek دارند:
1. برنشتاین: وحشت اطراف Nvidia و Broadcom بیش از حد است. موقعیت آنها در بازار به دلیل تقاضای قوی همچنان قوی خواهد بود.
2. سیتی: بله، چین یک چالش را کنار گذاشته است، اما ایالات متحده از طریق دسترسی به تراشه های پیشرفته انویدیا، مزیت خود را حفظ می کند.
3. ریموند جیمز: DeepSeek می تواند با کاهش نیاز به خوشه های GPU بزرگ، بازار را مختل کند. این امر توسعه مدل های هوش مصنوعی را ارزان تر و در دسترس تر می کند.
4. کانتور: برعکس، هیاهوی تبلیغاتی پیرامون استارتاپ چینی علاقه به محاسبات را برانگیخته است.
5. جی پی مورگان: فناوریهای DeepSeek ثابت میکنند که هزینه توسعه هوش مصنوعی میتواند کاهش یابد و سرمایهگذاریها در این زمینه اغلب بیش از حد ارزش گذاری میشوند.
6. جفریز: پتانسیل پس انداز از DeepSeek می تواند در اوایل سال 2026 آشکار شود - برای دور جدیدی از رقابت آماده شوید.
DeepSeek: خیلی خوب است که درست باشد؟
در ضمن سرویس DeepSeek نتوانست با هجوم کاربران کنار بیاید. پس از رشد سریع محبوبیت و رسیدن به رتبه یک در اپ استور آمریکایی، این پلتفرم با قطعی مواجه شده است.
این سؤالی را در بین کارشناسان ایجاد کرد: آیا زیرساخت DeepSeek برای استفاده انبوه آماده است یا این فقط تبلیغاتی است که تأثیری کوتاه مدت دارد؟
بعدش چی؟
اگرچه DeepSeek موج ایجاد کرد و بازارها را تکان داد، تحلیلگران عجله ای برای دفن انویدیا و غول های دیگر ندارند. این استارت آپ ممکن است توسعه فناوری را تسریع کند، اما زیرساخت GPU جهانی همچنان مورد تقاضا است.
نظر شما چیست؟ آیا این آغاز یک دوره جدید است یا فقط یک فلش است که بدون به جا گذاشتن اثری محو می شود؟