طبق گزارشی که روز دوشنبه 27 ژانویه 2025 (8 بهمن 1403) از سوی CNN منتشر شد، مدل هوش مصنوعی قدرتمندی به نام DeepSeek-R1، ضمن غافلگیر کردن صنعت هوش مصنوعی، والاستریت را نیز دستپاچه کرده است. همان طور که گفته شد، این مدل هوش مصنوعی توسط مهندسین DeepSeek توسعه یافته است؛ استارتآپی چینی که یک سال بیشتر از تأسیس آن نمیگذرد، اما در همین مدت کوتاه به چنان موفقیت چشمگیری دست یافته که مارک اندریسن (Marc Andreessen)، سرمایهگذار معروف حوزه تکنولوژی، از آن به عنوان «لحظه اسپوتنیک هوش مصنوعی» یاد کرده است. این تعبیر، با اشاره به تقدم روسها در فرستادن نخستین ماهواره به فضا و تلاش آمریکا برای پیشی گرفتن از آنها، به این معناست که چین با درک برتری تکنولوژیک آمریکا در هوش مصنوعی، به جبران کمبودهای خود در این حوزه پرداخته و در حال رسیدن به آمریکاست.
موفقیت DeepSeek را از چند جهت میتوان بررسی کرد. در وهله اول باید بدانیم این استارتآپ چینی تنها با صرف هزینهای معادل 5.6 میلیون دلار موفق به توسعه مدل هوش مصنوعی قدرتمندی شده که به اذعان کارشناسان، قابلیتهای آن با امثال GPT-4، جمنای و Llam برابری میکند؛ این در حالیست که کمپانیهای آمریکایی تاکنون صدها میلیون دلار (اگر نگوییم میلیاردها) برای توسعه مدلهای خود هزینه کردهاند. اما قضیه زمانی جالبتر میشود که بدانید، ایالات متحده سالهاست که با اعمال تحریمهای متعدد علیه چین، مانع از دست یافتن کمپانیهای چینی به تراشههای قدرتمند هوش مصنوعی شده است. به عبارت دقیقتر، DeepSeek مدل هوش مصنوعی کمهزینه خود را (ظاهراً) با استفاده از تراشههای نه چندان قدرتمند به سرانجام رسانده است.
استارتآپ DeepSeek را بهتر بشناسیم
استارتآپ DeepSeek اواخر سال 2023 توسط لیانگ ونفنگ (Liang Wenfeng) در شهر هانگژو پایهگذاری شد. ونفنگ – که مدیریت یک صندوق سرمایهگذاری پوششی به نام High-Flyer را نیز بر عهده دارد – در مارچ 2023، در حساب رسمی خود در WeChat اعلام کرد که قصد دارد منابع صندوق را جهت بررسی ماهیت AGI (هوش مصنوعی عمومی) روی راهاندازی یک گروه پژوهشی جدید و مستقل متمرکز کند. کمی بعد از این اتفاق، DeepSeek متولد شد.
رقم سرمایهگذاری صندوق High-Flyer در استارتآپ DeepSeek مشخص نیست، اما لازم به ذکر است، این صندوق در همان ساختمانی که DeepSeek فعالیت میکند صاحب دفتر بوده و مالکیت پتنتهای مربوط به خوشههای تراشه مورد استفاده در تعلیم دادن مدلهای هوش مصنوعی DeepSeek نیز در اختیار همین صندوق است. گفتنیست، طبق ادعای واحد هوش مصنوعی High-Flyer در جولای 2022، این صندوق مالکیت و مدیریت یک خوشه 10 هزارتایی از تراشههای A100 را بر عهده دارد.
همچون دیگر استارتآپهای فعال در حوزه هوش مصنوعی – مثل Anthropic و Perplexity – استارتآپ DeepSeek نیز طی یک سال اخیر مدلهای متنوعی از هوش مصنوعی عرضه کرد که برخی از آنها مورد توجه قرار گرفت. به عنوان مثال، DeepSeek-V3 که بر بستر زبان و فرهنگ چینی بهینه شده، برای طیف وسیعی از کارکردها – از جمله پردازش طبیعی زبان، خدمات مشتریان، آموزش و سلامت و بهداشت – طراحی شده است. البته V3 در موضوعات حساس مرتبط با دولت چین و حکمرانی آن محدودیتهایی داشته و از این رو به گفته والاستریت ژورنال بعید است بتواند به عنوان رقیبی جدی در صنعت هوش مصنوعی به حیات خود ادامه دهد.
برخلاف V3، مدل DeepSeek-R1 یک نمونه تمامعیار از مدلهای هوش مصنوعی به حساب میآید. R1 کار خود را بیمقدمه و ناگهانی آغاز کرد و پس از عرضه در هفته قبل، در کانون توجهات قرار گرفته است. در کنار کمهزینه بودن، متن-باز بودن DeepSeek-R1 نیز یکی دیگر از مزایای این مدل هوش مصنوعی بوده و این امکان را به کمپانیهای دیگر میدهد که بتوانند برای بهبود آن تلاش کنند. بد نیست بدانید، طی هفته گذشته، اپلیکیشن DeepSeek در بین اپلیکیشنهای محبوب اپ استور اپل بالاتر از ChatGPT قرار گرفته و حدود 2 میلیون بار دانلود شده است.
چرا DeepSeek تا این اندازه مهم شده است؟
هوش مصنوعی از جمله فناوریهاییست که به صرف هزینههای گزاف و همچنین انرژی زیاد نیاز دارد؛ آنقدر زیاد که برخی از رهبران عرصه فناوری در آمریکا جهت تأمین برق مورد نیاز برای مدلهای هوش مصنوعی خود اقدام به خرید کمپانیهای انرژی هستهای کردهاند! متا هفته گذشته از برنامه خود برای صرف بیش از 65 میلیارد دلار در سال جاری برای توسعه هوش مصنوعی خبر داد. به گفته سم آلتمن (Sam Altman)، مدیرعامل OpenAI، مدلهای پیشرفته هوش مصنوعی به مراکز دادهای نیاز دارند که مصرف برق بالایی دارد. در ساخت این مراکز داده نیز از تراشههای قدرتمندی استفاده میشود که توسعه آنها به سرمایهگذاری چندین تریلیون دلاری نیاز دارد.
در چنین شرایطی، به یکباره خبر موفقیت یک استارتآپ چینی گمنام در توسعه یک مدل هوش مصنوعی قدرتمند با هزینهای بسیار پایینتر از رقبای آمریکایی، ضمن اینکه بسیار شوکهکننده است، میتواند تصور قبلی ما از مقدار سرمایه مورد نیاز برای توسعه هوش مصنوعی را دگرگون کند. نکته جالبتر اینکه حتی استفاده از DeepSeek-R1 – بسته به نوع کاری که از آن انتظار دارید – 20 تا 50 برابر ارزانتر از OpenAI o1 است. لذا رسیدن به موفقیتی چشمگیر با این هزینههای پایین، میتواند عملکرد کمپانیهای آمریکایی رقیب را زیر سوال برده و استدلال آنها برای صرف هزینههای هنگفت را به چالش بکشد.
برخی کارشناسان درباره موفقیت ناگهانی DeepSeek شک و شبهه ایجاد کرده و واقعیت را فراتر از آنچه گفته شده میدانند. به عنوان مثال، الکساندر وانگ (Alexandr Wang)، مدیرعامل Scale AI، طی مصاحبهای با CNBC، مدعی شد که DeepSeek در توسعه مدل هوش مصنوعی خود از 50 هزار تراشه Nvidia H100 استفاده کرده است. به گفته وی – که هیچ مدرکی برای صحت حرفهای خود ارائه نکرد – این امر هیچگاه رسماً اعلام نشد زیرا تحریمهای آمریکا مبنی بر ممنوعیت فروش چنین تراشههای پیشرفتهای به کمپانیهای چینی را نقض میکرد. البته DeepSeek هنوز به این اظهارات واکنشی نشان نداده است. تحلیلگران مؤسسه Brenstein نیز هزینه صرفشده برای تعلیم دادن مدل هوش مصنوعی DeepSeek را به مراتب بالاتر از 5.6 میلیون دلاری میدانند که به گفته این استارتآپ برای توان پردازشی این مدل هزینه شده است.
پیامد DeepSeek برای آمریکا چه خواهد بود؟
ایالات متحده به بهانه ارتقاء امنیت ملی خود، با وضع تحریمهایی علیه کمپانیهای چینی آنها را از خرید تراشههای پیشرفته آمریکایی محروم کرد. درست یک هفته قبل از ترک کاخ سفید، جو بایدن محدودیتهای بیشتری را برای ممنوعیت صادرات تراشههای هوش مصنوعی به کمپانیهای چینی وضع کرد. اما در پایان شاهد آن بودیم که استارتآپ گمنامی مثل DeepSeek تمام این تحریمها را زیر سوال برد و تابوی شکستناپذیری آمریکا را با تهدیدی جدی مواجه کرد.
شاید آمریکا با اعمال این تحریمها برای خود وقت خریده باشد، اما باید پذیرفت که سردمداری کمپانیهای آمریکایی در عرصه هوش مصنوعی به شدت کمرنگ شده است. DeepSeek نشان داد که محدود کردن دسترسی به یک تکنولوژی کلیدی الزاماً به معنای آن نیست که ایالات متحده پیروز خواهد شد. به گفته کارشناسان CNN، این میتواند پیام مهمی برای دونالد ترامپ باشد؛ رییس جمهوری که همچنان سیاست انزواطلبانه «اول آمریکا» را دنبال میکند. گفتنیست به دنبال موفقیت چشمگیر DeepSeek در هفته اخیر، شاهد کاهش ارزش سهام بسیاری از کمپانیهای فناوری آمریکایی از جمله Nvidia، متا، آلفابت، marvell، برادکام، Palantir، Oracle و … بودیم.
جایگاه DeepSeek در دولت چین
موفقیت استارتآپ DeepSeek پیش از این مورد توجه محافل سیاسی ردهبالای چین قرار گرفته است. طبق گزارش خبرگزاری دولتی شینهوا، لیانگ ونفنگ، بنیانگذار DeepSeek، روز 20 ژانویه 2025 (1 بهمن 1403)، درست در همان روزی که DeepSeek-R1 در اختیار عموم قرار گرفت، در یک همایش غیرعلنی با حضور تجار و کارشناسان شرکت کرد که به میزبانی لی چیانگ (Li Qiang)، نخست وزیر چین تشکیل شده بود. حضور لیانگ فنگ در این همایش نشانه آن است که موفقیت DeepSeek در راستای سیاستهای پکن قرار دارد؛ سیاستهایی که هدف آن غلبه بر تحریمهای واشنگتن و رسیدن به خودکفایی در صنایع راهبردی مثل هوش مصنوعی است. ناگفته نماند، رابین لی (Robin Li)، مدیرعامل Baidu، نیز سال گذشته در همایشی مشابه شرکت کرده بود.
source