همه چیز درباره استارت‌آپ چینی DeepSeek و موفقیت چشمگیر آن در توسعه هوش مصنوعی

واحد خبر mobile.ir : همه کارشناسان اتفاق نظر دارند که رونمایی استارت‌آپ آمریکایی OpenAI از مدل هوش مصنوعی ChatGPT در سال 2022، نقطه عطفی در صنعت هوش مصنوعی به حساب می‌آید. به دنبال این اتفاق مهم، دیگر کمپانی‌های آمریکایی نظیر متا و گوگل نیز با معرفی مدل‌های هوش مصنوعی خود (Llam و Gemini) نشان دادند که در این زمینه حرف‌های زیادی برای گفتن دارند. لذا تا همین اواخر تصور می‌شد شرکت‌های آمریکایی سلطان بی‌چون‌وچرای صنعت هوش مصنوعی بوده و قواعد بازی را آنها تعیین می‌کنند. اما به یکباره، یک مدل هوش مصنوعی از یک شرکت چینی ناشناخته به نام DeepSeek توانست در مدت زمان بسیار کوتاه، به موفقیت چشمگیری دست یافته و در اصطلاح قواعد بازی را بر هم بزند.

طبق گزارشی که روز دوشنبه 27 ژانویه 2025 (8 بهمن 1403) از سوی CNN منتشر شد، مدل هوش مصنوعی قدرتمندی به نام DeepSeek-R1، ضمن غافلگیر کردن صنعت هوش مصنوعی، وال‌استریت را نیز دستپاچه کرده است. همان طور که گفته شد، این مدل هوش مصنوعی توسط مهندسین DeepSeek توسعه یافته است؛ استارت‌آپی چینی که یک سال بیشتر از تأسیس آن نمی‌گذرد، اما در همین مدت کوتاه به چنان موفقیت چشمگیری دست یافته که مارک اندریسن (Marc Andreessen)، سرمایه‌گذار معروف حوزه تکنولوژی، از آن به عنوان «لحظه اسپوتنیک هوش مصنوعی» یاد کرده است. این تعبیر، با اشاره به تقدم روس‌ها در فرستادن نخستین ماهواره به فضا و تلاش آمریکا برای پیشی گرفتن از آنها، به این معناست که چین با درک برتری تکنولوژیک آمریکا در هوش مصنوعی، به جبران کمبودهای خود در این حوزه پرداخته و در حال رسیدن به آمریکاست.

موفقیت DeepSeek را از چند جهت می‌توان بررسی کرد. در وهله اول باید بدانیم این استارت‌آپ چینی تنها با صرف هزینه‌ای معادل 5.6 میلیون دلار موفق به توسعه مدل هوش مصنوعی قدرتمندی شده که به اذعان کارشناسان، قابلیت‌های آن با امثال GPT-4، جمنای و Llam برابری می‌کند؛ این در حالی‌ست که کمپانی‌های آمریکایی تاکنون صدها میلیون دلار (اگر نگوییم میلیاردها) برای توسعه مدل‌های خود هزینه کرده‌اند. اما قضیه زمانی جالب‌تر می‌شود که بدانید، ایالات متحده سال‌هاست که با اعمال تحریم‌های متعدد علیه چین، مانع از دست یافتن کمپانی‌های چینی به تراشه‌های قدرتمند هوش مصنوعی شده است. به عبارت دقیق‌تر، DeepSeek مدل هوش مصنوعی کم‌هزینه خود را (ظاهراً) با استفاده از تراشه‌های نه چندان قدرتمند به سرانجام رسانده است.

استارت‌آپ DeepSeek را بهتر بشناسیم

استارت‌آپ DeepSeek اواخر سال 2023 توسط لیانگ ونفنگ (Liang Wenfeng) در شهر هانگژو پایه‌گذاری شد. ونفنگ – که مدیریت یک صندوق سرمایه‌گذاری پوششی به نام High-Flyer را نیز بر عهده دارد – در مارچ 2023، در حساب رسمی خود در WeChat اعلام کرد که قصد دارد منابع صندوق را جهت بررسی ماهیت AGI (هوش مصنوعی عمومی) روی راه‌اندازی یک گروه پژوهشی جدید و مستقل متمرکز کند. کمی بعد از این اتفاق، DeepSeek متولد شد.

رقم سرمایه‌گذاری صندوق High-Flyer در استارت‌‌آپ DeepSeek مشخص نیست، اما لازم به ذکر است، این صندوق در همان ساختمانی که DeepSeek فعالیت می‌کند صاحب دفتر بوده و مالکیت پتنت‌های مربوط به خوشه‌های تراشه مورد استفاده در تعلیم دادن مدل‌های هوش مصنوعی DeepSeek نیز در اختیار همین صندوق است. گفتنی‌ست، طبق ادعای واحد هوش مصنوعی High-Flyer در جولای 2022، این صندوق مالکیت و مدیریت یک خوشه 10 هزارتایی از تراشه‌های A100 را بر عهده دارد.

همچون دیگر استارت‌آپ‌های فعال در حوزه هوش مصنوعی – مثل Anthropic و Perplexity – استارت‌آپ DeepSeek نیز طی یک سال اخیر مدل‌های متنوعی از هوش مصنوعی عرضه کرد که برخی از آنها مورد توجه قرار گرفت. به عنوان مثال، DeepSeek-V3 که بر بستر زبان و فرهنگ چینی بهینه شده، برای طیف وسیعی از کارکردها – از جمله پردازش طبیعی زبان، خدمات مشتریان، آموزش و سلامت و بهداشت – طراحی شده است. البته V3 در موضوعات حساس مرتبط با دولت چین و حکمرانی آن محدودیت‌هایی داشته و از این رو به گفته وال‌استریت ژورنال بعید است بتواند به عنوان رقیبی جدی در صنعت هوش مصنوعی به حیات خود ادامه دهد.

برخلاف V3، مدل DeepSeek-R1 یک نمونه تمام‌عیار از مدل‌های هوش مصنوعی به حساب می‌آید. R1 کار خود را بی‌مقدمه و ناگهانی آغاز کرد و پس از عرضه در هفته قبل، در کانون توجهات قرار گرفته است. در کنار کم‌هزینه بودن، متن-باز بودن DeepSeek-R1 نیز یکی دیگر از مزایای این مدل هوش مصنوعی بوده و این امکان را به کمپانی‌های دیگر می‌دهد که بتوانند برای بهبود آن تلاش کنند. بد نیست بدانید، طی هفته گذشته، اپلیکیشن DeepSeek در بین اپلیکیشن‌های محبوب اپ استور اپل بالاتر از ChatGPT قرار گرفته و حدود 2 میلیون بار دانلود شده است.

چرا DeepSeek تا این اندازه مهم شده است؟

هوش مصنوعی از جمله فناوری‌هایی‌ست که به صرف هزینه‌های گزاف و همچنین انرژی زیاد نیاز دارد؛ آنقدر زیاد که برخی از رهبران عرصه فناوری در آمریکا جهت تأمین برق مورد نیاز برای مدل‌های هوش مصنوعی خود اقدام به خرید کمپانی‌های انرژی هسته‌ای کرده‌اند! متا هفته گذشته از برنامه خود برای صرف بیش از 65 میلیارد دلار در سال جاری برای توسعه هوش مصنوعی خبر داد. به گفته سم آلتمن (Sam Altman)، مدیرعامل OpenAI، مدل‌های پیشرفته هوش مصنوعی به مراکز داده‌ای نیاز دارند که مصرف برق بالایی دارد. در ساخت این مراکز داده نیز از تراشه‌های قدرتمندی استفاده می‌شود که توسعه آنها به سرمایه‌گذاری چندین تریلیون دلاری نیاز دارد.

در چنین شرایطی، به یکباره خبر موفقیت یک استارت‌آپ چینی گمنام در توسعه یک مدل هوش مصنوعی قدرتمند با هزینه‌ای بسیار پایین‌تر از رقبای آمریکایی، ضمن اینکه بسیار شوکه‌کننده است، می‌تواند تصور قبلی ما از مقدار سرمایه مورد نیاز برای توسعه هوش مصنوعی را دگرگون کند. نکته جالب‌تر اینکه حتی استفاده از DeepSeek-R1 – بسته به نوع کاری که از آن انتظار دارید – 20 تا 50 برابر ارزان‌تر از OpenAI o1 است. لذا رسیدن به موفقیتی چشمگیر با این هزینه‌های پایین، می‌تواند عملکرد کمپانی‌های آمریکایی رقیب را زیر سوال برده و استدلال آنها برای صرف هزینه‌های هنگفت را به چالش بکشد.

برخی کارشناسان درباره موفقیت ناگهانی DeepSeek شک و شبهه ایجاد کرده و واقعیت را فراتر از آنچه گفته شده می‌دانند. به عنوان مثال، الکساندر وانگ (Alexandr Wang)، مدیرعامل Scale AI، طی مصاحبه‌ای با CNBC، مدعی شد که DeepSeek در توسعه مدل هوش مصنوعی خود از 50 هزار تراشه Nvidia H100 استفاده کرده است. به گفته وی – که هیچ مدرکی برای صحت حرف‌های خود ارائه نکرد – این امر هیچ‌گاه رسماً اعلام نشد زیرا تحریم‌های آمریکا مبنی بر ممنوعیت فروش چنین تراشه‌های پیشرفته‌ای به کمپانی‌های چینی را نقض می‌کرد. البته DeepSeek هنوز به این اظهارات واکنشی نشان نداده است. تحلیلگران مؤسسه Brenstein نیز هزینه صرف‌شده برای تعلیم دادن مدل هوش مصنوعی DeepSeek را به مراتب بالاتر از 5.6 میلیون دلاری می‌دانند که به گفته این استارت‌آپ برای توان پردازشی این مدل هزینه شده است.

پیامد DeepSeek برای آمریکا چه خواهد بود؟

ایالات متحده به بهانه ارتقاء امنیت ملی خود، با وضع تحریم‌هایی علیه کمپانی‌های چینی آنها را از خرید تراشه‌های پیشرفته آمریکایی محروم کرد. درست یک هفته قبل از ترک کاخ سفید، جو بایدن محدودیت‌های بیشتری را برای ممنوعیت صادرات تراشه‌های هوش مصنوعی به کمپانی‌های چینی وضع کرد. اما در پایان شاهد آن بودیم که استارت‌آپ گمنامی مثل DeepSeek تمام این تحریم‌ها را زیر سوال برد و تابوی شکست‌ناپذیری آمریکا را با تهدیدی جدی مواجه کرد.

شاید آمریکا با اعمال این تحریم‌ها برای خود وقت خریده باشد، اما باید پذیرفت که سردمداری کمپانی‌های آمریکایی در عرصه هوش مصنوعی به شدت کمرنگ شده است. DeepSeek نشان داد که محدود کردن دسترسی به یک تکنولوژی کلیدی الزاماً به معنای آن نیست که ایالات متحده پیروز خواهد شد. به گفته کارشناسان CNN، این می‌تواند پیام مهمی برای دونالد ترامپ باشد؛ رییس جمهوری که همچنان سیاست انزواطلبانه «اول آمریکا» را دنبال می‌کند. گفتنی‌ست به دنبال موفقیت چشمگیر DeepSeek در هفته اخیر، شاهد کاهش ارزش سهام بسیاری از کمپانی‌های فناوری آمریکایی از جمله Nvidia، متا، آلفابت، marvell، برادکام، Palantir، Oracle و … بودیم.

جایگاه DeepSeek در دولت چین

موفقیت استارت‌آپ DeepSeek پیش از این مورد توجه محافل سیاسی رده‌بالای چین قرار گرفته است. طبق گزارش خبرگزاری دولتی شینهوا، لیانگ ونفنگ، بنیانگذار DeepSeek، روز 20 ژانویه 2025 (1 بهمن 1403)، درست در همان روزی که DeepSeek-R1 در اختیار عموم قرار گرفت، در یک همایش غیرعلنی با حضور تجار و کارشناسان شرکت کرد که به میزبانی لی چیانگ (Li Qiang)، نخست‌ وزیر چین تشکیل شده بود. حضور لیانگ فنگ در این همایش نشانه آن است که موفقیت DeepSeek در راستای سیاست‌های پکن قرار دارد؛ سیاست‌هایی که هدف آن غلبه بر تحریم‌های واشنگتن و رسیدن به خودکفایی در صنایع راهبردی مثل هوش مصنوعی است. ناگفته نماند، رابین لی (Robin Li)، مدیرعامل Baidu، نیز سال گذشته در همایشی مشابه شرکت کرده بود.

source

EXPRESSJS - مجله تکنولوژی نرم افزار و سخت افزار

توسطexpressjs.ir

استارت‌آپ DeepSeek را بهتر بشناسیم

چرا DeepSeek تا این اندازه مهم شده است؟

پیامد DeepSeek برای آمریکا چه خواهد بود؟

جایگاه DeepSeek در دولت چین

توسط expressjs.ir

پست های مرتبط

کاهش طبیعی دردهای پس از زایمان با «سنبل‌الطیب»

گوگل مدل هوش مصنوعی Nano Banana Pro را رونمایی کرد

تئوری تازه سخنگوی دولت پزشکیان: در جنگ رسانه‌ای تمام عیاریم، کنارمان باشید!

You missed

کاهش طبیعی دردهای پس از زایمان با «سنبل‌الطیب»

گوگل مدل هوش مصنوعی Nano Banana Pro را رونمایی کرد

تئوری تازه سخنگوی دولت پزشکیان: در جنگ رسانه‌ای تمام عیاریم، کنارمان باشید!

سرمایه‌گذاری برای استفاده از ظرفیت ۳۰ میلیون تنی بنادر کشور

EXPRESSJS - مجله تکنولوژی نرم افزار و سخت افزار