شرکت DeepSeek در حال آمادهسازی برای عرضه نسل جدید مدل زبانی بزرگ خود با نام DeepSeek-R2 است که پیشبینی میشود بین ۱۵ تا ۳۰ آگوست ۲۰۲۵ رونمایی شود. این بازه زمانی در جریان یک تعامل با مدل هوش مصنوعی خود شرکت فاش شده و حاکی از عرضه قریبالوقوع این مدل، تنها چند روز پس از انتشار ChatGPT-5 است.
پیشرفتهای معماری و توان پردازشی
انتظار میرود DeepSeek-R2 جهشی چشمگیر در معماری خود ایجاد کند و از ساختار پیشرفتهتر Mixture of Experts (MoE) بهره بگیرد. این مدل همچنین یک شبکه مسیریابی (gating network) هوشمندتر برای مدیریت بهتر بارهای کاری سنگین در مرحله استنتاج خواهد داشت.
به گفته منابع آگاه، این مدل میتواند تا ۱.۲ تریلیون پارامتر مقیاس پیدا کند؛ تقریباً دو برابر DeepSeek-R1 که ۶۷۱ میلیارد پارامتر داشت. با این حال، این رقم همچنان کمتر از ChatGPT-4/5 است که بیش از ۱.۸ تریلیون پارامتر دارند.
گامی به سوی خودکفایی هوش مصنوعی در چین
در حرکتی استراتژیک برای رسیدن به خودکفایی داخلی در حوزه هوش مصنوعی، این مدل بهطور کامل بر روی تراشههای Ascend 910B ساخت هواوی آموزش دیده است. خوشه پردازشی هواوی با توان ۵۱۲ پتافلاپس (FP16) و بهرهوری ۸۲٪، reportedly معادل ۹۱٪ عملکرد خوشه Nvidia A100 است. تحلیلگران این اقدام را گامی مهم در جهت کاهش وابستگی چین به سختافزار آمریکایی میدانند.
گزارشها حاکی است که هزینه آموزش DeepSeek-R2 نسبت به GPT-4 حدود ۹۷٪ کمتر بوده که این امر به لطف استفاده از سختافزار داخلی و تکنیکهای بهینهسازی محقق شده است. انتظار میرود DeepSeek دسترسی API این مدل را با قیمت پایینتری ارائه کند؛ اقدامی که میتواند مدلهای قیمتگذاری فعلی تحت سلطه OpenAI و Anthropic را تحت تأثیر قرار دهد.
واکنش بازار و نوآوریهای مرتبط
انتشار این خبر موجب تحرک در سهام شرکتهای فناوری چین شده است. سهام سازنده تراشه هوش مصنوعی Cambricon با رشد ۲۰ درصدی، ارزش بازار خود را به بیش از ۳۵۵ میلیارد یوان (حدود ۴۹.۷ میلیارد دلار) رساند.
در خبری مرتبط، هواوی چارچوب جدیدی برای استنتاج هوش مصنوعی با نام Unified Cache Manager (UCM) معرفی کرده است. این چارچوب با بهینهسازی مدیریت دادههای KV Cache در لایههای حافظه نظیر HBM، DRAM و SSD، باعث شتابدهی فرایند استنتاج میشود. طبق آزمایشهای انجام شده با China UnionPay، این فناوری باعث کاهش ۹۰ درصدی تأخیر و افزایش ۲۲ برابری توان پردازش شده است. هواوی قصد دارد UCM را در ماه سپتامبر به صورت متنباز منتشر کند.
نتیجهگیری
عرضه DeepSeek-R2 به همراه معرفی چارچوب UCM هواوی، نشاندهنده تغییری بزرگ در جاهطلبیهای چین برای حوزه هوش مصنوعی است. این تحولات نوید آیندهای را میدهند که در آن چین قادر خواهد بود سیستمهای هوش مصنوعی پیشرفته را بدون اتکا به تراشهها یا ابزارهای نرمافزاری غربی، توسعه و اجرا کند.