DeepSeek-R2 با 1.2 تریلیون پارامتر و معماری MoE پیشرفته، بین 15-30 آگوست 2025 رونمایی می‌شود. این مدل کاملاً روی تراشه‌های Ascend 910B هواوی آموزش دیده و هزینه آموزش آن 97% کمتر از GPT-4 است. همراه با چارچوب UCM هواوی، گامی بزرگ برای خودکفایی چین در هوش مصنوعی محسوب می‌شود.

شرکت DeepSeek در حال آماده‌سازی برای عرضه نسل جدید مدل زبانی بزرگ خود با نام DeepSeek-R2 است که پیش‌بینی می‌شود بین ۱۵ تا ۳۰ آگوست ۲۰۲۵ رونمایی شود. این بازه زمانی در جریان یک تعامل با مدل هوش مصنوعی خود شرکت فاش شده و حاکی از عرضه قریب‌الوقوع این مدل، تنها چند روز پس از انتشار ChatGPT-5 است.


پیشرفت‌های معماری و توان پردازشی

انتظار می‌رود DeepSeek-R2 جهشی چشمگیر در معماری خود ایجاد کند و از ساختار پیشرفته‌تر Mixture of Experts (MoE) بهره بگیرد. این مدل همچنین یک شبکه مسیریابی (gating network) هوشمندتر برای مدیریت بهتر بارهای کاری سنگین در مرحله استنتاج خواهد داشت.

به گفته منابع آگاه، این مدل می‌تواند تا ۱.۲ تریلیون پارامتر مقیاس پیدا کند؛ تقریباً دو برابر DeepSeek-R1 که ۶۷۱ میلیارد پارامتر داشت. با این حال، این رقم همچنان کمتر از ChatGPT-4/5 است که بیش از ۱.۸ تریلیون پارامتر دارند.


گامی به سوی خودکفایی هوش مصنوعی در چین

در حرکتی استراتژیک برای رسیدن به خودکفایی داخلی در حوزه هوش مصنوعی، این مدل به‌طور کامل بر روی تراشه‌های Ascend 910B ساخت هواوی آموزش دیده است. خوشه پردازشی هواوی با توان ۵۱۲ پتافلاپس (FP16) و بهره‌وری ۸۲٪، reportedly معادل ۹۱٪ عملکرد خوشه Nvidia A100 است. تحلیل‌گران این اقدام را گامی مهم در جهت کاهش وابستگی چین به سخت‌افزار آمریکایی می‌دانند.

گزارش‌ها حاکی است که هزینه آموزش DeepSeek-R2 نسبت به GPT-4 حدود ۹۷٪ کمتر بوده که این امر به لطف استفاده از سخت‌افزار داخلی و تکنیک‌های بهینه‌سازی محقق شده است. انتظار می‌رود DeepSeek دسترسی API این مدل را با قیمت پایین‌تری ارائه کند؛ اقدامی که می‌تواند مدل‌های قیمت‌گذاری فعلی تحت سلطه OpenAI و Anthropic را تحت تأثیر قرار دهد.


واکنش بازار و نوآوری‌های مرتبط

انتشار این خبر موجب تحرک در سهام شرکت‌های فناوری چین شده است. سهام سازنده تراشه هوش مصنوعی Cambricon با رشد ۲۰ درصدی، ارزش بازار خود را به بیش از ۳۵۵ میلیارد یوان (حدود ۴۹.۷ میلیارد دلار) رساند.

در خبری مرتبط، هواوی چارچوب جدیدی برای استنتاج هوش مصنوعی با نام Unified Cache Manager (UCM) معرفی کرده است. این چارچوب با بهینه‌سازی مدیریت داده‌های KV Cache در لایه‌های حافظه نظیر HBM، DRAM و SSD، باعث شتاب‌دهی فرایند استنتاج می‌شود. طبق آزمایش‌های انجام شده با China UnionPay، این فناوری باعث کاهش ۹۰ درصدی تأخیر و افزایش ۲۲ برابری توان پردازش شده است. هواوی قصد دارد UCM را در ماه سپتامبر به صورت متن‌باز منتشر کند.


نتیجه‌گیری

عرضه DeepSeek-R2 به همراه معرفی چارچوب UCM هواوی، نشان‌دهنده تغییری بزرگ در جاه‌طلبی‌های چین برای حوزه هوش مصنوعی است. این تحولات نوید آینده‌ای را می‌دهند که در آن چین قادر خواهد بود سیستم‌های هوش مصنوعی پیشرفته را بدون اتکا به تراشه‌ها یا ابزارهای نرم‌افزاری غربی، توسعه و اجرا کند.


source

توسط expressjs.ir