DeepSeek-R2 به زودی عرضه می‌شود؛ تلاش چین برای استقلال در هوش مصنوعی!

شرکت DeepSeek در حال آماده‌سازی برای عرضه نسل جدید مدل زبانی بزرگ خود با نام DeepSeek-R2 است که پیش‌بینی می‌شود بین ۱۵ تا ۳۰ آگوست ۲۰۲۵ رونمایی شود. این بازه زمانی در جریان یک تعامل با مدل هوش مصنوعی خود شرکت فاش شده و حاکی از عرضه قریب‌الوقوع این مدل، تنها چند روز پس از انتشار ChatGPT-5 است.

پیشرفت‌های معماری و توان پردازشی

انتظار می‌رود DeepSeek-R2 جهشی چشمگیر در معماری خود ایجاد کند و از ساختار پیشرفته‌تر Mixture of Experts (MoE) بهره بگیرد. این مدل همچنین یک شبکه مسیریابی (gating network) هوشمندتر برای مدیریت بهتر بارهای کاری سنگین در مرحله استنتاج خواهد داشت.

به گفته منابع آگاه، این مدل می‌تواند تا ۱.۲ تریلیون پارامتر مقیاس پیدا کند؛ تقریباً دو برابر DeepSeek-R1 که ۶۷۱ میلیارد پارامتر داشت. با این حال، این رقم همچنان کمتر از ChatGPT-4/5 است که بیش از ۱.۸ تریلیون پارامتر دارند.

گامی به سوی خودکفایی هوش مصنوعی در چین

در حرکتی استراتژیک برای رسیدن به خودکفایی داخلی در حوزه هوش مصنوعی، این مدل به‌طور کامل بر روی تراشه‌های Ascend 910B ساخت هواوی آموزش دیده است. خوشه پردازشی هواوی با توان ۵۱۲ پتافلاپس (FP16) و بهره‌وری ۸۲٪، reportedly معادل ۹۱٪ عملکرد خوشه Nvidia A100 است. تحلیل‌گران این اقدام را گامی مهم در جهت کاهش وابستگی چین به سخت‌افزار آمریکایی می‌دانند.

گزارش‌ها حاکی است که هزینه آموزش DeepSeek-R2 نسبت به GPT-4 حدود ۹۷٪ کمتر بوده که این امر به لطف استفاده از سخت‌افزار داخلی و تکنیک‌های بهینه‌سازی محقق شده است. انتظار می‌رود DeepSeek دسترسی API این مدل را با قیمت پایین‌تری ارائه کند؛ اقدامی که می‌تواند مدل‌های قیمت‌گذاری فعلی تحت سلطه OpenAI و Anthropic را تحت تأثیر قرار دهد.

واکنش بازار و نوآوری‌های مرتبط

انتشار این خبر موجب تحرک در سهام شرکت‌های فناوری چین شده است. سهام سازنده تراشه هوش مصنوعی Cambricon با رشد ۲۰ درصدی، ارزش بازار خود را به بیش از ۳۵۵ میلیارد یوان (حدود ۴۹.۷ میلیارد دلار) رساند.

در خبری مرتبط، هواوی چارچوب جدیدی برای استنتاج هوش مصنوعی با نام Unified Cache Manager (UCM) معرفی کرده است. این چارچوب با بهینه‌سازی مدیریت داده‌های KV Cache در لایه‌های حافظه نظیر HBM، DRAM و SSD، باعث شتاب‌دهی فرایند استنتاج می‌شود. طبق آزمایش‌های انجام شده با China UnionPay، این فناوری باعث کاهش ۹۰ درصدی تأخیر و افزایش ۲۲ برابری توان پردازش شده است. هواوی قصد دارد UCM را در ماه سپتامبر به صورت متن‌باز منتشر کند.

نتیجه‌گیری

عرضه DeepSeek-R2 به همراه معرفی چارچوب UCM هواوی، نشان‌دهنده تغییری بزرگ در جاه‌طلبی‌های چین برای حوزه هوش مصنوعی است. این تحولات نوید آینده‌ای را می‌دهند که در آن چین قادر خواهد بود سیستم‌های هوش مصنوعی پیشرفته را بدون اتکا به تراشه‌ها یا ابزارهای نرم‌افزاری غربی، توسعه و اجرا کند.

EXPRESSJS - مجله تکنولوژی نرم افزار و سخت افزار

توسطexpressjs.ir

پیشرفت‌های معماری و توان پردازشی

گامی به سوی خودکفایی هوش مصنوعی در چین

واکنش بازار و نوآوری‌های مرتبط

نتیجه‌گیری

توسط expressjs.ir

پست های مرتبط

قابلیت ترجمه Grok در پست‌های پلتفرم X گسترش یافت

بدون پرده و رک؛ باید سلاح هسته‌ای بسازیم! | فیلم

کاهش قیمت اقلام اساسی در آستانه اربعین حسینی

You missed

قابلیت ترجمه Grok در پست‌های پلتفرم X گسترش یافت

بدون پرده و رک؛ باید سلاح هسته‌ای بسازیم! | فیلم

کاهش قیمت اقلام اساسی در آستانه اربعین حسینی

آب به آخر خط رسید/ از خزر تا خلیج‌فارس، کشور در گرداب خشکسالی، بی آبی و فرونشست

EXPRESSJS - مجله تکنولوژی نرم افزار و سخت افزار