با معماری Blackwell، پردازنده‌های گرافیکی جدید انویدیا (GB300) انقلابی در پردازش هوش مصنوعی ایجاد کرده‌اند. نتایج اولیه نشان می‌دهد هر کارت جدید معادل شش کارت نسل قبلی (H100) عملکرد دارد. با پشتیبانی از ۳۷ ترابایت حافظه و پهنای باند ۱۳۰ ترابایت بر ثانیه، این پردازنده‌ها مدل‌های عظیم هوش مصنوعی را بدون گلوگاه پردازش می‌کنند و هزینه هر محاسبه را به طور چشمگیری کاهش می‌دهند.

جدیدترین پردازنده‌های گرافیکی NVIDIA GB300 که بر پایه معماری Blackwell ساخته شده‌اند، حالا در نخستین آزمون‌ها قدرت واقعی خود را نشان می‌دهند. نتایج منتشرشده از سوی CoreWeave نشان می‌دهد این تراشه‌ها در اجرای مدل‌های سنگین هوش مصنوعی، راندمان بسیار بالاتری نسبت به نسل پیشین ارائه می‌دهند.

کارایی شش‌برابری نسبت به H100

در آزمایش انجام‌شده با استفاده از مدل DeepSeek R1، تنها ۴ کارت GB300 توانستند عملکردی برابر با ۱۶ کارت H100 داشته باشند. این یعنی هر کارت گرافیک GB300 حدود شش برابر توان عملیاتی بیشتر نسبت به H100 ارائه می‌دهد. این برتری به لطف ارتقای سخت‌افزاری و معماری کارآمدتر نسل جدید به دست آمده است.

توان پردازشی و حافظه عظیم

پلتفرم GB300 NVL72 قابلیت پشتیبانی از ۳۷ ترابایت حافظه (تا حداکثر ۴۰ ترابایت) با پهنای باند ۱۳۰ ترابایت بر ثانیه را دارد. این ظرفیت عظیم باعث می‌شود مدل‌های بسیار بزرگ هوش مصنوعی بدون گلوگاه‌های متداول در سخت‌افزارهای قدیمی پردازش شوند. همچنین، این نسل از چهار-راهی تانسور پارالل (TP4) استفاده می‌کند؛ در حالی‌که H100 برای دستیابی به مقیاس مشابه به ۱۶-راهی (TP16) نیاز داشت. کاهش تعداد تقسیم‌ها، سربار ارتباطی را کم کرده و به کمک NVLink و NVSwitch نسل پنجم، تاخیر پردازش به حداقل می‌رسد.

مزیت‌های اقتصادی برای شرکت‌ها

برای کسب‌وکارهایی که سرویس‌های بزرگ هوش مصنوعی اجرا می‌کنند، این پیشرفت به معنای تولید سریع‌تر توکن‌ها، کاهش هزینه هر پردازش و ساده‌تر شدن مقیاس‌پذیری خواهد بود. CoreWeave تأکید کرده که این افزایش بهره‌وری مستقیماً به بهبود عملکرد در مدل‌های استدلالی منجر می‌شود؛ جایی که کارایی انرژی و کاهش تأخیر اهمیت بالایی دارند.

قیمت بالا، اما ارزشمند برای مراکز داده

البته این سخت‌افزار ارزان نخواهد بود. سیستم‌های مبتنی بر GB300 NVL72 با قیمت پایه‌ای در حدود ۳۰۰ هزار دلار عرضه می‌شوند و کاملاً در حوزه سازمانی قرار می‌گیرند. با این حال، برای شرکت‌هایی که به‌شدت روی زیرساخت هوش مصنوعی سرمایه‌گذاری کرده‌اند، این جهش عملکرد می‌تواند توجیه اقتصادی داشته باشد.

اگر این نتایج اولیه در مقیاس گسترده‌تر تأیید شوند، GB300 می‌تواند یکی از بزرگ‌ترین جهش‌های نسلی انویدیا لقب بگیرد و معیاری تازه برای پردازش‌های پرقدرت هوش مصنوعی تعیین کند.




source

توسط expressjs.ir