جدیدترین پردازندههای گرافیکی NVIDIA GB300 که بر پایه معماری Blackwell ساخته شدهاند، حالا در نخستین آزمونها قدرت واقعی خود را نشان میدهند. نتایج منتشرشده از سوی CoreWeave نشان میدهد این تراشهها در اجرای مدلهای سنگین هوش مصنوعی، راندمان بسیار بالاتری نسبت به نسل پیشین ارائه میدهند.
کارایی ششبرابری نسبت به H100
در آزمایش انجامشده با استفاده از مدل DeepSeek R1، تنها ۴ کارت GB300 توانستند عملکردی برابر با ۱۶ کارت H100 داشته باشند. این یعنی هر کارت گرافیک GB300 حدود شش برابر توان عملیاتی بیشتر نسبت به H100 ارائه میدهد. این برتری به لطف ارتقای سختافزاری و معماری کارآمدتر نسل جدید به دست آمده است.
توان پردازشی و حافظه عظیم
پلتفرم GB300 NVL72 قابلیت پشتیبانی از ۳۷ ترابایت حافظه (تا حداکثر ۴۰ ترابایت) با پهنای باند ۱۳۰ ترابایت بر ثانیه را دارد. این ظرفیت عظیم باعث میشود مدلهای بسیار بزرگ هوش مصنوعی بدون گلوگاههای متداول در سختافزارهای قدیمی پردازش شوند. همچنین، این نسل از چهار-راهی تانسور پارالل (TP4) استفاده میکند؛ در حالیکه H100 برای دستیابی به مقیاس مشابه به ۱۶-راهی (TP16) نیاز داشت. کاهش تعداد تقسیمها، سربار ارتباطی را کم کرده و به کمک NVLink و NVSwitch نسل پنجم، تاخیر پردازش به حداقل میرسد.
مزیتهای اقتصادی برای شرکتها
برای کسبوکارهایی که سرویسهای بزرگ هوش مصنوعی اجرا میکنند، این پیشرفت به معنای تولید سریعتر توکنها، کاهش هزینه هر پردازش و سادهتر شدن مقیاسپذیری خواهد بود. CoreWeave تأکید کرده که این افزایش بهرهوری مستقیماً به بهبود عملکرد در مدلهای استدلالی منجر میشود؛ جایی که کارایی انرژی و کاهش تأخیر اهمیت بالایی دارند.
قیمت بالا، اما ارزشمند برای مراکز داده
البته این سختافزار ارزان نخواهد بود. سیستمهای مبتنی بر GB300 NVL72 با قیمت پایهای در حدود ۳۰۰ هزار دلار عرضه میشوند و کاملاً در حوزه سازمانی قرار میگیرند. با این حال، برای شرکتهایی که بهشدت روی زیرساخت هوش مصنوعی سرمایهگذاری کردهاند، این جهش عملکرد میتواند توجیه اقتصادی داشته باشد.
اگر این نتایج اولیه در مقیاس گستردهتر تأیید شوند، GB300 میتواند یکی از بزرگترین جهشهای نسلی انویدیا لقب بگیرد و معیاری تازه برای پردازشهای پرقدرت هوش مصنوعی تعیین کند.