انویدیا جدیدترین اطلاعات از پردازنده گرافیکی Blackwell را به اشتراک گذاشت
سخت افزار/ انویدیا آمار و اطلاعات بیشتری از کیفیت عملکرد معماری پردازنده گرافیکی نسل بعدی خود یعنی Blackwell را به اشتراک گذاشته است، آماری که توانست این صنعت را تحت تاثیر خود قرار دهد. این شرکت معیارهای مختلفی از جمله نتایج علمی، هوش مصنوعی و شبیهسازی خود را در مقابل تراشههای هاپر خروجی و پردازندههای x86 رقیب در هنگام استفاده از ماژولهای سوپرچیپ مبتنی بر Grace به اشتراک گذاشت.
انویدیا در یک پست وبلاگی جدید، اعلام کرده است که چگونه GPUهای Blackwell قرار است عملکرد بسیار بالاتری را به بخش تحقیقاتی که شامل محاسبات کوانتومی، کشف دارو، انرژی فیوژن، شبیهسازیهای مبتنی بر فیزیک، محاسبات علمی و غیره میشود، اضافه کنند. زمانی که انویدیا این تراشه را در رویداد GTC 2024 معرفی کرد، این شرکت اعداد بزرگی را به نمایش گذاشت ولی خوب در آن زمان نگاه کاملی نسبت به معماری آن وجود نداشت. بنابراین همچنان منتظر انتشار خبرها و اطلاعات بیشتری از آن بودهایم.
با نگاهی به جزئیات، خواهیم دید یکی از بزرگترین اهداف NVIDIA با معماری پردازنده گرافیکی بلک ول خود، کاهش هزینه و انرژی مورد نیاز است. انویدیا بیان کرده است که پلتفرم Blackwell میتواند الگوهای آب و هوا را با 200 برابر هزینه کمتر و 300 برابر انرژی کمتر شبیهسازی کند، در حالی که اجرای شبیهسازیهای دیجیتال دوقلویی که کل سیاره را در بر میگیرد با هزینه 65 برابر و کاهش انرژی 58 برابری انجام میشود.
همچنین انویدیا دقت مضاعف قابلیتهای FP64 (نقطه شناور) پردازنده گرافیکی Blackwell خود را که 30 درصد TFLOP بیشتر از Hopper دارند را به نمایش میگذارد. یک واحد پردازشگر گرافیکی Hopper H100 حدود 34 TFLOP محاسبات FP64 و یک واحد پردازش گرافیکی Blackwell B100 حدود 45 TFLOP عملکرد محاسباتی را ارائه میدهد. بلکول بیشتر در سوپرچیپ GB200 عرضه میشود که شامل دو پردازنده گرافیکی به همراه پردازنده Grace است، به طوری که حدود 90 TFLOP از قابلیتهای محاسباتی FP64 است. یک تراشه در پشت شتاب دهنده های AMD MI300X و MI300A Instinct قرار دارد که 81.7 و 61.3 TFLOP از قابلیت های FP64 را روی یک تراشه ارائه میدهند.
در حالی که پردازنده گرافیکی Blackwell انویدیا، عملا یک گام رو به عقب در عملکرد سنتی ممیز شناور متراکم برداشته است، اما این موضوع باعث نشده است که تواناییهای محاسباتی کلی آن ضعیف شود. این شرکت ابتدا عملکرد شبیهسازی را در شبیهسازی Cadence SpectreX نشان میدهد که 13 برابر سریعتر در Blackwell GB200 و با افزایش 22 برابری در CFD (Computational Fluid Dynamics) در مقابل ASIC و CPUهای سنتی اجرا میشود. این تراشه همچنین بسیار سریعتر از سیستم های A100 و Grace Hopper (GH200) است.
انویدیا یک بار دیگر عملکرد برتر خود در هوش مصنوعی را به رخ رقبایش میکشد، جایی که پلتفرم GPU Blackwell GB200 بار دیگر با افزایش 30 برابری H100 در GPT (پارامتر 1.8 تریلیون) برتری میکند. پلتفرم GB200 NVL72 تا 30 برابر بازدهی بالاتر را امکانپذیر میسازد در حالی که 25 برابر راندمان انرژی بالاتر و 25 برابر TCO کمتر (هزینه کل عملیات) را به دست میآورد. حتی قرار دادن سیستم GB200 NVL72 در مقابل CPUهای X86 72 باعث افزایش 18 برابری برای سیستم Blackwell و افزایش 3.27 برابری نسبت به سیستم GH200 NVL72 در پایگاه داده Join Query میشود.
با توجه به تمام اطلاعاتی که تا کنون در مورد پردازندههای گرافیکی Blackwell به دست آمده است، شاید به نظر برسد که پس از عرضهی آن، عملا همه Hopper را فراموش کنند، ولی واقعیت به شکلی دیگر خواهد بود. پلتفرم گرافیکی ابرتراشه NVIDIA Grace Hopper GH200 همچنان پادشاه بلامنازع بخش هوش مصنوعی کنونی است و در حال حاضر به 9 ابر رایانه مختلف را در سراسر کره زمین با قابلیت محاسباتی ترکیبی 200 Exaflops قدرت میدهد و به 200 کوینتیلیون محاسبه در ثانیه عملکرد هوش مصنوعی میپردازد.
ابرکامپیوترهای جدید مبتنی بر Grace Hopper که به صورت آنلاین عمل میکنند عبارتند از EXA1-HE، در فرانسه، از CEA و Eviden. Helios در مرکز کامپیوتر آکادمیک Cyfronet، در لهستان، از شرکت Hewlett Packard (HPE) و Alps در مرکز ملی ابر رایانه سوئیس، بازهم از شرکت HPE. ژوپیتر در مرکز ابرکامپیوتر جولیخ، در آلمان؛ DeltaAI در مرکز ملی کاربردهای ابررایانه در دانشگاه ایلینویز Urbana-Champaign؛ و Miyabi در مرکز مشترک ژاپن برای محاسبات با کارایی بالا پیشرفته – ایجاد شده بین مرکز علوم محاسباتی در دانشگاه تسوکوبا و مرکز فناوری اطلاعات در دانشگاه توکیو.
پردازندههای گرافیکی انویدیا در حال حاضر یکی از محبوبترین انتخابها برای افزایش تقاضای هوش مصنوعی هستند و به نظر میرسد هیچ توقفی در مسیر آن وجود ندارد. تحلیلگران خاطرنشان کردهاند که انویدیا در طول سال 2024 بدون رقیب خواهد ماند و میتوان انتظار داشت که به محض اینکه Blackwell در دسترس مشتریان قرار بگیرد، سطح عملکردی بیسابقه در بخش هوش مصنوعی و جریان درآمد خود انویدیا به وجود بیاید. اما انویدیا اصلا قصد ندارد به آنچه که هم اکنون در دست دارد قانع شود، زیرا پیشبینی میشود که این شرکت تولید پردازندههای گرافیکی نسل بعدی Rubin R100 خود را تا اواخر سال 2025 آغاز کند، تراشهای که جزئیات اولیه دیوانهکنندهای با خود به همراه خواهد داشت.