اکنون می توانید قوی ترین ابرکامپیوتر هوش مصنوعی گوگل را اجاره کنید!
شهر سخت افزار/ گوگل بیش از ده سال است که در حال توسعه واحدهای پردازشی Tensor، شتابدهندههای کاستوم هوشمصنوعی است و اکنون چند ماه پس از معرفی، اعلام کرد که نسل ششم این TPUها به مرحله مصرف عمومی رسیدهاند و امکان اجاره آنها وجود دارد. جزییات بیشتر را در ادامه خواهید خواند.
به گزارش وبسایت TechRadar، ابرکامپویتر تریلیوم (Trillium) که ظرفیت HBM و پهنای باند اتصال داخلی اینترچیپ را دوبرابر میکند و در گذشته برای آموزش مدل هوشمصنوعی پرچمدار گوگل یعنی Gemini 2.0، استفاده شده است، اکنون برای مصارف عمومی در دسترسی قرار گرفته است.
به گزارش گوگل، این ابرکامپیوتر تا 2.5 برابر بهتر از نسلهای پیش از نظر عملکرد بر دلار میباشد که آن را یکی از گزینههای برتر برای شرکتهای دارای زیرساخت هوشمصنوعی هستند تبدیل میکند.
بهبود این ابرکامپیوتر نسبت به نسل پیشین
به ادعای گوگل، تریلیوم نه تنها در زمینه ارزش عملکرد، بلکه در زمینههای دیگر نیز از نسلهای پیشین خود برتر ظاهر شده است. برای مثال، این ابرکامپیوتر تا 4 برابر بیش از نسل پیشین خود قدرت دارد و بهینگی مصرف انرژی آن تا 67 درصد افزایش یافته است. همچنین پیک عملکرد بر تراشه آن نیز به میزان 4.7 درصد افزایش یافته است.
بر اساس نتایج آزمونهای گوگل، ابرکامپیوتر تریلیوم، عملکرد استتناج را نیز افزایش میدهد و نسبت به نسلهای پیشین، سه برابر بیشتر از مدلهای تولید تصاویر مانند Stable Diffusion XL یا دو برابر بیشتر از مدلهای زبانی بزرگ خروجی دارد.
در ادامه قابلیتهای این ابرکامپیوتر باید گفت که تراشههای آن برای مدلهای Embedding-Intensive بهینه شده است و به لطف نسل سوم SparseCore، عملکرد بهتری در عملیات پویا و متکی بر داده دارد.
جالب است بدانید که واحد پردازشی تنسور، همچنین پایه ابرکامپیوتر هوشمصنوعی ابری گوگل را نیز تشکیل میدهد. این سیستم که به بیش از 100 هزار تراشه تریلیوم متصل شده توسط شبکه فیبر Jupiter مجهز است، توانایی ارائه پهنای باند 13 پتابیت بر ثانیه را دارد.
این ابرکامپیوتر، سختافزار بهینهشده، نرمافزارهای منبع باز، فریموورکهای یادگیری ماشینی محبوب مانند PyTorch، JAX و TensorFlow را نیز ادغام میکند.
اکنون با در دسترس عموم قرار گرفتن تریلیوم، مشتریان Google Cloud، فرصت دسترسی به همان سختافزاری را که برای آموزش Gemini 2.0 استفاده شده، خواهند داشت تا زیرساخت هوشمصنوعی با عملکرد بسیار بالا و قابل استفاده توسط اپلیکیشنهای بیشتر را بسازند.