اینتل پردازنده گرافیکی Xe HP را با قدرتی فوقالعاده بهنمایش گذاشت
زوميت/ راجا کودوري در جريان برگزاري رويداد Hot Chips، پردازندهي گرافيکي خانوادهي Xe HP را که متشکلاز چهار کاشي است و به مقايس پتافلاپس ازلحاظ قدرت پردازشي دست پيدا ميکند، بهنمايش گذاشت.
راجا کودوري، معمار ارشد اينتل و رئيس واحد تجاري کارت گرافيک مجزا در اين شرکت که سال ۲۰۱۷ از AMD جدا شد، طي چند ماه اخير در مراسمهاي مختلف حضور پيدا کرده و جزئياتي جديد دربارهي معماري جديد پردازندههاي گرافيکي اينتل يعني معماري Xe و محصولاتي که برپايهي آن ساخته ميشوند با رسانهها در ميان گذاشته است. پردازندههاي گرافيکي خانوادهي Xe تنوع بالايي از محصولات را شامل ميشوند؛ از پردازندههاي گرافيکي کممصرف مجتمع و پايينرده تحت نام Xe LP Graphics گرفته تا پردازندههاي گرافيکي مخصوص ديتاسنترها که عموما متشکلاز چندين تراشه هستند. کودوري بهتازگي جزئياتي جديد دربارهي پردازندههاي گرافيکي دستهي دوم دردسترس رسانهها قرار داده است.
همانطور که هفتهي گذشته اعلام شد، پردازندههاي گرافيکي سري Xe HP اينتل قرار است در سه نوع روانهي بازار شوند. مدل پايه که تاکنون چند بار در اخبار رسمي ظاهر شده است از يک کاشي (Tile) بهره ميگيرد که شامل ۵۱۲ واحد اجرايي (EU) و بهاحتمال زياد دو بستهي HMB2e خواهد بود. اينتل هنوز مشخصات فني رسمي اين پردازندهي گرافيکي را تأييد نکرده، اما بهتازگي نحوهي عملکرد پردازندههاي گرافيکي خانوادهي Xe که شامل يک، دو يا چهار کاشي هستند را بهنمايش گذاشته است که جزئيات را ميتوانيد در تصوير زير مشاهده کنيد:
براي مشاهدهي تصوير بالا در ابعاد اصلي اينجا کليک کنيد
قدرت پردازشي بيشتري که حضور کاشيهاي اضافه بههمراه ميآورد در نگاه اول فوقالعاده است؛ بااينحال نبايد فراموش کنيد نتايج حاضر در تصوير بالا مربوط به انجام وظايف گرافيکي آني (Real-Time) نيستند. تقسيم کار بين پردازندههاي گرافيکي بهمنظور دستيابي به فناوريهايي نظير SLI و CrossFire کار بسيار سختتري است و استفاده از پردازنده گرافيکي اضافي در بهترين حالت ممکن، عملکرد اجراي بازيهاي ويدئويي را بين ۵۰ تا ۸۰ درصد بهبود ميبخشد. براي اهداف غيرگرافيکي که بيشتر روي توان پردازشي متمرکز هستند، کارها بهطور معمول بهطور مجزا انجام ميشوند.
راجا کودوري در رويداد Hot Chips پردازندهي گرافيکي چهار کاشي Xe HP را جلوي دوربين بهنمايش گذاشت
در ابتدا تصور ميشد که پردازندهي گرافيکي متشکلاز چهار کاشي وجود خارجي ندارد و بيشتر بازي تبليغاتي اينتل است؛ اما راجا کودوري در جريان برگزاري رويداد Hot Chips اينتل، پردازندهي موردبحث را که ابعاد بسيار بزرگي داشت رو به دوربين نشان داد تا ثابت کند اينتل واقعا در حال ساخت پردازندهي گرافيکي بسيار ردهبالا و قدرتمندي است.
پردازندهي متشکلاز چهار کاشي اينتل واقعا ابعاد بزرگي دارد؛ بزرگتر از تمامي تراشههايي که تاکنون ديده بوديم. اينکه پردازندهي گرافيکي موردبحث سري Xe HP وارد مرحلهي توليد نهايي ميشود يا نه، سؤالي است که فعلا پاسخش را با اطمينان نميدانيم. فراموش نکنيد اينتل پردازندهي گرافيکي Xe HPC ملقببه پونته وکيو (Ponte Vecchio) را هم دارد و طي چند وقت اخير بهشکلي ويژه روي آن مانور داده است.
براي مشاهدهي تصوير بالا در ابعاد اصلي اينجا کليک کنيد
پردازندهي گرافيکي Xe HP براي تبديلشدن به پردازندهاي با چند کاشي از EMIB استفاده ميکند. آنطور که اينتل در اطلاعيهاي رسمي اعلام کرده، پردازندهي گرافيکي Xe HPC قرار است شامل يک کاشي با نام رمبو کش (Rambo Cache) باشد، از فناوري پکيجينگ Foveros استفاده کند و با بهرهگيري از Co-EMIB بهبودهاي بيشتري در زمينهي پردازشي ارائه دهد.
اينتل روي سه مدل از پردازندههاي گرافيکي Xe HP با يک، دو و چهار کاشي کار ميکند
اينتل ميگويد کاشي پايهي پردازندهي پونته وکيو با استفاده از ليتوگرافي جديد ۱۰ نانومتري سوپرفين (SuperFin) ساخته ميشود که نسخهي بهبوديافتهي فينفت (FinFET) بهحساب ميآيد. کاشي رمبو کش از ليتوگرافي «بهبوديافتهي» سوپرفين که جزئيات کاملش را دردسترس نداريم استفاده ميکند. هنوز ليتوگرافي کاشي Xe Link I/O مشخص نشده، اما اينتل گفته که اين کاشي توسط شرکتي خارجي توليد ميشود. درنهايت آنطور که تيم آبي ميگويد، براي توليد کاشي اصلي يعني کاشي پردازشي، از دو نوع ليتوگرافي بهره گرفته خواهد شد که در نوع خود اتفاق عجيبي است.
اينتل بهصورت رسمي اعلام ميکند که در آزمايشگاههايش درحال کار روي پردازندههايي از خانوادهي Xe HP با يک، دو و چهار کاشي است. استفاده از EMIB بدين معني است که دو پردازندهي گرافيکي آخر بهترتيب دو و چهار برابر پردازندهي پايه ابعاد دارند؛ بنابراين لازم است در آنها از سه سوکت مجزا استفاده شود.
براي مشاهدهي تصوير بالا در ابعاد اصلي اينجا کليک کنيد
پردازندهي گرافيکي چهار کاشي Xe HP که راجا کودروي در جلوي دوربين نشانش داد ظاهرا ميتواند به ۴۲ ترافلاپس قدرت پردازشي FP32 دست پيدا کند؛ البته اين عدد، حداکثر توانايي پردازندهي گرافيکي اينتل نيست. کودوري در بخشي از سخنان خود مدعي شد اين پردازندهي گرافيکي قدرتمند ميتواند به قدرت پردازشي در مقايس پتافلاپس دسترسي پيدا کند (بهعبارتي ديگر، بيش از ۱٬۰۰۰ ترافلاپس). دستيابي به اين هدف بهلطف حضور هستههاي تنسور (Tensor) ممکن ميشود؛ البته فعلا پيکربندي دقيق هستهها را در پردازندهي گرافيکي اينتل نميدانيم.
همچون معماري A100 انويديا و معماري TPUv4 گوگل، Xe HP از هستههاي تنسور پشتيباني ميکند. هنوز اطلاعاتي دقيق اعلام نشده اما حدس ميزنيم اين هستهها ميتوانند بهازاي هر سيکل، ۱۲۸ عمليات انجام دهند؛ بهعبارتي، پردازندهي گرافيکي اينتل بهازاي واحد اجرايي شامل يک هستهي تنسور خواهد بود. اين يعني اگر ۲٬۰۴۸ واحد اجرايي داشته باشيم، با حل کردن اين معادله «۲۰۴۸x۱۲۸x۲» به جواب «۵۲۴٬۲۸۸» ميرسيم. البته در اينجا سرعت کلاک را لحاظ نکردهايم. انتظار داريم براي يک پتافلاپس شاهد دستيابي به سرعت کلاک دو گيگاهرتز باشيم. شايد اينتل نوع ديگري از هستههاي تنسور را استفاده کند که بتوانند بهازاي هر سيکل، بيش از ۱۲۸ عمليات انجام دهند. در هر صورت بهلطف چنين پردازندهي توانمندي، ابررايانهها سادهتر ميتوانند به قدرت پردازشي بسيار بالا دسترسي پيدا کنند.