زومیت/ جزئیات مربوط به معماری Xe اینتل از کارت گرافیکِ محاسبات پرچم‌داری خبر می‌دهد که ۱۰۰۰ واحد محاسباتی و حافظه‌ی کش رمبو دارد.

اینتل آخرین جزئیات مربوط به محصولات جدید مبتنی‌بر معماری گرافیکی Xe خود را در کنفرانس مربوط به توسعه‌دهندگان HPC (مخفف Hight Performance Computing به‌معنی محاسبات رده‌بالا) مننتشر کرد. شخصی که روی جایگاه محصولات و سرویس‌ها را معرفی می‌کرد، راجا کدوری، معاون کل اینتل و مدیر بخش معماری بود. او نخستین نقشه‌ی راه اولین معماری گرافیکی ساخت اینتل، یعنی Xe را آشکار و محصولاتی را معرفی کرد که معماری مذکور در آن‌ها به‌کار خواهد رفت.

نکات بسیاری درباره‌ی محصولات جدید اینتل وجود دارد؛ اما بهتر است ابتدا مهم‌ترین موضوع، یعنی خود معماری Xe را تحلیل کنیم. معماری گرافیکی Xe اینتل مقیاس‌پذیر است و تراشه‌های مختلف را می‌تواند توسعه دهد. تصمیم تیم آبی بر این است تا با تکیه بر معماری Xe، سه نوع ریزمعماری را روانه‌ی بازار کند:
Xe LP اینتل که کارت گرافیکی مجتمع و پایین‌رده است؛
Xe HP اینتل که میان‌رده است و برای مصارف عمومی و مراکز داده و هوشی مصنوعی کاربرد دارد؛
Xe HPC اینتل که برای محاسبات پیچیده کاربرد دارد و حداقل یک هگزافلاپس محاسبه را در ثانیه انجام می‌دهد.

آنچه از نام‌گذاری پردازنده‌های گرافیکی مذکور می‌توان نتیجه گرفت، نوع کاربری هرکدام از این محصولات است. نام LP مخفف Low-Power به مفهوم کم‌مصرف و عبارت HP مخفف High-Performance به مفهوم عملکرد پیشرفته است. اختصار HPC نیز همان‌گونه که پیش‌تر گفته شد، مخفف Hight Performance Computing و اشاره به معماری‌ای است که محاسبات پیچیده را انجام می‌دهد و از جدیدترین فناوری‌های اینتل در آن استفاده شده است. درادامه، فناوری‌های یادشده بررسی خواهند شد. به‌گفته‌ی تیم آبی‌، توان پردازنده‌ی گرافیکی Xe LP بین ۵ تا ۲۰ وات است و تا ۵۰ وات توانایی سازگاری دارد. کارت گرافیک Xe HP اینتل نیز یک سطح بالاتر و توان مصرفی آن بین ۷۵ تا ۲۵۰ وات است. در‌همین‌حال، معماری HPC با توان محاسباتیِ بیشتر درمقایسه‌با دو معماری دیگر، توان مصرفی بیشتری خواهد داشت. راجا کدوری درباره‌ی انواع معماری Xe چنین می‌گوید:

معماری تضمینی برای سازگاری نرم‌افزاری است. در ابتدا در حال برنامه‌ریزی به‌منظور استفاده از Xe برای دو میکرومعماری بودیم؛ یعنی معماری‌های LP و HP. بااین‌حال، فرصت را برای ارائه‌ی سومین معماری در قالب HPC مهیا دیدیم.

کارت‌های گرافیکی کلاسِ Xe اینتل عرض بردار (Vector) متغیری خواهند داشت. برای تبیین موضوع این نکته را در نظر بگیرید که کارت‌های گرافیک اینتل پردازنده‌هایی برداری یا آرایه‌ای محسوب می‌شوند. این نوع از پردازنده‌ها مجموعه دستورالعمل‌هایی را اجرا می‌کنند که دستورالعمل‌های یک‌بعدی از داده‌ها یا خطی داشته باشند. در‌هر‌حال، پردازنده‌های گرافیکی مذکور در انواع مختلف می‌توانند دستورالعمل‌ها را به‌صورت موازی در تعداد زیادی از واحدهای اجرایی (EU) اجرا کنند. عرض بردار در پردازنده‌های گرافیکی، اشاره به نوع پردازش هم‌زمان و موازی است که در کارت‌های گرافیک Xe در انواع SIMT و SIMD و تلفیقی از هر دو تقسیم‌بندی شده است. SIMD مخفف عبارت Single instruction multiple data به مفهوم دستورالعمل و داده‌های چندگانه و SIMT مخفف Single Instruction Multiple Threads به مفهوم دستورالعمل و چندین رشته است.

پردازنده‌ی گرافیکی Ponte Vecchio با بهره‌گیری از معماری گرافیکی Xe حداکثر ۱۰۰۰ عدد واحد اجرایی دارد
ازآنجاکه تمامی تمرکز کنفرانس توسعه‌دهندگان روی محاسبات بالارده (HPC) بود، راجا کدوری نیز به‌طور ویژه از پردازنده‌های گرافیکی HPC کلاس Xe صحبت کرد. پردازنده‌های مذکور می‌توانند ۱۰۰۰ واحد اجرایی (EU) داشته باشند و هر واحد اجرایی به‌لطف به‌روز‌رسانی‌ها تا ۴۰ برابر قدرت محاسباتی بیشتری در فرمت عددی double-precision floating-point یا نقطه‌ی شناور با دقت دوگانه ایجاد می‌کند. در فرمت یادشده (FP64) اطلاعات با حجم ۶۴ بیتی و دقتی فراوان در حافظه‌ی دستگاه ذخیره می‌شوند.

واحدهای اجرایی در پردازنده‌ی گرافیکی جدید اینتل با پارچه‌ی حافظه‌ی جدیدی با کارایی درخورتوجه در هر شرایطی، به چندین کانال حافظه با پهنای باند بالا متصل شده‌اند. پارچه‌ی حافظه در کلاس Xe با نام XEMF شناخته می‌شود که مخفف XE Memory Fabric به‌معنی پارچه‌ی حافظه‌ی Xe است. معماری پردازنده‌های گرافیکی HPC از کلاس Xe، شامل حافظه‌ی کش یکپارچه‌ی بسیار بزرگی با نام رمبو (Rambo) است که چندین واحد پردازش گرافیکی را به‌هم متصل می‌کند. حافطه‌ی کش رمبو با ارائه‌ی پهنای باند وسیعی از حافظه، توانایی محاسبات پایدار فرمت عددی FP64 را در بارهای کاری با دقت زیاد فراهم می‌کند. راجا کدوری درباره‌ی پارچه‌ی جدید حافظه می‌گوید:

در قلب معماری Xe، پارچه‌ی جدیدی با نام XEMF داریم. این پارچه‌ی XEMF قلب عملکرد این ماشین‌ها است و ما آن را کش رمبو نامیدیم. این حافظه‌ی کش یکپارچه‌ای است که از پردازنده و کارت گرافیک دردسترس است.

اینتل کارت‌های گرافیک کلاس HPC از معماری Xe را با آخرین فناوری لیتوگرافی هفت نانومتری خواهد ساخت. این همان لیتوگرافی بالارده‌ی هفت نانومتری است که این شرکت قبلا درباره‌اش حرف زده بود. اینتل برای توسعه‌ی کارت‌های گرافیک اگزامقیاس خود بیشترین استفاده را از فناوری‌های جدید و پیشرفته‌ی یکپارچه‌سازی شرکت مانند رابط‌های EMIB و Forveros خواهد کرد. رابط‌های مذکور رابط‌های دای‌به‌دای است و توانایی اتصال دای‌های ناهمگن را با هزینه‌ی مقرون‌به‌صرفه فراهم می‌آورند. در مبحث مدارهای مجتمع، هر دای (die) یک بلوک کوچک از مواد نیمه‌رسانا است که مداری با کارکرد خاص در فرایندی مانند فوتولیتوگرافی روی آن ساخته شده‌ است. در بحث مربوط به فرایند ساخت، موارد زیر بهبودهای مهمی هستند که اینتل برای لیتوگرافی ۷ نانومتری خود اعلام کرده است:

تراشه‌های هفت نانومتری در همان اندازه‌ی دای ۱۰ نانومتری با دوبرابر تراکم ترانزیستور بیشتر؛
بهینه‌سازی‌های برنامه‌ریزی‌شده‌ی درون گره‌ها (intra-node)؛
کاهش چهاربرابری قوانین طراحی؛
لیتوگرافی به‌وسیله‌ی اشعه‌ی ماوراء‌بنفش (EUV)؛
آخرین فناوری از رابط‌های EMIB و Forveros.

کارت‌های گرافیک Xe HPC از فناوری Forveros برای اتصال به حافظه‌ی کش رمبو بهره خواهند گرفت. شایان ذکر است حافظه‌ی رمبو را می‌توان بین چندین کارت گرافیک HPC در مداری یکپارچه به اشتراک گذاشت. EMIB نیز برای اتصال حافظه‌ی با پهنای باند بالا (HBM) به کارت گرافیک استفاده می‌شود. هر دو این فناوری‌ها جهش بزرگی در کارایی پهنای باند و تراکم پردازنده ایجاد می‌کنند. دقیقا همانند پردازنده‌های Xeon، کارت‌های گرافیک HPC نیز همراه‌با حافظه‌ی ECC و تصحیح‌کننده‌ی حافظه‌ی کش و دسترسی‌پذیری و قابلیت اطمینان و سرویس‌پذیری در کلاس Xeon همراه خواهند بود.

ابرکامپیوتر آئورورا؛ اولین محصول مجهز به مرکز داده‌ی هفت نانومتری Ponte Vecchio مبتنی‌بر معماری Xe
حال‌که به تمامی فناوری‌های مهم اشاره کردیم، باید اولین محصول هفت نانومتری از معماری Xe HPC را بررسی کنیم. این محصول Ponte Vecchio نام دارد که پردازنده‌ی گرافیکی عظیمی است و هدفش طرح جدیدترین تک‌تراشه‌ی اگزامقیاس برای ابرکامپیوترها است. Ponte Vecchio با ۱۶ چیپلت محاسباتی روانه‌ی بازار خواهد شد که برپایه‌ی معماری گرافیکی Xe HPC شکل گرفته‌اند.

به‌نظر می‌رسد در کارت گرافیک Ponte Vecchio مقادیر عظیمی از حافظه‌ی با پهنای باند بالای DRAM به هر واحد پردازش گرافیکی متصل خواهد بود. تنها یک بسته‌ی پردازشی از این نوع برای ابرکامپیوتر آئورورا (Aurora) استفاده خواهد شد. بسته‌ی مذکور ۶ کارت گرافیک Ponte Vecchio را شامل می‌شود که با رابط‌های CXL (لینک محاسبه‌ی سریع یا Compute Express Link) یا Xe Link به‌هم متصل شده‌اند و از بسته‌ی نرم‌افزاری OneAPI بهره می‌برند. بسته‌ی پردازشی مذکور همچنین دو پردازنده‌ی Sapphire Rapids را درون خود جای داده‌ است که نسل بعدی از لیتوگرافی ++10nm معماری Willow Cove هستند. همان‌طورکه پیش‌تر ذکر شد، ابرکامپیوتر آئورورا اولین محصولی است که از مرکز داده‌ی هفت نانومتری Ponte Vecchio مبتنی‌بر معماری Xe استفاده می‌کند. برخی از ویژگی‌های مهم در بسته‌ی پردازشی ابرکامپیوتر آئورورا بدین‌شرح است:
عملکرد پیشرفته در هوش مصنوعی و محاسبات بالارده و تحلیل داده؛
معماری یکپارچه‌ی حافظه در سراسر پردازنده‌‌ها و کارت‌های گرافیک؛
اتصال همه‌جانبه در بسته که باعث کاهش تأخیر و افزایش پهنای باند شده است؛
ورودی/خروجی‌های غیرموازیِ توسعه‌پذیر در تمامی گره‌ها.

رویکرد تیم آبی بسیار شبیه به کاری است که انویدیا با مدل DGX-2 خود انجام داده است. DGX-2 از ۱۶ پردازنده‌ی گرافیکی Volta بهره می‌برد که با رابط NVSwitch به بسته‌ای واحد تبدیل شده است؛ اما برخلاف طرح اینتل، انویدیا کل بسته را پردازنده‌ی گرافیکی کامل نامیده است. اینتل ۱۶ چیپلت روی مدار یکپارچه را پردازنده‌ی گرافیکی می‌نامد و هر بسته‌ ۶ پردازنده‌ی گرافیکی را شامل می‌شود. به‌نظر می‌رسد انویدیا طراحی چیپلت ماژول چندتراشه‌ای (MCM) را روی محصولات HPC شرکت مذکور دنبال کند؛ همانند پردازنده‌ی Ampere که یک‌ سال زودتر از Ponte Vecchio، یعنی در سال ۲۰۲۰ وارد بازار پردازنده‌های HPC خواهد شد.

در کانال آی‌تی و ™CanaleIT هم کلی عکس و ویدئوی دسته اول و جذاب داریم

بلد
بلد آگهی