کشف باگی عجیب در پردازندههای EPYC Rome شرکت AMD

شهر سخت افزار/ AMD به تازگی اسنادی را از پردازندههای EPYC Rome خود منتشر کرده است که نشان میدهد آنها به صورت خودکار پس از 1044 روز (تقریباً سه سال) فعالیت مداوم هنگ میکنند و به منظور رفع این مشکل باید در زمانی کمتر از این مقدار مجدداً راهاندازی شوند. جزییات بیشتر از این باگ عجیب پردازندههای AMD را در ادامه بخوانید.
پردازندههای EPYC Rome از شرکت AMD بر هستههای پردازشی Zen 2 مبتنی هستند و در حال حاضر یکی از بهترین محصولاتی محسوب میشوند که این شرکت برای پشتیبانی از دیتاسنترها و مراکز داده روانه بازار کرده است. اما براساس گزارش Techpowerup، به تازگی یک باگ عجیب در ساختار این پردازندهها کشف شده است که سبب میشود آنها پس از 1044 روز یا سه سال فعالیت مداوم با مشکلاتی روبرو شوند و فعالیت آنها متوقف شود.
البته AMD اعلام کرده است که مدت زمانی که طول میکشد تا پردازندههای EPYC Rome با این مشکل روبرو شوند به میزان Spread Spectrum (تغییر سرعت پایه پردازنده به منظور کاهش تداخل الکترومغناطیسی) و فرکانس REFCLK (ساعت مرجع پردازنده که به آن در تنظیم زمان کمک میکند) وابستگی دارد. هر چند که بررسیهای صورت گرفته توسط بخشی از کاربران توییتر و Reddit نشان میدهد که زمان تخمین زده شده توسط AMD تاحدودی اشتباه است و حداکثر زمانی که این پردازندهها میتوانند بدون تداخل انسان به فعالیت مداوم خود ادامه دهند چیزی در حدود 1042 روز و 12 ساعت است.
در صورتی که پردازندههای EPYC Rome در طول این مدت به منظور فعالیت مداوم و بدون وقفه به کار گرفته شوند آنگاه به صورت خودکار هستههای آن هنگ میکنند و هیچگونه راهکاری به منظور رفع این مشکل در دسترس کاربران خود قرار نمیدهند. تنها میتوان با خاموش کردن سیستم مبتنی بر این پردازنده ها این زمان را صفر کرد و سپس آن ها میتوانند برای مدت 1042 روز دیگر به فعالیت خود ادامه دهند.
AMD اعلام کرده است که برای رفع این ایراد پردازندههای EPYC Rome برنامهای ندارد و کاربران باید پیش از رسیدن به زمان اعلام شده به منظور جلوگیری از مشکل، سیستمهای خود را یک بار راهاندازی مجدد کنند. این نسل از پردازندههای AMD در سال 2018 معرفی و عرضه شدند و به نظر میرسد انتشار اطلاعاتی در مورد این باگ زمانی صورت گرفته است که بخشی از کاربران با آن روبرو شدهاند.
اگرچه بروزرسانی های امنیتی و همچنین فعالیتهای مربوط به نگهداری از این پردازندهها باید در زمانی کمتر از 1042 روز صورت بگیرد اما باید گفت که حضور این باگ در پردازندههای EPYC Rome از اهمیت زیادی برخوردار است و ممکن است کاربران را با مشکلات و مسائلی مهم درگیر کند. بخشی از کاربران این پردازندهها از سیستم عامل لینوکس استفاده میکنند و میتوانند بروزرسانی های مختلف منتشر شده برای آن را بدون نیاز به راهاندازی مجدد نصب کنند. از سوی دیگر بخشی از سرورها و مراکز داده برای فعالیتهای حیاتی و مهم به کار گرفته میشوند و باید زمانی طولانی روشن بمانند. این موارد احتمال درگیر شدن کاربران با این باگ عجیب را بیشتر میکند.
البته به نظر میرسد که AMD اینگونه فکر نمیکند؛ چرا که اعلام کرده است این باگ چندان مهلک نیست و برنامهای برای رفع آن ندارد. در گذشته نیز بخشی از پردازندههای عرضه شده به بازار این ایراد را داشتند. این باگ عجیب در پردازندههای AMD بیش از هر چیز ما را به یاد سریال لاست میاندازد. جایی که ساکنین جزیره مجبور بودند به دلایلی نامعلوم هر چند دقیقه دکمهای را فشار دهند.