ماشین هوشمند بدون کمک انسان موفق به حل مکعب روبیک شد
زوميت/ يک ماشين هوشمند با حل معماي مکعب روبيک بدون هيچ آموزش انسان، شگفتي و پتانسيل قدرتمند دنياي هوش مصنوعي را براي جهانيان به نمايش کشيد. آيا نسل جديد از ماشين هاي هوشمند در حال تولد هستند؟ هوش و مهارت انسان توسط ماشين هوشمند (Machine Smart) به چالش کشيده شده است. تکنيک جديدي از يادگيري عميق ماشين و پيادهسازي آن باعث شده است، يک ماشين هوشمند با خودآموزي بدون کمک انسان موفق به حل مکعب روبيک شود. اين رويداد ميتواند نقطه عطفي براي رويکردي جديد در مقابله با مشکلات مهم، در علم کامپيوتر باشد. اينکه چگونه ميشود مشکلات پيچيده را با کمترين کمک حل کرد. طوفان روبيک و بسيج جهاني براي حل آن مکعب روبيک (Rubik's Cube) يک پازل سهبعدي و مکانيکي است که در ۱۹۷۴ توسط يک معمار اهل بوداپست در مجارستان به نام ارنو روبيک (Erno Rubik) اختراع شد. ارنو سعي داشت دانشجويان خود را به يک فهم مبسوط از دنياي سهبعدي برساند. نتيجه اين تلاش ساخت مکعب روبيک بود که در دنياي سرگرمي و دانش طوفاني به پا کرد. ارنو بهزودي متوجه شد حل مکعب جادويياش از روي شانس و تصادف تقريباً غيرممکن است. يک مکعب روبيک ۳*۳*۳ ميتواند ۴۳ تريليون حالت را ايجاد کند. براي حل اين مکعب جذاب بايد تمام مربعهاي هر وجه به يکرنگ دربيايند. حل همين مسئله بهظاهر ساده و جذاب باعث شد، اين مکعب يکي از پرفروشترين اسباببازيهاي دنيا لقب بگيرد و با رکود فروش بيشتر از ۳۵۰ ميليون جايگاه ويژهاي براي خود دستوپا کند. ارنو نيز بعد از يک ماه تلاش، سرانجام توانست راهحلي براي مرتب کردن مکعب جادويي ارائه دهد. ديويد ساينمستر (David Singmaster) يک رياضيدان متولد امريکا است که در سال ۱۹۸۰ روش حل لايهاي مکعب روبيک را بر اساس نظريه گروهها منتشر کرد و از همين زمان بود که مکعب جادويي ارنو به نام مکعب روبيک معروف شد. بعدازآن هم رياضيدانان و علاقهمندان زيادي با انواع متدها و الگوريتمها مکعب روبيک را حل کردند که شايد معروفترين آن روش حل جسيکا فردريک (CFOP) است. البته براي حل مکعب روبيک نيازي نيست رياضيدان باشيد، تفاوت اين روشهاي حل در سرعت عمل و به خاطر سپاري حالتهاي مختلف براي بهزانو درآوردن مکعب روبيک است. مثلاً در روش فردريک شما ابتدا يک وجه مکعب به يک رنگ درميآوريد و بعدازاينکه مربعهاي وسط هر وجه نيز به رنگ درست و برابر همان وجه تنظيم شد، وارد مرحله بعدي ميشويد. همين روشهاي رسيدن از يک مرحلهبهمرحله بعد بهصورت تعدادي الگوريتم در اختيار شما قرار ميگيرد. يک روش مانند روش فردريک درمجموع ۱۲۰ الگوريتم در اختيار شما قرار ميدهد و روشهاي ديگري هستند که بيش از ۱۷۰ الگوريتم در اختيار شما قرار ميدهند تا در هر حالتي از اين مکعب روبيک اسير شديد بتوانيد آن را به حالت روز اول و هنگاميکه خريديد، برگردانيد. بهعبارتديگر شما براي حل هر وضعيت روبيک يک الگوريتم در اختيارداريد. مثال بصري اين مفهوم در دنياي اطراف ما درختان هستند. اگر شما سرشاخههاي يک درخت را در نظر بگيريد و در امتداد آن حرکت کنيد به تنه درخت و نهايتاً ريشه درخت ميرسيد. همه سرشاخهها (الگوريتم ها) با هر پيچ و خمي، دير يا زود شمارا به تنه اصلي درخت ميرساند. اينيک مفهوم ساده براي تسهيل در تصميمگيري است که باعث ميشود همه راهها سرانجام به حل مکعب روبيک ختم شود. حالا براي حل سريعتر، هرچه زودتر از سرشاخهها به شاخه اصلي برسيد، موفقيت در زمان کمتري نصيب شما ميشود. عموماً متدهاي حل روبيک در پيدا کردن يکي از اين شاخههاي اصلي و هدايت به تنه درخت (حل مکعب روبيک) شکل ميگيرند. در بازي شطرنج حرکات مهرهها در فرمهاي نمرات (scoresheets) به شيوه نمادگذاري جبري (Algebraic chess notation) ثبت ميشود. بهنوعي اطلاعات هر بازي و نتايج هر حرکت در يک بازي در اختيار ديگران براي تجزيهوتحليل و حتي تکرار گامبهگام قرار ميگيرد. دنياي روبيک هم شيوه نماديني براي ثبت حرکات و چرخش وجوه مکعب و ثبت الگوريتمها دارد. به اين طريق تجربه مکعب بازها (کيوبرها) و اطلاعات ذيقيمت آنها به يکديگر منتقل ميشود و با تمرينات کيوبرها طبق اين بانک اطلاعاتي، رکوردها شکسته ميشود.امروزه روبيک پسرعموهايي نيز دارد؛ مانند روبيک جادويي (Rubik's Magic)، روبيک ماري (Rubik's Snake) و روبيک ۳۶۰ (Rubik's 360) که البته هيچکدام بهاندازه روبيک يا همان مکعب روبيک مشهور و محبوب نيستند. مکعب روبيک هم در چند سايز از قبيل روبيک جيبي (روبيک 2*2*2)، استاندارد (روبيک 3*3*3)، انتقام استاد (روبيک 4*4*4) و روبيک حرفهاي (روبيک 5*5*5) و غيره ساخته ميشود. مکعب روبيک مسابقات جهاني نيز دارد که در بيش از ۱۰ مدل و شيوه انجام ميشود. مکعب روبيک از روزي که ساختهشده بارها حلشده و البته به تعداد بيشتري هم به ديوار کوبيده شده است. از کساني که مکعب روبيک در ميان انگشتان آنها اسير است و به مکعب باز (cuber) معروف هستند، ميتوان سِئونگ بِئوم چو (SeungBeom Cho) را نام برد که يک مکعب روبيک را در عرض ۴.۵۹ ثانيه حل ميکند که در اصطلاح کيوبرها به مقام اسپيد کيوبر (Speed cuber) رسيده است. براي يک فرد عادي اين زمان بهاندازهاي است که تشخيص دهد هر وجه مکعب سرانجام به چه رنگي درخواهد آمد. مکعب روبيک و دانشمندان فناوري اطلاعات پيچيدگي معماي مکعب روبيک باعث شده که هوش مصنوعي برخلاف موفقيت در بازي شطرنج در حل آن عاجر بماند. موج جذابيت اين پازل سهبعدي مکانيکي، دانشمندان کامپيوتر و طراحان هوش مصنوعي را نيز تحت تأثير خود قرار داده است. آنها نيز به چالشي لذتبخش دچار شدند تا بفهمند، چگونه ميشود مکعب روبيک را در هر وضعيتي با کمترين حرکت حل کرد؟ با تحقيق و محاسبات آنها به اين نتيجه رسيدند که براي هر مدل از مکعبهاي روبيک تعداد حرکات ميتواند متفاوت باشد براي يک روبيک استاندارد با ۲۰ حرکت ميتوان به نتيجه رسيد و در يک روبيک انتقام استاد اين تعداد به ۲۶ حرکت هم ميرسد؛ ولي جذابيت معماي روبيک براي آنها به اينجا ختم نشد. مهندسان با ساخت يک ربات موفق شدند زمان حل مکعب روبيک را به کمتر از نيم ثانيه برسانند؛ اما يک چالش محبوب ديگر اين بود آيا يک ماشين هوشمند ميتواند بهطور خودآموز معماي روبيک را حل کند؟ برخلاف حرکات شطرنج، تحليل حرکات مکعب روبيک کار سختي است، به همين دليل يادگيري عميق (Deep Learning) ماشينهاي هوشمند تابهحال بهتنهايي قادر به حل مکعب روبيک نبوده است. در هوش مصنوعي، يادگيري ماشين (Machine learning) يک روش تجزيهوتحليل اطلاعات است که ماشين با افزايش اطلاعات دريافتي خود به تحليل ميپردازد و کارايي و کارآمدي خود را ارتقا ميدهد. در اين شيوه، ماشين با تجزيهوتحليل داده تصميمگيري ميکند و اين امر منجر به افزايش قدرت تشخيص و حل مسئله در ماشين ميشود. از اين طريق در هر بار مواجهه با مسئله قبلي ماشين ميتواند راهحلهاي بهينهتر و مفيدتري را ارائه دهد. استفاده از پتانسيل يادگيري ماشين ميتواند از افزايش مهارت راه رفتن براي يک روبات دوپا شروع شود تا استفاده از توانايي ماشين هوشمند در کشف و توسعه صنايع پيشرفته نفت يا هوافضا. هدف اين کار کاهش چشمگير مشکلات و بهبود استفاده از دادهها و بهتبع آن کاهش هزينهها و موفقيت سريعتر و باکيفيت بيشتر است. يادگيري ماشين تنها بخشي از مفهوم هوش مصنوعي (Artificial Intelligence) است. ازلحاظ تئوري Machine learning مفهوم خيلي سادهاي دارد، ماشين دادهها را جمعآوري ميکند و براي مشکلات خود، راهحلهاي جديدي ميسازد. هوش مصنوعي يک وضعيت در دستگاه است، يعني وضعيتي که يک دستگاه ميتواند، تشخيصي صحيح، مانند يک تصميمگيري انساني انجام دهد. پس مهم نيست که اين ماشين اجزايي مانند دست و صورت داشته باشد ميتواند همانند يک کامپيوتر ساده باشد. استفاده از يادگيري ماشين در زندگي روزمره بسيار مرسوم هست، حتي شايد در روز چندين بار از آن استفاده کنيد. ما ميتوانيم براي لحظاتي به تجربه مفهوم عميق هوش مصنوعي (AI) نزديک شويم، زماني که چراغهاي منزل با توجه به تعداد نفرات توسط يک سيستم اتوماتيک در يک خانه هوشمند روشن ميشوند و يا هنگامي از که سيري (Siri) در گوش همراه خود استفاده ميکنيم؛ ولي در حقيقت ما از هوش مصنوعي انتظاري فراتر از حل اين مسائل داريم. ما ميخواهيم هوش مصنوعي با متدهاي يادگيري ماشين دقيقاً همانند مغز انسان کار کند و اگر کسي مخالفتي نداشته باشد، شايد هوش مصنوعي را به سطح برسانيم که از مغز انسان نيز بهتر کار کند. طراحان هوش مصنوعي سعي کردند با حل چالش مکعب روبيک به دنبال روشهاي جديد براي شکوفايي ماشينهاي هوشمند و ارتقا شيوه يادگيري ماشينها پيدا کنند. يکي از بحثهاي مطرح در يادگيري ماشيني، يادگيري عميق (Deep learning) است. يادگيري عميق سعي دارد مفاهيم پيچيده را به قسمتهاي کوچکتر و سادهتر تقسيم کند و با اين اطلاعات روشن و ساده ماشين بتواند بدون نياز به انسان، تصميمگيري کند. براي دريافت بهترين نتيجه بايد دادههاي اصلي به شيوهاي ارائه شود که مفاهيم اصلي و پايه با سرعت در اختيار ماشين قرار بگيرد. اين اطلاعات براي ما ميتواند همان زبان نمادين در شطرنج يا مکعب روبيک باشد اما در مورد يادگيري ماشين و البته يادگيري عميق اين کار اغلب اوقات بهراحتي ممکن نيست؛ مثلاً فرض کنيد تجزيهوتحليل گفتار انسان در وهله اول ديگر کار چندان سختي نيست ولي وقتي عواملي مثل لهجه يا جنسيت به آن اضافه ميشوند، تشخيص همان مفاهيم پايه، بسيار پيچيده و خارج از تصور است. در بعضي مواقع تشخيص مفاهيم در لهجهها براي انسان هم سخت است. استفاده از مزاياي يادگيري عميق نيز از وقايع روزمره زندگي ما زياد دور نيست اگر با گوگل کار ميکنيد ناخواسته آن را تجربه کردهايد مثلاً در بخش جستجوي عکس شما از تواناييها و يادگيري ماشين و البته يادگيري عميق استفاده ميکنيد. در يادگيري عميق که از مباحث يادگيري ماشين است، دادهها و اطلاعات بهصورت لايهلايه تحليل ميشوند و با تجزيه دقيق هر لايه و جمعبندي آنها يک تحليل خروجي به دست ميآيد که باعث ميشود يک ماشين بتواند بهطور خودکار اشيا و دادههاي جديد را با دقت بالا تشخيص دهد. هر چه اين لايههاي تحليل در يادگيري عميق بيشتر باشند، يادگيري عميقتر و دقيقتر اتفاق ميافتد. با ارتقا يادگيري عميق دنياي ما بسيار متحول و متفاوتتر از زماني خواهد شد که گوشيهاي هوشمند وارد زندگي ما شدند. فرض کنيد تبليغات يک نمايشگر تبليغاتي با تحليل و درک احساسات شما بهسرعت تغيير ميکند و تبليغاتي که شما بيشتر راغب به ديدن و حتي خريد و استفاده از آن راداريد، به شما نمايش داده ميشود. يک ماشين هوشمند تنها با تجزيهوتحليل حالات چهره و تشخيص خرسندي و ناخرسندي شما هنگام ديدن تبليغات، اين کار را مديريت ميکند. اگر خريد شما يک سري محصولات مشخص است؛ مثلاً محصولات لبني، ماشين هوشمند بهجاي اينکه به شما پيشنهاد دهد که يک محصول لبني ديگر و متفاوت بخريد، به تحليل خريدهاي ديگر مشتريان که مشابه شما خريد کردهاند، ميپردازد و با بررسي خريد آنها به شما يک پيشنهاد مناسب ميدهد. شايد براي خريد در بازار آينده و حفظ پول در کيف پول خود بايد بيشتر مواظب بروز احساسات خود باشيد ولي اين تکنولوژي جنبههاي مثبت فراواني نيز دارد؛ مانند تشخيص و تحليل معاينات پزشک با دقت بالا و پيشگيري از بيماريهاي صعبالعلاج يا حتي کشف داروهاي جديد. پس در هوش مصنوعي (Artificial intelligence) و بهتبع آن يادگيري ماشين دو نکته مهم باهم مشارکت دارند يک بخش تحليل و آناليز قدرتمند و بخشي ديگر اطلاعات درست و مناسب است. اين دو بخش با مشارکت هم ميتوانند يک نتيجه و خروجي درست را در هوش مصنوعي به ما بدهند. هوش مصنوعي و يادگيري ماشين مخصوصاً يادگيري عميق و متدهاي مختلف اجراي آن بر پايه توانايي انسان در حل مسئله ايجاد شد. از شيوههاي علمي و با شناخت ابزار فکر و درک انسان اين متدها الهام گرفته ميشوند و در دنياي هوش مصنوعي با کمک تکنولوژي در يادگيري عميق پياده ميشوند. در دنياي روبيک و انسانها شيوههاي علمي و تحليلي رياضيدانان باعث شده که متدهاي حل روبيک بهطور استاندارد گسترش پيدا کند. در گذشته هم ماشينها با کمک مهندسان تبديل به شطرنجبازان قهاري شدند که توانستند غولهاي شطرنج جهان را به چالش بکشند و حال زمان ورود ماشين هوشمند براي حل مکعب روبيک بود. دانشمندان اين ايده به ذهنشان رسيد که از شيوه پاداش و تنبيه که در انسانها مرسوم است براي يادگيري هوش مصنوعي استفاده کنند. ايده خلاقانه براي حل روبيک توسط ماشين هوشمند در اين سناريو ساخت هوش مصنوعي به ماشين هوشمند با متدهاي يادگيري عميق، قوانين بازي آموزش داده ميشود تا اين بار ماشين شروع به حل مکعب روبيک کند. نکته بسيار مهم، پاداشي است که در هر گام با توجه به چگونگي انجام آن داده ميشود. اين روند پاداش دهي در يادگيري ماشين بسيار مهم است چراکه به کمک آن متوجه شود که حرکت درستي را انجام داده است يا نه. بهعبارتديگر، به ماشين کمک ميکند تا ياد بگيرد؛ اما اين ايده در دنياي واقعي چندان کارآمد نيست زيرا پاداشها براي ماشين اغلب کمياب هستند و سخت به دست ميآيند. مثلاً يادگيري عميق چرخاندن تصادفي مکعب روبيک چگونه ميتواند يک پاداش در پي داشته باشد؟ چگونه ميشود فهميد که اين آرايش جديد مربعهاي رنگي ميتواند به حل مسئله کمک کند؟ يا حل مسئله را سختتر ميکند. چرخاندن تصادفي ميتواند مدتها مديد حل مسئله را به تعويق بيندازد، نکتهاي که خالق روبيک (ارنو روبيک) در همان آغاز به آن پي برد، بنابراين پاداشها نيز بهندرت نصيب ماشين هوشمند در حين يادگيري ماشين ميشود. تجربه ماشين هوشمند و شطرنج نيز يک بازي در زميني کاملاً متفاوت بود. بازي شطرنج بهعنوان يک پازل، گستره زيادي از حرکات را در برميگيرد ولي به ازاي هر حرکتي ميتوان يک ارزيابي داشت و پاداشي يا تنبهي نيز در انتظار خواهد بود، اين شرايط درباره مکعب روبيک صدق نميکند. استفان مک آلير (Stephen McAleer) و همکارانش در دانشگاه کاليفرنيا (UC Irvine) در جنوب شهر لسآنجلس تکنيک جديدي را براي حل اين مشکل مطرح کردند. اين تکنيک جديد در يادگيري ماشين به نام Autodidactic iteration باعث ميشود که ماشين خودآموز شود و بدون کمک انسان بتواند مکعب روبيک را بهمانند روز اولي که از جعبه درآمده است، تحويل دهد. تکنيک مک آلير يکراه جايگزين و مناسب براي متد پاداشها در يادگيري عميق است. يک مکعب حلنشده به ماشين داده ميشود و ماشين بايد تشخيص دهد چه حرکتي را روي مکعب انجام دهد تا معماي روبيک حل شود. براي اين کار ماشين بايد بتواند حرکت را ارزيابي کند. اين ارزيابي از محل دادهاي ثبتشده يا همان الگوريتمهاي حل مکعب در ماشين به دست ميآيد. البته اين وظيفه يک ماشين هوشمند است که خود دادههاي درست را جمعآوري کند تا در حل مکعب روبيک از آنها استفاده کند. در تکنيک Autodidactic iteration يادگيري و حل مسئله با مکعب حلشده انجام ميشود؛ يعني ماشين با يک مکعب حلشده شروع به تست انواع حرکات روي مکعب ميکند و سعي ميکند متوجه شود، روال معکوس کدام حرکات، مکعب را به حالت اول برميگرداند. تمام اين حرکات درون ساختار دادهاي بهعنوان راه نجات و ايدههاي حل مسئله ضبط و دستهبندي ميشوند. اين فرآيند مکرر آزمونوخطا به ماشين کمک ميکند تا تشخيص دهد کدام حرکت بهطورکلي از حرکت ديگر بهتر است. هنگام حل مکعب درهمريخته، ماشين خودآموز شروع ميکند به جستجو در بانک اطلاعاتي خود تا براي هر وضعيت حرکت مناسب را براي حل مکعب روبيک پيدا کند. اين ساختار داده و بانک اطلاعاتي در ماشين بهصورت همان مفهوم درخت و شاخهها در حل مسئله روبيک است که به آن درخت تصميم (Decision Tree) ميگويند. نتيجه اين تکنيک در حل معماي روبيک توسط ماشين موفقيتآميز بوده است. مک آلير که از نتيجه تلاش خود و همکارانش با اجراي اين تکنيک در يادگيري عميق راضي است و ميگويد: الگوريتم ما قادر به حل کامل مکعب روبيک در هر وضعيتي است. ماشين با اين الگوريتم بهطور متوسط با ۳۰ حرکت مکعب روبيک را حل ميکند بدون نياز به کمک انسان. اجراي اين تکنيک جالب و مفيد در يادگيري عميق ميتواند ثمرات فراواني ديگري نيز داشته باشد. ماشين هوشمند با اين تکنيک ميتواند به حل پازلهايي همچون سکوبان (Sokoban) نيز دست بزند. همانطور که شما در سکوبان بايد در يک فضاي محدود مثلاً چند جعبه را به نحوه درست چيدمان کنيد، هوش مصنوعي (AI) نيز با اين تکنيک ميتواند در آخر سال و چيدمان مبلها در جريان خانهتکاني، يک راهکار نجاتدهنده و محبوب باشد. احتمالاً اين ماشين ميتواند در بازي همچون ماريو، او را از ميان هزاران سرزمين با موجودات عجيبالخلقه، صحيح و سالم به معشوقه خود برساند. اين تکنيک به ماشين هوشمند کمک ميکند وارد رياضيات هم بشود و بتواند به تجزيه اعداد همدست بزند. مشابه همان کاري که ما با استفاده از ساختار درختي براي تجزيه يک عدد اول انجام ميدهيم. همان شيوه درخت تصميم که براي اطمينان از رسيدن به هدف راههاي گوناگون را پيش پاي ما ميگذاشت. مک آلير و همکارانش به تکنيک خود خيلي اعتماد دارند و اهداف ديگري نيز براي استفاده ماشين هوشمند در چشمانداز خود قرار دادهاند. آنها معتقدند باکار و گسترش اين تکنيک حتي ميتوانند وارد مسائلي همچون پيشبيني و تحليل ساختار سهبعدي پروتئينها را نيز بشوند. باوجوداين خوشبينيها هنوز نتيجه استفاده از اين رويکرد در حل مشکلات ديگر واضح نيست. لزوماً اينکه آنها توانستهاند در حل مکعب روبيک با اين تکنيک موفق شوند دليل موفقيت آنها در حل مسائل ديگر با ماشين هوشمند نميشود؛ ولي بدون شک اين رويکرد تا بدين جا در مورد حل روبيک با کمترين تعداد حرکت مفيد و مؤثر بوده است.مک آلير و همکارانش ادعا ميکند که تکنيک آنها يک فرم استدلال در حل مسئله است. آنها ميگويند که يکي از تعاريف استدلال اين استفاده و الگوبرداري از دانش بهدستآمده براي حل مسئلههاي جديد و ابهامات است. آنها الگوريتم خود را که در دنياي ماشينهاي هوشمند با روشي ساده موفق به تشخيص الگوهاي خاص شده DeepCube ناميدند. مک آلير و تيم او به اين موضوع افتخار ميکند که با الگوريتم DeepCube ميتواند تنها با يک جايزه براي تقويت يادگيري ماشين به مقابله با مسائل پيچيده بروند. درنهايت آزمايشها واقعي به ما نشان خواهند داد که الگوريتم DeepCube در دنياي ماشين هوشمند چگونه ميتواند از پس مسائلي پيچيده همچون پروتئينها سربلند بيرون بيايد. شايد هم DeepCube به ما نشان دهد که دنياي ماشينها هوشمند و يادگيري ماشين را چگونه متحول کنيم؟ اين محققان هوش مصنوعي که از جستجو و کوشش خود بسيار راضي هستند. همراهان عزيز، آخرين خبر را بر روي بسترهاي زير دنبال کنيد: آخرين خبر در سروش http://sapp.ir/akharinkhabar آخرين خبر در ايتا https://eitaa.com/joinchat/88211456C878f9966e5 آخرين خبر در آي گپ https://igap.net/akharinkhabar آخرين خبر در ويسپي http://wispi.me/channel/akharinkhabar آخرين خبر در بله https://bale.ai/invite/#/join/MTIwZmMyZT آخرين خبر در گپ https://gap.im/akharinkhabar