«دیپمایند» چگونه با حل مساله ساختار پروتئینها دنیای پزشکی را دگرگون میکند؟
ديجياتو/ اتفاقي که همه چيز را تغيير ميدهد؛ اين خبري بود که ديروز به تيتر اول بسياري از نشريات علمي و معتبر از جمله «نيچر» و«ساينس» بدل شده و از حل يک مساله ۵۰ ساله زيستشناسي توسط هوش مصنوعي حکايت داشت. براي آشنايي بيشتر با اين دستاورد بزرگ که انقلابي در زمينه زيستشناسي مولکولي بر پا کرده در ادامه مطلب با ما همراه باشيد
«ديپ مايند»، يکي از پيشگامترين کمپانيهاي حوزه هوش مصنوعي است که از زيرمجموعههاي گوگل محسوب ميشود و اخيرا به لطف هوش مصنوعي موفقيت چشمگيري را در پيش بيني ساختار پروتئينها کسب کرده است. اين شرکت ديروز اعلام کرد که با سيستم «آلفا فولد» خود چالش بزرگ چينش و تاشدگي پروتئين را حل کرده که به مدت 50 سال جامعه علمي را نااميد کرده بود.
هوش مصنوعي اين شرکت توانسته يکي از پيچيده ترين شبيه سازيهاي ساختار پروتئينها را که قبلا به صورت تجربي تنها در آزمايشگاههاي عظيم انجام شده، اين بار با هوش مصنوعي عملي کند. اين الگوريتم در واقع شکل سه بعدي پروتئينها را بوسيله توالي اسيد آمينههاي آن پيش بيني کرده و جهشي عظيم در حل يکي از بزرگترين چالشهاي زيست شناسي محسوب ميشود.
نتايج تحقيقات اين شرکت در آغاز کنفرانس دوسالانه «CASP» اعلام شد. در اين کنفرانس 100 تيم شرکت کننده ديگر نيز حضور داشتند اما نتايج پروژه ديپمايند از بقيه بهتر بود. «جان مولت»، استاد دانشگاه «مريلند»، که در سال 1994 اين کنفرانس را با هدف بهبود روشهاي محاسباتي براي پيش بيني دقيق ساختارهاي پروتئيني بنيان نهاد، ميگويد: «اين اتفاق مهمي است و ميشود گفت به معني واقعي مشکل حل شده است.»
توانايي پيش بيني دقيق ساختارهاي پروتئيني از توالي اسيد آمينه آنها يک پيشرفت بزرگ براي علوم زيستي و پزشکي است و باعث تسريع تلاشهاي دانشمندان در شناخت کامل سلولها و حتي توليد داروهاي پيشرفته ميشود. براي نمونه ميتوان به داروهاي منوکلونال آنتي بادي اشاره کرد که به غشاي سلولهاي هدف اتصال پيدا ميکنند. اين داروها به صورت مستقيم توانايي شناسايي يک مولکول خاص را دارند و به همان مولکول اتصال مييابند و از اين طريق در درمان بسياري از سرطانها و حتي بيماريهاي خود ايمني کاربرد دارند؛ براي مثال داروي «رتاکسيمب» که در درمان بيماري MS کاربرد دارد.
اين داروها با توجه به ساختار سه بعدي که دارند اختصاصا به يک گيرنده خاص در سلول هدف متصل شده و باعث ايجاد اثر درماني ميشوند. براي توليد اينگونه داروها حتما بايد ساختار سه بعدي پروتئين گيرنده و ساختار سه بعدي دارو را بدون هيچگونه اشتباهي تعيين کنيم. همچنين درک ساختار سه بعدي پروتينها و آمينو اسيدها در ساختار اين داروها و حتي پروتينهاي هدف در اين مورد لازم است و اينجاست که اين عظمت اين پروژه و کارايي آن در کمک به دانشمندان و پزشکان براي تشخيص و درمان بيماريها براي ما نمايان ميشود.
تيم مستقر در لندن «آلفافولد» در سال 2018 براي اولين بار در اين کنفرانس شرکت کرد و امسال يعني سال 2020 از تمام رقبا يک سر و گردن جلوتر بود و حتي به گفته دانشمندان در حال ايجاد يک انقلاب در زمينه زيشت شناسي است. «آندري لوپاس»، زيست شناس تکاملي در موسسه توسعه زيست شناسي ماکس پلانک در توبينگن آلمان، که عملکرد تيمهاي مختلف را در CASP ارزيابي کرد بر اين باور است که «اين اتفاق بازي را تغيير ميدهد.»
تيم آلفا فولد به او کمک کرده است تا ساختار پروتئيني را که به مدت يک دهه در آزمايشگاه به دنبال آن بوده و او را گيج کرده بود، پيدا کند. از همين رو انتظار دارد اين پيشرفت باعث تغييراتي اساسي در نحوه مطالعات و دانش پزشکي شود: «اين اتفاق پزشکي، تحقيقات و مطالعات، مهندسي زيستي و همه چيز را تغيير خواهد داد.»
البته اين همه داستان نيست، گاهي اوقات ساختار پيش بيني شده هوش مصنوعي گوگل با ساختار اصلي و واقعي که به صورت تجربي و برپايه روشهاي «استاندارد طلايي» مانند کريستالوگرافي اشعه ايکس و يا ميکروسکوپ الکتروني مشخص شده، متفاوت است.
اين موضوع نشان ميدهد نياز ما به اين روشهاي گران قيمت ممکن در است در سالهاي آينده از بين نرود. اما هوش مصنوعي به ما کمک ميکند که روي موجودات زنده با روشهاي جديد مطالعه کنيم.
مشکل ساختار
پروتئينها عناصر سازنده زندگي هستند و مسئوليت بيشتر آنچه در داخل سلولها اتفاق ميافتد را بر عهده دارند. نحوه کار و عملکرد پروتئينها توسط شکل سه بعدي آنها تعيين ميشود. هر پروتيئين توسط يک ژن توليد ميشود. البته مطالعات جديد نشان داده هر ژن در واقع مسئول توليد يک رشته آمينو اسيدي است.
اين يکي از قوانين زيست شناسي مولکولي اين است که «ساختار عملکرد است». در واقع پروتئينها تمايل دارند بدون کمک، شکل تعيين شده خود را بدست آورند. اين موضوع توسط قوانين فيزيک هدايت ميشود و شکل هر پروتئين با توجه به ساختار آمينو اسيدي و توالي آنها مشخص ميشود.
براي دهه ها، تجربيات آزمايشگاهي اصلي ترين و تنها راه براي تعيين ساختارهاي پروتئيني بود. اولين ساختارهاي کامل پروتئينها با تکنيکي کشف شد که در آن پرتوهاي اشعه ايکس به پروتئينهاي بلوري شکل (با روشهاي پيچيده شيميايي پروتيئينها بلوري شکل ميشوند) شليک ميشدند و نور انعکاس يافته به مختصات اتمي پروتئين تبديل ميشد. به اين روش کريستالوگرافي اشعه ايکس ميگويند.
شمايي از يک ساختار سه بعدي پروتيئني که قسمت آبي توسط هوش مصنوعي و قسمت سبز با روشهاي تجربي تعيين شده. پيشبينيها تقريباً باهم تطابق کامل دارند.
کريستالوگرافي اشعه ايکس سهم مهمي در کشف ساختارهاي پروتئيني ايفا کرده اما طي دهه گذشته، Cryo-EM (با استفاده از ميکرسکوپ الکتروني) به ابزار مورد علاقه بسياري از آزمايشگاههاي زيست شناسي ساختاري تبديل شده است. همانطور که در بالا اشاره کرديم اين ابزارها استاندارد طلايي تشخيص ساختارهاي پروتئيني هستند.
اين که پروتئينها چگونه با اجزاي ساختاري يعني اسيدهاي آمينه شکل خود را تعيين ميکنند براي محققان، مدتها جاي سوال بود. تلاشهاي اوليه استفاده از رايانه براي پيش بيني ساختارهاي پروتئيني در دهه 1980 و 1990 عملکرد ضعيفي داشتند. بسياري از ادعاها در اين زمينه زماني که محققان آنها را با روشهاي علمي بررسي ميکردند رد ميشد و اين روشها قدرت پيش بيني ضعيفي داشتند.
دليل اصلي جان مولت هم براي راهاندازي CASP سخت گيري بيشتر در مورد اين دست ادعاها بود. اين سلسله کنفرانسها تيمها را به چالش ميکشند تا ساختار پروتئينهايي را که با استفاده از روشهاي آزمايشي (استاندارد طلايي) حل شده اند، اما ساختارهاي آنها عمومي نشده، پيش بيني کنند. مولت اين کنفرانس را يک فضاي رقابتي نميبيند و ميگويد:
«شما خواهيد فهميد چه چيزهايي اميدوار کننده به نظر ميرسد، چه چيزهايي جواب ميدهد و بايد از چه چيزهايي دور شويد.»
هرچند عملکرد ديپمايند در CASP13 که دو سال قبل برگزار شد آنچنان درخشان نبود اما بسياري از دانشمندان اين حوزه را که مدتها بود در گروههاي کوچک دانشگاهي موفقيتي نداشتند، مبهوت کرد. «جان جمپر» که رهبري گروه DeepMind را به عهده دارد ميگويد:
«در ابتدا با هوش مصنوعي فاصله آمينو اسيدهاي جفت شده سنجيده ميشد و سپس در قسمت بعدي که ازهوش مصنوعي استفاده نميشد نرم افزارها با دادههاي حاصل از مرحله اول مشخص ميکردند که شکل پروتئين بايد چگونه باشد.»
تيم آلفا فولد سعي در ادامه اين روش داشت اما در نهايت شکست خورد. جمپر ميگويد، بنابراين اين روند را تغيير داديم و يک شبکه هوش مصنوعي ايجاد کرديم که شامل اطلاعات اضافي در مورد محدوديتهاي فيزيکي و هندسي انواع پروتئينها بود که نحوه چين خوردگي آنها را تعيين ميکرد. آنها همچنين کار سختتري را بايد انجام ميدادند: شبکه به جاي پيش بيني روابط بين اسيدهاي آمينه، ساختار نهايي پروتئين هدف را پيش بيني ميکرد؛ سيستمي که به باور جامپر بسيار پيچيده تر است
دقت حيرت انگيز
کنفرانس دوسالانه CASP طي چندين ماه انجام ميشود. پروتئينهاي هدف يا بخشي از پروتئينها که به آن نام «دامين» دادهاند (در مجموع حدود 100 نوع پروتئين ) به طور منظم در طي چندين هفته به تيمها داده ميشوند و تيمها چندين هفته فرصت دارند تا پيش بينيهاي خود را در رابطه با ساختار پروتئين مورد نظر ارائه دهند. سپس تيمي از دانشمندان مستقل پيش بينيهاي ارائه شده از تيمها را با استفاده از معيارهاي تعيين شده از طريق روشهاي استاندارد طلايي اندازه گيري ميکنند. داوران نميدانند چه کسي ساختارها را پيش بيني کرده است و داوريها به صورت کور يا بليند انجام ميشود.
لوپاس ميگويد، پيش بينيهاي آلفا فولد با نام "گروه 427" وارد مسابقه شده بود و به واسطه دقت حيرت انگيز بسياري از پيش بينيهاي آنها بين دوران شهرت پيدا کردند. وي ميگويد: «حدس ميزدم که آنها بايد آلفا فولد باشند، بيشتر داوران هم چنين حدسي داشتند.»
برخي از پيش بينيها از بقيه بهتر بود، اما تقريباً دو سوم پيش بينيها از نظر کيفيت در حد ساختارهاي آزمايشي (استاندارد طلايي) بودند. دقت روشهاي تيم آلفا فولد در حدي بود که حتي مولت معتقد بود اختلافهاي بين ساختارهاي پيش بيني شده و تعيين شده چنان کم بود که گاهي اوقات مشخص نبود اختلاف از طرف خطاهاي محساباتي آلفا فولد پيش آمده و يا خطاهايي در روشهاي استاندارد رخ داده است. مولت در ادامه ميگويد :
«بعضي از پيش بينيهاي آلفافولد با ساختارهاي آزمايشي تعيين شده توسط تکنيکي به نام طيف سنجي تشديد مغناطيسي هستهاي مطابقت نداشت، اما اين ميتواند به چگونگي تبديل دادههاي خام به مدل ساختاري پروتئيني ارتباط داشته باشد.»
اين شبکه حتي تعامل گروهي پروتئينها بر هم را بررسي ميکند و عملکرد هر پروتئين را هم به صورت مجزا و هم به صورت گروهي پيش بيني ميکند.
به طور کلي، تيمها ساختار پروتئينها را امسال با دقت بيشتري در مقايسه با آخرين CASP پيش بيني کردند اما اکثر اين پيشرفتها را آلفا فولد به دست آورده است. در مورد اهداف پروتئيني که نسبتاً دشوار به نظر ميرسند، عملکرد ساير تيمها در بهترين حالت 75 نمره از 100 نمره بود، در حالي که اين عدد براي آلفا فولد 90 بود.
به گفته مولت تقريباً نيمي از تيمها استفاده از «يادگيري عميق» را در مقاله خود ذکر کردهاند که نشانگر تاثير گسترده هوش مصنوعي در اين زمينه علمي است. بيشتر شرکت کنندهها از تيمهاي دانشگاهي بودند اما مايکروسافت و شرکت چيني «تنسنت» نيز در CASP14 شرکت کرده بودند.
برخي از شرکتکنندگان CASP از جمله «محمد القريشي»، زيست شناس محاسباتي در دانشگاه کلمبيا در نيويورک مشتاق است که جزئيات عملکرد آلفا فولد را پس از ارائه اين رورکدر توسط ديپمايند بررسي کند. القريشي معتقد است که نتايج تحقيقات آلفا فولد تحول آفرين خواهد بود. اين متخصص ميگويد:
«فکر ميکنم منصفانه است که بگوييم اين امر در زمينه پيش بيني ساختار پروتئينها با روشهاي تجربي (مانند کريستالوگرافي) تاثير منفي دارد. گمان ميکنم بسياري از دانشمندان اين روشهاي سنتي را رها ميکنند چون بدون شک مشکل اصلي حل شده. مطمئناً اين اتفاق يکي از مهمترين نتايج علمي زندگي من است.»
ساختارهاي سريعتر
يکي از پيش بينيهاي تيم آلفا فولد به تعيين ساختار يک پروتئين باکتريايي کمک کرده که آزمايشگاه لوپاس سال هاست سعي در تعيين ساختار آن دارد. تيم لوپاس پيش از اين دادههاي انعکاسي اشعه ايکس خام را جمع آوري کرده بود اما تبديل اين الگوها به يک ساختار پروتئيني به اطلاعاتي در مورد شکل پروتئين نياز داشت. تلاشها براي بدست آوردن اين اطلاعات و ساير ابزارهاي پيش بيني با شکست مواجه شده بود. لوپاس ميگويد:
«مدل گروه 427 بعد از گذشت يک دهه که همه چيز را امتحان کرديم، تنها در نيم ساعت ساختاري را به ما داد که ده سال در جستجوي آن بوديم.»
«دميس هسابيس»، بنيانگذار و مدير عامل ديپمايند، ميگويد اين شرکت قصد دارد آلفافولد را در مسيري قرار دهد تا دانشمندان ديگر هم امکان استفاده از آن را داشته باشند. هسابيس، کشف دارو و طراحي پروتئين را از اهداف آلفافولد عنوان ميکند :
«ما در حال درک بهتر خواستههاي زيستشناسان هستيم که يکي کشف داروهاي جديد و ديگري طراحي پروتئين هاست.»
دميس هسابيس، مدير عامل ديپمايند
در اوايل سال 2020، اين شرکت پيش بيني ساختارهايي از پروتئينهاي ويروس کرونا را که هنوز در آزمايشهاي تجربي اثبات نشده بوند، منتشر کرد. پيش بيني ديپمايند در مورد پروتئيني به نام «Orf3a» در نهايت بسيار شبيه به پروتئيني است که بعداً از طريق روش Cryo-EM تعيين شد و اين قدرت پيش بيني برنامههاي آلفا فولد را نشان ميدهد.
تاثيرات در دنياي واقعي
بعيد است آلفافولد به زودي بتواند درهاي آزمايشگاه هاي عظيمي مانند «بروهاون» را ببندد که از روشهاي تجربي براي تحليل ساختارهاي پروتئيني استفاده ميکنند. با اين حال دستاورد آنها بدين معني است که از دادههاي آزمايشي با کيفيت پايين تر که به شکلي آسانتر جمع آوري شده ميتوان براي تحليل ساختار پروتئينها بهره برد. برخي از برنامههاي کاربردي، مانند تجزيه و تحليل تکاملي پروتئين ها، قرار است شکوفا شوند زيرا سونامي دادههاي ژنومي موجود ممکن است براي تحليل ساختاري بسياري از پروتئينها به کار رود. لوپاس ميگويد:
«اين کار به نسل جديد زيست شناسان مولکولي امکان ميدهد به دنبال پاسخ براي پرسشهاي پيشرفتهتري باشند.»
«جانت تورنتون»، زيست شناس ساختاري در «آزمايشگاه زيست شناسي مولکولي اروپا»، «انستيتوي بيوانفورماتيک اروپا» در انگلستان، و يکي از داوران پيشين CASP ميگويد: «اين مشکلي بود که فکر ميکردم در طول زندگي من حل نخواهد شد.»
اين گفته جانت تورنتون به ما نشان ميدهد چه اتفاق و چه انقلابي در اين زمينه روي داده است. او اميدوار است اين روش بتواند به روشن شدن عملکرد هزاران پروتئين ناشناخته در ژنوم انسان کمک کند و تغييرات ژني ايجاد کننده بسياري از بيماريها را ،که ممکن است در افراد متفاوت باشد ،کشف کند.
عملکرد آلفا فولد جداي از دنياي زيستشناسي براي آينده ديپمايند گوگل نيز نقطه عطفي است. اين شرکت بيشتر به خاطر داشتن هوش مصنوعي در بازيهايي مانند Go مشهور شد، اما هدف طولاني مدت آن توسعه برنامههايي با توانايي دستيابي به هوش گسترده و شبه انساني است. هسابيس در اينباره ميگويد:
«مقابله با چالشهاي بزرگ علمي، مانند پيش بيني ساختار سه بعدي پروتئين، يکي از مهمترين کاربردهايي است که هوش مصنوعي ميتواند انجام دهد. من فکر ميکنم اين مهمترين کاري است که ما از نظر تأثير در دنياي واقعي انجام دادهايم.»
همانطور که مديرعامل ديپمايند ميگويند حالا ديگر دوران نمايش قدرت هوش مصنوعي از بازيها فراتر رفته و نوبت به بهرهگيري از آن براي غلبه بر چالشهاي بزرگتر رسيده است. ديپمايند تنها در چند سال توانست مسالهاي ۵۰ ساله را براي متخصصان حل کند و بايد ديد در دهه آينده چه مشکلات عظيمي را از سر راه برخواهد داشت.
منبع:Nature