حافظه مبتنی بر DNA چیست و چرا میلیونها برابر بهینهتر از هارد درایو به حساب میآید؟

ديجياتو/ وقتي فضاپيماهاي وويجر ناسا در سال ۱۹۷۷ به فضا فرستاده شدند تا به پژوهش روي محدوديتهاي منظومه شمسي ما بپردازند، با خود دو فايل حمل ميکردند که شامل تصاوير و اصواتي بودند که حيات زميني را ترسيم ميکردند. اما در آينده، بهترين کنسول فضايي نسل بعدي را ميتوان درون بدن ما انسانها يافت.
اين بدان خاطر است که دياناي، در ذخيرهسازي داده ميليونها برابر بهينهتر از هارد درايو مغناطيسي موجود در لپتاپ يا کامپيوتر شما عمل ميکند. از آنجايي که دادههايي به مراتب متراکمتر از آنچه روي سيليکون امکانپذير است را ميتوان در دياناي ذخيرهسازي کرد، اساسا قادر به جاي دادن تمام دادههاي جهان درون تنها چند گرم دياناي هستيد.
ايليا فينکلشتاين، دستيار پروفسور زيستشناسي مولکولي در دانشگاه تگزاس ميگويد: «از آنجايي که دياناي از سوي تمام گونههاي حيات به عنوان اصليترين مديوم ذخيرهسازي اطلاعات انتخاب شده، اساسا با سيستمي بسيار قدرتمند روبهرو هستيم. مدتهاي طولاني بعد از اينکه حافظههاي مغناطيسي ما شکلي منسوخ به خود بگيرند، طبيعتا همچنان در حال استفاده از دياناي خواهد بود».
فينکلشتاين عضو تيمي در دانشگاه تگزاس شهر آستين است که ميخواهد بيشترين استفاده ممکن را از متدهاي ذخيرهسازي مبتني بر دياناي ببرد. اگرچه اين حوزه حداقل از دهه ۱۹۸۰ ميلادي نقطهاي تلاقي ميان زيستشناسي مولکولي و علوم کامپيوتر بوده، محققان تا به امروز به سختي قادر به برطرفسازي خطاهايي بودهاند که دياناي مداوما به وجود ميآورد.
در مقالهاي که اخيرا در ژورنال Proceedings of the National Academy of Science منتشر شده، فينکلشتاين و اعضاي ديگر تيم به ارائه جزييات مربوط به متد تصحيح خطاي جديد خود پرداختهاند. آنها توانستهاند تمام رمان جادوگر شهر اُز را به زبان اسپرانتو و با دقت بيشتري نسبت به متدهاي مبتني بر دياناي پيشين ذخيره کردهاند. به اين ترتيب ما در مسير دستيابي به متدهاي آتي ذخيرهسازي داده قرار گرفتهايم.
تاريخچهاي کوتاه از ذخيرهسازي مبتني بر دياناي
محققان دانشگاه تگزاس به طور يقين نخستين دانشمنداني نيستند که در صدد انکد يک اثر هنري درون رشتههاي دياناي برآمدهاند.
سابقه ذخيرهسازي مبتني بر دياناي در واقع به سال ۱۹۸۸ ميلادي و آزمايشي در دانشگاه هاروارد بازميگردد. محققين اين دانشگاه توانستند تصويري متعلق به يکي از آثار هنري جو ديويز را درون يک رشته دياناي اشريشيا کلي ذخيرهسازي کنند. هنگام ديکد، اين تصوير ماتريکسي ۵ در ۷ به وجود آورد.
تا سال ۲۰۱۱ ميلادي، محققان انستيتوي بيوانفورماتيک اروپا در بريتانيا هم رويکردي مشابه در پيش گرفتند. نيک گلدمن، تکنيسين بيوانفورماتيک، مشغول صحبت با همکاران خود راجع به اين بود که چطور ميتوان رشتههاي ژنومي که جهان مقاديري بسيار فراوان از آنها را توليد کرده را يکي پس از ديگري روي هم ذخيره کرد. اين بحثي بود که به عنوان شوخي شروع شد.
خودش به نشريه Nature ميگويد: «با خودمان فکر کرديم چه چيزي جلوي ما را گرفته که از دياناي براي ذخيرهسازي اطلاعات استفاده نکنيم؟». دو سال بعد، اين گروه توانسته بود با موفقيت، ۵ فايل مختلف را درون رشتههاي دياناي انکد کند، از جمله سخنراني معروف «من رويايي دارم» مارتين لوتر کينگ جونيور و غزلهايي از شکسپير.
در ماه نوامبر ۲۰۱۶، يکي از شرکتهاي زيرمجموعه انستيتوي تکنولوژي ماساچوست به نام Catalog، توانست ۱۴۴ کلمه از شهر معروف «راه نرفته» از رابرت فراست را در رشتههاي دياناي ذخيره کند. اين فايل حدودا يک کيلوبايت حجم داشت.
در همان سال، تيمي از محققين مايکروسافت و دانشگاه واشنگتن توانستند ۲۰۰ مگابايت داده را درون رشتهاي طولاني از دياناي جاي دهند، بخشي از اين داده، رمان شهير جنگ و صلح بود. در ماه مارس ۲۰۱۹، همين تيم حتي توانست به توسعه نخستين سيستم ذخيرهسازي و بازيابي اتوماتيک داده بپردازند که از مواد ژنتيکي ساخته شده.
امروز بسياري از شرکتهاي بزرگ تکنولوژي وارد اين حوزه شدهاند و از جمله آنها ميتوان به IBM و گوگل اشاره کرد. حتي سازمان فوق سري «پروژههاي فعاليت تحقيقاتي پيشرفته اطلاعاتي» ايالات متحده -که همتاي دولتي دارپا به حساب ميآيد، اما براي جاسوسها- هم به سرمايهگذاري در اين حوزه پرداخته است. محققان تمام اين شرکتها و سازمانها آيندهاي را متصور شدهاند که در آن ميتوانيم ارزشمندترين دادههايمان را درون ويالهاي دياناي ذخيرهسازي کنيم و هر زمان که لازم بود، آنها را از آزمايشگاههاي تاريک و خنک بيرون بکشيم.
حافظه مبتني بر دياناي چطور کار ميکند؟
هارد درايو مغناطيسي يکي از محبوبترين متدها براي ذخيرهسازي داده در کامپيوترهاي امروزي به حساب ميآيد. درون اين حافظهها، يک جفت ديسک گردان به نام «ديس» يا «Platter» خواهيد يافت که شبيه به يک سيدي هستند. اين ديسها، دادهها را در قالب ۰ و ۱ (يا کد باينتري) روي سطوح خود ذخيره ميکنند. با تعبيه شدن روي يک محور، ديس به گردش ميافتد و يک جريان الکترونيکي، داده را روي سطح مينويسد يا از روي آن ميخواند. قطعات الکترونيکي نيز به تمام عمليات قوت ميرسانند.
به صورت مشابه، حافظه مبتني بر دياناي نيازمند تدابير انکد و ديکد است. در اين مورد خاص، محققان به صورت شيميايي به توليد دياناي مصنوعي با خواصي مشخص ميسازند که بر مبناي چهار نوکلئوتيد به دست ميآيند: آدنين (A)، کيتوزين (C)، گوانين (G) و تيمين (T). اين نوکلئوتيدها هستند که ساختار حلزوني و نردباني مواد ژنتيکي را ميسازند.
از آنجايي که دياناي چهار بلوک سازنده دارد، به جاي استفاده از ۰ و ۱ هاي باينري در هارد درايوهاي مغناطيسي، متد حافظه ژنتيکي به مراتب متراکمتر است. اين را جان هاوکينز، يکي از نويسندگان مقاله اخير ميگويد. «يک قاشق غذاخوري دياناي حاوي مقاديري از اطلاعات است که به صورت معمول براي ذخيرهسازي آنها با تکنولوژيهاي کنوني، به ديتاسنترهايي هماندازه ۱۰ سوپرمارکت والمارت نياز خواهيد داشت. يا آنطور که برخي مردم ترجيح ميدهند بيانش کنند، ميتوانيد تمام اينترنت را در يک جعبه کفش جاي دهيد».
نهتنها اين، بلکه دياناي آيندهاي تضمين شده دارد. هاوکينز زماني را به ياد ميآورد که طي دهه ۱۹۹۰ ميلادي، سيديها اصليترين متد ذخيرهسازي داده بودند و اين وعده به ما داده شده بود که داده تا ابد روي سيدي باقي ميماند، چرا که پلاستيک عمري بسيار طولاني دارد. داده ذخيره شده روي دياناي از طرف ديگر ميتواند صدها هزار سال باقي بماند. در واقع يک شاخه علمي کامل به نام باستانشناسي ژنتيکي داريم که با بررسي طول عمر دياناي، در صدد درک گذشته باستان برآمده است.
فراتر از اين، دياناي بعد از ذخيرهسازي داده نياز به هيچگونه نگهداري و رسيدگي ندارد. هرچه نباشد فسيلهاي بعد از سپري کردن ميليونها سال در زير زمين، کماکان رشتههاي دياناي را در خود نگه داشتهاند. حافظه دياناي نيازي به هيچگونه انرژي هم ندارد و صرفا بايد در جايي تاريک و خنک نگهداري شود تا بالاخره يک نفر يک روز تصميم به استفاده از دادههاي درون آن بگيرد. اما هاوکينز ميگويد بزرگترين مزيت اينست که خواندن داده از روي دياناي و نوشتن آن هيچوقت شلي منسوخ به خود نخواهد گرفت.
«اگر من بخواهم مقالهاي که در کودکي نوشتهام را بخونم، بايد نخست به يک موزه رفته و کامپيوتري سالم و متعلق به آن دوران را بيابم. و من تازه در دهه چهارم زندگيام به سر ميبرم. اما دياناي به شکلي منحصر به فرد آيندهاي تضمين شده دارد، زيرا خود ما از آن ساخته شديم. تا زماني که انسانها از دياناي ساخته شده باشند، همواره ماشينهايي دم دست خواهيم داشت که قادر به خواندن اطلاعات هستند.
عبور از خطاها
اما مثل تمام متدهاي ذخيرهسازي داده، دياناي نواقص و مشکلات خودش را نيز دارد. برجستهترين چالش در استفاده از اين متد، هزينه است. هاوکينز ميگويد که متدهاي کنون از نظر هزينه مشابه Apple Hard Disk 20 در دهه ۱۹۸۰ ميلادي هستند. در آن زمان، حدودا ۲۰ مگابايت فضاي ذخيرهسازي -معادل با ميزان دادهاي که براي دانلود يک ويديوي ۱۵ دقيقهاي نياز داريد- حدودا ۱۵۰۰ دلار هزينه به همراه ميآورد.
گذشته از اين، دياناي محکوم به خطا است. بياييد دوباره راجع به نوکلئوتيدهايي که نردبان دياناي را ميسازند صحبت کنيم. به صورت ميانگين، به ازاي هر ۱۰۰ الي ۱۰۰۰ نوکلئوتيد، يک خطا درون دياناي رخ ميدهد و اين خطاها ميتوانند به سه شکل بروز پيدا کنند: جايگزيني، جاگذاري و حذف.
در يک جهش جايگزيني، يک حرف واحد درون رشتهاي از نوکلئوتيد ممکن است جاي خود را به حرفي ديگر بدهد. مثلا ممکن است کيتوزين جايگزين تيمين شود، هرچند که طول رشتههاي دياناي يکسان باقي ميماند. در جاگذاري و حذف اما دياناي يک پايه نوکلئوتيدي اضافه به دست ميآورد يا يک پايه را حذف ميکند. اما برخلاف ارورهاي موجود در کدهاي کامپيوتري، شاهد هيچگونه فضاي خالي در جايي که پايه حذف شده قبلا وجود داشته نخواهيد بود. بنابراين هنگام ديکد داده ذخيره شده درون دياناي، اين موضوع خيلي سريع تبديل به مشکلي بزرگ ميشود.
هاوکينز به مقايسه اين موضوع با کلمات انگليسي ميپردازد: «با حذف يک حرف L، عبارت World تبديل به Word ميشود. حالا اگر يک S در اين عبارت جاگذاري شود، کلمه Sword به دست ميآيد. خواندن ورژن صحيح Sword که قرار بوده World باشد شکلي دشوار به خود ميگيرد، زيرا Sword کماکان يک کلمه واقعي در زبان انگليسي است. اما حروف تغيير مکان دادهاند.»
در ديگر فرمهاي حافظه دياناي، با تکرار کردن ۱۰ يا ۱۵ باره کد ميتوان از اين ارورها عبور کرد، اما چنين کاري به معناي اتلاف فضاي ذخيرهسازي نيز هست. در متد تازهاي که محققان در مقاله اخير خود به آن پرداختهاند، داده را به صورت مشبک درون دياناي قرار دادهاند و هر بيت داده، داده بعدي را تقويت ميکند و به اين ترتيب لازم است تنها يکبار خوانده شود.
آنها ضمنا به توسعه الگوريتمي پرداختهاند که به صورت يکجا به ارورهاي جاگذاري، حذف و جايگزيني رسيدگي ميکند و حافظه ديجيتالي مبتني بر دياناي شکلي بهينهتر به خود ميگيرد. به همين خاطر بوده که تيم مورد نظر توانسته به آساني جادوگر شهر از را درون رشتههاي دياناي جاي دهد و در اين مسير نيازمند تکرار ترکيبهاي A و C و T و G بهصورت پيدرپي نبوده است.
تصويري از آينده
با حرکت به سمت آينده، پتانسيل حافظههاي مبتني بر دياناي عملا نامحدود خواهد بود. فينکلشتاين تصويري از آيندهاي را ترسيم ميکند که در آن، ميتوانيم از دياناي حاوي داده درون مواد ديگر استفاده کنيم.
او ميگويد در يک مثال، محققان يک تکه پلاستيک چاپ سهبعدي شده را به رشتههاي دياناي حاوي فايلهاي طراحي همان پلاستيک چاپ شده مجهز کردند. همينطور که تکه پلاستيکي از درون پرينتر عبور ميکند، قادر به رها کردن دياناي است تا بازتوليد فايل در پروسهاي دائمي صورت بگيرد.
يا مي توانيد از حافظه داده مبتني بر دي ان اي به عنوان راهي براي به دست آوردن اطلاعات راجع به اشياي ثباتي که ماده ژنتيکي مخصوص به خود را ندارند استفاده کنيد. فرض ميکنيم که يک هواپيما را با مادهاي که حاوي دياناي است ميپوشانيد و دستورالعمل کامل ساخت هواپيما را درونش تعبيه ميکنيد. اگر مشکلي پيش آيد و هواپيما در دريا سقوط کند، دياناي تعبيه شده در لايه رويي به خاطر اشعههاي فرابنفش خورشيد تجزبه ميشود.
اين روند تجزيه ميتواند راهي براي جمعآوري اطلاعات راجع به اتفاقي که براي هواپيما افتاده باشد. حتي اگر تنها يک تکه از لاشه هواپيما کشف شود هم دانشمندان ميتوانند دياندي ذخيره شده و ميزان تجزيه را تحليل کرده و بفهمند هواپيما براي چه مدت در دريا گم شده بوده است.
اما حتي با دستاوردهاي مهمي که فينکلشتاين و تيمش داشتهاند هم حافظه ديجيتالي مبتني بر دياناي هنوز مسيري طولاني در پيش دارد. او ميگويد: «به نظرم در موارد بسيار خاص بزودي قادر به استفاده از چنين حافظههاي هستيم. اما فکر نميکنم که تا يک دهه ديگر يا حتي بيشتر شاهد عرضه آن به بازار به عنوان محصولي عمومي باشيم».
اما هر زمان که چنين چيزي امکانپذير شود، حافظه مبتني بر دياناي بزرگترين گامي خواهد بود که بشر تاکنون در زمينه ذخيرهسازي داده برداشته است.