نماد آخرین خبر
  1. جذاب ترین ها
علم و تکنولوژی

هوش مصنوعی اسرار متون قدیمی را فاش کرد/ با فناوری هیچ رازی پنهان نمی‌ماند

منبع
آنا
بروزرسانی
هوش مصنوعی اسرار متون قدیمی را فاش کرد/ با فناوری هیچ رازی پنهان نمی‌ماند

آنا/محققان دانشگاه نوتردام در حال توسعه یک شبکه عصبی مصنوعی برای خواندن دست نوشته‌های پیچیده باستانی مبتنی بر قابلیت یادگیری عمیق هستند.

کتابخانه کلیسای سنت گال در سوئیس دارای ۱۶۰ هزار جلد نسخه خطی ادبی و تاریخی است که به قرن هشتم میلادی باز می‌گردد. تمام این آثار با دست، روی پوست به زبان‌هایی که در دوران معاصر به ندرت صحبت می‌شود نوشته شده‌اند.

برای حفظ این روایت‌های مهم تاریخی معمولاً چنین متونی که شمار آنها در اقصی‌نقاط جهان به میلیون‌ها نسخه می‌رسد در موزه‌ها، کتابخانه‌ها و صومعه‌های سراسر جهان نگهداری می‌شوند. امروزه بخش قابل توجهی از این مجموعه‌ها از طریق تصاویر دیجیتال در دسترس عموم قرار گرفته است.
 
سایت‌هایی وجود دارد که می‌توانید به آن مراجعه کنید، کتاب مورد نظر خود را انتخاب کنید و صفحاتش را ورق بزنید، اما کارشناسان می‌گویند بخش قابل توجهی از مطالب این کتب هرگز خوانده نشده است و به عبارت دیگر گنجینه‌ای از تاریخ جهان در این متون پنهان مانده است.

توسعه یک شبکه عصبی مصنوعی برای حل مسئله
در حال حاضر محققان دانشگاه نوتردام در حال توسعه یک شبکه عصبی مصنوعی مبتنی بر یادگیری عمیق برای خواندن کتب باستانی هستند.

والتر شایرر(Walter Scheirer) دانشیار دانشکده علوم و مهندسی کامپیوتر در نوتردام می‌گوید: «ما با متون تاریخی سروکار داریم که زبان مورد استفاده از آنها قرن‌هاست منسوخ شده است(یا زبان‌هایی مثل لاتین که به ندرت استفاده می‌شود). ممکن است یافتن تصاویر زیبایی از آنها در فضای وب مقدور باشد اما آنچه ما قصد انجام آن را داریم این است که هوش مصنوعی درک صفحه را از منظر یک متخصص تقلید کرده و خواندن سریع و قابل جستجو را در متن فراهم کند.»

 تعداد زیادی آثار خطی در جهان وجود دارد که هنوز به طور دیجیتالی در نیامده و ترجمه نشده‌اند
شایرر در مقاله ترانزکشن(مقاله‌هایی با جزییات کامل) خود که در ژورنال Pattern Analysis and Machine Intelligence در انستیتوی مهندسی برق و الکترونیک منتشر شده است توضیح می‌دهد که چگونه تیم او روش‌های سنتی یادگیری ماشین را با روان‌فیزیک بصری(visual psychophysics) تلفیق کرده است؛ روشی برای اندازه‌گیری ارتباط بین محرک‌های فیزیکی و پدیده‌های روانی، مانند زمانی که متخصص برای تشخیص یک کاراکتر خاص به بررسی کیفیت دست خط یا استفاده از اختصارات خاص متوسل می‌شود.

تیم شایرر برخی از نسخه‌های خطی دیجیتالی لاتین را که توسط کاتبان در صومعه سنت گال در قرن نهم نوشته شده بود مطالعه کردند. خوانندگان رونویسی‌های دستی خود را در یک رابط نرم‌افزاری که برای این کار طراحی شده بود وارد کردند. سپس تیم زمان بررسی کامپیوتری را اندازه‌گیری کرد.

تلفیق یادگیری ماشینِ معمول و یک روش مبتنی روان‌فیزیک بصری
در این مرحله مشخص شد که کدام کلمات، کاراکترها و قطعات آسان یا دشوار هستند. شایرر در مقاله توضیح داده است که این نوع داده‌ها، شبکه‌ای سازگارتر با رفتار انسان ایجاد می‌کند، خطاها را کاهش می‌دهد و خوانایی دقیق‌تر و واقعی‌تری از متن ارائه می‌دهد.

وقتی از قرون وسطی و گذشته‌های دور صحبت می‌کنید، برای درک جزئیات و پیامدهای رویدادهای تاریخی باید نوشته‌ها و مطالب را بررسی کنید وگرنه شناختتان ناقص خواهد بود.
شایرر می‌گوید: «این راهبرد معمولاً در یادگیری ماشین استفاده نمی‌شود. ما داده‌ها را از طریق این اندازه‌گیری‌های روان‌فیزیکی که مستقیماً مبتنی بر مطالعات روانشناختی ادراک با اندازه‌گیری‌های رفتاری هستند تگ‌گذاری می‌کنیم. سپس شبکه را از مشکلات رایج در درک این کاراکترها از طریق یک سری ورودی‌های دیگر مطلع می‌کنیم و می‌توانیم بر اساس آن اندازه‌گیری‌ها اصلاحاتی انجام دهیم.»

یادگیری عمیق مورد توجه محققان علوم انسانی قرار گرفته است
هیلدگوند مولر(Hildegund Müller)، دانشیار گروه ادبیات کلاسیک در نوتردام می‌گوید: «بین گرفتن عکس از صفحات و قابلیت خواندن آنها و داشتن برنامه‌ای برای ایجاد قابلیت جست‌وجو تفاوت وجود دارد. اگر متون مورد استفاده در این تحقیق(یعنی نسخه خطی قرن نهم) را در نظر بگیرید متوجه می‌شوید که از دوران اولیه قرون وسطی حرف می‌زنیم. زمان زیادی تا تولید دستگاه چاپ باقی مانده است. بنابراین در این برهه شمار قابل توجهی کتب خطی تولید شده است.»

انواع اطلاعات پنهان در این نسخه‌های خطی و متون ناشناس وجود دارد که هیچکس قبلاً ندیده است و بی‌تردید به دانش ما از تاریخ کمک می‌کند. شایرر معتقد است با وجود اینکه هوش مصنوعی کمک زیادی کرده است اما چالش‌ها همچنان وجود دارد. در حال حاضر تیم او روی بهبود دقت رونوشت‌ها، به ویژه در مورد اسناد آسیب‌دیده یا ناقص و همچنین نحوه توضیح تصاویر یا جنبه‌های دیگری که می‌تواند برای شبکه گیج‌کننده باشد کار می‌کند.

یکی از مزایای راهبرد فعلی تلفیق روش‌های مختلف فناوری در کنار هم است
با این حال تیم تحقیقاتی توانسته است برنامه فعلی را برای رونوشت برداشتن متون حبشی تنظیم کند و آن را با زبانی با مجموعه کاراکترهای کاملاً متفاوت تطبیق دهد که این را می‌توان اولین گام در جهت توسعه یک برنامه با قابلیت رونویسی و ترجمه اطلاعات برای کاربران قلمداد کرد.

مولر می‌گوید: «این برنامه در زمینه ادبی واقعاً می‌تواند مفید باشد. هوش مصنوعی در تحقیقات بایگانی تاریخی ارزشمند است. با این وجود پیشرفت علوم انسانی دیجیتال همچنان در مراحل اولیه خود قرار دارد. وقتی از قرون وسطی و گذشته‌های دور صحبت می‌کنید، برای درک جزئیات و پیامدهای رویدادهای تاریخی باید نوشته‌ها و مطالب را بررسی کنید وگرنه شناختتان ناقص خواهد بود و این متون تنها چیزی است که ما داریم. ممکن است مشکل در خارج از دنیای غرب حتی بیشتر باشد. به زبان‌هایی فکر کنید که در فرهنگ‌های در معرض تهدید منسوخ می‌شوند. ما باید قبل از هر چیز این آثار را حفظ کرده در دسترس عموم قرار دهیم و سپس کارهای مرتبط با زبان‌شناسی آنها را تکمیل کنیم. اگر گرامر آنها را ندانیم کار دشواری در پیش خواهیم داشت. ما در حال رقابت با زمان هستیم.»


به پیج اینستاگرامی «آخرین خبر» بپیوندید
instagram.com/akharinkhabar