ديجياتو/ محققان فيسبوک موفق به توسعه يک مدل مبتني بر هوش مصنوعي شدهاند که از طريق بازيابي کلمات، جملات و پاراگرافها در زبانهاي مختلف و شناسايي الگوهاي درون آنها قادر به توليد متني خلاصه است. اين مدل «خودرمزگذار چند زبانه با قابليت بازيابي و توليد» يا به شکل خلاصه MARGE نام دارد.
بر اساس گزارش VentureBeat، محققان ادعا کردهاند که MARGE ميتواند براي بازنويسي، ترجمه و خلاصه کردن متن بدون تنظيم دقيق آموزش ببيند که يک قدم مناسب به سوي سيستمهايي محسوب ميشود که ميتوانند تمام وظايف مربوط به متون را تنها توسط آموزش قبلي انجام دهند.
در يادگيري ماشيني، آموزش قبلي شامل تمرين يک مدل هوش مصنوعي توسط حجم بالايي از اطلاعات پيش از تنظيم دقيق آن به وسيله تعداد کمي اطلاعات براي انجام وظايف خاص ميشود. MARGE ميتواند با کاهش اطلاعات موردنياز، متون را بازنويسي کند.
در زمان آموزش، هوش مصنوعي اسناد اوليه يا مدارک و اسناد هدف را مورد بررسي قرار ميدهد و نحوه خلاصه کردن دقيق را ياد ميگيرد و ميتواند بخشهاي خاصي از متن را ترجمه کند. MARGE ابتدا نمره ارتباط ميان هر جفت اسناد را محاسبه ميکند که همين موضوع جستجوي اسناد مرتبط بيشتر را در پي دارد. پس از اين کار، احتمال بازسازي هر هدف را با مدل اصلاح شده «seq2seq» که براي پردازش زبان توسعه پيدا کرده، محاسبه ميکند.
نمونهاي از مهارت MARGE در ترجمه زبان ايتاليايي
در نهايت اين هوش مصنوعي با استفاده از مدل مربوط به بازيابي، دستههايي از مدارک مرتبط با اهداف ايجاد ميکند. در طي آزمايشها، محققان يک مدل مبدل با ۹۶۰ ميليون پارامتر با نام «MARGE-NEWS» خلق کردند که شامل ۲۰۴۸ عامل ميشود که هر يک از آنها در ۵۵۰ هزار گام، زير دستههاي حاوي ۴ سند (دو مدرک و دو هدف) را پردازش ميکنند.
محققان فيسبوک گزارش کردهاند که MARGE در زمينه بازيابي جملات با زبانهاي مختلف، عملکرد بهتري نسبت به مدلهاي بينظارت دارد. در BLEU که پارامتري براي کيفيت ترجمه زبان است، MARGE موفق به کسب امتياز ۳.۵۸ در ترجمه آلماني به انگليسي شد که آن را در بالاترين ردهها قرار ميدهد.
بازار