زوميت/ نمونهي اوليهي سيستم ترجمهي مبتنيبر هوش مصنوعي گوگل، در ترجمهي ورودي صوتي علاوهبر تاکيد بر ارائهي معني درست کلمات، لحن گوينده را نيز شبيهسازي ميکند.
بيشک، ارتباطات، مفهوم گستردهاي دارد و تنها بهمعني انتقال واژهها بين دو طرف يک رابطه نيست. گوگل نمونهي اوليهي سيستم ترجمه مبتنيبر هوش مصنوعي را بهنمايش گذاشته است. اين سيستم جديد نهتنها واژههايي را که از دهان گوينده خارج ميشود بهخوبي ترجمه ميکند، بلکه در حين ترجمه به لحن و حالت گفتار گوينده نيز توجه نشان ميدهد و لحن فايل ورودي را شبيهسازي ميکند.
سيستم مبتنيبر هوش مصنوعي ترجمهي گوگل، Translatotron نامگذاري شده است. محققان گوگل در مورد جزئيات عملکرد اين سيستم جديد در وبلاگ رسمي گوگل توضيحات مفصلي ارائه دادهاند. البته بايد خاطرنشان کرد که انتظار نميرود Translatotron به اين سرعت به محصولي تجاري تبديل شود ولي توسعهي تجاري آن درنهايت محقق خواهد شد.
اوايل سال جاري، مدير بخش ترجمهي گوگل در گفتگويي با ورج اعلام کرده بود که گوگل قصد دارد ابزارهايي براي بهبود ترجمه ازجمله اضافه کردن قدرت تشخيص لحن گوينده را به سيستم ترجمهي اين شرکت اضافه کند تا گوگل ترنسليت بتواند با کارايي بهتر و همچنين خطاي کمتري مکالمات را ترجمه کند.
گوگل، فايلهاي نمونهي ترجمهي صوتي شرکت را بهاشتراک گذاشته شده است تا کاربران بتوانند با نحوهي عملکرد سيستم جديد ترجمهي گوگل آشنا شوند. فايل اول، فايل صوتي ورودي است. فايل صوتي دوم، ترجمهي اصلي به شکل مرسوم و فايل صوتي سوم نيز نمونهي ترجمهي بهينهسازيشده توسط سيستم Translatotron گوگل ترنسليت است.
اگر در فايلهاي صوتي دقت کنيد، متوجه ميشويد ترجمه فايل صوتي فقط بهصورت کلمهبهکلمه انجام نشده و در ترجمهي با سيستم Translatotron تغيير لحن گوينده براساس محتواي ترجمهشده کاملا مشهود است. گروه تحقيقاتي ترجمهي گوگل نمونههاي بيشتري از فايلهاي صوتي ترجمهشده با سيستم جديد را بهاشتراک گذاشته است.
سيستم Translatotron مبتنيبر هوش مصنوعي، ترجمهاي غيرمنفعل و غيرخطي ارائه ميدهد که ميتواند براي کاربران از جذابيت بالاتري نسبت به ترجمهي واژهبهواژه و بدون توجه به لحن گوينده برخوردار باشد. باتوجه به اينکه هيچگونه توقفي براي انجام فعاليتها و وظايف بعدي در سيستم مبتنيبر هوش مصنوعي وجود ندارد، به چنين سيستمي، سرتاسري يا end-to-end گفته ميشود. گوگل معتقد است که استفاده از رويکردهاي سرتاسري باعث افزايش سرعت ترجمه خواهد شد. علاوهبر اين، باتوجه به اينکه توقفي در حين انجام مراحل ترجمه هم وجود ندارد، از بروز خطاهاي متعدد حين ترجمه کاسته ميشود.
دادههايي که در اين مدل پردازش ميشوند، دادههاي خام صوتي نيستند. بلکه، طيف نگاره دادهها يا جزئيات تصويري دادهها نيز مورد استفاده قرار ميگيرد. درواقع، براي ترجمهي گفتار از يک زبان به زبان ديگر از تصاوير هم استفاده ميشود که براي درگير کردن ذهن مناسب است.
بايد ببينيم چنين سيستمهايي درعمل به چه صورت ميتوانند به کاربران کمک کنند. گوگل همواره سعي دارد که طرحهاي توسعهاي بلندپروازانهاي را دنبال کند تا کاربران بهصورت موثرتري بتوانند از گوگل ترنسليت استفاده کنند. بايد منتظر باشيم و ببينيم سيستم جديد ترجمهي گفتاري مبتنيبر هوش مصنوعي تا چه اندازه ميتواند مؤثر واقع شود.
بازار