هدفونی که مترجم همزمان چند کاربر می شود

مهر/ محققان آمریکایی یک سیستم هدفون پیچیده ابداع کرده اند که همزمان گفتار چند نفر را ترجمه و در عین حال جهت و کیفیت صوت ها را نیز حفظ می کند.
به گزارش اینترستینگ انجینرینگ، محققان دانشگاه واشنگتن یک سیستم جدید به نام «ترجمه گفتار فضایی» (Spatial Speech Translation) را توسعه دادهاند که با استفاده از هدفونهای ضد صوت موجود در بازار و میکروفونهای مجهز به آنها ساخته شده است.
این سیستم با استفاده از الگوریتمهای پیشرفته، توانایی جداسازی سخنگویان مختلف در یک محیط و پیگیری حرکات آنها را دارد. سپس، این سیستم سخنان هر فرد را ترجمه کرده و با تاخیری بین دو تا چهار ثانیه، آن را دوباره پخش میکند. شیام گولاکوتا، نویسنده ارشد این پژوهش، بیان کرد که سایر فناوریهای ترجمه معمولاً بر این فرض بنا شدهاند که تنها یک فرد در حال صحبت است. اما در واقعیت، یک صدای روباتیک نمیتواند به جای چند نفر در یک اتاق صحبت کند. این سیستم برای نخستین بار توانسته صدای هر فرد و جهتی که صدا از آن میآید را حفظ کند.
محققان همچنین اعلام کردند که این سیستم دارای سه نوآوری اصلی است. نخستین نوآوری آن است که به محض روشن شدن، بهطور لحظهای تعداد افرادی که در یک فضای بسته یا باز صحبت میکنند را شناسایی میکند. توچائو چن، رهبر پروژه، توضیح داد که الگوریتمهای طراحی شده مانند رادار عمل میکنند و فضای اطراف را بهطور ۳۶۰ درجه اسکن کرده و بهطور مداوم تعداد افرادی که در حال صحبت هستند را شناسایی و بهروزرسانی میکنند.
این سیستم وقتی بر روی دستگاههای موبایل با تراشه M۲ اپل مانند لپتاپ یا اپل ویژن پرو فعال میشود، گفتار را ترجمه کرده و ویژگیهای بیانی و بلندی صدای هر فرد را حفظ میکند. همچنین، محققان به دلیل نگرانیهای حریم خصوصی مربوط به نسخهبرداری از صدا، از ابر رایانشی استفاده نکردهاند.
این سیستم همچنین میتواند هنگام تکان دادن سر افراد، جهت و ویژگیهای صوتی آنها را ردیابی کند.