اپلیکیشنهای مترجم صدای گربه چگونه کار میکنند؟




مجله ديجي کالا/ اگر صاحب گربه هستيد، احتمالا با اپليکيشنهايي که مدعي ترجمهي صداي گربه هستند، روبرو شدهايد. اما آيا واقعا اين اپليکيشنهاي مترجم صداي گربه کارايي دارند؟ در پاسخ به اين پرسش بايد بگوييم که اين ادعا تا حدي صحت دارد. بخشي از پيچيدگي قضيه به منحصر به فرد بودن زبان هر گربه برميگردد اما به لطف فناوريهاي جديد، در اين زمينه پيشرفتهاي قابل توجهي صورت گرفته که در ادامه به اين موضوع ميپردازيم.
تشخيص گفتار و يادگيري ماشيني
تشخيص گفتار به زبان ساده مبتني بر ضبط گفتار موردنظر و تبديل آن به يک فايل ديجيتالي است. سپس نرمافزار بخشهايي از اين فايل را کدگذاري و تحليل ميکند تا بتواند منظور فرد را متوجه شود. اين کدگذاريها با توجه به صداي پسزمينه و نحوهي صحبت کردن فرد بسيار متفاوت محسوب ميشود.
ما گاهي اوقات تکنولوژي تشخيص صدا را يک امر بديهي در نظر ميگيريم اما بايد بگوييم که يک شاهکار در حوزهي تکنولوژي به حساب ميآيد. روي هم رفته هر کلمه شامل طيف گستردهاي از صداها يا آواها است که با يکديگر ترکيب ميشوند و در نتيجه کامپيوتر براي تشخيص و درک گفتار انسان بايد فرايند بسيار پيچيدهاي را پشت سر بگذارد. از طرف ديگر، تشخيص صداي گربه از اين هم سختتر به نظر ميرسد.
اپليکيشنهاي فعال در حوزهي تشخيص گفتار از مجموعه داده يا ديتاست استفاده ميکنند که از ميليونها کلمه تشکيل شده است. سپس اين اپليکيشن تلاش ميکند گفتار شما را با نزديکترين کلمات ذخيره شده در بانک اطلاعاتي خود تطبيق دهد. زماني که مرتکب اشتباه ميشود و شما آن را اصلاح ميکنيد، دادههاي جديد را براي دفعهي بعدي ذخيره ميکند. اين فرايند بخشي از يادگيري ماشيني محسوب ميشود.
سيستمهاي تشخيص صدا هنوز مشکلات مختلفي دارد که اين مشکلات براي افراد دچار اختلال گفتاري و لهجه بيشتر است. با اين حال، سيستمهاي تشخيص گفتار روزبهروز بهتر ميشوند. اما در نهايت سوالي که مطرح ميشود اين است که آيا اين رويکرد براي اپليکيشنهاي مترجم صداي گربه هم جواب ميدهد؟
تشخيص گفتار انسان در برابر تشخيص صداي گربه
اول از همه بايد درک کنيم چرا ترجمهي نوع خاصي از صداي گربه به «من گرسنه هستم» با تجزيه و تحليل گفتار انسان تفاوت دارد. از طرف ديگر، مشکل بزرگتر اين است که گربهها تا حد زيادي با نشانههاي غيرکلامي مانند حالت بدن خود، پيام را منتقل ميکنند. همچنين بايد به فقدان زبان بينالمللي گربهها هم اشاره کنيم.
روي هم رفته، کارشناسان ميگويند که صداي گربه بايد به همراه حالت بدن و شرايط موردنظر بررسي شود. در ضمن هر گربهاي زبان خاص خود را دارد. طبق بررسيهاي صورت گرفته، گربهها زبان شخصيسازي شده براي صاحبان خود را ايجاد ميکنند. بنابراين با توجه به اين محدوديتها، اپليکيشنهاي مترجم صداي گربه چگونه ميتوانند براي تمام گربهها انجام وظيفه کنند؟
يادگيري ماشيني انعطافپذير براي گربهها
اگرچه چند دستيار مجازي مانند Oto براي درک لحن و احساس ارائه شدهاند، اما سيستمهاي تشخيص گفتار در زمينهي سيگنالهاي غيرکلامي هنوز عملکرد خوبي ندارند. اما اين موضوع به معناي غيرممکن بودن تفسير اين اطلاعات نيست.
يکي از اپليکيشنهاي مترجم صداي گربه MeowTalk نام دارد که که براي غلبه بر اين مشکلات، از نوعي يادگيري ماشيني انعطافپذير بهره ميبرد. اين اپليکيشن توسط خاوير سانچز توسعه پيدا کرده که يکي از اعضاي تيم دستيار هوشمند الکسا از شرکت آمازون بوده است. به نظر او، اين اپليکيشن يک گام در راستاي حرکت به سمت قلادههاي هوشمند به حساب ميآيد. اين قلادهها قرار است با بهرهگيري از الگوريتمهاي بسيار پيشرفته، به انسانها براي درک بهتر گربههاي خود کمک کنند.
در اين اپليکيشن، براي هر گربه بايد پروفايل جداگانهاي ايجاد کنيد. طبق پژوهشهاي صورت گرفته، صداي يک بچه گربه با صداي گربهي بزرگسال تفاوت دارد و به همين خاطر اپليکيشن از شما ميخواهد که تاريخ تولد گربهي موردنظر را هم وارد کنيد. هر پروفايل يک شبکهي داده منحصر به فرد براي گربه ايجاد ميکند.
در ابتدا، اين اپليکيشن کار خود را با ۱۰ پروفايل صدا آغاز ميکند که هرکدام نشاندهندهي معناهاي مختلف مانند «شاد بودن» يا «حالت شکار» هستند. زماني که اپليکيشن صدايي را ميشنود و اشتباه تشخيص ميدهد، ميتوانيد آن را اصلاح کنيد يا اينکه پروفايل جديدي براي صداي موردنظر ايجاد کنيد.
سيستمهاي يادگيري ماشيني مربوط به اپليکيشنهاي تشخيص گفتار معمولا در برابر اين اصلاحات مقاومت ميکنند. اما يادگيري ماشيني انعطافپذير اين اپليکيشن به کاربران اجازه ميدهد که به راحتي اصلاحات زيادي را اعمال کنند. به مرور زمان و با اصلاح و اضافه کردن صداهاي مختلف، ميتوانيد يک پروفايل شخصيسازي شده براي گربهي خود را ايجاد کنيد.
آيا اپليکيشنهاي مترجم صداي گربه واقعا کار ميکنند؟
در نهايت، عملکرد اين نوع اپليکيشنها تا حد زيادي به خود کاربر بستگي دارند زيرا بايد نحوهي صحبت کردن گربهي خود را به اپليکيشن آموزش دهند. با توجه به اينکه گربهها زبان يکساني ندارند، اين رويکرد تغيير چنداني نخواهد داشت.
اما اين واقعيت که يادگيري ماشيني تا اين حد پيشرفت کرده و ميتواند حتي تا حدي در اين زمينه موفق باشد، باورنکردني است. يادگيري ماشيني و ديگر حوزههاي هوش مصنوعي با سرعت فوقالعادهاي روزبهروز بهتر ميشوند و طي سالهاي آينده، پيشرفتهاي هيجانانگيزي را امکانپذير ميکنند.