نماد آخرین خبر

اپلیکیشن‌های مترجم صدای گربه چگونه کار می‌کنند؟

منبع
مجله ديجي کالا
بروزرسانی

مجله ديجي کالا/ اگر صاحب گربه هستيد، احتمالا با اپليکيشن‌هايي که مدعي ترجمه‌ي صداي گربه هستند، روبرو شده‌ايد. اما آيا واقعا اين اپليکيشن‌هاي مترجم صداي گربه کارايي دارند؟ در پاسخ به اين پرسش بايد بگوييم که اين ادعا تا حدي صحت دارد. بخشي از پيچيدگي قضيه به منحصر به فرد بودن زبان هر گربه برمي‌گردد اما به لطف فناوري‌هاي جديد، در اين زمينه پيشرفت‌هاي قابل توجهي صورت گرفته که در ادامه به اين موضوع مي‌پردازيم.

تشخيص گفتار و يادگيري ماشيني
تشخيص گفتار به زبان ساده مبتني بر ضبط گفتار موردنظر و تبديل آن به يک فايل ديجيتالي است. سپس نرم‌افزار بخش‌هايي از اين فايل را کدگذاري و تحليل مي‌کند تا بتواند منظور فرد را متوجه شود. اين کدگذاري‌ها با توجه به صداي پس‌زمينه و نحوه‌ي صحبت کردن فرد بسيار متفاوت محسوب مي‌شود.

ما گاهي اوقات تکنولوژي تشخيص صدا را يک امر بديهي در نظر مي‌گيريم اما بايد بگوييم که يک شاهکار در حوزه‌ي تکنولوژي به حساب مي‌آيد. روي هم رفته هر کلمه شامل طيف گسترده‌اي از صداها يا آواها است که با يکديگر ترکيب مي‌شوند و در نتيجه کامپيوتر براي تشخيص و درک گفتار انسان بايد فرايند بسيار پيچيده‌اي را پشت سر بگذارد. از طرف ديگر، تشخيص صداي گربه از اين هم سخت‌تر به نظر مي‌رسد.


اپليکيشن‌هاي فعال در حوزه‌ي تشخيص گفتار از مجموعه داده يا ديتاست استفاده مي‌کنند که از ميليون‌ها کلمه تشکيل شده است. سپس اين اپليکيشن تلاش مي‌کند گفتار شما را با نزديک‌ترين کلمات ذخيره شده در بانک اطلاعاتي خود تطبيق دهد. زماني که مرتکب اشتباه مي‌شود و شما آن را اصلاح مي‌کنيد، داده‌هاي جديد را براي دفعه‌ي بعدي ذخيره مي‌کند. اين فرايند بخشي از يادگيري ماشيني محسوب مي‌شود.

سيستم‌هاي تشخيص صدا هنوز مشکلات مختلفي دارد که اين مشکلات براي افراد دچار اختلال گفتاري و لهجه بيشتر است. با اين حال، سيستم‌هاي تشخيص گفتار روزبه‌روز بهتر مي‌شوند. اما در نهايت سوالي که مطرح مي‌شود اين است که آيا اين رويکرد براي اپليکيشن‌هاي مترجم صداي گربه هم جواب مي‌دهد؟

تشخيص گفتار انسان در برابر تشخيص صداي گربه
اول از همه بايد درک کنيم چرا ترجمه‌ي نوع خاصي از صداي گربه به «من گرسنه هستم» با تجزيه و تحليل گفتار انسان تفاوت دارد. از طرف ديگر، مشکل بزرگ‌تر اين است که گربه‌ها تا حد زيادي با نشانه‌هاي غيرکلامي مانند حالت بدن خود، پيام را منتقل مي‌کنند. همچنين بايد به فقدان زبان بين‌المللي گربه‌ها هم اشاره کنيم.

روي هم رفته، کارشناسان مي‌گويند که صداي گربه بايد به همراه حالت بدن و شرايط موردنظر بررسي شود. در ضمن هر گربه‌اي زبان خاص خود را دارد. طبق بررسي‌هاي صورت گرفته، گربه‌ها زبان شخصي‌سازي شده براي صاحبان خود را ايجاد مي‌کنند. بنابراين با توجه به اين محدوديت‌ها، اپليکيشن‌هاي مترجم صداي گربه چگونه مي‌توانند براي تمام گربه‌ها انجام وظيفه کنند؟

يادگيري ماشيني انعطاف‌پذير براي گربه‌ها
اگرچه چند دستيار مجازي مانند Oto براي درک لحن و احساس ارائه شده‌اند، اما سيستم‌هاي تشخيص گفتار در زمينه‌ي سيگنال‌هاي غيرکلامي هنوز عملکرد خوبي ندارند. اما اين موضوع به معناي غيرممکن بودن تفسير اين اطلاعات نيست.

يکي از اپليکيشن‌هاي مترجم صداي گربه MeowTalk نام دارد که که براي غلبه بر اين مشکلات، از نوعي يادگيري ماشيني انعطاف‌پذير بهره مي‌برد. اين اپليکيشن توسط خاوير سانچز توسعه پيدا کرده که يکي از اعضاي تيم دستيار هوشمند الکسا از شرکت آمازون بوده است. به نظر او، اين اپليکيشن يک گام در راستاي حرکت به سمت قلاده‌هاي هوشمند به حساب مي‌آيد. اين قلاده‌ها قرار است با بهره‌گيري از الگوريتم‌هاي بسيار پيشرفته، به انسان‌ها براي درک بهتر گربه‌هاي خود کمک کنند.

در اين اپليکيشن، براي هر گربه بايد پروفايل جداگانه‌اي ايجاد کنيد. طبق پژوهش‌هاي صورت گرفته، صداي يک بچه گربه با صداي گربه‌ي بزرگسال تفاوت دارد و به همين خاطر اپليکيشن از شما مي‌خواهد که تاريخ تولد گربه‌ي موردنظر را هم وارد کنيد. هر پروفايل يک شبکه‌ي داده منحصر به فرد براي گربه ايجاد مي‌کند.

در ابتدا، اين اپليکيشن کار خود را با ۱۰ پروفايل صدا آغاز مي‌کند که هرکدام نشان‌دهنده‌ي معناهاي مختلف مانند «شاد بودن» يا «حالت شکار» هستند. زماني که اپليکيشن صدايي را مي‌شنود و اشتباه تشخيص مي‌دهد، مي‌توانيد آن را اصلاح کنيد يا اينکه پروفايل جديدي براي صداي موردنظر ايجاد کنيد.

سيستم‌هاي يادگيري ماشيني مربوط به اپليکيشن‌هاي تشخيص گفتار معمولا در برابر اين اصلاحات مقاومت مي‌کنند. اما يادگيري ماشيني انعطاف‌پذير اين اپليکيشن به کاربران اجازه مي‌دهد که به راحتي اصلاحات زيادي را اعمال کنند. به مرور زمان و با اصلاح و اضافه کردن صداهاي مختلف، مي‌توانيد يک پروفايل شخصي‌سازي شده براي گربه‌ي خود را ايجاد کنيد.

آيا اپليکيشن‌هاي مترجم صداي گربه واقعا کار مي‌کنند؟
در نهايت، عملکرد اين نوع اپليکيشن‌ها تا حد زيادي به خود کاربر بستگي دارند زيرا بايد نحوه‌ي صحبت کردن گربه‌ي خود را به اپليکيشن آموزش دهند. با توجه به اينکه گربه‌ها زبان يکساني ندارند، اين رويکرد تغيير چنداني نخواهد داشت.

اما اين واقعيت که يادگيري ماشيني تا اين حد پيشرفت کرده و مي‌تواند حتي تا حدي در اين زمينه موفق باشد، باورنکردني است. يادگيري ماشيني و ديگر حوزه‌هاي هوش مصنوعي با سرعت فوق‌العاده‌اي روزبه‌روز بهتر مي‌شوند و طي سال‌هاي آينده، پيشرفت‌هاي هيجان‌انگيزي را امکان‌پذير مي‌کنند.

در کانال آي‌تي و ™CanaleIT هم کلي عکس و ويدئوي دسته اول و جذاب داريم