هوش مصنوعی سکوت شما را ترجمه می‌کند

محققان دانشگاه علوم و فناوری پوهانگ (POSTECH) یک فناوری پوشیدنی پیشرفته را توسعه داده‌اند که می‌تواند با خواندن حرکات ظریف عضلات گردن، گفتار خاموش را به صدای قابل شنیدن تبدیل کند.

به گزارش جماران، این مطالعه که توسط پروفسور سونگ-مین پارک و دکتر سونگوک هونگ رهبری می‌شود، گامی مهم در ارتباط انسان و ماشین محسوب می‌شود.

ایسنا نوشت، به نقل از دیجیتال‌ترندز، این نوآوری بر اساس یک ایده ساده اما قدرتمند ساخته شده است. گفتار فقط مربوط به صدا نیست. وقتی فردی صحبت می‌کند یا حتی سعی می‌کند بی ‌صدا صحبت کند، حرکات ریزی در عضلات و پوست اطراف گردن او رخ می‌دهد. این حرکات نوعی «نقشه نامرئی» از گفتار مورد نظر را تشکیل می‌دهند.

برای ثبت این موضوع، محققان یک دستگاه پوشیدنی به نام حسگر نقشه‌برداری کرنش چندمحوری ایجاد کردند. این سیستم یک دوربین مینیاتوری را با سیلیکون انعطاف‌پذیر تعبیه شده با نشانگرهای مرجع ترکیب می‌کند و به آن اجازه می‌دهد حتی کوچکترین تغییر شکل‌های پوست را تشخیص دهد. این حسگر که برای استفاده روزانه طراحی شده است، می‌تواند به راحتی روی گردن قرار گیرد و هنگام تغییر موقعیت به طور خودکار دوباره کالیبره شود.

داده‌های جمع‌آوری‌ شده سپس با استفاده از هوش مصنوعی پردازش می‌شوند که الگوهای کرنش را تفسیر کرده و کلمات یا جملات مورد نظر را بازسازی می‌کند. با ادغام این سیستم با سیستم سنتز صدا که بر اساس پروفایل صوتی کاربر آموزش داده شده است، سیستم می‌تواند گفتاری تولید کند که بسیار شبیه صدای طبیعی فرد باشد، حتی زمانی که هیچ صدایی تولید نمی‌شود.

روش‌های سنتی بازیابی صدا به فناوری‌هایی مانند الکترومیوگرافی (EMG) یا الکتروانسفالوگرافی (EEG) متکی هستند که اغلب به تجهیزات حجیم نیاز دارند و می‌توانند برای استفاده طولانی مدت ناراحت‌کننده باشند.

رویکرد جدید محققان ارائه یک جایگزین سبک و پوشیدنی برای از بردن این موانع است. در آزمایش، این سیستم دقت بالایی را در بازسازی گفتار، حتی در محیط‌های پر سر و صدا مانند محیط‌های صنعتی که میکروفون‌های معمولی در آن با مشکل مواجه هستند، نشان داد.

پیامدهای این فناوری بسیار گسترده است. این فناوری می‌تواند یک مسیر ارتباطی جدید برای بیمارانی که به دلیل آسیب تارهای صوتی یا جراحی حنجره صدای خود را از دست داده‌اند، فراهم کند و آنها را قادر سازد تا دوباره با استفاده از پروفایل صوتی خود صحبت کنند.

فراتر از مراقبت‌های بهداشتی، این سیستم می‌تواند ارتباط خاموش را در محیط‌هایی که صحبت کردن با صدای بلند غیرعملی است مانند کتابخانه‌ها، جلسات یا محیط‌های کاری پر سر و صدا امکان‌پذیر کند. همچنین دری را به سوی رابط‌های طبیعی‌تر انسان و هوش مصنوعی می‌گشاید، جایی که می‌توان قصد و نیت را بدون تولید صدا به گفتار تبدیل کرد.

محققان قصد دارند این فناوری را برای استقرار گسترده‌تر در دنیای واقعی، بهبود دقت و گسترش قابلیت‌های زبانی اصلاح کنند. نسخه‌های آینده ممکن است به طور یکپارچه‌تری با دستگاه‌های مصرفی ادغام شوند و به طور بالقوه نحوه ارتباط افراد را در محیط‌های شخصی و حرفه‌ای متحول کنند.

با ادامه ادغام هوش مصنوعی با این فناوری پوشیدنی، نوآوری‌هایی مانند این نشان ‌دهنده تغییر به سمت اشکال تعاملی شهودی‌تر و نامحسوس‌تر است؛ جایی که حتی کلمات ناگفته نیز بالاخره قابل شنیدن هستند.