محققان دانشگاه علوم و فناوری پوهانگ (POSTECH) یک فناوری پوشیدنی پیشرفته را توسعه دادهاند که میتواند با خواندن حرکات ظریف عضلات گردن، گفتار خاموش را به صدای قابل شنیدن تبدیل کند.
به گزارش جماران، این مطالعه که توسط پروفسور سونگ-مین پارک و دکتر سونگوک هونگ رهبری میشود، گامی مهم در ارتباط انسان و ماشین محسوب میشود.
ایسنا نوشت، به نقل از دیجیتالترندز، این نوآوری بر اساس یک ایده ساده اما قدرتمند ساخته شده است. گفتار فقط مربوط به صدا نیست. وقتی فردی صحبت میکند یا حتی سعی میکند بی صدا صحبت کند، حرکات ریزی در عضلات و پوست اطراف گردن او رخ میدهد. این حرکات نوعی «نقشه نامرئی» از گفتار مورد نظر را تشکیل میدهند.
برای ثبت این موضوع، محققان یک دستگاه پوشیدنی به نام حسگر نقشهبرداری کرنش چندمحوری ایجاد کردند. این سیستم یک دوربین مینیاتوری را با سیلیکون انعطافپذیر تعبیه شده با نشانگرهای مرجع ترکیب میکند و به آن اجازه میدهد حتی کوچکترین تغییر شکلهای پوست را تشخیص دهد. این حسگر که برای استفاده روزانه طراحی شده است، میتواند به راحتی روی گردن قرار گیرد و هنگام تغییر موقعیت به طور خودکار دوباره کالیبره شود.
دادههای جمعآوری شده سپس با استفاده از هوش مصنوعی پردازش میشوند که الگوهای کرنش را تفسیر کرده و کلمات یا جملات مورد نظر را بازسازی میکند. با ادغام این سیستم با سیستم سنتز صدا که بر اساس پروفایل صوتی کاربر آموزش داده شده است، سیستم میتواند گفتاری تولید کند که بسیار شبیه صدای طبیعی فرد باشد، حتی زمانی که هیچ صدایی تولید نمیشود.
روشهای سنتی بازیابی صدا به فناوریهایی مانند الکترومیوگرافی (EMG) یا الکتروانسفالوگرافی (EEG) متکی هستند که اغلب به تجهیزات حجیم نیاز دارند و میتوانند برای استفاده طولانی مدت ناراحتکننده باشند.
رویکرد جدید محققان ارائه یک جایگزین سبک و پوشیدنی برای از بردن این موانع است. در آزمایش، این سیستم دقت بالایی را در بازسازی گفتار، حتی در محیطهای پر سر و صدا مانند محیطهای صنعتی که میکروفونهای معمولی در آن با مشکل مواجه هستند، نشان داد.
پیامدهای این فناوری بسیار گسترده است. این فناوری میتواند یک مسیر ارتباطی جدید برای بیمارانی که به دلیل آسیب تارهای صوتی یا جراحی حنجره صدای خود را از دست دادهاند، فراهم کند و آنها را قادر سازد تا دوباره با استفاده از پروفایل صوتی خود صحبت کنند.
فراتر از مراقبتهای بهداشتی، این سیستم میتواند ارتباط خاموش را در محیطهایی که صحبت کردن با صدای بلند غیرعملی است مانند کتابخانهها، جلسات یا محیطهای کاری پر سر و صدا امکانپذیر کند. همچنین دری را به سوی رابطهای طبیعیتر انسان و هوش مصنوعی میگشاید، جایی که میتوان قصد و نیت را بدون تولید صدا به گفتار تبدیل کرد.
محققان قصد دارند این فناوری را برای استقرار گستردهتر در دنیای واقعی، بهبود دقت و گسترش قابلیتهای زبانی اصلاح کنند. نسخههای آینده ممکن است به طور یکپارچهتری با دستگاههای مصرفی ادغام شوند و به طور بالقوه نحوه ارتباط افراد را در محیطهای شخصی و حرفهای متحول کنند.
با ادامه ادغام هوش مصنوعی با این فناوری پوشیدنی، نوآوریهایی مانند این نشان دهنده تغییر به سمت اشکال تعاملی شهودیتر و نامحسوستر است؛ جایی که حتی کلمات ناگفته نیز بالاخره قابل شنیدن هستند.