هوش مصنوعی پزشک گوگل از پزشکان بهتر عمل میکند!
مدل هوش مصنوعی پزشکی گوگل موسوم به Med-Gemini یک هوش مصنوعی متخصص در پزشکی است که ادعا میشود در برخی کارها حتی از پزشکان انسانی نیز عملکرد بهتری دارد.
به گزارش جماران، گروه گوگل ریسرچ(Google Research) و آزمایشگاه تحقیقاتی هوش مصنوعی گوگل به نام دیپمایند(DeepMind)، مدل هوش مصنوعی مد-جمینای(Med-Gemini) که خانوادهای از مدلهای پیشرفته هوش مصنوعی متخصص در پزشکی است را شرح دادهاند. این مدل، یک پیشرفت بزرگ در تشخیص بالینی با پتانسیل عظیم در دنیای واقعی است.
پزشکان روزانه تعداد زیادی از بیماران را با نیازهای ساده تا بسیار پیچیده معاینه و درمان میکنند. آنها برای ارائه مراقبت موثر باید با پرونده پزشکی هر بیمار آشنا باشند و با جدیدترین روشها و درمانها بهروز باشند.
سپس موضوع بسیار مهم رابطه میان پزشک و بیمار وجود دارد که بر پایه همدلی، اعتماد و ارتباط بنا میشود و برای اینکه یک هوش مصنوعی به تقلید از یک پزشک در دنیای واقعی نزدیک شود، باید بتواند همه این کارها را انجام دهد.
هوش مصنوعی و پزشکی این روزها متقارن شدهاند. طی ماههای اخیر اخبار و گزارشات زیادی درباره مدلهای هوش مصنوعی گزارش شده است که به پزشکان کمتر باتجربه در شناسایی پیشسازهای سرطان، تشخیص اوتیسم دوران کودکی از روی تصاویر چشمها و پیشبینی آنی اینکه آیا جراح تمام بافتهای سرطانی را در طول جراحی سرطان سینه برداشته است یا خیر، کمک میکند.
اکنون گفته میشود که Med-Gemini چیز دیگری است و از همه مدلهای پیشین سر است.
مدلهای جمینای گوگل نسل جدیدی از مدلهای هوش مصنوعی چندوجهی هستند، به این معنی که میتوانند اطلاعات را از حالتهای مختلف، از جمله متن، تصویر، ویدئو و صدا پردازش کنند.
این مدلها در زبان و مکالمه، درک اطلاعات متنوعی که بر روی آنها آموزش دیدهاند و آنچه که «استدلال با زمینه طولانی» یا استدلال از مقادیر زیادی داده مانند ساعتها ویدیو یا دهها ساعت صوت نامیده میشود، مهارت دارند.
هوش مصنوعی Med-Gemini تمام مزایای مدلهای پایه جمینای را دارد، اما آنها را به خوبی تنظیم و متعادل کرده است. محققان این ترفندهای متمرکز بر دارو را آزمایش کردند و نتایج آنها را در مقاله گنجاندند. در این مقاله ۵۸ صفحهای مطالب زیادی وجود دارد که در این گزارش به بیان چشمگیرترین آنها میپردازیم.
قابلیتهای خودآموزی و جستجوی وب
رسیدن به یک تشخیص و تدوین یک برنامه درمانی مستلزم آن است که پزشکان دانش پزشکی خود را با مجموعهای از اطلاعات مرتبط دیگر مانند علائم بیمار، تاریخچه پزشکی، جراحی و اجتماعی، نتایج آزمایشگاهی و نتایج سایر آزمایشات تحقیقاتی و واکنش بیمار به درمانهای قبلی گردآوری کنند تا درمانهای موجود بهروزرسانی شوند و درمانهای جدیدی معرفی میشوند. همه این موارد بر استدلال بالینی پزشک تأثیر میگذارد.
به همین دلیل است که گوگل با Med-Gemini دسترسی به جستجوی مبتنی بر وب را برای فعال کردن استدلال بالینی پیشرفتهتر فراهم کرده است. این هوش مصنوعی مانند بسیاری از مدلهای زبان بزرگ(LLM) متمرکز بر پزشکی با MedQA که حاوی سؤالات چند گزینهای نماینده سؤالات آزمون مجوز پزشکی ایالات متحده(USMLE) است، آموزش دیده که برای آزمایش دانش پزشکی و استدلال در سناریوهای مختلف طراحی شده است.
با این حال، گوگل همچنین دو مجموعه داده جدید را برای مدل خود توسعه داده است. اولی MedQA-R (استدلال) است که MedQA را با توضیحات استدلالی تولید شده مصنوعی به نام «زنجیره افکار»(CoTs) گسترش میدهد. دومی MedQA-RS (استدلال و جستجو) است که دستورالعملهایی را برای استفاده از نتایج جستجوی وب به عنوان زمینه اضافی برای بهبود دقت پاسخ به مدل ارائه میدهد. بدین ترتیب اگر یک سوال پزشکی منجر به پاسخ نامطمئن شود، از مدل خواسته میشود تا یک جستجوی وب را برای به دست آوردن اطلاعات بیشتر برای رفع عدم قطعیت انجام دهد.
هوش مصنوعی Med-Gemini بر روی ۱۴ معیار پزشکی آزمایش شد و عملکرد جدیدی را روی ۱۰ معیار اجرا کرد که از مدل GPT-۴ ساخته شرکت اوپنایآی(OpenAI) پیشی گرفت. این مدل در معیار MedQA با استفاده از استراتژی جستجوی هدایتشده به دقت ۹۱.۱ درصدی دست یافت و از مدل زبان بزرگ مبتنی بر پزشکی پیشین گوگل موسوم به Med-PaLM ۲ تا ۴.۵ درصد بهتر عمل کرد.
هوش مصنوعی Med-Gemini در هفت معیار چندوجهی، از جمله چالش تصویری مجله پزشکی نیوانگلند حاوی تصاویر موارد چالش برانگیز بالینی که از یک لیست ۱۰تایی تشخیص داده میشود، به طور متوسط از ۴۴.۵ درصد بهتر از GPT-۴ عمل کرد.
محققان میگویند: در حالی که نتایج امیدوارکننده هستند، تحقیقات بیشتری مورد نیاز است. به عنوان مثال ما محدود کردن نتایج جستجو به منابع پزشکی معتبرتر، با استفاده از بازیابی جستجوی چندوجهی یا تجزیه و تحلیل انجام شده در مورد دقت و ارتباط نتایج جستجو و کیفیت استنادها را در نظر نگرفتهایم. علاوه بر این، باید دید که آیا میتوان به مدلهای زبان بزرگ کوچکتر نیز استفاده از جستجوی وب را آموزش داد؟ ما این اکتشافات را به کارهای آینده واگذار میکنیم.
بازیابی اطلاعات خاص از پروندههای الکترونیکی پزشکی طولانی
پرونده الکترونیک سلامت(EHR) ممکن است بلندبالا باشد، اما پزشکان باید از محتوای آنها آگاه باشند. آنها گاهی پیچیده هستند، چرا که معمولاً حاوی شباهتهای متنی، املای غلط، کلمات اختصاری و مترادفها هستند که میتوانند هوش مصنوعی را به چالش بکشند.
بنابراین محققان برای آزمایش توانایی Med-Gemini در درک و استدلال از اطلاعات پزشکی بلندبالا و طولانی از یک پایگاه داده بزرگ و در دسترس عموم(Medical Information Mart for Intensive Care) که به مثابه پیدا کردن سوزن در انبار کاه است، استفاده کردند. این پایگاه حاوی دادههای بیماران بستری در بخشهای مراقبتهای ویژه است.
هدف این بود که مدل بتواند یک وضعیت، علامت، یا درمان پزشکی کماستفاده و ظریف را در مجموعه بزرگی از یادداشتهای بالینی بازیابی کند.
دویست نمونه انتخاب شد و هر نمونه شامل مجموعهای از پروندههای این پایگاه از ۴۴ بیمار بستری شده در بخش مراقبتهای ویژه با سابقه پزشکی طولانی بود.
هوش مصنوعی Med-Gemini دو مرحله برای یافتن سوزن در انبار کاه پیش رو داشت. اول اینکه مجبور بود همه موارد ذکر شده در مورد مشکل پزشکی مشخص شده را از سوابق گسترده بازیابی میکرد. دوم اینکه باید ارتباط همه موارد را با هم ارزیابی میکرد، آنها را دستهبندی میکرد و نتیجه میگرفت که آیا بیمار سابقه آن مشکل را داشته است و دلیل روشنی برای تصمیم خود ارائه میکرد. در نهایت این هوش مصنوعی عملکرد خوبی داشت.
محققان میگویند: شاید برجستهترین جنبه Med-Gemini، قابلیتهای پردازش سوابق طولانی باشد، زیرا آنها مرزهای عملکردی جدیدی را باز میکنند و امکانات کاربردی جدیدی را که قبلاً غیرممکن بود برای سیستمهای هوش مصنوعی پزشکی فراهم میکنند. این وظیفه یافتن «سوزن در انبار کاه» منعکس کننده یک چالش در دنیای واقعی است که پزشکان با آن مواجه هستند و عملکرد Med-Gemini پتانسیل آن را برای کاهش قابل توجه بار شناختی و افزایش قابلیتهای پزشکان با استخراج و تجزیه و تحلیل کارآمد اطلاعات حاصل از حجم وسیعی از دادههای بیماران نشان میدهد.
گفتگو با Med-Gemini
در یک آزمایش در دنیای واقعی، یک کاربر بیمار از Med-Gemini در مورد یک توده پوستی که خارش دارد، پرسید. این مدل پس از درخواست تصویر، سؤالات مناسب بعدی را پرسید و آن ضایعه نادر را به درستی تشخیص داد و به کاربر توصیه کرد که چه کاری باید انجام دهد.
همچنین از Med-Gemini خواسته شد تا زمانی که پزشک منتظر گزارش رسمی رادیولوژیست بود، عکس رادیوگرافی قفسه سینه یک بیمار را تفسیر کند و یک نسخه انگلیسی ساده از گزارش را تنظیم کند که بتوان آن را در اختیار بیمار قرار داد.
محققان میگویند: قابلیتهای مکالمه چندوجهی Med-Gemini امیدوارکننده است و چنین قابلیتهایی امکان تعامل یکپارچه و طبیعی بین افراد، پزشکان و سیستمهای هوش مصنوعی را فراهم میکنند.
با این حال، محققان دریافتند که کار بیشتری لازم است.
آنها گفتند: این قابلیت دارای پتانسیل قابل توجهی برای کاربردهای مفید در دنیای واقعی، از جمله کمک به پزشکان و بیماران است، البته خطرات قابل توجهی نیز به دنبال دارد. در حالی که پتانسیل تحقیقات آینده در این حوزه را برجسته میکنیم، ما تواناییهای مکالمه بالینی را در این کار، همانطور که قبلاً توسط دیگران در تحقیقات اختصاصی در زمینه هوش مصنوعی تشخیصی محاورهای بررسی شده بود، به طور دقیق مورد بررسی قرار ندادهایم.
چشم اندازهای آینده
محققان اذعان میکنند که کارهای بیشتری برای انجام دادن وجود دارد، اما قابلیتهای اولیه مدل Med-Gemini امیدوارکننده است. مهمتر از همه، آنها قصد دارند اصول هوش مصنوعی مسئول، از جمله حفظ حریم خصوصی و انصاف را در سراسر فرآیند توسعه مدل بگنجانند.
محققان میگویند: ملاحظات حریم خصوصی به طور ویژه باید در سیاستها و مقررات مراقبتهای بهداشتی موجود که از اطلاعات بیمار محافظت میکنند، ریشه داشته باشد. انصاف و عدالت حوزه دیگری است که ممکن است نیاز به توجه داشته باشد، زیرا این خطر وجود دارد که سیستمهای هوش مصنوعی در مراقبتهای بهداشتی ممکن است ناخواسته سوگیریها و نابرابریهای تاریخی را منعکس یا تقویت کنند و به طور بالقوه منجر به عملکرد مدل متفاوت و نتایج مضر برای گروههایی شود.
اما در نهایت، مدل Med-Gemini به عنوان یک ابزار خوب در نظر گرفته میشود.
پژوهشگران میگویند: مدلهای زبان بزرگ چندوجهی در حال آغاز دوره جدیدی از امکانات برای سلامت و پزشکی هستند. قابلیتهای نشان داده شده توسط جمینای و Med-Gemini نشاندهنده جهش قابل توجهی در عمق و وسعت فرصتها برای تسریع اکتشافات زیستپزشکی و کمک به ارائه مراقبتهای بهداشتی و تجارب است. با این حال، بسیار مهم است که پیشرفت در قابلیتهای مدل با توجه دقیق به قابلیت اطمینان و ایمنی این سیستمها همراه باشد. با اولویتبندی هر دو جنبه میتوانیم با مسئولیتپذیری هوش مصنوعی، آیندهای را متصور شویم که در آن قابلیتهای سیستمهای هوش مصنوعی شتابدهندههای معنادار و ایمن در پیشرفت علمی و مراقبت در پزشکی باشند.
دیدگاه تان را بنویسید