Model, hastalarla gerçekleştirilen görüşmelerde teşhis ve empati konusunda doktorları geçti.
Her gün bizi daha da şaşırtan yapay zeka teknolojileri, farklı alanlarda insanların yerini doldurabilecek yetenekler kazanıyor. Tıp da bunlardan biri. Daha önce birkaç kez yapay zekanın doktorlardan daha iyi performans verdiğini görmüştük. Şimdi bunlara bir yenisi daha eklendi.
DAHA GERÇEK HASTALAR ÜZERİNDE DENENMEDİ
Webtekno’nun aktardığına göre Google, kendi geliştirdiği bir dil modelini (LLM) temel alan bir sohbet botu hakkında çalışma yayınladı. Çalışmada, sohbet botunun tıbbi görüşmelerde doktorlardan daha iyi performans sergilediği görüldü. Articulate Medical Intelligence Explorer (AMIE) ismi verilen model, hastalarla konuşma ve hastaların tıbbi geçmişine dayanarak olası teşhisleri listeleme konusunda doktorlardan daha başarılı oldu. Henüz değerlendirmeden geçmeyen çalışma, 11 Ocak’ta arXiv’de ön baskı olarak yayınlandı.
Google araştırmacıları, modelin solunum ve kardiyovasküler hastalıkları daha iyi teşhis edebildiğini söylüyor. Ayrıca görüşmelerde gerçek doktorlarla benzer miktar bilgiyi elde edebildiğini, hatta daha iyi empati kurabildiğini de ekliyor.
Modelin henüz gerçek hastalar üzerinde test edilmediğini vurgulamak gerek. Çalışmada, sadece hastaları canlandıran aktörler kullanıldı. Zaten araştırmacılar da modeli “deneysel” olarak nitelendirdi ve henüz bir şey söylemek için çok erken olduğunu aktardı.
20 oyuncu, çalışma kapsamında 149 farklı klinik senaryoyu simüle ettiler. Görüşmeler de yüz yüze değil, metin tabanlı olarak gerçekleştirildi. Oyuncular, görüşmeler sırasında gerçek doktorlarla mı yoksa sohbet botuyla mı konuştuklarını bilmiyorlardı. Bir grup uzman da AMIE’nin ve doktorların performansını değerlendirdi. Nezaket, durumu ve tedaviyi açıklama, dürüst görünme, teşhis gibi şeylerin incelendiği çalışmalar sonucunda ise sohbet botunun 26 kriterin 24’ünde doktorları geçtiği görüldü.
AMIE, DOKTORLARDAN DAHA İYİ SONUÇ VERSE DE ONLARIN YERİNİ ALMAYACAK
Sonuçlar yapay zekanın doktorların yerini alacağı anlamına gelmiyor. Google araştırmacısı Alan Karthikesalingam da konuya ilişkin “Bu, hiçbir şekilde bir dil modelinin tıbbi görüşmelerde doktorlardan daha iyi olduğu anlamına gelmez.” ifadelerini kullandı. Öte yandan Harvard’da doktor olarak görev yapan Adam Rodman da aracın faydalı olabileceğini ancak doktorların yerine geçemeyeceğini söyledi: “Tıp, bilgi toplamaktan daha fazlasıdır. Tamamen insan ilişkileriyle alakalıdır.”
Araştırmayla ilgili şunu da eklemek gerek. Katılan doktorlar hiç böyle metin tabanlı görüşmeler gerçekleştirmeye alışık değillerdi. Bu da performanslarını etkileyip yapay zekanın öne geçmesine neden olmuş olabilir.
Yine de çalışma, yapay zekanın empati kurabilen ve hastanın geçmişinden yola çıkarak tanı koyabilen bir doktorlara benzer şekilde performans gösterme potansiyelinin olduğunun göstergesi. Bu araştırmanın sonraki adımı da potansiyel ön yargıları değerlendirmek ve sistemin farklı popülasyonlarda benzer sonuçlar vermesini sağlamak için daha ayrıntılı çalışmalar yapmak.