人工智慧(AI)也會搞種族歧視?
國立清華大學資訊工程系助理教授郭柏志與美國麻省理工學院(MIT)、哈佛大學跨國研究發現,當採用先進的AI深度學習演算法,判讀X光片及電腦斷層掃描時,電腦竟能從這些醫學影像分辨出患者是黑人、白人或亞洲人,並影響判斷的準確率。
科學家迄今還不明白,AI如何辦到的。
郭柏志指出,醫界近年大量引進AI,研發醫療機器人、智慧診療、及醫學影像識別技術等,協助醫生更快速、準確地診斷,這本該是造福病患的好事。
但這項研究也揭露當中隱憂,提醒大家要注意醫療倫理問題,並消弭引進AI智慧產生的醫療不平等現象。
方基墨因喉癌無法發聲 AI新創作出最接近的人聲
好萊塢巨星湯姆克魯斯的鉅片《捍衛戰士:獨行俠》在美國及台灣都衝出超高票房,令不少觀眾窩心的是,36年前在第一集成為阿湯哥最大對手的方基墨(Val Kilmer),雖因2014年發現罹患喉癌後無法正常說話,卻在AI技術協助下,巧妙在本片中與阿湯哥對話,並演出大和解戲碼。
根據倫敦一家新創公司Sonantic技術長暨共同創辦人佛林(John Flynn)去年8月在公司官網的專文,好萊塢2020年找上他們,希望可以為方基墨量身訂做一個AI聲音模型。
該公司過去製作的電腦語音作品,應用場景從電玩遊戲、好萊塢的電影音效,到語言治療都有(例如對自閉症患者)。
「2014年方基墨為了治療喉癌,做了氣切(氣管切開術)手術後,影迷再也無法容易聽出他的聲音了」。
「我們從一開始的目標,就是要做出一個方基墨能引以為傲的聲音模型。我們很想把他的聲音找回來,讓他不論之後參與任何演出,都有個可以用到的新工具。」
清大、MIT、哈佛、史丹佛、多倫多大學等 四國團隊共同研究
然而,任何技術都可能是兩面刃,如今清大的跨國研究經驗再次證實了這點。
清大今(9)日說明,這項橫跨四國的跨國研究團隊,還包括史丹佛大學、多倫多大學等,與美國國家衛生院(NIH)合作,分析20萬名位病患的胸部、頸椎、手部X光及胸部電腦斷層掃描,研究成果最近登上了國際頂尖期刊《刺胳針數位健康》(Lancet Digital Health),並引起國際科學媒體的注意。
美國食品藥物管理局(FDA)已核准醫院採用AI,輔助判讀X光片及電腦斷層掃描等醫學影像,AI的深度學習系統可幫助電腦針對大量資料自我訓練,並發展出辨識模型。
▲郭柏志助理教授與學生討論,AI如何從手掌X光派斷出人種。
人類無法從X光片判斷患者種族 AI能輕易做到、準確率達九成
研究團隊發現,人類放射師無法從X光片判斷出患者的種族,但AI卻能輕易做到,且準確率高達九成。
研究團隊中一位哈佛大學教授表示,當團隊成員告訴他AI可從X光片來判斷人種,他簡直不敢置信,認為這真的太瘋狂,一定是哪裡出錯了。
當愈來愈多證據浮現後,有團隊成員則直言感覺很「恐怖」。
證據逐漸浮現後 有團隊成員直言很「恐怖」
郭柏志表示,團隊本來猜想,AI可能是從骨質密度來判斷人種,因黑人的骨質密度高於白人,但後來發現並非如此。
他出示一張手掌的X光片,顯示AI判讀人種的重點聚焦在中指與食指的第三指節,「團隊裡也有20、30年經驗的放射科醫師,但我們實在想不出來AI是怎麼判讀出人種的」。
更令研究團隊憂心的是,AI的種族歧視也影響了醫學影像判讀的準確率。
郭柏志表示,研究發現白人的醫學影像有問題,卻沒被檢查出來的誤判率,是17%,但黑人的誤判率卻高達28%,相差超過10個百分點。
醫學影像的誤判會進一步影響急診、醫療給付等資源分配。
「原以為人類才會歧視,電腦應該是最公平」
郭柏志指出,原以為人類才會歧視,電腦應該是最公平的,但沒想到電腦也默默地提取了人類沒教它的資訊,包括人種及性別等。
「如何去除歧視,讓各族群的醫學影像判讀都有一致的準確率,是我們下一階段要努力的目標。」
郭柏志帶領清華大學兩位資工系的大四學生王瑞恩、陳立晴參與了這項跨國研究。王瑞恩表示,參與這麼大規模的跨國研究,對大學部學生來說是很難得的機會,他在團隊中負責AI模型分析,獲益良多。