Google除了有AlphaGo會下棋,另一個在AI領域讓各界驚豔的成就,就是可以協助醫師診斷視網膜病變,準確率甚至比專業醫師更高。而現在台灣醫療界也往這個方向跨出了重要一步。
要發展AI,除了需要有好的題目、強大的運算能力,更重要是要有「可用的數據」做為發展基礎。台北醫學大學附設醫院副院長陳震宇形容:「標註完整的資料就是黃金。」科技部聯合台大、榮總和台北醫學大學啟動的跨醫療院所醫療影像標註資料庫計畫,就是台灣在發展AI醫療跨出的重要一步。
科技部部長陳良基表示,過去一年來,投入這項計畫的醫師超過百位,總計已經建置了橫跨心臟冠狀動脈疾病、腦瘤、肺癌等多個疾病,共46450個案例的醫療影像,其中17950個案例標註了疾病資訊。
乍看之下,這樣的數據量好像不大,但其實有這樣的成果已經相當不容易。如參與台北醫學大學醫療影像研究計畫,現任陽明大學生物醫學影像暨放射科學習助理教授盧家鋒以肺部影像為例,指肺部影像的資料量相當大,要判讀的資訊相當多,一般來說,一個病例可能至少就要花上數十分鐘的時間才能看完。
而在真正實現借助AI將幾十分鐘的工作縮短到幾秒之內的目標之前,參與研究計畫的醫師必須先付出比一般作業時間更多心力完成影像標註工作,讓這些醫療影像變成經過標準化標註的結構化可用資料。
盧家鋒解釋,「一開始機器很笨。」如果醫生依循一貫的作法,在判讀資料上使用描述語句,機器其實是沒有辦法學習的。所以他們必須請醫師在經過數位化的病理玻片影像上圈出有問題的肺結節影像,還得完成多項欄位的標註,如肺結節的位置是在左肺葉還是右肺葉、在上方還是下方,還有大小和形狀等等各種細節,而一般在臨床上其實是不需要做這麼多細節標註的。而且這些影像的標註也不是一位醫生完成就可以,還需要有第二關、第三關的審核,以確保標註正確。
這些繁複但重要的作業,正是為什麼經過一年時間,北醫團隊收錄的肺結節影像只累積約1500個案例。但就算是國際組織TCIA,截至2018年為止,過去七年來收錄的癌症影像案例總數也約莫只有兩千例,而且大多還是缺乏標準化標註資訊的影像數據。
不過盧家鋒不悲觀,他認為在科技部的計畫帶動下,各大醫療院所都已經動起來,或許台灣距離實現AI醫療的那天沒有想像遙遠。
而長期來說,隨著這些依循相同標準標註的醫療影像數據不斷累積,機器可能會愈來愈聰明,終至有一天,判讀這些醫療影像尋找病灶就不再是大海撈針,而在AI的輔助下,醫生也可望有更多精力和時間放在討論病患的治療方針上。