台灣有優勢的科技硬體人才,但物聯網時代,業界需要更多的軟體人才。除了寫程式的工程師外,大數據、機器人都是新興的領域,面對新潮流,學校準備好了嗎?
「常常我腦袋想到後面去了,但是分析人員無法做到我要的東西!」勤業眾信企業風險管理部門副總經理曾韵,是今年東吳巨量資料在職專班的新生,學資管出身的她,過去十一年來,工作是針對不同產業的客戶,做企業內部的資訊安全、行銷推薦機制等資料分析。她有感於大數據時代需要跨領域專業,萌生進修念頭。
例如,她想要找出企業內部的舞弊人員,透過分析郵件內容的特定字句,來找出問題;但是這不只需要統計專業,也需要資料探勘等技術,分析電腦的搜尋規則。另外,也有許多客戶擁有大量資料,卻沒有技術來改善。曾韵期待自己進修後,能夠成為連接企業和技術廠商溝通者的角色。
新增系所不易 國立大學多以學程方式突圍
交大將於明年九月起於資訊工程所新設「資料科學」組,主責的資工系教授曾新穆說,交大課程以資訊科學、統計數學和領域知識三大部分,參考美國哥倫比亞大學的資料科學研究所內容,也和聯發科、IBM,以及竹科的半導體、光電、電子公司產學合作,運用大數據技術改善工廠良率、研發產品。
曾新穆說,擁有資料探勘分析能力,也要有創新和想像力,不是短短幾門課可以解決,他會在一○四學年下學期,針對校內學生,開設交大第一堂大數據的總論課程「大數據技術與應用」。另也將在今年底辦理研討會,讓國內有興趣的老師可以來進修,分享他的課程教材。
企業保護數據 以機密為由 不願釋出數據分析
另外,交大管理學院九月起,也針對大數據開設三階段、共十八周的認證課程,提供業界人才進修管道。曾新穆說,第一階段課程會教怎麼使用、建立和分析各種大數據技術平台;第二階段課程側重應用面;第三階段課程則是針對企業經營管理者,用大數據來創造新的商業獲利模式。雖然是短期課程,卻可讓不同需求的人建立重點式的知識。
台大在九月起,由台大電機資訊學院院長、電機系教授陳銘憲開授「資料科學」課程,預計後年成立資料科學學位學程。深耕巨量資料多年、曾任資策會執行長的陳銘憲,從一九九九年起,就開授台灣最早的「資料探勘」課程,是大數據的基礎課程,強調「從礦石找金子」,把處理過的數據資料找出有用的知識,例如民眾在超商或信用卡上的消費。
今年開授的「資料科學」比起「資料探勘」,更強調在大數據時代下,對於每筆資料本身的了解與應用,有具體和步驟化的教學。陳銘憲希望這堂課作為打底課程,再來上「資料探勘」進階課程,此一課程非常受歡迎,選課學生已超過百人。
「統計如有明確的分析項目,計算量較不複雜,但是資料探勘是在茫茫物海中找出意義,計算複雜度高」,陳銘憲說,想要做出好的大數據應用,需要具資訊和統計背景的「技術提供者」、企業作為「資料擁有者」,和擁有領域知識的「創新應用專家」。但是學校教學也面臨到多數企業在商業機密的考量下,不願釋出數據以供分析,因此能保護隱私之探勘在實務上非常重要。
企業資料取得不易,元智大學也面臨同樣困境,元智大數據與數位匯流創新中心主任賴國華說,他發現學校地緣所處的桃園,雖然有大量的製造業,但很多工廠生產線的自動化不足,未有系統化的感測數據,即使有也多以機密為由不提供。學校有技術、業界沒人才,以至於產業在大數據的進展上牛步。
「我們和桃園市政府合作不少項目。」賴國華說,例如工務局、環保局提供市民回報的路不平,元智大學研究團隊會協助分析、整合資料,來作派工修復和追蹤;另交通局的路況資料,也可以透過分析來因應號誌燈的變換。
公開資訊不夠多 健保資料庫不完整 阻礙精準研究
大數據可應用的領域眾多,隨著高齡化社會來臨,健康照護也成為顯學,亞洲大學就抓準這樣的趨勢,與鄰近的中國醫藥大學結盟成為「中亞聯大」,三年前開始,在生醫方面合作巨量資料跨校跨領域學程,由五個系所共同設立,總共八門課。亞洲大學生物資訊與醫學工程學系助理教授詹雯玲說,過去的醫療僅止於「對症下藥」,如今由於次世代基因定序技術之成熟,漸漸朝向「個人化醫療」;而累積的巨量基因體資料,透過生物資訊分析,可全面觀察到疾病之致病機轉(造成疾病的原因),未來可朝向「相同之致病機轉,採用共同之治療方式」。
「明年亞洲大學也會有自己的醫院,臨床數據加上基因體定序資料,到時候的數據會更完整好用。」詹雯玲說,健保資料庫的資料是各醫院為了申請健保核銷登錄,有其限制,例如自費項目、醫學影像檔案及臨床檢驗數據等,都不在公開資料庫上,對現在透過大數據講究的「精準醫療」研究,有其阻礙。
放眼國內各校,雖然開設大數據相關學程的不少,但都在近兩、三年才開始,畢業生產出速度,遠遠不及企業現在大量的需求;台灣各行各業在大數據的分析上,相對世界各國的腳步也慢了不少,勢必要參考各國培養人才的作法,除了開設學校課程,找來懂實務的業界講師也很重要,更積極合作交流,才能帶來迎頭趕上的契機。
東吳大學成立國內第一所巨量資料學院,圖為東吳巨量資訊管理學院學士學位學程主任許晉雄,前方為數據中心。(攝影/陳俊銘)