毛揆拚大數據 產業跟上了嗎?

首圖來源:anntw

最近大數據的議題很夯,4月業界主辦大數據跨域整合聯盟成立大會,我主持了其中一場論壇,論壇成員包括行政院科技會報室、工研院、IBM、遠傳電信、東森新聞雲、跨域聯盟會長等不同領域主管,行政院副院長張善政親來致詞,因為,這是行政院長毛治國上任時的三支箭(大數據、開放資料、群眾委外)中,比較需要領域整合的一支箭。

salmo1

(image source:moneydj)

以大數據為例,行政院首度運用大數據調查全台484萬名受薪階級,而最新出爐的大數據報告,則是以接近母體方式,直接調查484萬受薪者薪資實況,「精確到每一個有名有姓的人」。

old1

(image source:freepik)

為什麼要跨域整合?有一次我問金融界的朋友,你們大數據的人才都往哪個系找?統計系、數學系、資工系、資管系、工管系、還是財金系?找數學系的,他們不熟資訊工具;找資工系的,他們沒有產業知識;找財金系的,他們的數學(演算法)與資訊工具又不太熟;找資管與工管系的學生,他們懂數學,懂資訊,也懂產業專業,又都不夠深入。這支箭第一個遇到的問題就是人才何覓,現在學校科系的分法,很難訓練出適合企業馬上可以使用的人才。

我接著問在企業的朋友,大數據部門歸誰管?資訊中心還是業務部門?還是放在總經理室,總經理親自來整合?對企業而言,大數據是一個新的領域,安插在哪個部門,也還在摸索中。

更麻煩的是,大數據的範疇定義也很模糊,依照我的看法,可以分資料掘礦、輿情分析以及江河運算三大部分。

資料掘礦是一個很成熟的大數據工具,處理的主要是大量儲存好的結構化資料。像是阿里巴巴,在淘寶光棍節累積了相當大的交易資料,經過大數據的分析,馬雲可以知道哪一省的客戶買最多的比基尼泳裝(答案竟然是蒙古),光棍節到了,北京人、上海人、成都人、廣州人都在買甚麼,這些大數據可以提供未來商業發展上的預測參考。

另一項成熟的大數據領域是輿情分析,處理的主要是大量儲存好的非結構化資料。像是選舉到了,候選人想知道網路社群上討論的輿情,可以做文字的爬文,關鍵字的聲量(出現次數)計算,正負評論的分析……也有人用做品牌監控,特別是當有廣告出去了,評估其品牌聲量效果,或是企業在做危機處理時,想知道網路輿論的正負評論聲量。

前面這兩點屬於大數據中的傳統產業,目前都有很成熟的技術。

第三種大數據技術需要江河運算,因為物聯網與感知器的普及,要處理大量即時偵測,但沒有儲存的資料。像是高速公路有上百萬輛汽車行走,ETC付費系統在每一時間都有大量行車資料被偵訊,未來可以開放(開放資料)給警政單位,查目前贓車的所在位置、追逃犯、計算堵車路段……等應用,這些應用需要即時的運算,因為過了時間效果就不大了。

未來智慧城市、智慧家庭與智慧手機應用越來越普及,這些即時收集到的感知器與物聯網資料,未來能夠做甚麼,就需要更多的創意了(群眾委外)。

最近工業局提倡工業4.0,背後就是此類大數據應用。德國將工業化歷程分四個階段:蒸汽機、電力、資通訊科技、物聯網感知器,最後一個階段稱之為工業4.0,因為未來的智慧工廠將遍布許多感知器。

舉例來說,目前的電表都是一個月抄表一次,未來的智慧電表可以每秒鐘回傳目前的電力使用狀況,來從事智慧建築的能源管理應用。

在工廠,感知器更可以做即時的環境監控、製程監控、品質監控等等,這些即時產出,未經儲存的大數據需要即時運算與有用的演算法,都是未來的挑戰。

毛揆的第一支箭,射出了,產業跟上了嗎?

文章內容屬作者個人觀點,不代表本站立場

盧希鵬

「勵志、陽光、創新」是學生對他的形容詞,擅長運用生活中的小啟示或饒富趣味的故事,寫出對人生的觀察、對科技、商業趨勢的了解,不是告訴你SOP,而是將你帶入情境,讓我們能夠將心比心。現任國立台灣科技大學管理學院專任特聘教授,台灣電子商務專家、資訊管理學者。