2014年8月26日星期二

資料價值還缺一味,資料科學團隊還缺一位


時間:2014.8.16-17 (Sat-Sun)
地點:高雄醫學大學濟世大樓二樓 CS201 教室
活動:Code for Healthcare (CfH) 工作坊

* 活動緣由請見這裡

Code for Healthcare 工作坊團隊簡報時間:《轉診系統初探》

活動名稱雖冠以「工作坊」,但其實這是一場 Hackathon,它與一般滿聚程式高手、間有 UI 設計者駭客松的不同之處,是參與者除了資料科學團隊中常見的資料處理者 (程式設計師)、資料分析者 (統計、資料探勘專家)、視覺與服務體驗設計師外,還有大半是醫傷、醫管、急救領域的專業人士。所以它不只是一場駭客松,它更是一場充滿領域知識專家 (Domain Expert) 的資料科學駭客松。

來瞧瞧其中一隊的陣容:外傷科醫師 X 4、整形外科主治醫師 X 1、外傷登錄師 X 3、資料科學講師 X 1,他們做的主題是「外傷登錄分析」; 另一隊成員則有來自統計、醫管、醫療資訊、資訊工程、後勤中心、服務設計等背景,他們做的主題是「肺炎轉診分析」。

2014年7月26日星期六

拆解 IoT 與 IoE,其實他們說的是 Internet of Data ── 聯網皆資料

資通訊熱潮一波波,IoT (Internet of Things,物聯網) 在 2009 年~2011 年間隨著 RFID 議題有過一波的 hype,如今又有再來一波之勢;IoE (Internet of Everything;萬物聯網) 則是 Cisco 在 2013 年開始,嘗試延伸 IoT 的新說法:People、Process、Data、Things 透過綜合性的技術,都通通連起來。這真是擴張價值空間到宇宙無敵大的新語。

圖  1. Internet of Data 才是 Internet of XXX 背後的共同主題

我們可以分三大區塊 ── 終端設備、網路、後端系統來說明 IoT 的內涵。

2014年6月25日星期三

開放資料價值,勿以小侍大

大數據》(Big Data: a revolution that will transform how we live, work, and think) 作者之一,在牛津大學網路研究所任教的維多.麥爾荀伯格 (Viktor Mayer-Schönberger),再帶來一陣議論 Big Data 之風,連馬總統也能順應潮流,應對說出:「台灣巨量資料,投資不足」的話語。

從一個持續在打造行業別 Big Data 解決方案的業者角度,我們當然樂見中華民國總統,可以從社稷發展、社會整體競爭力整備的角度,以國家領導者的高度,表達對此一議題的憂慮與警示,至少這代表此議題可以列為「策略性話題」。

我們想要追問的是:

「總統怎麼看 Open Data 與 Big Data?」
「投資不足,是指公部門,還是私部門?」
「投資不足,我們知道了。然後呢?」

當然,我們也不認為應該期待馬總統來回答這個問題,畢竟,他還有更重要的事情必須費心答覆。

若要探究 Open Data vs. Big Data,兩者並不在同一個維度上,一個重點在「開放的價值」,一個說的是「如何解決量大、及時、多結構的問題」。Apple to Apple 放在一起比較,意義不大,但相同的重點,都環繞在「Data」上。要如何轉兌資料的價值,則是兩者共通的議題。

資料價值,孰大、孰小?


圖 1. 資料價值的 4 個層次

由個體或群體所在的位置,我們可以將資料價值的層次,區分為個人、商業、社會、國家戰略。對應到價值轉兌所需的資料,我們可以大致歸結如圖 2.:

圖 2. 資料 vs. 價值

2014年5月27日星期二

當代 Big Data 武林的光明頂 ── Big Data Taiwan 2014

由 Etu 連年籌劃主辦的 Big Data Taiwan 盛會,今年已經來到了第三年,我們可以說,這是一個跟 Etu 同年誕生的活動,瞧瞧這三年的主題:「Big Data Taiwan 2012 - 大數據挖掘大商機」、「Big Data Taiwan 2013 - Crossovers 成長之旅」、「Big Data Taiwan 2014 - 聚生態、顯意圖、兌價值」,您可以一一點進去看每年的議程,細看一下其中的內涵,觀察到什麼樣的變遷了嗎?

圖 1. Big Data Taiwan 2014 以 Converge . Discover . Monetize 為主題

2012 年關鍵字:Hadoop、雲端、行動、分析
2013 年關鍵字:技術、價值、Open Data、Hadoop、社群
2014 年關鍵字:Hadoop、應用、工具

從活動企劃者的角度來看,我們可以觀察到三年時間跨度的變與不變:

2014年4月27日星期日

投資、跨界、產品、區域 ── 從 Intel 投資 Cloudera 7.4 億美金看 Big Data 市場發展

今年三月底,市場傳出 Intel 投資 Cloudera 7.4 億美金 (約合 222 億台幣),取得後者 18% 的股權,創下 Intel 投資 Datacenter 相關技術的單一投資金額歷史紀錄。

事實上,Cloudera,這個目前市場最廣為人知的 Hadoop 版本發行商,此回合的增資總額是 9 億美金,在這輪被稱為 "Financing Round" 的投資者清單中,還包括了 T. Rowe Price、Google Ventures、MSD Capital (Michael Dell 家族) 等投資機構。無疑地,Intel 佔總數 82% 的投資額,還是當中獨大、最引人注目者。

除了來自雙邊的官方新聞稿 (Cloudera PR1, PR2;Intel PR1),由於此次的投資金額頗高,也引起了許多媒體的關注與報導。其中一度傳出此筆投資的許多現金並未注資到 Cloudera 公司,而是進到原有股東的口袋,比如說這個 TechCrunch 的報導。最終 Cloudera CEO Tom Reilly 說全部 9 億美金中的 60%,也就是 5.4 億美金 (約合 162 億台幣) 會進到 Cloudera 公司的口袋,這筆錢除使用來投入於產品的發展與擴大市場外,更明確的行動,則是「聘僱更多的技術人手來進行 CDH 與 IDH/IDP 的整合,未來將協助 Intel 既有客戶改用兩者整合後的新版 CDH」,Tom Reilly 如是說。

是的,IDH/IDP 已被宣告走入歷史終點。在 2014.3.27 兩家的共同新聞稿中指出:Intel 的 IDH/IDP 在 2014 年 3 月底發佈 v3.1 後,就會被整合進 Cloudera 的 CDH,不再獨立發展。
"The optimizations from Intel’s Distribution for Apache Hadoop/Intel Data Platform (IDH/IDP) will be integrated into CDH and IDH/IDP and will be transitioned after v3.1 release at the end of March." 

Source: Flickr.com, by The Field Museum Library

2014年4月22日星期二

一場資料科學的實踐 ── 從 DSP 團訓班看 Open Data 的困窘

什麼人最能夠發揮資料的價值?

EtuCode for Tomorrow 共同發起與主辦的資料科學計畫 (DSP) 認為,與其寄望身負多項絕技、萬中選一的資料科學家,不如先培養能夠跨界分工的團隊:讓 Campaigner, Analyst, Hygienist, 與 Designer 同桌而坐,為共同的問題尋找答案,在有限的 4 週團隊合作時間中,交付資料產品 (Data Product),以 Team Project 闡釋資料應用的價值。

在已經舉辦的兩期 DSP 團訓班過後,我們留下了 10 個 Team Project 與對資料科學滿懷熱情的 60 多位校友。從實踐的過程中,我們看到了什麼、學到了什麼?更重要的是,我們有沒有更堅定的意志要鼓勵更多的人,投入資料科學探索之路?

圖 1. DSP 團訓班第 2 期「愛。住易」團隊的作品《找尋銀髮幸福宅》
(完整 Infographic PDF 下載:http://goo.gl/fKdXXi)

2014年3月28日星期五

Etu 生日快樂 ─ 從幼到少

Etu 2 歲了, 藍衣人生日快樂。


圖 1. 藍衣人齊聚,歡慶 Etu 2 歲生日快樂

2012.3.28,Etu 這個亞洲原生的 Hadoop Big Data 品牌,隨著第一個產品 Etu Appliance 一起走入市場,藍衣人現身,以「A Purpose-built Big Data Solution Vendor」為市場定位,認定 End-to-End 行業別解決方案,才能滿足現階段企業客戶的需求。而在資料價值的闡釋上,從基本的「提高營運效能」到企業期望的「增加營收」,甚至是「開創新藍海」,強調應用於行銷、產品/服務開發、商業營運、客戶體驗、客戶服務高於 IT。