2015年8月25日 星期二

一種 Data-driven 信仰與組織文化的樹立或毀壞

8/20-8/23 中央研究院人文社會科學館非常的「資料科學」,因為這裡一連舉辦了 4  天的「第二屆台灣資料科學愛好者年會」。在第 2 天的《DSP 資料開竅.企業論壇》中,筆者主持了「跨國、行動、即時的資料團隊」這場分享與座談,主辦單位請到了通用移動 (Gmobi) 創辦人暨執行長吳柏儀 (Paul Wu)、大數據顧問暨數據科學家趙國仁 (Craig Chao)、沛星互動科技 (Appier) 營運長李婉菱 (Winnie Lee) 這三位擁有「不只 Data Team」帶領經驗的創業者與專業人士,分享他們在 Data Product 發展、組織運作、市場開發工作中,累積而來的洞察與提醒。

圖 1.  由左而右:Craig、Winnie、Paul、筆者
(本照片由 DSP 智庫驅動提供)

三位講者分享的觀點,擲地有聲,屢屢打中也身在「有資料組織」中聽眾的心。由於實在難得,聆聽的心得很多,筆者特別藉此一文,將個人認為最重要的元素:信仰、文化、與人,做一彙整。

Data-driven 是一種信仰與組織文化的樹立

在 Winnie 提出的「8 Tips To Turn Big Data into Big Insights」裡頭,第一點即是:
If you want to build a big data organization, everybody has to first believe in data.
(要建立 Big Data 組織之前,每個人首先要相信 Data)

2015年7月27日 星期一

資料未必氾濫,但洞察的確難求

筆者即將在 8/21 參與《DSP 資料開竅.企業論壇》其中一場座談的主持工作,在該論壇的活動說明中,開宗明義即道:「資料氾濫,洞察難求」。

從 Data Owner 的角度來看,資料可能多到不可勝數,的確氾濫。但從擁有資料科學技能,但卻苦無資料可以發揮的 Data Science Team 看來,資料可能永遠缺一集。所以,我想說的是:「資料未必氾濫,但洞察的確難求」。

為什麼會這樣?可以歸結為 Data Owner、Data Science Team、Domain Expert 三者無法有效結合。而通常感覺不到資料價值的人,是因為他/她連洞察 (Insights) 都還沒看見。

圖 1. 資料價值由資料產品傳遞,需要三種角色有效結合

如上圖 1. 所示,資料價值的載體是 Data Product (資料產品),而 Data Owner (資料擁有者)、Data Science Team (資料科學團隊)、與 Domain Expert (領域專家),則是打造 Data Product 的鐵三角,缺一不可。但我們觀察這鐵三角的發展現狀,正面臨一些問題,說明如下。

2015年6月21日 星期日

資料價值領袖風範與關鍵行動 ── 以 Data Lake 為例

Big Data 領導者的風範幾乎都是 Thinker 與 Doer 兼具,有獨到的戰略規劃觀點,也有徹底的戰術執行計畫。舉例來說,許多企業都想從 Big Data 裡獲取洞察 (Insights),因為有了洞察,就可以進一步策劃行動,解決問題,產生價值。Big Data Thinker 與 Doer 在洞察這件事情上,應該要如何行動,才能將 Big Data 轉變成商業創新的機會,在符合企業擘化未來的同時,又能獲得立即的成效?

洞察很美,但美夢如何成真?

由 Big Data 而來的洞察不會憑空而生,通常是由結合領域知識的資料分析過程而來。而資料分析,必須是有米之炊 ── 使用經過蒐集、清洗、結構化好的資料,準確的洞察才有可能。

換言之,沒有清洗乾淨、結構化好的資料,分析不只沒有意義,洞察更可能導致悲劇。

Enterprise Data Lake 的存在,就是希望透過一個 Big Data 平台,加上一個標準化的流程,來讓資料準備 (Data Preparation) 這件事,做到正確、有效、自動化,讓商業洞察的美夢具備成真的基礎。

圖 1. Data Lake 透過資料盤點、儲存、處理、入庫流程自動化,讓商業洞察美夢成真

2015年5月24日 星期日

企業資料經濟第三講:打造一個具生態觀的資料產品團隊,給 Data Team Lead

我們在《企業資料經濟第一講:打造企業的資料價值平台,給 CxO》的結論中指出:Big Data 是企業管理議題,需要具經營高度的策略來思考與妥善料理。

企業管理議題不能僅用硬的 KPI 數字來表達,更重要的是要靠「生態」來解,而這個生態的建構與運作,我們可以從資料產品團隊 (Data Product Team,或簡稱 Data Team) 談起。

什麼是資料產品團隊?

筆者曾在《一位產品經理對 Open Data 的幾點思考》 中述及,最能夠發揮資料價值的載體,應該就是以資料為原料的應用產品或服務了,所以我們以「資料產品」(Data Product) 來概括這些因資料而生的產品或服務。而打造供企業內部或外部使用的資料產品者,通常不是一個個人,而是一個團隊,是為資料產品團隊。

圖 1. 資料產品團隊 > 資料科學團隊

2015年4月26日 星期日

企業資料經濟第二講:為企業打造一座生態豐富的 Data Lake,給 Data Team

2015 上半年,缺水,在台灣各地成為民生的熱議問題。議論缺水問題,免不得要談到水庫。水庫是一個儲水、養水的容積物,它的建構,可以是天然形成,或是人工打造的湖泊。

湖水的補充來源,可以是來自天上的雨水,或是周邊匯集注入的溪江河。除了水資源本身,一座湖很重要的價值,還來自它所涵養的生態系統:各類大小魚群、浮游生物、悠遊鴨鵝、湖中水草、湖邊林木、湖上翱翔的鳥群……展現豐富的生物多樣性與關聯旺盛的生命力。

在多結構化 Big Data 的環境下,Data Team 需要打造的,即是相同概念的企業資料湖 ── Enterprise Data Lake,它匯集與涵養各種的內外部資料,時間跨度更長,內容更接近原始型態,讓 Data Team 成員可以潛入、探索、實驗各種的資料產品。

圖 1. Enterprise Data Lake,現代企業必備的 Data Infrastructure 
(「賽里木湖日出」by fred chiang)

水是湖的基本組成,資料是資料湖的基本組成;而資料的源頭,可以是來自以下的資料批次轉入,或是資料流即時串接:

2015年3月23日 星期一

Etu 生日快樂 ─ 從少到青

Etu 3 歲了,藍衣人生日快樂。

一年嬰、兩年幼、三年少 、四年青、五年壯」,這是我們對 Etu 從一個品牌蛻變成一家公司的期待與實踐。藍衣人團隊正在一起 Starting Up 一家有顯著價值的 Big Data 公司。

圖 1. Etu 3 歲生日快樂 (@藍衣人為愛而跑公益運動會)

未來的可能很多,但我們堅定相信的有幾個。

2015年2月22日 星期日

企業資料經濟第一講:打造企業的資料價值平台,給 CxO

羊年開春,計畫撰寫一系列的「企業資料經濟」三講,分別是:
  1. 第一講給 CxO,對企業高層全面性地說明資料平台的價值領域與構成支柱,並提醒如何避免失敗、提高成功的機率;可視為策略篇。
  2. 第二講給 Data Team,對處理與分析資料的團隊說明企業資料平台的建構方式,與給出實用的 Use Cases;可視為實務篇。
  3. 第三講給 Data Team Lead,對領導者說明資料產品團隊的建構與其生態發展;可視為團隊篇。
廢話不多說,就讓我們直接進入第一講:《打造企業的資料價值平台》吧。

為何第一講要請 CxO 來聽?

因為如果 CxO 沒有認知到自己是企業資料經濟的 Key Stakeholder (關鍵利益相關人),或是因為不知道而漏掉策略環節重點,那麼企業縱使坐擁資料金礦,還是很有可能無法發揮它們的價值。某些應用場景,甚至必須由 CEO 來協調跨 CxO、跨部門的端到端 (End-to-End) 流程。

根據 Infochimps 這家 Big Data 雲服務公司的《CIOs & Big Data》報告指出:企業的 Big Data 專案失敗率高達 55%,而一般的 IT 專案,失敗率僅為 25%。

圖 1. Big Data 專案的失敗/成功率
圖 2. 一般 IT 專案的失敗/成功率

這 30% 的失敗差異來自哪裡?主要有兩點: