一位產品經理對 Open Data 的幾點思考

《資料價值 — 一位資料產品經理的視野》解析

《資料價值 — 一位資料產品經理的視野》是我在 9.14 Open Data 聯盟成立大會上的演講主題。內容相關連結為:
小弟自許是一位永遠的產品經理,近幾年又勉力投入 Hadoop Big Data 產品與應用的發展,當碰上 Open Data 這個值得公民關心的議題,不免「先問問題,再探索解答」的職業病油然而生,首先自問幾個問題:
  1. Open Data 的價值何在?
  2. Open Data 的價值是對誰而言的價值?
  3. Open Data 是目的,還是工具?
  4. 現在誰在投入 Open Data 的應用發展?
  5. 政府相關單位一直在強調的「Open Data 產業」真的存在嗎?如果存在,產值該如何估算?
  6. Open Data 應用產品,應該如何發展,才能有健康成長的基礎?
適逢 Open Data 聯盟邀請,在聯盟成立大會上,可以同時以公民與軟體業者的雙重身分,將包含以上的問題探索,逐一分享。公民、企業、學研、官員,230 餘人,匯聚一堂,各種角色 Stakeholders 俱足,藉機表達觀點,或期許、或憂心、或提醒、或破迷思,也算一吐為快。

為何從「資料產品」的角度切入?

不管是 Big Data,還是 Open Data,強調的都是資料價值。而最能夠發揮資料價值的載體,應該就是以資料為原料的應用產品或服務了。以下以「資料產品」(Data Product) 來含括產品或服務。

我們對資料產品的具體定義如下:
使用一或多種資料,進行處理、統計、或分析後,再以下列任一形式提供商品或服務:
  • 格式化資料
  • 資料庫
  • API
  • 報表
  • 視覺化工具
  • 決策輔助
  • 結論
  • 其他
Open Government Data 在這一波全球 Open Data 運動中,扮演著絕對重要的地位。台灣政府,尤其是經濟相關單位,在鼓勵或扶持某種新技術或新趨勢發展的起始,往往偏執地冠之以「產業發展」,Open Data 亦然,彷彿商業價值就是資料價值的全部,而忘記了社會 (公民)、政府治理透明化等更高層次的價值。

好吧,既然政府這麼愛講產業、產值,那就順著這個勢,藉由資料產品的規劃、開發、行銷、支援、營運,用一個具體的發展架構來討論在應用 Open Data 時,會碰到的種種議題,以及一位資料產品經理會用怎樣的觀點來看這些議題。

報告老闆,我們發展 Open Data 應用產品最大的風險是......資料提供者

在簡報中,我提到了「正規版的產品經理工作架構」,以及「產品發展團隊,不只有資料科學成員」:

圖 1. 產品經理正規工作架構

圖 2. 產品發展團隊成員

在工作架構中指出,產品所需的資料來源,有以下的面向必須被審慎評估:
  • 品質:資料的正確性、內容格式的一致性、資料內容的完備性等。我們怕的是,要耗費大量的時間才能整理出乾淨與補充出完整的資料。
  • 授權:資料的授權模式,必須確保使用與散佈的完整自由性。我們怕的是,拿到無法合法利用的資料。
  • 格式:資料以開放、非專屬的格式釋出,如 TXT、CSV、JSON、XML 等。我們怕的是,為了接取與處理資料,還要付出權利金或授權費給專屬格式的廠商,墊高成本與失去自由。
  • 更新:資料的更新頻率週期。我們怕的是,即使客觀內容已經改變,但就是拿不到最新的資料,導致產品使用者的不滿;更怕的是,哪天資料提供者說將暫時或永久停止供應資料。
  • 成本:資料的取用費用。我們怕的是,資料使用成本過高,產品無法獲得合理的利潤,甚至是無法維持團隊的正常運作。
如果一位產品經理在他的產品 Business Plan 中,很明確的指出這項產品發展與營運計畫在三年後,將可以為公司帶來每年 5,000 萬的獲利,而且每年都會持續成長,對應的資源是,向老闆請求投入 2,000 萬元的資金,建立 10 個人的團隊。數字看起來相當的漂亮,對吧?

老闆問了一個問題:「請問這個計畫的最大風險是?」

產品經理答:「報告老闆,本計畫的最大風險在於資料提供者 —— 我們不知道他們哪時會因為不明確的資料授權而提訴,哪時會暫時或永久停止提供資料。」

老闆:「那你去忙其他的事好了。」(內心 OS:你這個笨蛋,還浪費這麼多時間寫計畫)

報告言必稱「商業經濟」、數字 KPI 導向的政府長官,一個促進民間投資金額 2,000 萬、增加 10 個就業人數的案子,就這樣沒了。

而這也就是目前為何我們很難在台灣看到有中大型資訊服務公司,投入 Open Government Data 產品發展的原因,因為那個 Commercial-friendly 的環境條件尚未具足。

很抱歉,Data 本身不是一個產業

我在過去的一篇部落格文章「Big Data Lifecycle — 價值流轉與產業發展」中,曾經以「生、流、存、算、用、看」資料流轉的六個階段來說明相關的硬、軟體產業與商機所在。但如果回到「資料」本體,它會是許多行業應用的加值原料,但它並非是一個獨立存在的產業。數位時代,資料時時生、處處在,它就像是大自然中的空氣、陽光、水,是能量的源頭,可以合成、可以加工,硬要用產業來框架與闡釋它們的價值,再怎樣都是低估。

我們不會說空氣、陽光、水是產業;資料亦然。

真要計算資料的產值,可以用相關的硬體、軟體、服務等載體的市場營收來推估,但請言必稱「商業經濟」的長官們,不要再將資料視作是一個獨立存在的產業來看待與思考,錯把價值當營收。

開放資料、開放政府、開放發展

Open Data 的價值,貴在多元、貴在開放發展 (Open Development)。

我在簡報的首段,即指陳「現今社會的許多對立,可能多肇因於一元或少元的發展,Stakeholders 生態侷限、偏頗。數位時代,多元發展已是事實,不己破則被破,不自立則逐波。」我們期盼,藉由 Open Data、Open Development,給 Stakeholders 一個合作創新的機會。

個人、商業、公民社會、國家戰略,在不同的層次上,可以使用不同的 Private Data 與 Open Data 來開發不同的應用,發揮不同層次的資料價值。同層或異層中的摩擦、衝突難免,但不應該影響開放發展大道的舖設。

圖 3. 資料價值層次圖

圖 4. 異元價值碰撞縫隙圖

各種面向的資料集、多種資料集的關聯分析、多維分析後的智慧洞見、多層次洞見的決策、多元決策後的價值發展,這是我身為一位產品經理對 Open Data 應用的架構脈絡。

而 Open Data 中的 Open Government Data,應該只是要達到政府透明治理的一個下位策略工具。打造一個開放政府 (Open Government),為整個國家創造開放發展的有利條件,才是終極目標




留言

  1. 好文!
    我也有參加「台灣生活資料科學養成計畫」,希望之後能跟前輩一起努力! :)

    回覆刪除

張貼留言