群起的 Big Data PurePlay 縱隊


Hadoop Summit 2012 行後記 3


Hadoop Summit 已經有 5 年歷史,根據大會發佈的統計數字,從 2008 年首辦,5 年之間,從一開始的 200+ 人,到今年的 2,200+ 人,參與人數增加了十倍。今年贊助商有 47 家 (含主辦單位 Yahoo! 與 Hortonworks),比起去年增加快要一倍。根據小弟的統計,贊助商公司型態中,Big Data PurePlay (即與 Hadoop、Big Data 有關的 Startups) 占了近 7 成,Big Vendor (傳統 IT 大廠) 則不到 1/4,剩下的則是 Internet 公司,他們是 Hadoop 的 Heavy User,如 Yahoo!、AWS、Facebook、Dropbox 等。

Hadoop Summit 2012 贊助商公司型態統計 (by Fred Chiang)

如果進一步分析這些贊助商的產品或服務類型,會發覺其實種類還蠻多樣的。其中以工具 (Tool) 廠商與資料庫 (DB) 廠商最多,都佔到 17%,其後依序是:


  • 硬體廠商 (Hardware,14%) 
  • 顧問/系統整合/方案提供者 (Consulting/SI/Solution,12%)
  • 平台廠商 (Platform,10%) 
  • 雲服務 (Cloud Service,8%)
  • Hadoop 使用者 (User,8%)
  • 叢集管理廠商 (Cluster Management,6%)
  • Hadoop 版本發行商 (Distribution,6%)
  • 資料安全 (Data Security,2%)  
 
Hadoop Summit 2012 贊助商產品/服務類型統計 (by Fred Chiang)



在這邊,我最想提的是位居贊助商前兩名的工具 (Tool) 與資料庫 (DB) 廠商中的 Big Data PurePlay,他們不像傳統 IT 大廠那樣 —— 擁有許多與 Hadoop 相關或無關的產品,PurePlay 就只做跟 Hadoop、Big Data 有關的產品、方案、或服務,也就是將整個未來都壓在這條路上的新創公司。
  
在工具方面 — 包含整合工具、分析工具、視覺化工具的蓬勃發展。Karmasphere、Datameer、Pentaho、Talend、Tableau、Jaspersoft、Pervasive、Quest Software 等公司,都是在 Hadoop Community 非常活躍的角色。他們代表 Hadoop Ecosystem 中有一股強大的驅力,要將 Hadoop 上的資料使用權,從 Developer 手上轉到 Data Analyst (資料分析師) 與 Business User (商務使用者) 的手上。
 
另一方面,以 DB 為主要參展產品者,充滿了大批品牌的 SQL DB、DW、與 MPP DB 廠商,他們的想法都是要讓企業的傳統結構化資料與 Hadoop 叢集中的半、非結構化資料整合,企圖創造「Total Data」的價值。但近來深受注目的 NoSQL DB,以 PurePlay 廠商為主者,亦欣見沒有缺席。這裡面有提供 open source 軟體,如提供 Cassandra 技術服務的 Datastax 與 MongoDB 技術服務的 10gen,也有自行開發 operational Big Data DB 的 MarkLogic、in-memory MPP DB 的 Kognitio、real-time DB over Hadoop 的 Drawn to Scale。
 
群起的 Big Data PurePlay 縱隊,真的很精彩。其中有些小弟也在會前、會中、與會後有所聯繫,大家相互交流對 Hadoop 市場前景的看法。
 
大家同在浪頭上,現在只能說:PurePlay 的好戲正開始。



留言