业界热议大数据:大机遇还是大忽悠?

大数据一个概念有多火,看看它在所在领域的论坛上被提及的频率便可以知道。在7月12日举行的“2012中国CIO高峰论坛”上,“大数据”是CIO们最为关注的话题之一。一天之后,在北京举行的“2012大数据世界论坛”上,微软、英特尔、Oracle等巨头的高管们又纷纷登台,分享他们对大数据的见解,同时“推销”自己的产品;场外的展台前也是人头攒动。在微博上,大数据相关的话题也被无数业内人士谈论着。如同前两年的云计算,如今的大数据尽管基本概念尚未完全厘清,却已成为企业IT领域无法回避的话题;企业与厂商都跃跃欲试,迎接大数据带来的机遇与挑战。

大数据是大谎言?

不过,正如其他热门的新概念一样,大数据也开始受到越来越多的质疑,其中最信任关注的是3月下旬Sybase公司CTO关毅凡(Irfan Khan)在《福布斯》网站上发表的一篇题为《大数据是个大谎言》的文章。他在文章中称,不断增长的数据对于企业来说一直都是难题,也不断有人声称数据洪流将给企业带来灾难,但事实上IT行业总是能够通过改进计算机基础架构解决这些困扰;大数据不会引发世界末日,企业也不必为此过分担忧。

类似的声音此后不断出现,就在前不久,国内技术圈内的知名作者、丁香园CTO冯大辉也在一篇题为《大数据可能是一场骗局》的文章中表达了相近的观点。冯大辉认为数据的“大”只是相对的,大数据是“新瓶装旧酒”,它有价值、是机会,但价值“没有那么大”,也“不是所有人的机会”;他不相信大数据会带来“商业模式的变革”,反而认为它“会和信息爆炸、网格计算、云计算等一样逐渐被淡忘”。

不过质疑声并没有让大数据的热潮消退。在“2012中国CIO高峰论坛”上,通用电气亚太区IT服务总监冯中茜、凡客高级副总裁滕崧和京东高级副总裁李大学等嘉宾均表示大数据“不是谎言”。藤松认为,大数据对于IT解决方案提供商来说“可能是谎言”,但对于使用方来说却不是;他表示,凡客每天采集的数据都达到数百GB甚至1TB,如何分析这样大规模的非结构化数据对于公司来说的确是一个很大的挑战,目前基于这些数据的用户行为研究都还处于“初级阶段”。李大学也表达了类似的观点,称数据的增长让京东面临着很大的压力,“传统的解决方案都不行了,不得不采用分布式等解决方案”。

从3V到4V

企业处理大数据的需求,对于IT服务提供商来说就是新的商机,因此质疑的声音无法阻止这些公司对于大数据概念的宣传,抑或是“炒作”。微软亚太研发集团首席技术官孙博凯(Prakash Sundaresan)表示,“如今大数据成为了竞争力,要保持竞争优势必须采用大数据技术”。他认为大数据服务未来几年内“会达到30%以上的增长”,远超传统IT服务的5%-10%,产值更是将超过100亿美元。

谈到大数据,企业和厂商都习惯用“3V”形容其特点,即大容量(Volume)、高增长速度(Velocity)和多种类(Variety);不过最近,第四个V——价值(Value)被越来越多的提及。在赛仕软件(北京)总经理刘政看来,价值是大数据被人们关注的根本原因:“它会创造价值,如果没有价值的话,我们就没有必要讨论这个问题了。”他引用美国的案例称,大数据带来的价值将达到上千亿美元的级别,“你如何在这么大的一块市场中占得你的利益?那就要对大数据做分析。”

Splunk亚太及日本区域副总裁刘文熙则用一个案例具体介绍了大数据的价值:“人们上一个网站会做出点击,你和我的行为、表现是不一样的,这种用户行为、用户习惯会对电子商务、电子营销、电子广告的公司产生价值;当他们需要做广告时,他们就可以根据这些数据知道我需要怎样的内容,可以把我可能感兴趣的广告推送给我,而不是广撒网式地推送。”

传统IT厂商力拼大数据解决方案

在谈论大数据价值的同时,厂商们也不会放过实现大数据为他们自己带来的价值——推广自己的产品。在Hadoop得到越来越多的应用之后,传统的数据库产品提供商也纷纷推出新版的产品,试图通过集成这一架构来解决用户对于大数据处理方面的需求。微软于前不久发布了SQL Server系列的最新版本——SQL Server 2012,“集成Hadoop”被其作为这款产品的主要卖点之一。孙博凯表示,在Windows Azure云平台的支持下,Hadoop的部署速度将大大提升,“一个小时就可以完成”。他强调,微软提供的是端到端的大数据解决方案,“连接10亿的数据源,每一个个人、品牌都是一个云的分数。”

作为硬件厂商,英特尔则重点突出了自己的大数绝解决方案在性能方面的优势。英特尔(中国)有限公司行业合作与解决方案部中国区总监凌琦表示,英特尔的计算、存储和IO架构能在性能与容量间求得最佳平衡,以满足大数据应用的需求。“在数据分发、数据管理、数据库应用等方面,英特尔都有相应的技术,能在硬件平台上给软件开发提供了足够的支撑。”他强调,英特尔的设备能在数据分发和存储方面保证高可靠性和高可用性和,并对今后可扩展性的存储架构提供支撑。

大数据的特征之一是非结构化,这在一定程度上使得Oracle赖以生存的关系数据库产品失去了用武之地;Hadoop和NoSQL的崛起更是令Oracle受到了不小的冲击。不过在Oracle全球副总裁、大中华区技术总经理喻思成看来,Hadoop和NoSQL “并不是Oracle数据库的对立面或竞争者,而是Oracle数据库的一个补充;今天Oracle公司也拥抱这些技术,使得我们能够拥有更大数据库平台。”他表示,无论是关系型的数据库还是非关系型的大数据产品,都是为了给企业完整的解决方案,“大数据本身只是数据蓝图的补充”;而Oracle的产品覆盖后端数据源、数据存储、数据仓库处理、前端中间件、前端BI展现等各个环节,此外还提供以云的方式进行管理的功能,是真正软硬件优化集成的大数据综合解决方案。

(本报刊登在《电脑报》2012年第29期,有改动)

By 抬头365 on 2012/07/18 · Posted in 软件•服务

Be the first to post a comment.