大数据概念
大数据究竟是什么? 很多人可能仍然有些混淆, 本文让我们来看看大数据的一些主要的定义. 首先要注意的是, 行业内的所有人都普遍认同, 大数据不只是更多的数据.
(1)最初的大数据
大数据的特征可以用很多词来描述. 2001 年 Doug Laney 最先提出 "3V" 模型, 包括数量 (Volume), 速度 (Velocity) 和种类(Variety). 在那以后, 业界很多人把 3V 扩展到了 11V, 还包括有效性, 真实性, 价值和可见性等.
(2)大数据: 技术
为什么十多年前的老术语突然被放在聚光灯下? 这不仅是因为我们现在拥有比十年前更多的数量, 速度和种类. 而是因为大数据受到新技术的推动, 特别是快速发展的开源技术, 例如 Hadoop 和其他存储和处理数据的 NoSQL 方式.
这些新技术的用户需要一个术语来将它们区别于以前的技术, 于是大数据成了他们的最佳选择. 如果你去参加大数据会议, 你肯定会发现, 涉及关系型数据库的会议会很少, 无论他们鼓吹多少个 V.
(3)大数据与数据的区别
大数据技术的问题是, 大数据有些含糊不清, 以至于行业中的每个供应商都可以跳进来声称自己的技术是大数据技术. 以下是两种很好的方法来帮助企业理解现在的大数据与过去单纯的大数据的区别.
交易, 交互和观察: 这是由 Hortonworks 公司负责企业战略的副总裁 Shaun Connolly 提出的. 交易是我们过去收集, 存储和分析的主要数据. 交互是人们点击网页等操作得到的数据. 观察是自动收集的数据.
(4)大数据: 信号
SAP 公司的 Steve Lucas 认为, 应该根据意图和时机来划分这个世界, 而不是根据数据的类型."旧世界" 主要是关于交易, 当这些交易被记录时, 我们已经无法对它们采取任何行动: 企业都在不断管理 "失效的数据". 而在 "新世界", 企业可以使用新的 "信号" 数据来预测将会发生什么, 并进行干预来改善情况.
相关的案例有, 追踪社交媒体上人们对品牌的态度, 以及预测性维护(用复杂的算法帮助你决定何时需要更换零部件).
(5)大数据: 机会
这是来自 451 Research 的 Matt Aslett, 他将大数据定位为 "之前因为技术限制而被忽略的数据".(虽然在技术上, Matt 使用了 "暗数据", 而不是大数据, 但已经非常接近). 这是笔者最喜欢的定义, 因为它符合大部分文章和讨论中的说法.
来源: http://www.jianshu.com/p/19ab3bfc06e7