对于大数据软件而言, 成功的关键是为企业提供基础应用程序和工具来构建自定义应用程序以下是 20 家专门从事大数据构建或相关业务的企业所提供的应用程序
如今, 大数据技术对企业来说不再是一种尝试和体验, 它已成为企业开展业务的一个重要组成部分根据调研机构 IDC 公司的调查, 2017 年全球大数据和业务分析 (BDA) 的市场收入将达到 1508 亿美元, 和 2016 年相比增长 12.4% 到 2020 年, 其收入将超过 2100 亿美元
这些大部分来自硬件和服务对于大数据软件而言, 在某些情况下, 每家公司的需求都是基于垂直行业的独特需求即使在同一行业, 如零售行业或制造行业, 每个公司的需求也会有所不同, 因此开发一种套装软件很难为所有行业的潜在客户提供服务
对于大数据软件而言, 成功的关键是为企业提供基础应用程序和工具来构建自定义应用程序人们可以了解什么是真正的大数据应用软件这些提供应用程序的公司有很多是行业知名厂商, 然而, 也有一些令人关注的初创公司的产品也包括在内
以下是 20 家专门从事大数据构建或相关业务的企业所提供的应用程序这个清单并没有什么特别的顺序
1. Domo
Omniture 公司前首席执行官 Josh James 于 2010 年创立了 Domo 公司, 为企业提供了一种方法, 可以从不同来源不同的孤岛中查看数据它自动从电子表格社交媒体内部存储数据库, 基于云的应用程序, 以及数据仓库中提取数据, 并在可定制仪表板上显示信息它以其易用性以及几乎任何人都可以建立和使用它而闻名, 而不仅仅是数据科学家采用它配备了许多预加载的图表和数据源设计, 可以快速移动
2. Teradata Database
从 Teradata Database 15 开始, 该公司增加了 Teradata 统一数据架构等新的大数据功能, 使企业能够跨多个系统访问和处理分析查询, 其中包括从 Hadoop 导入和导出双向数据它还添加了地理空间数据的 3D 显示和处理, 以及增强的工作负载管理和系统可用性支持 AWS 和 Azure 的基于云计算的版本称为 Teradata Everywhere, 它在基于公共云的数据和本地部署的数据之间提供了大规模的并行处理分析
3. Hitachi Vantara
Hitachi Vantara 的大数据产品是建立一些流行的开源工具基础上 Hitachi Vantara 成立于 2017 年, 是日立数据系统公司的存储和数据中心基础设施业务部门, 是由 Hitachi Insight 集团物联网业务和日立 Pentaho 大数据业务组合成的一家合资公司 Pentaho 基于 Apache Spark 内存计算框架和 Apache Kafka 消息系统 Pentaho 8.0 还增加了对 Apache Knox Gateway 的支持, 以对用户进行身份验证, 并强制访问大数据存储库的访问规则它还增加了对通过 Docker 容器构建分析应用程序的支持
4. TIBCO 公司的 Statistica
TIBCO 公司的 Statistica 是针对各种规模企业的预测分析软件, 使用 Hadoop 技术对结构化和非结构化数据执行数据挖掘, 解决物联网数据, 能够在全球任何地方的设备和网关上部署分析, 并支持数据库内分析来自 Apache HiveMySQLOracleTeradata 等平台的功能它使用模板来设计完整的分析, 因此只有较少的技术用户可以进行自己的分析, 并且可以将模型从电脑导出到其他设备
5. Panoply
Panoply 公司通过使用人工智能来销售所谓的智能云数据仓库, 以消除转换集成和管理数据所需的开发和编码该公司声称, 其智能云数据仓库实质上提供了数据管理即服务, 能够在无需任何干预的情况下消费和处理高达 1PB 的数据其机器学习算法可以检查来自任何数据源的数据, 并对该数据执行查询和可视化
6. IBM Watson Analytics
Watson Analytics 是 IBM 公司的基于云计算的分析服务当用户将数据上传到 Watson 时, 它会根据数据分析向用户提供可帮助回答的问题, 并立即提供关键数据可视化它还可以进行简单分析预测分析智能数据发现, 并提供各种自助服务仪表板 IBM 公司还有另一种分析产品 SPSS, 可用于从数据中发现模式, 并查找数据点之间的关联
7. SAS Visual Analytics
Statistical Analysis System (SAS)创建于 1976 年, 比大数据的创建还要早, 就是为了处理大量数据它可以从各种来源中挖掘更改管理和检索数据, 并对所述数据执行统计分析, 然后将其呈现在一系列方法中, 如统计数据图表等, 或将数据写入其他文件它支持所有类型的数据预测和分析要点, 并附带预测工具来分析和预测流程
8. Sisense 商业智能软件
Sisense 公司声称其提供了唯一的商业智能软件, 使用户可以通过从商品服务器硬件上的多个源进行来准备分析和可视化复杂数据 Sisense 的片上高性能数据引擎可以在一秒钟内完成对 TB 级数据的查询, 并且为不同行业提供了一批模板
9. Talend 的大数据工作室
Talend 一直专注于为 Hadoop 生成干净的原生代码, 无需手动编写所有代码它为各种大数据存储库提供接口, 如 Cloudera,MapR,Hortonworks 和 Amazon EMR 它最近添加了一个数据准备应用程序, 可以让客户创建一个通用字典, 并使用机器学习, 自动执行数据清理过程, 以便在更短的时间内为数据处理准备好数据
10. Cloudera
Apache Hadoop 公司是最受欢迎的提供商和支持者, 它与戴尔英特尔甲骨文 SAS 德勤和凯捷等公司都有合作关系它由五个主要应用程序组成: 核心数据管理平台 Cloudera Essentials, 数据管理平台 Cloudera Enterprise Data Hub, 用于商业智能和基于 SQL 的分析的 Cloudera Analytic DB; 高度可扩展的 NoSQL 数据库 Cloudera Operational DB, 以及 Cloudera Data Science and Engineering, 在 Core Essentials 平台上运行的数据处理数据科学和机器学习
11. MongoDB
MongoDB 已成为各行业大数据项目的首选数据库它的 NoSQL 支持适合大数据经常使用的非结构化数据其灵活性对 JSON 和 JavaScript 的支持灵活的框架丰富的查询语言, 以及广泛的行业支持使其成为数据库的标准
12. Vertica Analytics Platform
大数据的数据库传统上是非结构化的, 意味着可以在其中存储任何类型的数据 Micro Focus 的 Vertica 分析平台采用传统的面向列的关系数据库格式, 但专门设计用于处理来自 Hadoop 集群的现代分析工作负载该平台使用集群方式存储数据, 并全面支持 SQLJDBC 和 ODBC 它使用列式存储而不是行式存储, 因为访问列可以更轻松地分组数据
13. SAP Vora
SAP HANA 本身并不适用于大数据这是一个内存中的 RDBMS 系统但是当用户添加 HANA Vora 这个大数据接口时, 它变得更加可行 Vora 允许 HANA 连接到 Hadoop 存储库, 并扩展 Apache Spark 执行框架, 以实现企业和 Hadoop 数据的交互式分析所以数据科学家可以通过支持大数据存储来获得 HANA 的力量
14. Oracle Big Data suite
Oracle 公司这个数据库巨头拥有全套大数据集成产品, 如支持实时数据流批量数据处理企业数据质量和数据治理功能的数据集成平台云流分析物联网支持, 以及通过 Oracle Event Hub 云服务支持 Apache Kafka
15. Apache Cassandra
虽然 MongoDB 是领先的数据库, 但 Cassandra 在可扩展性方面具有优势这是由 Facebook 公司前员工所编写, 它跨越了大量的商品服务器, 确保没有故障点和高级容错能力
16. Plotly
Plotly 或 Plot.ly 专注于数据可视化, 而不需要编程或数据科学技能它的 GUI 设计用于导入和分析数据, 并为其所有图形使用 D3.js JavaScript 库它的仪表板可以实时生成, 也可以从现有数据池生成, 并支持导出到各种可视化工具, 其中包括 Excel,SQL 数据库, Python,R 和 MATLAB
17. Wolfram Alpha
想要计算或了解有关事物的新内容? Wolfram Alpha 是一款用于查找关于所有内容的信息非常棒的工具 Proessaywriting 公司的 Doug Smith 表示, 他的公司使用这个平台进行金融历史社交和其他专业领域的高级研究例如, 如果输入 Microsoft, 就会收到输入解释基本面和财务信息最新交易价格历史记录绩效比较数据回报分析相关矩阵, 以及许多其他信息
18. Tibco Spotfire
Spotfire 是一款内存分析平台, 升级后包含对大数据存储库的支持并执行预测分析它为 Apache Hadoop 提供了一个连接器, 它可以让用户在大数据上执行数据混搭, 数据发现和分析任务, 就像他们对 Oracle,SAP 和其他传统数据源所做的那样它还支持实时数据驱动的事件可视化, 并具有人工智能驱动的推荐引擎, 可缩短数据发现时间
19. AnswerRocket
AnswerRocket 专注于自然语言搜索数据发现, 使其成为商业用户的工具, 而不是数据科学家的神秘工具它可以在几分钟内提供答案, 而不是等待几天才能形成查询
AnswerRocket 用户可以使用日常语言提问, 并在几秒钟内获得可视化效果, 然后他们可以在特定的图表或图表上进行深入查看以获得进一步的洞察
20. Tableau
Tableau 专门从多个数据孤岛中进行绘图, 并将其集成到一个仪表板中, 只需点击几下鼠标, 即可使用自定义过滤器和拖动和连接来创建交互式灵活的仪表板 Tableau 还使用自然语言查询, 因此用户可以询问业务问题, 而不是技术问题
来源: http://bigdata.51cto.com/art/201803/569024.htm