什么是数据仓库?
数据仓库收集和管理来自不同来源的数据, 以提供有意义的业务洞察.
它是一组数据, 与操作系统分开, 支持公司的决策. 在数据仓库中, 数据是从历史角度存储的.
仓库中的数据是从多个功能单元中提取的. 对其进行检查, 清理, 然后与数据仓库系统集成.
什么是数据集市?
数据集市是数据仓库的简单形式. 它专注于单一主题. Data Mart 仅从少数几个来源获取数据. 这些来源可能是中央数据仓库, 内部操作系统或外部数据源.
数据集市是一个索引和提取系统. 它是数据仓库的重要子集. 它以主题为导向, 旨在满足特定用户群的需求. 数据集市快速且易于使用, 因为它们使用少量数据.
image.PNG
参考资料
python 测试开发项目实战 - 目录
python 工具书籍下载 - 持续更新
python 3.7 极速入门教程 - 目录
讨论 qq 群 630011153 144081101
- https://www.tutorialspoint.com/sqoop/sqoop_installation.htm
- https://sqoop.apache.org/docs/1.4.7/SqoopUserGuide.html
- https://www.softwaretestinghelp.com/top-4-etl-testing-tools/
来源: http://www.jianshu.com/p/a3da74e0dbd8