"为什么同样是用 Excel 工作, 新来的小李竟能比我这资深表哥快这么多".
对自己多年练就的 "神速做表手" 充满信心的老王怎么也想不明白, 为什么自己最快也要两天才能做好的数据报表, 到新来的小李手里只用半天就搞定了.
其实要解释老王的疑惑一点也不难, 小李站在 "表结构" 数据上跳舞, 而老王仍停留在传统 Excel 的 "表格结构" 数据上埋头苦干.
两者虽然只有一字之差, 但 "表结构" 数据比 "表格结构" 数据更具优势, 而且这种优势是单凭人的快速熟练的操作技巧所追赶不上的.
1, 什么是表结构数据, 什么又是表格结构数据, 两者间又有什么区别呢?
表格结构数据就是我们传统使用的 Excel 工作表数据,
表结构数据则是像数据库中数据表一样的数据结构.
两者间最大的区别就是基本计算单位不同.
表格结构数据基本计算单位是单元格, 如果在 C1 单元格中输入公式 "=A1+B1", 则公式将分别引用单元格 A1 与单元格 B1 中的值, 再将两个值相加并在 C1 单元格中返回计算结果. 整个运算过程都是基于单元格完成的, 像这样以单元格为参照对象进行计算的数据结构就是表格结构数据.
表结构数据的基本计算单位是整列数据, 如下图所示, 先在 Excel 的 A 列和 B 列中分别输入商品数量和商品单价的相关信息, 然后使用开始选项卡中套用表格格式功能将 A 列和 B 列中的值转换为表结构数据, 并且在 C2 单元格中输入公式 "=[@商品数量]*[@商品单价]" 并点击回车后......
会神奇的发现, 再不用向下拖拽公式了, 所有不同行上的商品数量与商品单价的乘积的结果都会自动显示在 C 列中.
这是因为表结构数据的基本计算单位是整列数据, 表结构数据对列中所有行上的值进行统一计算, 并统一返回所有行上值对应的计算结果的原因.
2, 表结构数据的优势在哪?
表结构数据在以下几个方面具有表格结构数据无法比拟的优势:
优势 1: 可对零散数值进行不同维度下的汇总观测
优势 2: 可非常轻松地关联并整合多种不同数据源数据
优势 3: 可对大规模数据进行批量计算, 其速度远大于表格结构数据
优势 4: 可在不同表间建立关联关系, 让所有不同维度数据表整合为一个完整的多维数据模型
优势 5: 多数表结构数据处理工具记录的是运算过程而非计算结果, 所以一旦记录好一次完整, 准确的运算过程, 便可反复利用, 可大幅减少在 Excel 传统工作表中进行的重复性工作.
3, 表结构数据是如何完胜的?
正是以上五点优势帮助站在表结构数据上跳舞的小李完胜了还在表格结构数据上苦干的老王, 那么为什么小李会完胜老王呢?
老王要制作的数据报表需要先从多个不同的数据源中采集数据, 这些数据有来自于 CSV 格式文本文件的, Excel 的, 数据库中多个不同数据表的, TXT 格式文本文件等等
每次老王需要一个个将这些数据源中的数据复制粘贴到自己工作用的 Excel 文件中的多个不同工作表中, 要处理的数据行数多达六万行.
V 好数据后, 当前文件很有可能因为计算资源枯竭而导致崩溃, 老王需要尽快把这份数据转移到一个新的 Excel 文件上.
转移过后, 老王需要继续添加多个计算列才能完成一份完整的数据源, 有了数据源后, 老王还需要制作多个数据透视表来获得最终数据报表中使用的汇总值, 有了汇总值, 老王才可以着手准备数据报告.
老王负责的数据报表是周报, 也就是说每周都要重复一次上述所有的工作流程, 在制作报表过程中哪怕有一步做错了都要再重新来过......
我不想再说下去了, 表哥表姐表叔表嫂们心里的苦是说不清道不尽的.
那么面对同样的工作问题, 已经玩转表结构数据的小李又是如何做的呢?
小李用到了 Excel 中专门处理表结构数据的 Power Query 以及 Power Pivot 工具.
他先用 Power Query 直接关联到多个不同数据源上, 将这些数据源中的数据统一导入到 Power Query 数据环境下, 然后使用合并功能, 轻松将所有不同数据源中数据汇总到了一起, 这就是表结构数据第一个优势.
然后小李在整合好的数据中添加计算字段, 虽然数据量很大, 但因为表结构数据具有 "可对大规模数据进行批量计算, 其速度远大于表格结构数据" 的优势, 瞬间就完成了所有计算任务.
然后小李把加工好的多个数据表一起导入到 Power Pivot 中创建关联关系, 搭建了统一的多维数据环境, 并且在 Power Pivot 中设计了复杂的汇总计算规则, 在完整的数据环境上, 小李非常轻松的获得了报表所需的数据汇总值.
并且在此基础上还为领导提供了可做筛选操作的多个不同的观测维度信息. 这就是表结构数据的第三和第四个优势.
小李创建的整个处理过程被完整的记录在 Power Query 与 Power Pivot 中, 于是, 到了每周出周报的时间, 小李只需要把数据源文件替换好, 然后点击一下 Excel 中数据选项卡下的全部刷新按钮, 稍等片刻, 所有工作就全部完成了. 再不需要每次都重复所有的制作过程.
所以一旦记录好一次完整, 准确的运算过程, 便可反复利用, 可大幅减少在 Excel 传统工作表中进行的重复性工作 " 成为小李压倒老王的最后一根稻草. 在面对表结构数据的高维打击下, 处在低维的表格结构数据已经开始显得力不从心.
在业务数据分析中, 常用到的表结构数据处理加工分析工具主要有 Excel Power BI 以及数据库的 SQL 语句.
来源: http://bigdata.51cto.com/art/201811/586470.htm