如今, 由于数字化转型的失败, 数据分析很少能吸引 IT 和商界领袖的兴趣.
事实上, 利用科学方法, 流程, 算法和技术系统从结构化和非结构化数据中提取一系列见解的数据科学举措可能会以任何方式失败, 导致浪费时间, 金钱和其他资源. 主要由于决策者误入歧途, 导致缺陷项目对企业的损害大于利益.
数据质量差
有问题数据会导致错误数据科学, 因此花时间确保数据的高质量至关重要. 对于任何分析工作来说都是如此, 数据分析也是如此.
当企业将不干净的数据用于数据科学项目时, 最终将 " 看看那些产生奇怪产出的模型, 并看到它不能代表现实业务或流程, 使事情变得更好.
有时, 由于数据集中的偏差或差异, 导致数据质量较差.
没有明确定义要解决问题的标准
对于一些拥有多个系统的企业, 在许多情况下, 业务随每个系统而变化, 因此将会导致不同的流程或计算业务内指标的方法产生变化.
这可能是数据科学失败的一个主要原因. 由于基于修改后的业务流程进行重复计数, 调查结果可能会夸大其份. 要解决这个问题, 组织必须制定数据分析计划, 概述一个特定日期, 其中数据可以验证, 每个人都理解并认同的共同标准.
缺乏相关数据
数据科学失败的另一个可能是不能提供解决特定问题所需的特定类型的数据.
向问题抛出大量数据不一定能获得答案.
有一种假设认为, 大数据将带来见解, 而实际上这种情况很少见. 智能, 定制且通常更小的数据集通常提供强大的可概括模型.
为了从数据科学中获取价值, 应该继续努力继续从最相关来源收集数据. 由于数据是从各种来源收集或购买的, 团队需要确保数据的任何修改不会扭曲结果, 并牺牲整个数据集的质量. 他们还必须确保数据集没有隐私, 法律等问题.
缺乏数据透明度
团队需要透明地使用他们用于构建任何给定模型的数据.
当领导不信任该模型或理解解决方案时, 数据科学项目就会失败. 解决这个问题的方法是, 必须能够 "分析结果可视化" 并将其传达给可能不具备技术或统计技能的利益相关者.
数据科学家需要解释数据的来源, 他们为计算模型所做的工作, 并提供对所有相关数据的访问权限. 透明度可能是项目成功的关键.
缺少决策层的拥护
数据科学工作需要决策层中的拥护者, 以确保项目获得足够的资源和支持.
"如果是首席信息官, 它会有所帮助," 莱利说."我们认为数据科学是我们运营不可或缺的一部分, 我确信自己一定会成为我们努力的拥护者. 即使 CIO 不是数据科学的内部拥护者, 他们也应该负责保护所有相关数据的安全."
"充分利用你掌握的信息是我所说的现代 CIO 的责任." 有了所有这些数据, 您就有能力从中学习并智能地使用这些数据, 而这是 CIO 可以用来帮助其功能跨组织地使用的东西.
在确定销售过程中可以做出的新策略和修改方面, 自适应器从数据科学工作中获得了最大的收获. 这与我们的产品或 IT 基础设施, 营销无关, 仅此而已. 从业务流程优化的角度来看, 它对我们帮助最大, 能够更好地从内部销售中处理和管理线索.
人才短缺
技能差距困扰着 IT 的许多方面, 数据科学也不例外. 许多组织根本就没有维护项目或获得最大价值的技能集.
"博纳非数据科学家的需求量很大, 很难得到, 而且成本高,"Tracy(Tracy Huitika, CIO, Beanworks) 说, Beanworks 是一家基于云的账户付费自动化提供商. 这个职位通常需要物理学或科学博士学位, 以及在 R 和 Python 中编写代码的能力.
Johnson 说, 数据科学项目失败的最大原因之一是缺乏继续管理该项目的运营人才. 他表示:" 让一位出色的数据科学家在没有计划的情况下创建模型, 通过市场调整和数据变化来运行持续改进的运营, 就像为一辆汽车设计工程, 并将钥匙交给一个 10 岁的孩子一样.
公司需要获得合适的技能组合, 无论是通过聘请或利用精通数据科学的外部专家, 以保持模型投入生产后.
数据分析不是正确的解决方案
如果某个特定问题一开始就不需要数据科学作为解决方案, 该怎么办? 这种对学科的误导性使用可能导致失败, 因此值得在何时何地不应用数据科学方法, 流程和工具进行大量思考.
"导致数据科学项目失败的最大事情之一是, 如果数据科学, 算法和机器学习甚至不是正确的解决方案,"Riley 说.
"您可能根本不需要机器学习模型: 你可能需要简单的回归, 你可以花大量的时间和精力去经历所有不同的排列, 而不用数据科学,"Riley 说." 我们陷入了这样的情况之一, 即我们正在研究财务数据科学建模, 以可视化预测器, 从而实现业务线的未来财务成功. 事实证明, 最好的用途只是统计回归.
解决方案
前文看似很多问题将企业数字化转型这条路给堵死, 但是现在 DataFocus 已经将偷偷开辟了一条新的道路. 搜索式分析让广大非数据学科不懂代码的专家也可以轻松的进行数据清洗处理并进行有效的可视化展示. 由于独创的大数据处理引擎可以轻松处理大量数据, 并在短时间内输出可视化结果. 各种模型构建成本, 试错成本大大降低. 最关键的是可以让一线的业务人员也参与到数据分析当中, 让数据分析落实到企业每一层业务当中. 让数据与现实接轨.
来源: http://www.cioage.com/art/202109/682372.htm