2018 年, 在由中国研究型医院学会医疗信息化分会医疗和临床科研大数据专业委员会主办, HIT 专家网承办的 "医疗大数据应用与实践研讨会" 上, 国家卫生计生委统计信息中心原副主任, 中国医院协会信息管理专业委员会 (CHIMA) 主任委员王才有阐述了当前对医疗大数据概念的再认识, 及其所面临的机遇与挑战.
当前医疗大数据面临四大挑战
反复认识 "数据" 和 "大数据" 的概念
对于大数据的认识, 不断在深化. 但是, 迄今为止, 人们对于大数据的概念并不清晰, 比如 "两会大数据表明" 的说法."数据" 反映的是事实, 但是数据又不一定是事实. 比如医生在看病人的时候, 医生对病的认识是不一样的, 并且需要记下来. 而从事实到医生做判断, 是需要一个过程的. 在这个过程中, 有些数据可能就丢掉了, 有些数据可能是误解. 既是事实, 又不是事实, 这就是大数据的特点.
以往, 为了某种研究目标, 人们去收集一些有质量控制的数据, 比如 ICD-10, 目标是很准确的. 但是到了大数据时代, 情况就不一样了. 数据不是由人来把控的, 在不真实数据中, 即便有再好的模型和算法, 也算不出有价值的结果. 所以, 数据并不是越多越好. 谈到大数据, 业界都会关注 "4 个 V"(Volume,Variety,Value,Velocity). 但这是不够的, 重要的是针对 "4 个 V" 后面用什么新技术解决数据的处理和分析问题 . 针对大量的数据, 流失的数据, 目前还没办法解决. 比如, 心脏监测还做不到连续的监测, 目前只是一个断点, 一个断点地寻找数据.
大数据只会越来越大. 当今之所以叫数据时代, 是因为数据已经足够多了, 但是人类的分析数据能力还远远不够, 所以才要发展人工智能, 机器学习. 美国 Gartner 公司的研究表明, 人类有史以来 90% 的数据是计算机在最近两年产生的, 其中只有 1% 的数据进行了分析. 反观医院, 其实在医院的计算机里, 在业务流程中, 生成了大规模数据, 大量的数据往往只是一次性地应用, 照了片子, 看了结果, 做了检查报告后就放在一边了, 以后能不能持续性地应用, 还没有做到数据分析.
医疗大数据任重道远
医疗行业是一个数据密集行业. 比如肿瘤医院的每个医生一辈子会接触许多病人, 以前和过去包括现在的经验的数据组成了医学, 医疗系统在数据利用上是最有价值的一个系统, 长期以来我们一直在用临床决策系统. 临床决策系统的概念 (CDSS) 和应用已经发展了 40 多年. 但是做临床决策知识系统之后, 仍然会发现数据范围是有限的. 只有收集更多的数据, 才可能给医生更多的建议 , 包括: 患者过敏史, 用药史, 家族病史和基因情况等. 在此我向大家推荐一个大数据技术交流圈: 658558542 突破技术瓶颈, 提升思维能力 .
集成了这些数据的系统, 如果能主动地给医生提供建议, 就会降低医疗事故, 提升医疗质量. 因此, 业界意识到, 做医院临床决策知识系统必须要有平台, 必须把不同知识系统里面的数据集成起来 . 当然这绝不是一两年内就会实现的, 而是一个长远目标. 医疗健康大数据的需求, 也来自于医院管理. 现在的医院日子还比较好过, 得益于医疗体制改革中, 大量的资金涌到了医院, 但这种现象不可能持续下去. 因为钱总是有限的, 人们对生命的追求是无限的.
怎么用有限的钱来提高居民的健康服务水平? 医院之间以后一定要竞争, 自然就要比较竞争能力. 在做分析, 决策, 判断, 临床服务, 医疗资源方面进行竞争, 实际上这也是大数据的应用带来的美妙前景. 当前为什么要强调 "医疗健康大数据"? 因为数据越来越多了, 通过物联网技术, 社交媒体,"互联网 +", 数字化医疗设备等渠道, 有越来越多的数据可以处理, 同时 IT 系统的存储和计算能力也在增加.
医疗大数据应用的机遇和挑战
在美国召开的 HIMSS17 会议上, 美国 IBM 公司总裁 Ginni Rometty 做了一个非常有鼓动性的发言, 她认为认知计算将带领医疗走向黄金时代. 但在 Rometty 的发言后不久的时间, IBM 与其顶级合作伙伴 MD Anderson 肿瘤医学中心就产生了分歧, 可以看出医疗健康大数据不是一件容易的事情. 另外有研究表明, 2011 年美国提出医疗大数据, 但盘点 5 年之后的情况, 只有 10%-20% 的目标实现了.
所以, 中国现在如果把握不好, 今天美好的医疗健康大数据愿景在 5 年之后也许也只有 10% 能实现. 一定要找到机遇的突破点, 不是期望把任何问题都能现在解决, 把现在解决不了的问题要留给后人. 但是一定要抓住现在能解决的问题, 因为你不解决别人就解决了.
医疗大数据的四大挑战
第一, 数据来源的挑战. 大数据的来源是多元的, 质量是不受控制的, 有些数据是拿来也不可用的, 比如: 不可及的碎片化数据, 可及但又是错误的数据, 可及, 正确但是残缺, 无法修补的数据.
第二, 数据治理的挑战. 没有新的数据治理方式, 解决不了数据共享问题. 现在是社会化的数据采集, 分享方式. 原有的自给自足的数据治理方式, 必须采用新的数据治理方式.
第三, 数据分析能力的挑战. 最近几年, 算法进步, 并行计算能力进步很快. 信息中心更多是学计算机的人, 缺少统计分析, 流行病学, 医学的人.
第四, 组织能力的挑战. 大数据应用需要团队协同, 除去技术, 数据来源, 最重要的还是组织问题. 要挖掘大数据的价值, 需要掌握不同的技术, 学科, 专业的人. 需要不同专业的人去去学习, 特别是各种学科边界上的接口人才, 组织管理人才, 包括数据科学家, 业务专家, 决策者, IT 工程师等.
未来, 医疗卫生机构需要构建数据驱动型组织, 实现知识, 技术协同, 能力提升, 特别是制度的创新, 从而逐步释放大数据的潜能, 实现智慧医疗.
感谢您的观看, 如有不足之处, 欢迎批评指正.
在此我向大家推荐一个大数据开发交流圈:
658558542 (点击即可加入群聊)
里面整理了一大份学习资料, 全都是些干货, 包括大数据技术入门, 大数据离线处理, 数据实时处理, Hadoop ,Spark,Flink, 推荐系统算法以及源码解析等, 送给每一位大数据小伙伴, 让自学更轻松. 这里不止是小白聚集地, 还有大牛在线解答! 欢迎初学和进阶中的小伙伴一起进群学习交流, 共同进步!
最后祝福所有遇到瓶颈的大数据程序员们突破自己, 祝福大家在往后的工作与面试中一切顺利.
来源: http://www.jianshu.com/p/3de3931dba77