怎么样做好 大数据 项目?第一件事情就是建立数据交流,非常重要,整个语言统一。第二,建立数据质量。数据质量, 大数据 时代,不仅仅是数据完全正确,三个不同维度:及时性、准确性和完整性。第三才是准确问题。数据质量非常重要。
数据共享,非常难,今天每个城市推 智慧城市 ,推数据共享,最大困难依然是数据。最大问题是思想问题。非常难解决,数据本身预示着权力,对这件事情本身控制。每个城市推动过程,碰到最大问题就是 数据库 。
另外一个很重要就是分析难。简单地讲这个概念。 大数据 真正核心,怎么样把数据里面有用信息提取过来,运用到决策当中去。获取信息方法分成四类,报表、统计分析、多维分析、 数据挖掘 。 数据挖掘 ,上世纪93、94年,IBM系统提出来。现在一系列的 算法 ,我在1999年出的一本书《 数据挖掘 功能、 算法 及典型应用》,科学院、中科院普遍教材,按照不同方法进行分类。
医疗现在的问题是成本问题,美国整个医疗占15%,这样一个体系架构。我们国家面临老龄化问题,医疗产能巨大,这里面举了一些例子,医疗 大数据 价值,在美国据说每年大概三千亿,相当于GDP增长了0.7%体系架构。
医疗行业数据,数据量增长非常快速,尤其是医疗影像数据,这是非常快速的体系架构。医疗方面问题,一个是资源问题,参与主体比较复杂,尤其我们国家,信息不共享,这是我们国家目前医疗面临最大问题。
A医院拍的片子到B医院,不要,必须重新拍。电子化、信息化非常重要的医疗方面的问题,怎么解决这个问题,利用 大数据 方法。 大数据 在行业应用,医疗属于领先体系架构。
数据主要来源,包括患者档案、医疗机构、制药企业等等,所以医患和药,这是围绕这样一个体系架构去做的。它本身数据要求周期比较长,一般按要求时间很长,这里面各种各样一些数据。解决方案,本身基础是什么?这是数据架构。
利用 大数据 架构,分析临床、操作、定价问题、付款问题、支付问题、研发以及新的商业模式、体系架构、制药行业,临床决策,费用报销等等,这样一个体系架构,医疗行业应用面非常广。
我帮摩斯制药做的糖尿病,预估一个人7到8年之间,哪些人得糖尿病概率比较高。目前在广州做肝病的预估。这种方法,初级医生、中级医生预估效果好。现在到医院看病的时候,经常发现医生通过 互联网 查病历去治,这是 大数据 带来的价值,用这样一个方式。