在认知时代,数据作为一种新的自然资源能够被计算机系统所理解、推理和学习,但企业必须在数据价值有效期内对其进行分析,形成洞察并予以应用。
近日,IBM公司宣布推出基于Apache Spark的新型z/OS平台,新的z/OS平台配有来自业务合作伙伴的加速器,可以帮助企业更便利地利用大型主机的数据和能力,来了解市场变化和客户的个性化需求,从而对业务及时进行调整。此举将给数据科学家和开发人员创造新的机会,帮助他们对系统丰富的数据集进行高级分析,以实现实时洞察。
Apache Spark是一种开源的分析框架,IBM此次推出的基于Spark的z/OS平台将支持其在z/OS主机操作系统上实现本地运行。新的操作系统平台可以帮助数据科学家打通分析库和底层文件系统之间的联系,无需进行提取、转换和加载(ETL)即可对数据实现就地分析。
IBM去年发布了一项针对Spark的承诺,将投入3500名IBM研究人员和开发人员参与与Spark相关的项目。为了推进支持大型主机分析的开源技术,大型主机还成了一个新的GitHub组织,以便开发人员协作建立针对Spark的z/OS工具。比如,Project Jupyter和任一NoSQL数据库的组合都能提供灵活、可扩展的数据处理和分析解决方案。
这一方法可以帮助件开发人员选择他们的工具和语言,提供能够在不同数据环境中监控分析结果的新型视觉辅助工具,开发出新的数据处理技术和技巧,从而让新的开源工具更易使用。使用z/OS的开发人员现在已经可以下载基于Apache Spark的IBM z/OS平台。
IBM也在与DataFactZ、Rocket Software和Zementis这三家公司进行合作,通过IBM z/OS平台为Apache Spark开发定制解决方案:
DataFactZ是IBM新的合作伙伴,双方正在合作开发基于Spark SQL和MLlib的Spark分析产品,以用于在大型机上处理的数据和交易。
Zementis正在开发支持Apache Spark的基于多个标准的执行引擎。作为一款新的z/OS交易中预测分析(in-transaction predictive analytics)解决方案,它允许用户在处理交易时部署和执行高级预测模型,帮助用户在影响最大的时候实时地预测终端用户需求、计算机风险或侦测欺诈。