日立有限公司旗下子公司Hitachi Vantara宣布推出新一代数据整合及分析软体平台Pentaho 8.2,此新版本将与日立领先业界的日立内容平台(Hitachi Content Platform)整合,提供更新且跳脱框架的服务,Pentaho 8.2与Hitachi Vantara的产品组合可进行更隹的整合,让客户透过使用HCP所产生的非结构化数据来处理关键的产业专案,同时可用全新的方式管理混合云环境,并扩展对分析生态系统(analytic ecosystem)的支援。
Pentaho 8.2 让非结构化数据亦能进行分析
根据哈佛商业评论报告(Harvard Business Review)显示,只有不到一半的企业结构化数据会被用於企业决策中,而非结构化的数据所被使用的机率更是少於1%,透过Pentaho与HCP的全新整合,用户现在可以建构包含结构化与非结构化的数据管道(data pipelines)如文字、影片、音讯、图片、社群媒体、点击流(clickstreams)及日志档等,允许数据分析师及资料科学家能获得更好的见解,以创造更多商业价值。
Pentaho 8.2 在各领域都开辟了新的使用案例,像是银行业的金融服务机构可透过相关连的交易数据及电子邮件的来往以满足合规性需求;医疗保健业上医学研究人员可以透过将患者数据和病史与非结构化MRI扫描相结合来进行新药物的研发;零售商可以透过店内监控画面与销售据点的数据相结合,来分析每个顾客的购物偏好和店内各品牌商品的销售流量;而公共安全上执法机关可结合影片片段与犯罪纪录更快取得证据,并在遵守法规的情况下改善决策的流程。
更简单的混合云数据管理
市面上有许多像是NoSQL资料库,或是像Microsoft Azure、Amazon及Google的公有云方案,以及本地部署(on-premises)的物件储存资料湖泊(data lakes),而企业也正在仔细观察数据管理以及如何符合法规的最隹方案。
当与日立内容平台一同使用时,Pentaho 8.2 可提供更新及更隹的管理数据方案。举例来说,用户现在可以将数据载入HCP来当作资料湖泊的功能,并使用Pentaho来准备、净化以及标准化数据。接着再藉由Pentaho为数据进行逻辑性的分类,判断何种数据适合何种云端方案。透过减少不必要的数据传至云端空间,企业可透过Pentaho 8.2 更有效地进行管理成本。
延伸的分析生态系统支援
Pentaho 8.2 延伸了对成长中第三方产品及技术生态系统的支援,以帮助企业组织最隹化其数据管道以及各类分析专案,如AMQP支援,Pentaho客户可透过这受欢迎的讯息协定(messaging protocol),协助企业读取与发布边缘装置的串流数据至云端,来处理新兴的物联网应用案例;改善Google云端平台的安全性支援客户管理式加密金钥(CMEK),在读取Google云端平台储存与Google BigQuery时可控制自身的数据加密金钥,来为Pentaho用户提供额外的防护。
Python Step上Pentaho 8.2用户可以操作化(operationalize)机器学习以及使用由Python语言建构的深度学习模型,亦可进行对scikit-learn或TensorFlow等知名资料库的应用程式介面呼叫(API calls);OpenJDK 支援,Pentaho用户现在可从现在有商业条款的OpenJDK转换到开放原始码的OpenJDK免费版本。