Close

Pentaho Data Integration

允许用户摄取、混合、清理和准备任何来源的不同数据。Pentaho 提供可视化工具,消除了编码操作和复杂性,使 IT 和企业能够轻松获得优质数据。

易于使用,可集成所有类型的数据

直观的拖放式数据集成功能可以集成来自所有数据来源的任何数据

  • 图形化 ETL 设计器简化了数据管道的创建
  • 丰富的预置组件库可帮助访问、准备和混合数据
  • 强大的编排功能可协调并组合不同的转换操作

无需任何编程,轻松实现大数据集成

将大数据分析的设计和部署速度提高到手动编程的 15 倍

  • 借助大数据集成工具消除手动编程和脚本撰写操作
  • 无缝切换执行引擎,例如,Apache Spark 和 Pentaho
  • 获得 Hadoop 发行版本、Spark、对象存储和 NoSQL,以及本地和云环境方面的强大支持

可加快数据传输速度的企业平台

在单一平台中管理分析数据管道

提高时间效率

可重复使用的动态数据集成模板使用户能够实时创建转换。

跟上数据增长的步伐

多线程数据集成引擎可进行纵向和横向扩展,包括部署到集群和云计算环境中。

简化管理

功能包括性能监控、任务回滚和重启及操作集市,简化了使用量审核。

广泛的自适应大数据集成

在快速变化的大数据环境中为您的团队提供得力支持

更高的灵活性

管理和处理本地、混合云和多云环境中的数据,而不会受到大数据生态系统变化的影响。

数据无关设计

支持 Hadoop、NoSQL、对象存储以及来自不同软件提供商的分析数据库分发版本。

实时数据摄取

能够从 Apache Kafka、AWS Kinesis 和物联网实时提取数据,而不会发生返工情况。

跨整个数据管道提升您的团队生产力

协同进行数据准备,快速访问分析数据

支持多种引擎

可通过集群内执行无缝切换或组合数据处理引擎,提高数据处理效率。

可执行内联分析

更快向企业用户提供数据模型,提高业务与 IT 部门之间的协作能力。

缩短开发时间

利用数据服务对转换后的数据进行可视化,使数据集可立即用于报告和各种应用。

运用数据科学功能

加强数据工程师和数据科学家之间的合作

准备和协调模型数据

为机器学习模型准备传统数据并将其与大数据来源(如传感器和社交媒体)相融合。

训练、调整和测试模型

使用 Spark MLlib 和 Weka 等库无缝训练、调整和测试 R 及 Python 等语言的模型。

部署和操作模型

可以轻松将机器和深度学习模型嵌入到数据管道中并分析结果,而无需编程知识。
Pentaho Data Integration Demo
Pentaho Data Integration
了解 PDI 如何通过可视化工具更快地向最终用户提供可用于分析的数据,从而节约时间并降低复杂性。
Pentaho 与机器学习协调
了解 Hitachi Vantara 的 Pentaho 平台如何精简整个机器学习工作流。
通过 DataOps 执行分析
如何实现智能数据操作并加快决策。
TDWI 报告:改善业务分析中的数据准备
实施合适的策略、流程和技术来解决数据准备问题的最佳实践。
借助 Pentaho 和 HCP,探究新的数据集成
深入了解 Pentaho 和 Hitachi Content Platform 的新集成。

阅读关于 PENTAHO 数据集成的客户案例

为了提取数百万个数据流并将其转换为客户可用于增强能源交付流程的有意义信息,我们需要开展大量工作。Pentaho 将这一切变得更容易。

– Dan Hopkinson,ElectraLink 网络和 EMI 服务主管

为改善患者护理,我们需要访问我们的数据。Pentaho 帮助我们为每年所服务的数十万患者提供更好的分析和护理。

–- Joel Hughes,Loma Linda University Health Care 商业智能分析师

ElectraLink
能源
Loma Linda University Health Care
医疗保健和生命科学

我们是您在数字化时代的最佳合作伙伴!

Hitachi Data Systems、Pentaho 与 Hitachi Insight Group 现已合并为一家公司: Hitachi Vantara.

我们将继续为您提供更多、更先进、更智能的数据驱动解决方案。而我们对您的承诺将一如既往,我们为您提供的产品和服务不会受到任何影响。