CERN 依托 Pentaho 优化运营
可视化工具能够减少构建和维护分析数据管道的时间和复杂性,有助于管理体量快速增加、更趋多样化、需要更快速处理的数据。
简化整合
共同构建、部署和监控数据流,简化数据交付。
为访问、准备和混合多个数据源以交付分析就绪数据缩短时间并降低复杂性。
缩短时间并降低复杂性,以便访问、准备和混合来源,从而提供可用于分析的数据。
从本地或云端访问数据源,包括平面文件、RDBMS、对象存储和应用程序数据库。
借助跨多个云环境的 Kubernetes 和 Docker* 集群,开发适应性和可扩展管道。
*有限适用于有匹配要求的组织
可操作 R、Python、Scala 和 Weka 机器学习模型,进而使用行业领先的库。
使用 Kafka、JMS 和 Kinesis 消息并以较低延迟处理数据流、IoT 和点击数据。
分析、验证和发现数据,然后清理可用于分析的数据,并对其进行结构化和可视化处理。
CERN 的系统需要管理大量有关其员工及其家庭的机密数据,因此安全性、数据治理和数据完整性都至关重要。在对五款不同的专有和开源平台进行评估后,发现 Pentaho 最为契合我们的需求。
- Jan Janke
CERN 副组长