概述
挑战
- 通过极佳数据可视性实现更具可持续的水资源管理。
解决方案
- 借助 Pentaho Data Catalog 改善 33 万项水资源的数据管理。
成果
- 通过自动化使用较少资源来改善数据管理。增强了整个部门标准化数据的可见性。简化了查找和理解正确数据的过程,以管理当前的用水情况并规划未来。
挑战
亚利桑那州水资源部负责保护、养护和改善该州 700 多万居民的水源供应。该部必须在极端气温和干旱沙漠环境中,可持续地管理亚利桑那州的水资源。其工作直接影响亚利桑那州现在和未来的经济和环境。
为了有效管理亚利桑那州的水资源,该部每年收集、存储和分析近 6 万亿加仑的用水量,并追踪 30 多万口水井和地表水应用的所有权情况和用水类型。该部门还记录地理位置坐标、水深,并调查用水情况以裁定水权。
如果没有元数据存储库,新员工很难找到重要的数据集。该组织还需要自动化数据质量,因为在资源有限的情况下,雇佣更多员工是不切实际之举。“我们努力寻找能够完全满足自身要求的人员和经济实惠的工具。我们需要一个业务术语表,但大多数目录软件并未单独销售,所以我们用 SQL 创建了自用术语表。但我们后来意识到,如果没有数据目录工具,我们就无法实施更成熟的数据管理最佳实践。”
为了简化数据管理并确保可持续管理水资源,该部门需要一种智能数据发现和自动化工具。在整个项目过程中,该部门必须能够搜索旧记录,确保公民记录安全并最大限度地减少停机时间。
解决方案
2020 年 5 月,亚利桑那州水资源部选择了 Hitachi Vantara 的 Pentaho Data Catalog。该自动化平台提供了该部门所需的所有功能,使其能够以较少资源管理亚利桑那州的大量数据源。该解决方案还包括:
- 定制化数据发现目标
- 使用元数据剖析进行编目流程
- 完全自动化的迁移计划
- 网络安全专业知识
Hitachi Vantara 提前搭建平台,以满足该部门的安全要求和权限框架,防止数据迁移延迟。Hitachi 团队使用机器学习训练 Pentaho 平台的 Data Catalog,以识别不同的结构化数据类型。这些数据包括地理坐标数据、个人信息字符串、以及与正在进行的裁决过程相关的敏感法庭数据。机器学习算法对遗留记录进行大规模采样,然后生成伴随的元数据以建立关键的谱系关系。
仅用两周时间即完成了整个数据发现、元数据编目和平台迁移,停机时间极短。通过 Pentaho Data Catalog 可视化控制面板,该部门现在可以了解、整合和分析其拥有的独特关键数据集,用以满足亚利桑那州水资源用户、规划人员和决策者的需求。亚利桑那州水资源部企业数据管理办公室经理 Lisa Williams 评论称:“我们对通用数据智能抱有信心的原因之一是,您只需输入‘well’,就可以获得一份精准全面的报告,其中包含我们事务数据库、数据仓库、文档管理系统和空间数据中该数据元素的 300 多个实例,实例可供导出;这为我们节省了大量时间。”
成果
数据更加精准,实现可持续的水资源需求和供水规划
借助 Hitachi Vantara 的智能自动化解决方案,亚利桑那州水务部门现在可以更好地查看其重要数据,并完全信任其质量。亚利桑那州水资源部企业数据管理办公室经理 Lisa Williams 表示:“过去,我们对关键术语的定义和理解存在分歧;我们现在正在对所有许可和申请流程进行现代化改造。拥有一个集中式元数据存储库,可使我们的员工和顾问能够在项目发现过程中,快速了解在线和自动化流程中使用的现有数据。当数据迁移入云时,我们将获知数据的完整来源。”
统一的元数据目录使整个部门的工作人员能够创建一致的框架以进行持续分析。例如,地下水水文学家、水资源管理人员和应用程序开发人员,可以比较用水量的定义,并将该部门理解、编制和分析现实世界中的用水情况进行标准化。
通过更准确地了解数据和水资源状况,亚利桑那州可以勇敢、细致、创新的方式,保护、养护和改善亚利桑那州的水资源供应。还可以与其他利益相关者合作,对其分析和建模保持信心。因此,该部门无论是现在还是将来,都能更好地应对水资源挑战。