所有博客文章

湖仓逻辑:为何对象存储是新的分析引擎

Jens Doerpmund and Mark Geel
Jens Doerpmund, VP, Software Architecture & Mark Geel, Sr. Product Marketing Manager – Object Storage

2025 年 8 月 18 日

Lakehouse Logic: Why Object Storage is the New Analytics Engine

数据分析归结为一个简单目标:在正确的时间、正确的地点,为人类——以及越来越多的 AI 代理——提供正确的信息。

就是这样。说起来容易,但在历史上却难以实现。

好消息是,格局正在改变。随着数据湖仓架构的兴起、开放表格式的出现,以及元数据日益重要(生成式 AI 时代),象存储正演变为结构化分析的高性能平台。

让我们探讨我们是如何走到这一步的,以及这一转变为何至关重要。

从数据仓库到数据湖再到湖仓

我们可以回顾几十年前,以理解分析的发展历程:提取、转换数据并将其存储在数据仓库中的过程,即使在最佳情况下也非常耗时。业务用户提供需求与领域知识,但整个解决方案的开发,包括报表与仪表盘的设计,完全依赖 IT。

随后出现了自助式 BI,使用户能够独立探索数据——前提是数据已存储在仓库中。但缓慢的交付周期和僵化的模式往往限制了访问。

随着大规模并行处理和存储(MapReduce、Hadoop)的发展,关注点最终转向数据湖——可扩展、灵活的环境,用于存储海量原始数据。数据已成为新的石油,拥有数据的人被认为会具备竞争优势。但数据质量和治理却往往滞后。

但正如石油需要精炼,人们意识到,要使数据产生价值,必须对其进行转换、清洗和编目。湖仓满足了这一需求,将数据湖的灵活性与数据仓库的事务完整性和性能结合起来。

在湖边的生活似乎很美好,但这种美好非常短暂。

对象存储登场

尽管数据湖适合存储结构化和非结构化数据,但并非总是理想之选。难怪它们常被称为“数据沼泽”,因为重点在于规模和多样性,而非数据质量。

对象存储简化了数据管理。它能够存储不可变对象,使其非常适合存储结构化和非结构化数据。但它们也并非完美无缺。

面临的挑战包括:

  • ROT 数据(冗余、过时、琐碎) 的积累。
  • 暗数据——被存储但未使用,占据宝贵空间,却没有业务价值。
  • 有限的可见性 ——缺乏对数据存在及其用途的清晰了解。

要释放对象存储的全部潜能,我们需要更强大的元数据、治理与查询能力。

而现在,它已经到来。

VSP One Object 引入原生 S3 Table 支持

Hitachi Vantara 的 VSP One Object 通过原生支持 S3 Table,将对象存储提升到新水平。这是业界首个支持本地对象存储的案例,其意义重大。

原生支持 S3 Table 意味着:

  • 您可以使用熟悉的 S3 Table API 来创建和管理 S3 表存储桶、命名空间和表。
  • 可以直接在开放格式数据上运行基于 SQL 的分析——无需复杂的 ETL 或数据迁移。

结合 Apache Iceberg REST 目录、零配置 SQL 引擎和高级元数据服务等内置功能,VSP One Object 成为数据湖仓和 AI 工作负载更强大的基础。

VSP One Object 原生 Amazon S3 Table 支持的变革性功能,使数据湖仓架构更简化,分析更快速,并能与 Apache Iceberg 等现代工具实现无缝集成。展示了组织如何弥合数据湖与数据仓库之间的差距,以加速洞察并支持 AI/ML 工作负载。
 

解锁 S3 元数据以实现更智能的分析

除了表格支持之外,VSP One Object 还引入了 S3 元数据日志记录。启用后,每一个对象事件——创建、更新、删除——都会记录在一个不可变日志中,并以 S3 表的形式存储。

这提供了关键功能,包括:

  • 完整且可查询的对象活动历史。
  • 关于每个对象的丰富元数据。
  • 与 Iceberg 客户端和 SQL 引擎的无缝集成。

现在,您可以使用相同的工具同时管理和分析数据及其元数据——提升治理、可观测性和性能。

恰逢其时的对象存储解决方案

各组织面临的压力比以往任何时候都更大,需要从数据中实现更多价值,而且要更快、更智能并具备更大规模。无论您是在构建 AI 模型、启用实时分析,还是仅仅在应对数据的爆炸式增长,您选择的基础架构都比以往任何时候更为重要。

VSP One Object 正是为此而生。它将传统对象存储转变为高性能、智能化的平台,轻松支持现代分析与 AI 工作负载。

这是恰到好处的解决方案,提供:

  1. 用于结构化分析的原生 S3 Table 支持。
  2. 内置智能与元数据服务。
  3. 针对 AI 与湖仓工作负载优化。
  4. 简洁性、可扩展性与高速性能。

VSP One Object 不仅仅是存储。它是战略性赋能平台,帮助组织释放数据的全部潜能——无论是结构化还是非结构化,历史数据还是实时数据,人类生成还是机器生成。

了解更多关于 GigaOm Radar for Object Storage 为何因对象存储创新而认可 Hitachi Vantara,或联系您的 Hitachi Vantara 代表,开启对象存储现代化之旅。

阅读更多:


Jens Doerpmund

Jens Doerpmund

As VP of Software Architecture Engineering, Jens Doerpmund is responsible for architectural governance and innovation at Hitachi Vantara. He focuses primarily on GenAI-related topics, as well as the design and development of data management solutions for hybrid cloud environments. Connect with Jens on LinkedIn.