概述

挑战

  • 加快 SARS-CoV-2 (COVID-19) 的检测和研究,并灵活地分析大量数据。

解决方案

  • 部署具有高性能和自动化的融合基础设施,以更快地运行复杂化分析。

成果

  • 扩大分析性能,实现每周处理大量 DNA 测序数据
  • 提供即时洞察并消除延迟,藉此加速医学研究(包括 COVID-19)
  • 将静态基础设施转变为高度自动化的动态集群解决方案
  • 搭建敏捷、模块化的内部高性能计算平台

“Crucially, we have used the Hitachi Vantara converged infrastructure solution to analyze and assemble complete SARS-Cov-2 genome sequences. This research will be published to contribute to the global effort of scientists and medical staff to combat the COVID-19 pandemic more effectively.”

Fredrik Boulund, Head of Bioinformatics, Centre for Translational Microbiome Research, Karolinska Institutet


挑战

利用医学研究促进公共卫生向前发展

卡罗琳斯卡医学院 (Karolinska Institutet) 是全球顶级医学院之一。其使命是为改善人类健康做出贡献,每年发表 6000 多篇经同行评审的科学出版物。卡罗琳斯卡医学院的诺贝尔奖获得者大会 (Nobel Assembly),负责评选出诺贝尔生理学或医学奖获得者,因此该校在学术界拥有特殊的地位。

卡罗琳斯卡医学院微生物学、肿瘤和细胞生物学系的转化微生物组研究中心 (CTMR),是与 Ferring Pharmaceuticals 建立的创新型公私合作机构。Ferring Pharmaceuticals 的总部位于瑞士,深深地扎根于瑞典,是一家研究驱动型专业生物制药公司。

CTMR 的研究人员正积极努力,加速胃肠道慢性疾病各方面的研究,竭力更好地了解微生物群系对生殖健康的影响。其主要目标是释放人类微生物群(人体消化系统中的微生物群落)的潜力,从而改善治疗并预防疾病。

CTMR 生物信息学负责人 Fredrik Boulund 解释称:“我们的很多工作都是分析实验室样本。查看 DNA 测序数据时,第一步是确定样本中有哪些微生物。我们分析多维微生物组数据以了解群落组成。第二步是研究微生物在样本中的作用,即它们消耗什么、它们能生产什么。我们需要确定样本中微生物群落的能力与我们的研究问题有何关系。”

这项研究非常耗费计算且占内存。CTMR 可以通过瑞典国家计算基础设施 (SNIC) 访问共享高性能计算机 (HPC)。但是,它需要全年使用更灵活的计算能力,来处理在难以预测的时间点出现的大量样本。

“使用外部计算资源是一种有价值的选择,但也限制了我们的生产率,”Boulund 说,“整体工作流程提供了缓慢的反馈循环。在规划这项分析后,我们必须将原始数据上传到共享 HPC 系统,然后将计算作业提交至中央队列。然接下来,我们必须等待数小时甚至数天,直至作业完成或失败。随着我们在共享 HPC 系统上的分配逐渐增多,超出自身能力,我们开始寻找新的选择方案,以便更快、更灵活地获得洞察。”

2020 年,瑞典政府还要求 CTMR 超越基础研究,建立全新国家流行病中心 (NPC)。NPC 与瑞典分子生物科学支持组织—生命科学实验室 (SciLifeLab) 共同启动。为了加强瑞典对 COVID-19 的防控,NPC 每周分析约 4.5 万个基于 PCR 的 COVID-19 检测。在瑞典疫情期间,该机构逐渐发展成为瑞典最大的 SARS-CoV-2 (COVID-19) 分析实验室设施之一。NPC 有时提供的检测能力占该国总检测能力的五分之一。

NPC 的一项主要职责是向从事 COVID-19 研究的研究人员提供先进技术和专业知识。“疫情工作开始时,突然之间,我们不得不处理更多的数据,”Boulund 补充道,“我们的团队需要迅速扩展自身的数据分析能力,以便能够帮助推进 SARS-CoV-2 研究。”

解决方案

在真正需要之处提供快速灵活的信息技术 (IT)

Hitachi Vantara 发现 CTMR 需要更强大的 IT 资源,因此与 CTMR 接洽,希望其能够支持 COVID-19 的研究和检测。CTMR 在两台实体服务器上运行 IT 服务和分析作业,配置极为静态,无需虚拟化或可扩展容量。

Hitachi Vantara 团队为 CTMR 设计了融合基础设施解决方案。双方共同部署了 Hitachi Unified Compute Platform CI 解决方案以及 Hitachi Virtual Storage Platform F370 阵列。Hitachi Vantara 选择了 Cisco 交换机来确保优化网络性能。

该解决方案集成了计算、存储、网络和管理软件,并通过使用 VMware 虚拟化动态调整资源,提供了高度的灵活性。同时,Hitachi Unified Compute Platform Advisor 软件简化了系统管理并自动执行管理任务。团队还可以自行部署和使用标准 HPC 工具(如 Slurm),用以进行集群管理和跨虚拟化服务器基础架构的作业调度。

Hitachi Vantara 与其合作伙伴 Cisco 和 VMware 携手合作,向 CTMR 提供综合贷款,以加快实施速度。“Hitachi Vantara、Cisco 和 VMware 提供了极优惠的报价,”Boulund 说道,“各方的参与和商业灵活性,使我们在获得全部资金保障之前,就能够利用全新强大的 IT 解决方案。”

这项解决方案符合该校中央 IT 的严苛规则和要求,主要安装在其主要数据中心设施中的一处。

成果

抗击全球流行病并产生即时见解

借助 Hitachi Vantara,CTMR 建立了一个敏捷的模块化内部 HPC 平台。通过使用 VMware 虚拟化和 Hitachi UCP Advisor 管理资源,CTMR 能够简化系统管理并自动执行部署和系统管理任务。该团队可以按需启动和关闭虚拟机以执行特定计算任务,从而快速轻松地重新配置其集群。

“Hitachi UCP Advisor 的自动化功能,使我们能够根据标准化模板按需启动新实例,”Boulund 说道,“这种方法有助于我们根据处理任务定制实例大小,在短时间内最大限度地提高项目性能。这意味着我们可以更智能地使用资源,从长远来看,可以更快地响应研究科学家的请求。”

该解决方案帮助 CTMR 充分利用新一代高通量 DNA 测序技术,该技术每周能够生成大量测序数据。“这对我们的研究人员来说极其实用,”Boulund 证实道,“我们可以在更短的周转时间内获得新见解。过去,我们可能需要几天甚至几周才能得到结果,极大降低了我们的研究速度。”

“至关重要的是,我们利用 Hitachi Vantara 融合基础设施解决方案来分析和组装完整的 SARS-Cov-2 基因组序列。这项研究即将公布,为全球科学家和医务人员更有效地抗击 COVID-19 疫情做出贡献。”

Boulund 总结道:“过去,在共享 HPC 资源上准备分析数据的过程有些繁琐,与我们的研究需求不太吻合。在 Hitachi Vantara 的支持下,我们内部现在可以随时以更快的速度分析大批量数据。我们与 Hitachi Vantara、VMware 和 Cisco 携手,实现了 IT 现代化,并建立了强大灵活且高度自动化的数据中心。性能的提升有助于我们推动科学发展,并激励我们的研究人员深入地洞悉人体。”

CTMR 卡罗林斯卡医学院

行业

  • 医疗保健和生命科学、教育

解决方案

  • 虚拟化基础设施:实现资源现代化和优化

硬件

  • 融合基础设施:Hitachi Unified Compute Platform CI 系列
  • Hitachi Virtual Storage Platform F370

软件

  • Hitachi Unified Compute Platform Advisor
  • VMware vSphere Enterprise Plus

服务

  • 标准化支持

合作伙伴

  • Advania(经销商)、Broadcom、Cisco、VMware