破解生命密码,青云QingCloud EHPC带来弹性高性能算力支持

文章来源:网络整理编辑:采集侠2022-08-04 08:14

导读:

[破解生命密码,青云QingCloud EHPC带来弹性高性能算力支持

如果说 18、19 世纪是蒸汽机、电动机的时代,20 世纪是信息化的时代,那么 21 世纪可以说是生命科学、人工智能的时代。

物理学家伦琴发现 X 射线,为沃森和克里克提出 DNA 双螺旋结构提供了重要的技术基础。

DNA 双螺旋结构的发现标志着人类对生命科学的研究进入了分子水平,预示着人们即将揭开生命遗传的神秘面纱,对于更为深入地认知生命过程,进行疾病控制和品种改良等具有划时代的意义。

“高冷”的超级计算与“神秘”的生命科学

生命科学作为 21 世纪最重要的科学分支之一,离不开信息技术的突破与发展;高性能计算作为人工智能模型建立的基础,对生命科学的研究起到非常重要的推动作用。

破解生命密码,青云QingCloud EHPC带来弹性高性能算力支持

随着基因测序技术的飞速发展,基因组序列的海量数据不断涌现,数据正以指数级增长,对于如此庞大的基因进行同源性搜寻、比对、分析和遗传发育分析等等,往往伴随着巨大的数据处理量和并行计算量。

同时,由于生命科学的研究对象往往是蛋白质和 DNA 的大分子,对这些分子的三维结构的预测,动力学特性、热力学特性、在生命过程中如何发生作用,进行分子动力学模拟以及利用计算机辅助药物设计等等科学问题,都需要借助计算机来处理。

高性能计算作为一种用于解决计算密集型、海量数据处理等计算需求的计算科学形式,正是生命科学所需要的,可以通过计算分析、模拟试验,来验证理论的正确性。

高性能计算(High Performance Computing,缩写 HPC)可以理解为使用很多处理器或者是某一集群中的几台计算机的硬件资源、计算系统和环境,将大规模的运算任务拆分成很多小任务,分发到各个服务器上并行计算,再将计算结果汇总成最终的结果。

破解生命密码,青云QingCloud EHPC带来弹性高性能算力支持

前文提到基因组数据是非常庞大的,这个“庞大”是什么概念呢?

举个例子,人类的基因组大约包括 30 亿碱基对,相当于 3GB 的数据,而如果考虑到准确测序所需的深度或覆盖倍数,比如 30 倍就能取得相当准确的测序数据,那么一个人的基因组数据量将达到 100GB 左右。

有一种植物叫重楼,是一种很有名的中草药,能清热解毒、消肿止痛。在重楼中有一个种类叫做重楼百合,重楼百合有着世界上最庞大的基因组,基因组中拥有大约 1500 亿个碱基对,差不多是人类基因组数据量的 50 倍。考虑准确测序,重楼百合的基因组数据量至少有 4TB。

据专业人士预测,基因研究工程需要的计算资源(包括计算速度、内存和磁盘存容量以及网络通信能力)将超过人类登月工程的上百万倍。

著名的“人类基因组计划”于 1990 年启动,耗时 13 年、花费 30 亿美元初步完成人类全基因组测序,当时测一个基因组需要花费 1 亿美元;而现在,一个基因组测序费用降到了 1000 美元以下,测序时长缩短到了 1-10 天。

测序的成本和时长均呈现超摩尔定律下降,基因测序逐渐走入寻常百姓家,而让基因测序变得可用、实用的关键因素之一就是 HPC 技术的应用。

我国一直积极发展高性能计算技术,相继出台“863”、“新基建”、“十四五”和“东数西算”等政策方针指导,数据中心市场不断扩大,国家和企业自建的数据中心规模稳步快速增长。

弹性高性能计算助力破解生命密码

科学技术的发展与应用相辅相成。随着生物学数据不断增长和生命科学研究的不断深入,传统 HPC 逐渐显现弊端:过于依赖人工运维与管理,排期和等待时间长;租户共用超算网络,面对各种新型网络攻击方式,网络安全问题重重;购买硬件设备自建投入大,周期长,作业高峰期资源不足,作业低谷期资源浪费严重,等等。

为了更好地适应新的计算需求,生物学家们开始使用一种新的计算方式,也就是弹性高性能计算。

弹性高性能计算(Elastic High Performance Computing,缩写EHPC)提供弹性和可扩展的 HPC 计算资源,是传统 HPC 技术与云计算技术的融合升级。

用户可以同时享有 HPC 计算的超高性能和云计算的弹性与可扩展性,通过快捷、弹性、安全以及互通的公有云高性能计算服务,实现计算资源的弹性定制,大大降低了作业费用,提高了资源利用率,具有极大的灵活性。

据报道,近日斯坦福大学研究团队将人类 DNA 测序的时间缩短至 5 小时 2 分钟,重新定义了人类基因组测序速度,该研究团队就是利用了 EHPC,将病例样本原始信号数据实时传输到云存储,通过云计算系统对算力进行弹性扩容,将数据分布到多台云计算机上实时筛选,使测序后运行时间减少了 93%。

破解生命密码,青云QingCloud EHPC带来弹性高性能算力支持

生命科学领域不乏优秀的 EHPC 解决方案,以青云 QingCloud EHPC 生命科学云解决方案为例,其基于青云QingCloud 云基础设施,面向基因测序分析、药物虚拟筛选、蛋白质结构预测、分子动力学模拟等应用场景,为生命科学行业用户提供一站式高性价比解决方案。

计算资源

Intel Xeon 6258R 型号 CPU,双核,单颗处理器主频 2.7GHz、28 核,单核心峰值 86.4 GFlops,GPU 计算采用 NVIDIA GPU A100 卡;

存储资源

采用分布式并行文件系统 Lustre 商用版本,提供 GB 级吞吐,百万级 IOPS;

网络资源

采用专用 IB 网络,计算节点之间,计算与存储之间通信最高达 100GB/S;

软件资源

本文链接:http://www.soxunwang.com/kjrd/2022/0804/105472.html

声明:
1、此文内容为本网站刊发或转载企业宣传资讯,仅代表作者个人观点,供读者参考。
2、搜讯网所转载的稿件都会明确标注作者和来源,如您不希望被转载请及时与我们联系删除。
3、搜讯网的原创文章,请转载时务必注明文章作者和"来源:搜讯网",不尊重原创的行为搜讯网或将追究责任。
4、本站提供的图文仅供参考,不能作为任何咨询依据,专业问题请咨询专业人士,谨防受骗。

关注搜讯网微信号

扫描加关注!

搜讯网福利发放

最新热点 更多
相关阅读 更多