解决方案

以客户为中心,提供定制化或一站式的全栈解决方案,赋能千行百业

宝德高性能计算之生命科学解决方案
项目背景


生物信息学(序列搜寻比对分析)

计算为整数计算,基本无浮点计算; 计算的主要特点为频繁的load 和write(内存的读写),意味着需要较大的内存容量和内存带宽, 需要直连架构CPU;网络的压力不大,用最高性价比的千兆网,而不需求使用具有较高价格的Infiniband高速网。

分子动力学

主要是浮点计算为主 ,非常适合大规模并行,但是对网络需求比较大,节点间需要使用低延时,高带宽的Infiniband高速网。

分子对接(药物设计)

计算量非常大,消耗计算机时很多;网络的性能要求不高,扩展性主要看看配体小分子的数量和它们计算规模的均匀性。

测序仪离线处理

相比计算量,存储容量需求更大;作业运行需要与作业调度系统结合; 测序离线处理往往有序列拼接的需求,目前最主流的序列拼接软件denovo为多线程程序,单节点内存容量需求非常大,往往需要达到256G甚至512GB,需要配置大容量内存SMP胖节点。

电子显微镜图象处理

主要为浮点计算,其中大量的单精度FFT计算;软件加速比完全线性,对网络依赖低; 软件内存需求和IO需求较大,一般需要配置并行文件系统; 系统计算量大,计算时间长,系统稳定性,可靠性要求高。

质谱仪原始资料处理

软件加速比接近线性,对网络依赖低;系统计算量大,计算时间长,系统稳定性,可靠性要求高。


方案介绍

宝德生命科学高性能计算集群是一个有机的、高性能、高可靠性的集群系统。系统的硬件都选用经过严格测试的主流产品,保证系统的可靠性;互联系统各组件的网络都是专用的高效网,通过集群核心的管理系统使得整个系统协调一致的运行,如单独的一台高性能计算机一样为用户提供统一的服务。

该集群向用户提供一个单一计算机的界面。前置计算机负责与用户交互,并在接受用户提交的计算任务后通过调度器程序将任务分配给各个计算节点执行;运行结束后通过前置计算机将结果返回给用户。程序运行过程中的进程间通信通过专用网络进行。

方案解析

✔ 方案计算系统的选择实现了多样化,该方案配置10个宝德自研的双路八核刀片服务器PR8020P。刀片式集群系统在计算密度、功耗散热、运营成本、维护成本、可靠性等方面,都明显优于其它系统,且为系统的扩容升级提供了良好的基础。

计算系统也可采用宝德高性能PR2510P双路服务器,注重浮点峰值和内存性能。对于大内存的需求,采用宝德自研八路PR8800G SMP服务器,采用了因特尔至强E7 v4处理器。

互联系统各组件的网络都是专用的高效网络,通过集群核心的管理系统使得整个系统协调一致的运行。

方案优势
  • 高性能、灵活

    能为苛刻的生命科学计算提供高浮点运算性能,计算集群可灵活采用多种计算系统

  • 高带宽、低延迟

    计算网络采用高速的EDR 100Gb IB网络互联,确保用户的计算任务在运行过程中不受网络带宽的限制,延迟低速度快。两层高速网络保障集群中所有节点无阻塞、全线速的运行,可充分满足高速互联的需求。

  • 高可靠性

    主要产品都采用了冗余设计(电源、风扇等),存储系统采用双链路冗余设计,系统的可靠性有较高保证

  • 高可扩展性

    GPU节点、存储节点、计算节点等有很高的扩展性,既能满足现阶段的业务要求,也能更具未来业务量的增长进行升级和扩容。