::: 首页 > 解决方案 > 高效能运算解决方案
 

高效能运算解决方案

高效能运算解决方案










 

高效能运算丛集系统–HPC Cluster

高效能运算丛集系统–HPC Cluster
高效能运算(HPC: High Performance Computing),泛指透过应用程序平行化机制,而能在有限或较短的时间内可以完成复杂或大量运算工作以大幅提高应用程序的处理能力。通常应用于一般计算机主机所无法处理的大型计算。例如医学影像计算或是生物的基因分析比对、计算机动画、能源探勘、气候模拟、天文科学、太空与各种物理与化学计算。
 
一般而言,常见的高效能运算系统可分为几大类:
1.对称多重处理器计算机(SMP: Symmetric Multi-Processors),系统所有的处理器均无差别且共享相同的主存储器,通常又为共享式内存(Shared Memory)多处理器系统。其适用只需较少数量的处理器但需要能同时处理大量数据运算分析之应用程序。其优点是系统架构简单方便管理且平行运算的程序易于撰写,但缺点则是系统扩充能力较差,高阶机种扩充成本较为高昂。
 
2.巨量多处理器计算机(MPP: Massive Parallel Processors),系统由许多处理节点所组成且各处理节点具备独立区域性内存及微核心(Micro Kernel)操作系统,整个系统通常无全局性内存且由单一主要操作系统系统搭配各处理节点微核心操作系统集中管理,其又称为分布式内存平行处理系统(Distributed Memory Parallel,DMP)。其优点是系统扩充性高,但缺点则是因需考虑用户程序内存如何分散到不同的处理节点内,较不容易撰写平行运算的程序。

3.丛集式高效能运算计算机系统(Cluster HPC Computer System)通常采用相同等级硬件架构的计算机主机节点(有独立的处理器、内存及操作系统),透过一般网络或特殊高速网络相链接而组成单一并行计算机系统。其最大的优点是采用工业化标准的运算主机及技术,依需求弹性扩充其运算能力,具备极高的弹性与成本效益。缺点则是若无搭配设计良好的HPC软件套件支持服务,管理复杂度较高且应用软件需要特别加以平行化才能发挥最佳的效能。
 
计算机节点一般分为二大类,前者称之为公用服务节点(Utility Node),主要提供整体系统之资源管理、工作排程以及使用者操作环境;而后者则称之为运算节点(Compute Node),主要作为应用程序的运算服务平台。公用服务节点依其用途又可分为:
 
• 登入节点(Login Node) – 提供使用者主要使用操作、工作交付与程序开发测试环境。大型丛集式高效能运算系统通常具备多组登入节点以及具备平衡负载(Load Balancing)功能,以提供大量用户同时操作使用。
 
• 服务控制节点(Admin Node) – 主要负责运算资源管理、用户工作排程以及系统监控服务。通常具备高可用性备援能力(High Availability),以提供整体全时不中断的高效能运算服务。
 
• 数据储存节点(Storage Node) – 主要提供网络档案平行化文件系统服务,让所有登入节点、控制节点以及运算节点透过网络共同存取数据服务。
 
TSTi High Performance Computing Suite
是大同世界科技针对地球科学、机械工程、电子设计、数值分析、信息生物、气候变迁、计算机动画、能源探勘、财务金融分析与各种物理与化学计算等各类产业客户所设计之丛集式高效能运算解决方案。
 
其以开放式原始码软件套件为核心,搭配主流Linux操作系统完整功能,提供系统快速更新部署、资源管理及工作自动排程、软件开发工具与系统效能监控管理等功能之丛集式高效能运算整合平台。功能特色说明如下:
 
• 操作系统快速安装与软件更新派送
• 自动化系统计算资源管理与工作排程
• 系统效能实时监控及事件自动通知
• 高弹性用户平行化程序开发作业环境及系统管理
• 高效能平行化文件系统服务
• 客制化整合式系统管理服务
 
TSTI HPC Suite搭配具备先进自我监控、自我诊断、主动支持等功能之64位Intel/AMD处理器伺服主机、超高速InfiniBand网络、平行化档案储存系统以及大同世界科技专业建置部署规划及系统优化调校整合服务,即能拥有专属之最佳高效能运算系统。
 
 

图形处理器平行运算–GPU Computing

图形处理器平行运算–GPU Computing
虽然随着半导体制程技术的飞进,一般商用的中央处理器(CPU: Central Processing Unit)已具备极高的数据处理与运算能力。但对于具备高度运算需求的科学领域的研究人员而言,其效能提升的速度在兼顾运算成本效益的考虑下仍无法充份满足其运算需求。而反观市售图形显示适配器上的新型高性能图形处理器(GPU: Graphic Processing Unit),由于其单一的浮点运算能力甚至已可达到每秒一兆次(TFLOPS)以上,加上新型的图形处理器也已具备可程序化(Programmability)之特性,让原本被锁定用于绘图运算的图形处理器,开始可执行通用式浮点运算,如此一来,便可透过图形处理器,透过其强大的并行处理能力带来更强大的运算能力。由于图形处理器拥有数量庞大的处理核心,因此当其特别在面对处理单指令流多数据流(SIMD: Single Instruction Multiple Data)的数据运算量远大于数据传输量时,其性能上将大幅超越一般的中央处理器。
 
一般而言,图形处理器高速平行运算(GPU Computing)的最大效益,是可在采用一般中央处理器所建构之高速平行运算环境中,于各计算节点中搭配高速图形处理器,将需要重度运算分析的SIMD数据交由GPU来处理,而由中央处理器来负责应用程序中其他部份有关数据传输与一般性处理工作。透过CPU和GPU的协同处理,将可大幅提升应用程序的成本效益。
 
在 GPU 运算中,由 GPU 负责处理应用程序中运算密集的工作,程序中的其他部分则仍在 CPU 上运作,透过此方式,GPU 运算能提供无与伦比的应用程序效能,而就用户的角度而言,所能感受到的就是应用程序的运作速度明显提升许多。
 
CPU + GPU 为相当强大的组合,这是因为 CPU 包含数个已针对序列处理优化的核心,而 GPU 则包含数千个专为平行效能所设计的更小、更有效率的核心。程序的序列部分在 CPU 上运作,平行部分则在 GPU 上运作。
 
虽然GPU Computing最大的优势就是强大的运算能力,但最大的缺点除了部份应用程序受限于其数据特性其应用有其局限性外,改写既有的平行化应用程序困难度较高。所幸近年来OpenCL、CUDA、FireStream以及DirectCompute等GPU Computing应用程序平台及接口在各大厂商及社群研究人员的技术投入下,GPU Computing的环境与应用已逐渐成熟。其中又以NVIDIA CUDA™,为目前最为普及的GPU Computing平行运算平台。
 
CUDA,其为一革命性的平行运算架构,同时可支持软硬件,具备专为运用图形处理器运算加速科学和研发应用程序编程模式,因而能够运用图形处理器内建数百组运算核心进行各种通用型的精准数学计算,大幅提升应用程序运算效能。其提供多种简易的 C 及 C++ 扩充,可供您细部和整体处理数据,以及进行工作平行处理。程序设计师可以选用 C、C++、Fortran 等高级语言,或 OpenACC 指令来进行平行处理。此外CUDA目前也已可支持超过 180 种以上先进的研发、科学和商业应用软件,成功获得广泛的用户和应用基础。而最新的CUDA 5 全新的编程功能更可让众多运用 GPU 加速应用之开发比从前更快、更容易。
 
2009年NVIDIA®推出 Fermi GPU,其基于复合式运算模型以CPU 和 GPU 协同工作解决计算密集的运算工作,开启了迎接高效能计算HPC的新纪元。几年后由 7.1亿个晶体管所组成,具有每秒兆次的整数、单精度,和双精度浮点运算效能,以及最高内存带宽的NVIDIA® Kepler GK110 GPU问世,其所具有创新的运算技术及特性如:

• SMX - 开创性的全新串流多处理器设计,能让更大比例的空间应用于处理器核心,高于应用于控制逻辑的空间比例,如此能提供更强大的处理效能及效率
• Dynamic Parallelism - 藉由让程序设计人员能更容易地加速所有平行巢状回路,GPU能在其本身内部动态产生新的工作绪而毋需回至CPU,如此便能简化GPU程序设计
• Hyper-Q - 藉由让多个CPU核心可同步利用单一Kepler GPU,如此可缩减 CPU空闲时间,进而大幅提升可程序性及效率。
 
使其可广泛运用于各种科学运算应用程序,并让应用程序开发人员及研究人员能更容易地使用复合式运算,而这是全世界最快速及最具效率的高效能运算(HPC)架构之一。
 
GPU 不断进化,在此阶段,许多已实际使用的应用程序都能在 GPU 尚轻松运作,且速度较多核心系统大幅提升。平行核心 GPU 与多核心 CPU 共同运作的复合式系统将是未来运算架构的主流。
 
大同世界科技提供客户最完整的HPC Cluster与GPU Computing的硬件平台与软件开发环境,包括了具备NVIDIA高效能图形处理器的工作站与伺服主机硬件平台,以及提供包含GPU-Accelerated Libraries与Development Tools在内之CUDA发展环境整合安装建置服务。