HPC高性能計算集群解決方案
發布時間:2018-05-28 閱覽次數:
10068 次
集群(cluster)就是一組計算機,它們作為一個整體向用戶提供一組網絡資源。這些單個的計算機系統就是集群的節點(node)。
集群(cluster)就是一組計算機,它們作為一個整體向用戶提供一組網絡資源。這些單個的計算機系統就是集群的節點(node)。一個理想的集群是,用戶從來不會意識到集群系統底層的節點,在他/她們看來,集群是一個系統,而非多個計算機系統。并且集群系統的管理員可以隨意增加和刪改集群系統的節點。
集群并不是一個全新的概念,其實早在七十年代計算機廠商和研究機構就開始了對集群系統的研究和開發。由于主要用于科學工程計算,所以這些系統并不為大家所熟知。直到Linux集群的出現,集群的概念才得以廣為傳播。
對集群的研究起源于集群系統的良好的性能可擴展性(scalability)。提高CPU主頻和總線帶寬是最初提供計算機性能的主要手段。但是這一手段對系統性能的提供是有限的。接著人們通過增加CPU個數和內存容量來提高性能,于是出現了向量機、對稱多處理機(SMP)等。但是當CPU的個數超過某一閾值,象SMP這些多處理機系統的可擴展性就變得極差。主要瓶頸在于CPU訪問內存的帶寬并不能隨著CPU個數的增加而有效增長。與SMP相反,集群系統的性能隨著CPU個數的增加幾乎是線性變化的。
幾種計算機系統的可擴展性
集群系統的優點并不僅在于此,下面列舉了集群系統的主要優點:
高可擴展性:如上所述。
高可用性:集群中的一個節點失效,它的任務可以傳遞給其他節點,可以有效防止單點失效。
高性能:負載平衡集群允許系統同時接入更多的用戶。
高性價比:可以采用廉價的符合工業標準的硬件構造高性能的系統。
2.2高性能計算機集群簡介
簡單的說,高性能計算(High-Performance Computing)是計算機科學的一個分支,它致力于開發超級計算機,研究并行算法和開發相關軟件。高性能計算主要應用于如下兩類問題的研究。
*大規模科學問題,像天氣預報、地形分析和生物制藥等
*存儲和處理海量數據,像數據挖掘、圖象處理和基因測序
顧名思義,高性能集群就是采用集群技術來研究高性能計算。
影響高性能計算機系統分類的因素有很多,所以從不同的分類標準得出的高性能集群計算機的系統架構也各不相同。但如果考慮到采用大規模生產的商用計算機和同樣是大規模生產的商用LAN及ATM網絡來制造的話,主要都是如下兩種架構。
目前,主流的PC服務器一般含有一到四個處理器,在一個操作系統的控制下,共同存取一個唯一的內存地址空間。各處理器在內存的存取上是平等的,存取代價是相同的。所以這種系統叫做一致內存存取系統,或叫SMP(對稱多處理計算機系統)系統。在這個系統中,處理器是以系統總線、交叉開關或其它專有網絡與內存連接在一起。
SMP系統的最大特點是:一方面,系統架構及共享內存的編程模式的相對簡單,所以制造和應用成本很少,為廣大中小企業所喜愛。這是我們用于構建集群節點的主要原因。另一方面,它的可拓展性相對較差,一般如果處理器的數量超過四個,那它的制造成本就會變得相當可觀。這就制約了它的進一步的發展。
但是業界為了彌補這種不足,又推出了另外一種系統――分布式內存存取系統。它較之SMP系統的最大特點是沒有一個統一的內存空間。這種系統的每一個處理器和它的內存空間構成一個獨立的系統,由一個操作系統控制,可以獨立運行。在這里我們叫它作節點,這些節點均使用它的網絡接口連接到互連網絡,并通過網絡通信。