個人和組織使用的設備收集了大量數據,這使人工智能成為技術顛覆的核心。如果沒有數據分析和人工智能,每天產生的大量數據幾乎毫無用處。企業對人工智能的使用正在增加,這推動了對高性能機器的需求。對HPC的重新關注在很大程度上是因為需要為人工智能工作負載計算大量數據。
人工智能和HPC之間的聯系是共生的,因為HPC為人工智能工作負載提供動力,但人工智能可以識別HPC數據中心的改進。例如,人工智能可以優化加熱和冷卻系統,降低電力成本并提高效率。AI系統還可以監控服務器、存儲和網絡設備的健康狀況,檢查系統是否保持正確配置,并預測設備何時會出現故障。
此外,人工智能可以用于安全目的,篩選和分析進出的數據,檢測惡意軟件,并實施行為分析來保護數據。
游戲是gpu最初的使用案例,技術革新了高分辨率游戲。gpu的其他用例已經變得很明顯,包括HPC。gpu執行數據密集型工作,應用范圍從機器學習到自動駕駛汽車。它們已經被證明是處理HPC工作負載的超級芯片,因為它們專注于數據計算。
圖形處理器的崛起使英偉達成為高性能計算領域的關鍵玩家,因為該公司是圖形處理器制造的領導者。然而,谷歌的tpu已經開始威脅到gpu的統治地位。tpu是用于特定應用的集成電路(asic),可以加速人工智能計算和算法。
谷歌專門為神經網絡機器學習開發了它們,包括它的TensorFlow軟件。GPU在高性能計算領域的角色目前仍將是核心,但像谷歌這樣有影響力的公司的內部芯片開發意味著,如果英偉達想要在高性能計算領域保持地位,就不能滿足于現有的成就。
舊的中央處理器(cpu)、gpu、asic和現場可編程門陣列(fpga)之間的處理多樣性正在不斷增長。工作負載可以有很大的差異,因此,為不同的用例提供不同計算的靈活性是必不可少的。
HPC玩家越來越多地允許定制他們的產品,這超出了處理能力。華為為其客戶提供三種不同的HPC架構,而IBM允許數據存儲定制,HPE根據靈活的消費模式向客戶收費。
客戶可以選擇將他們的HPC數據中心放在本地、云中,或者部署在邊緣。一些供應商在一個包中提供針對不同工作負載的混合解決方案。
許多供應商已經從銷售設備轉向提供HPCaaS。HPCaaS的興起與云作為HPC解決方案的出現有關。因此,HPCaaS的發展趨勢使Amazon Web Services (AWS)、谷歌和阿里巴巴等云服務提供商受益,盡管傳統的HPC供應商也在提供HPCaaS。
HPCaaS對于終端用戶來說可能是一個很有吸引力的選擇,因為它將需要高性能的數據處理和工作負載放在那些缺乏必要資金來雇傭熟練員工和投資硬件的公司的手邊。HPCaaS為那些無力在內部開發HPC知識和基礎設施的公司帶來了HPC能力。然而,訂閱HPCaaS而不是在內部開發HPC,會帶來部署在云中的HPC的所有限制。
HPC誕生于內部數據中心,但在2010年下半年,云計算開始改變HPC。該優勢最近作為一種新的HPC部署平臺出現了。隨著高性能解決方案領域的擴展,供應商已經開始提供混合選項?;旌系腍PC解決方案通常涉及補充現有內部數據中心的云能力。
內部云和私有云托管的結合克服了公共云的一些弱點,包括性能差和許多行業特定的、數據密集型的HPC工作負載的多樣性和復雜性所帶來的優化挑戰。相比之下,混合解決方案可以定制,往往是可伸縮的,同時提供云的靈活性。
向混合動力的轉變將使戴爾和惠普這樣的供應商受益。如果云計算的發展允許其缺點得到修正,AWS和微軟等公司將處于更有利的地位。
靈活性、HPCaaS和混合解決方案的出現都成為HPC的一個主要趨勢:民主化。這一趨勢與HPC更廣泛的使用有關,并與更多終端用戶能夠接觸到的技術定位有關。
超級計算機曾經屬于研究、學術或軍事領域。然后HPC擴展到股票交易,銀行,石油和天然氣。使用HPC的業務范圍很廣,包括汽車、航空航天,甚至食品加工。高性能計算在邊緣的部署將進一步擴大高性能計算的范圍。
百億億次計算是一種計算系統每秒執行十億次計算的能力,以exaFLOPS而不是FLOPS來衡量性能。第一臺百億億次計算機預計最早將于2022年問世。
百億億次計算并不是像量子計算那樣的一種新的計算形式,而是指現有技術可能實現的下一個級別的處理能力。然而,百億億次高性能計算機勢必會在高級模擬和建模方面帶來一些改進,這些改進將應對各種挑戰,如預測自然災害和推進科學發現,特別是在醫學領域。
百億億次計算是HPC整體處理能力的一大進步,然而,性能的提高越來越多地來自于較小的設計創新,這些創新可能不那么引人注目,但仍然很重要。
微架構層面的進展包括更快的互連速度、更高的計算密度、可擴展的存儲、更高效的基礎設施、生態友好性、空間管理和更好的安全性。在未來幾年里,諸如此類的進步將繼續成為高性能計算的趨勢。