深度|超算上“云”不管你愿不愿意,它來了
目(mu)前越(yue)來越(yue)多的公有云(yun)開始提供高(gao)性能計(ji)算服務(wu),我們從現在(zai)到未來預見高(gao)性能計(ji)算上(shang)云(yun)將是(shi)個(ge)勢(shi)不可擋的趨勢(shi),基于以下幾個(ge)理由(you):
0和(he)1問題,就拿工業產品的(de)(de)設(she)(she)計(ji)(ji)(ji)制造來(lai)(lai)說(shuo),以(yi)(yi)前我(wo)們(men)主要(yao)是(shi)逆向(xiang)設(she)(she)計(ji)(ji)(ji)制造。但是(shi)隨著(zhu)時代的(de)(de)變化(hua),我(wo)們(men)產品的(de)(de)創新(xin),提(ti)高質(zhi)量(liang)(liang)和(he)經濟效(xiao)益來(lai)(lai)說(shuo),我(wo)們(men)越(yue)來(lai)(lai)越(yue)依賴(lai)于正(zheng)向(xiang)設(she)(she)計(ji)(ji)(ji),而正(zheng)向(xiang)設(she)(she)計(ji)(ji)(ji)需(xu)要(yao)大(da)量(liang)(liang)的(de)(de)建模和(he)模擬仿(fang)真計(ji)(ji)(ji)算(suan)。這(zhe)就需(xu)要(yao)大(da)量(liang)(liang)的(de)(de)高性能計(ji)(ji)(ji)算(suan)。對于中小(xiao)企業來(lai)(lai)說(shuo),構建傳統的(de)(de)HPC基礎(chu)設(she)(she)施是(shi)昂貴的(de)(de),而且企業無法快速支(zhi)撐(cheng)HPC的(de)(de)需(xu)求爆發性的(de)(de)增長。所以(yi)(yi)超算(suan)云是(shi)幫(bang)助他們(men)解困的(de)(de)必(bi)由之路。
傳(chuan)統云計算服務(wu)市場逐漸飽和(he),刺(ci)激各大云提供商的持(chi)續投入,終于讓高性能計算上云不再只(zhi)是少數傳(chuan)統玩家的專利(li)。
隨著科學(xue)技術的(de)(de)(de)進步(bu)(bu),原來(lai)的(de)(de)(de)一些問題和障礙也會逐步(bu)(bu)得到解(jie)決,比如高速(su)網絡(luo)的(de)(de)(de)成本價格會降(jiang)低,適合HPC低消耗的(de)(de)(de)容器技術被大量用在(zai)HPC的(de)(de)(de)應用上。
在商(shang)業(ye)的HPC市場,應用(yong)軟(ruan)件的成本和硬件之比大(da)約(yue)是(shi)7:3,這(zhe)也是(shi)阻礙HPC上(shang)(shang)云的一大(da)障礙,但是(shi)隨著HPC應用(yong)大(da)量開源軟(ruan)件的出現和國產化(hua)工業(ye)APP的發展,人們使用(yong)HPC的成本會大(da)大(da)降低,這(zhe)將(jiang)會激(ji)發更多的用(yong)戶上(shang)(shang)超算云。
來自Market Research Future的《CloudHPC市場研究報告(gao)——及2023年預測(ce)》。
我們(men)再(zai)來看看目前公(gong)有云(yun)發(fa)展所(suo)帶來的一些優勢,而這些往(wang)往(wang)受超算(suan)中(zhong)心所(suo)不具(ju)備的。
規(gui)模:就拿(na)中國(guo)市(shi)場來說,我們所有超(chao)算總(zong)(zong)節點數不(bu)超(chao)過(guo)10萬,而云服(fu)務器總(zong)(zong)規(gui)模超(chao)過(guo)100萬
可(ke)用(yong)(yong)(yong)規(gui)(gui)模(mo):不(bu)同于(yu)(yu)超算(suan)(suan)中(zhong)心模(mo)式,云計(ji)算(suan)(suan)中(zhong)心的各個可(ke)用(yong)(yong)(yong)區之間(jian)是可(ke)以(yi)打(da)通(tong)的,甚至還可(ke)以(yi)在不(bu)同云廠商之間(jian)通(tong)過(guo)API調(diao)用(yong)(yong)(yong)打(da)通(tong)使用(yong)(yong)(yong),這(zhe)意味著云計(ji)算(suan)(suan)中(zhong)心的可(ke)用(yong)(yong)(yong)規(gui)(gui)模(mo)約等(deng)于(yu)(yu)其總規(gui)(gui)模(mo)。超算(suan)(suan)中(zhong)心對(dui)單個用(yong)(yong)(yong)戶(hu)申請的資源上限進行嚴格審(shen)核,如國家超級計(ji)算(suan)(suan)長沙中(zhong)心規(gui)(gui)定(ding)(ding)單個用(yong)(yong)(yong)戶(hu)最多(duo)使用(yong)(yong)(yong)100個節點(dian)。云計(ji)算(suan)(suan)中(zhong)心對(dui)于(yu)(yu)單個用(yong)(yong)(yong)戶(hu)也(ye)有(you)類似的限制,稱為“服(fu)務(wu)配額”,但這(zhe)是由(you)商務(wu)模(mo)式決(jue)定(ding)(ding)的,不(bu)是由(you)技(ji)術限制決(jue)定(ding)(ding)的,類似給(gei)用(yong)(yong)(yong)戶(hu)發放信用(yong)(yong)(yong)卡一樣(yang),信用(yong)(yong)(yong)越高額度(du)越大。
短(duan)(duan)時最大可調(diao)用(yong)(yong)(yong)(yong)規模:云(yun)計(ji)算(suan)的一大特色就是具備短(duan)(duan)時間內大規模調(diao)用(yong)(yong)(yong)(yong)海量計(ji)算(suan)資源的能力(li),這一能力(li)已在(zai)各(ge)行各(ge)業經過了充(chong)分的驗證。前(qian)不(bu)久,哈佛大學醫學院在(zai)《Nature》發布了VirtualFlow開源藥物發現平(ping)臺,稱(cheng)利用(yong)(yong)(yong)(yong)該平(ping)臺調(diao)用(yong)(yong)(yong)(yong)16萬個(ge)CPU對接10億個(ge)分子(zi)僅(jin)耗時約15小(xiao)時,而使用(yong)(yong)(yong)(yong)1萬個(ge)CPU則需要2周。
除了公有(you)云對資源使用的規模(mo)和靈活性外(wai),它還有(you)其它方面的優勢:
種(zhong)(zhong)類(lei)(lei)繁多的基礎資源,云(yun)計(ji)(ji)算(suan)(suan)中心(xin)主要提(ti)供的是虛擬資源,用戶能夠享受到更為(wei)豐富的計(ji)(ji)算(suan)(suan)資源選擇(ze)。如某公有云(yun)廠商的企業級云(yun)服務器ECS分為(wei)通用型(xing)、計(ji)(ji)算(suan)(suan)型(xing)、內(nei)存型(xing)、大數據(ju)型(xing)、GPU型(xing)、本地(di)SSD型(xing)、高主頻型(xing)、FPGA型(xing)、彈性裸金屬(shu)九大類(lei)(lei),其中每一種(zhong)(zhong)類(lei)(lei)型(xing)還可以選擇(ze)與(yu)不(bu)同存儲和網絡的組合(he)。
存(cun)儲空間方(fang)面,可以(yi)選(xuan)擇20-500GiB不等的高效云盤或SSD云盤作為(wei)系(xi)統盤,單(dan)塊數據盤最(zui)多則可配到32768GiB。網絡帶(dai)寬的選(xuan)擇范圍(wei)(wei)(wei)也很大,用(yong)戶可以(yi)選(xuan)擇“按(an)固定帶(dai)寬”和“按(an)使用(yong)流量(liang)”兩種帶(dai)寬計費(fei)模式,前者的帶(dai)寬值可選(xuan)范圍(wei)(wei)(wei)為(wei)1-200M,后者的帶(dai)寬峰值可選(xuan)范圍(wei)(wei)(wei)為(wei)1-100M。
附加產品和(he)服務:不同于超算中心,云(yun)計算中心的產品可以(yi)用玲瑯滿目來形容(rong)。這(zhe)是(shi)因為云(yun)計算的服務對象要(yao)比超算客戶廣泛(fan)的多(duo)。
靈活的計(ji)(ji)費模(mo)式(shi):相對(dui)于超算(suan)中心的機時計(ji)(ji)費或節點(dian)獨占(zhan)模(mo)式(shi)計(ji)(ji)費,云(yun)計(ji)(ji)算(suan)由a)預(yu)留實例,相當(dang)于批(pi)發,主(zhu)要針對(dui)中長期穩定需求,優點(dian)是價格整(zheng)體比較(jiao)(jiao)低,缺點(dian)是資源(yuan)必(bi)須長期持有,靈活性(xing)(xing)差。b)按需實例:相當(dang)于零售,即(ji)買即(ji)用(yong)。針對(dui)短期彈(dan)性(xing)(xing)需求,按小時計(ji)(ji)費,靈活精準,避免(mian)浪費,但價格比較(jiao)(jiao)高。c)可被搶占(zhan)實例,相當(dang)于秒殺,手快(kuai)有手慢(man)無。
所以很明(ming)顯(xian),超級計(ji)(ji)算(suan)和云(yun)(yun)計(ji)(ji)算(suan)相結合(he),為(wei)云(yun)(yun)計(ji)(ji)算(suan)市場和超算(suan)領域(yu)的(de)(de)市場注(zhu)入了(le)一(yi)股清新的(de)(de)潮流(liu)。優(you)勢(shi)互補是(shi)大(da)家能(neng)夠(gou)看到的(de)(de)希(xi)望(wang)。無論是(shi)中國(guo)國(guo)內還(huan)是(shi)海外主流(liu)云(yun)(yun)服(fu)務提供商都對HPC云(yun)(yun)給(gei)予了(le)極大(da)的(de)(de)熱情,基于對云(yun)(yun)計(ji)(ji)算(suan)前景的(de)(de)樂觀。HPC云(yun)(yun)早晚將成為(wei)云(yun)(yun)計(ji)(ji)算(suan)的(de)(de)一(yi)只耀眼的(de)(de)明(ming)星。
世界Top 5 超算云提供商(HPC in the Cloud):
第(di)一名AWS,亞馬遜(xun)從2006年以(yi)來一直提供HPC的云服務,在這個領域處于(yu)領導者地位。AWS主要提供具有(you)無與倫比存儲能力的IAAS解(jie)決方(fang)案。AWS可以(yi)讓企業通過租用而(er)不是(shi)購(gou)買有(you)能力運行計算(suan)(suan)密集型的計算(suan)(suan)任務,使得客戶節省大量(liang)的金錢和最大限度地減少浪費(fei)。
通過AWS,您(nin)能(neng)在(zai)數分鐘(zhong)內完成(cheng)高(gao)性(xing)能(neng)計算(suan)集群的(de)創(chuang)建,并(bing)將并(bing)行(xing)HPC 任務的(de)數量增加到(dao)大多(duo)數本地HPC 環境都無法支持(chi)的(de)規模,從(cong)而(er)提高(gao)研究速度并(bing)縮短(duan)獲(huo)得成(cheng)效的(de)時間。AWS 可按需提供針(zhen)對特(te)定(ding)應用程(cheng)序進行(xing)優化的(de)CPU、GPU 和(he)FPGA 服務器(qi),有眾多(duo)的(de)服務器(qi)類型(xing)選擇,無需巨額資金投入,從(cong)而(er)幫助(zhu)降低成(cheng)本。您(nin)有權限訪問面向(xiang)緊密(mi)耦(ou)合、IO 密(mi)集型(xing)和(he)存儲密(mi)集型(xing)工作負(fu)載的(de)完全等(deng)分的(de)高(gao)帶寬網絡,這使您(nin)能(neng)夠在(zai)數千個核心之間橫向(xiang)擴展(zhan),從(cong)而(er)更快(kuai)獲(huo)得成(cheng)效。
最初(chu)EC2服務(wu)被不(bu)適合(he)運行HPC應用程(cheng)序。就此(ci),Amazon專門為HPC創立了(le)“集(ji)群(qun)實例(li)(li)(Cluster Instance)”,根據(ju)用戶(hu)需求(qiu)可配置(zhi)虛擬HPC集(ji)群(qun)實例(li)(li)提供給用戶(hu)。他們的第一個產品(pin)是(shi)提供兩個集(ji)群(qun)實例(li)(li),提供了(le)數量眾多(duo)的CPU ,并配置(zhi)了(le)高性能的網絡(10 GigE )。實例(li)(li)有兩種規模的CPU核(he)數,一是(shi)基于(yu)(yu)Nehalem 的4倍特大實例(li)(li)(8核(he)/節點(dian)(dian),23 GB RAM ,1.7 TB本地(di)存儲),另一種則是(shi)基于(yu)(yu)Sandy Bridge 的8倍超(chao)大實例(li)(li)(16核(he)/節點(dian)(dian),60.5 GB 的RAM ,3.4 TB 的本地(di)存儲)。
此外(wai),Amazon 還提(ti)(ti)供(gong)了(le)另外(wai)兩個(ge)(ge)專門的(de)實例(li)。第(di)一個(ge)(ge)是GPU集群實例(li),它(ta)(ta)提(ti)(ti)供(gong)了(le)兩個(ge)(ge)NVIDIA Tesla Fermi M2050 GPU ,具有比例(li)較高的(de)CPU 和10 Gi gE 網絡性能。第(di)二個(ge)(ge)是高I / O 實例(li),它(ta)(ta)提(ti)(ti)供(gong)兩個(ge)(ge)基(ji)于SSD的(de)卷(juan),每個(ge)(ge)卷(juan)具有1024G 的(de)存(cun)儲空(kong)間。
根據資源的按需、計(ji)劃或現貨購(gou)買(mai),定(ding)價可能有所不同。通常,按需EC 2 實(shi)例(li)的成本如下:四(si)倍超(chao)大實(shi)例(li)是1.3美(mei)(mei)(mei)(mei)元(yuan)(yuan)/小(xiao)(xiao)時(shi)(0.33美(mei)(mei)(mei)(mei)元(yuan)(yuan)/核時(shi))八倍超(chao)大實(shi)例(li)是2.4美(mei)(mei)(mei)(mei)元(yuan)(yuan)/小(xiao)(xiao)時(shi)(0.15美(mei)(mei)(mei)(mei)元(yuan)(yuan)/核時(shi)),GPU集群實(shi)例(li)是2.1美(mei)(mei)(mei)(mei)元(yuan)(yuan)/時(shi),高I/O實(shi)例(li)為每小(xiao)(xiao)時(shi)3.1美(mei)(mei)(mei)(mei)元(yuan)(yuan)。
因此,使用小(xiao)型(80個(ge)核,每(mei)(mei)個(ge)核4 GB RAM ,500 GB存儲)將花費(fei)每(mei)(mei)小(xiao)時24.00美(mei)元(10 個(ge)8倍(bei)超大實例(li))。更大的使用情(qing)況(256 個(ge)核,每(mei)(mei)個(ge)核4 GB RAM ,1TB 快速(su)全局存儲)將花費(fei)38.4美(mei)元/小(xiao)時(16個(ge)8倍(bei)超大實例(li))。
Amazon 對(dui)傳(chuan)輸到EC 2 的(de)數(shu)據(ju)不(bu)收(shou)取費用(yong),但對(dui)從(cong)云中傳(chuan)輸出去的(de)數(shu)據(ju)收(shou)取不(bu)同(tong)的(de)費用(yong);此外,EC 2 存儲(chu)成本也是存在的(de)。因(yin)此,總成本取決(jue)于計(ji)算時間、總數(shu)據(ju)存儲(chu)和傳(chuan)輸。一旦創建了(le)實例,就(jiu)必須由(you)用(yong)戶提(ti)供和配(pei)置實例,使其作為集(ji)群工作。
第二(er)名(ming)Google,如同AWS谷(gu)歌(ge)(ge)云(yun)平臺也提供了IAAS方(fang)案(an),但是(shi)谷(gu)歌(ge)(ge)提供了非常特別的(de)按(an)-分鐘計(ji)費模式。谷(gu)歌(ge)(ge)允許客戶選擇開源(yuan)的(de)Hadoop或(huo)則谷(gu)歌(ge)(ge)的(de)Cloud dataflow 來處理和存儲數據。谷(gu)歌(ge)(ge)具有競爭(zheng)力的(de)價(jia)格使(shi)它們(men)能夠吸引大公司和中小(xiao)企業。
第三(san)名微軟(ruan)(ruan)Azure 為企業(ye)提供(gong)(gong)機時付費的HPC解決方案(an)。微軟(ruan)(ruan)的優(you)勢是在于那些微軟(ruan)(ruan)的老客戶,他們一直(zhi)習(xi)慣于微軟(ruan)(ruan)的產品和解決方案(an)。Azure提供(gong)(gong)了易(yi)用平臺來集(ji)成(cheng)Windows系統來支撐HPC任務運行在云中。Azure為SAAS和PAAS客戶提供(gong)(gong)量身定制的解決方案(an)。
第四(si)名(ming)IBM Spectrum計算允許用(yong)戶從各種公共(gong)、私有(you)或混(hun)合云基礎設施中進行選擇。為(wei)(wei)客(ke)戶提供(gong)使用(yong)靈(ling)活的(de)(de)遠程管理系(xi)統的(de)(de)機會。IBM為(wei)(wei)企(qi)業客(ke)戶提供(gong)了許多(duo)開箱即用(yong)(out of box)的(de)(de)解(jie)決方案(an),包(bao)括IBM 高(gao)性(xing)能計算服務,高(gao)性(xing)能分析服務,IBM Spectrum等。IBM將這些軟件包(bao)作為(wei)(wei)開箱即用(yong)的(de)(de)解(jie)決方案(an)提供(gong),而不(bu)是為(wei)(wei)企(qi)業客(ke)戶創(chuang)建可定制的(de)(de)解(jie)決方案(an)。
第五(wu)名(ming)企鵝(e)的(de)(de)Computing on Demand (POD)盡管企鵝(e)是(shi)第一(yi)(yi)(yi)個(ge)建立真正HPC 云的(de)(de)廠商(shang),但是(shi)在(zai)排名(ming)上只能在(zai)第五(wu)位。POD云,是(shi)第一(yi)(yi)(yi)個(ge)提(ti)供遠程(cheng)HPC服務的(de)(de)。從一(yi)(yi)(yi)開始POD 就(jiu)是(shi)一(yi)(yi)(yi)個(ge)類似于內部集群的(de)(de)裸機計(ji)算模型。每個(ge)用戶(hu)都有一(yi)(yi)(yi)個(ge)虛擬機的(de)(de)登錄節點(dian)(dian),該(gai)節點(dian)(dian)在(zai)代碼執(zhi)行中不(bu)起作(zuo)用。標準計(ji)算節點(dian)(dian)有一(yi)(yi)(yi)系列選項,包(bao)括雙四(si)核至(zhi)強、雙六核至(zhi)強或四(si)核12核AMD處理器,速度范圍(wei)從2.2至(zhi)2.9GHz,每臺服務器24至(zhi)128Gb內存,每個(ge)節點(dian)(dian)最(zui)多1Tb的(de)(de)本地臨時(shi)存儲。
POD提供預裝數百個應(ying)用(yong)程序的HPC集群(qun)服(fu)務。這樣做的好處是,允許用(yong)戶(hu)可以為(wei)自己(ji)量身定制HPC解決方案。Penguin 類似于IBM 提供這些開箱即(ji)用(yong)的產品,但(dan)是用(yong)戶(hu)只為(wei)他們(men)構建、管理和使用(yong)的套餐付費。
相對于云(yun)計算(suan)市場(chang),高(gao)性(xing)能計算(suan)云(yun)相對比(bi)較(jiao)晚,我(wo)們(men)預(yu)計它在未(wei)來(lai)幾年(nian)將以非常快的(de)(de)速度增(zeng)(zeng)長。上述公(gong)司(si)只是市場(chang)上一些大公(gong)司(si)的(de)(de)名(ming)單,并不是所(suo)有(you)(you)HPC云(yun)運營商(shang)的(de)(de)名(ming)單。我(wo)們(men)可以看(kan)到未(wei)來(lai)幾年(nian)會(hui)有(you)(you)更多(duo)的(de)(de)供(gong)應(ying)商(shang)將在一些狹窄領域上線提(ti)供(gong)服(fu)務。我(wo)們(men)將看(kan)到由于競(jing)爭(zheng)的(de)(de)增(zeng)(zeng)加導(dao)致更多(duo)服(fu)務提(ti)供(gong)商(shang)。
毫無疑問(wen),我們會看到滿足各種需求的HPC云(yun),這樣(yang)的選擇范圍差異很大。每個提供商都有自(zi)己的功能集,對用戶來說最(zui)重要(yao)的一步(bu)是確保他們為自(zi)己的需求選擇最(zui)佳的解決方案。
中國超算云提供商
IDC最新(xin)發布的(de)《中國(guo)公有云服(fu)務市(shi)(shi)(shi)(shi)場(chang)(2020第四季度)跟蹤(zong)》報告顯(xian)示:2020年第四季度中國(guo)IaaS市(shi)(shi)(shi)(shi)場(chang)規模為34.9億(yi)美元,阿里(li)巴巴仍然占據市(shi)(shi)(shi)(shi)場(chang)份額第一的(de)位置,華為與騰訊并列第二,中國(guo)電(dian)信和(he)AWS位居其后,前(qian)五(wu)服(fu)務商共(gong)同(tong)占據77.4%的(de)市(shi)(shi)(shi)(shi)場(chang)份額。
盡管(guan)沒有直接(jie)數據說明中國公有云(yun)在高性能計算(suan)方面的排(pai)名,我(wo)們就簡單按其公有云(yun)的市場(chang)排(pai)名來(lai)一(yi)一(yi)說明這些廠(chang)商在HPC云(yun)方面的情(qing)況(kuang)
阿里E-HPC
自(zi)從(cong)阿(a)里(li)2017年9月(yue),阿(a)里(li)云(yun)宣(xuan)布推出全新一代(dai)異(yi)構(gou)計(ji)算(suan)加速平臺稱作E-HPC。阿(a)里(li)的(de)(de)(de)EHPC提供(gong)的(de)(de)(de)是機(ji)遇阿(a)里(li)自(zi)主的(de)(de)(de)神龍服(fu)(fu)務(wu)器(qi)(qi)(qi)架構(gou)構(gou)建的(de)(de)(de)裸金屬(shu)服(fu)(fu)務(wu)器(qi)(qi)(qi),這不同于AWS提供(gong)虛擬機(ji)的(de)(de)(de)高(gao)性(xing)(xing)能計(ji)算(suan)集群。屬(shu)于高(gao)性(xing)(xing)能計(ji)算(suan)的(de)(de)(de)IAAS服(fu)(fu)務(wu)層次。2020年阿(a)里(li)云(yun)彈(dan)性(xing)(xing)計(ji)算(suan)產(chan)品年度發(fa)布會上,阿(a)里(li)云(yun)宣(xuan)布推出第(di)(di)三代(dai)神龍云(yun)服(fu)(fu)務(wu)器(qi)(qi)(qi),即第(di)(di)三代(dai)彈(dan)性(xing)(xing)裸金屬(shu)服(fu)(fu)務(wu)器(qi)(qi)(qi)(ECS Bare Metal Instance),它(ta)是基于阿(a)里(li)云(yun)完全自(zi)主研發(fa)的(de)(de)(de)下一代(dai)虛擬化技術(shu)而打(da)造(zao)的(de)(de)(de)新型計(ji)算(suan)類服(fu)(fu)務(wu)器(qi)(qi)(qi)產(chan)品,兼具(ju)虛擬機(ji)的(de)(de)(de)彈(dan)性(xing)(xing)和物理機(ji)的(de)(de)(de)性(xing)(xing)能及功能特(te)性(xing)(xing)。
據介(jie)紹(shao),《流(liu)浪地球》制作方MORE VFX(墨鏡天(tian)合(he))已將算力需求最大的渲染環(huan)節遷(qian)上阿里(li)云(yun)(yun)。傳統的后(hou)期處(chu)理(li)(li),對計算力的需求會隨(sui)項目而變,低(di)谷期利用率不高(gao)、高(gao)峰期資源無保障,且(qie)排隊(dui)嚴(yan)重。為(wei)了解決這一(yi)問題,MORE VFX通過專線上云(yun)(yun),利用阿里(li)云(yun)(yun)高(gao)性能計算E-HP服務,在云(yun)(yun)端完成渲染,一(yi)天(tian)可(ke)以處(chu)理(li)(li)原本一(yi)周的量,大大縮(suo)短了渲染等待時間(jian)。
華為HPC云
華(hua)為(wei)(wei)(wei)云的產品線分為(wei)(wei)(wei)線上和線下,作為(wei)(wei)(wei)華(hua)為(wei)(wei)(wei)的高(gao)(gao)性(xing)能(neng)產品和解決(jue)方案以線下為(wei)(wei)(wei)主,也就是說以私有(you)部(bu)署為(wei)(wei)(wei)主。其(qi)HPC解決(jue)方案面向汽(qi)車制造(zao)業(ye)、生命(ming)科學、金融領域(yu)、石油天(tian)然氣、動畫渲染(ran)、氣象預測以及教育(yu)科研等行業(ye),具備(bei)超強的計算能(neng)力、靈活高(gao)(gao)效存(cun)儲以及極速的網(wang)絡性(xing)能(neng),在(zai)行業(ye)內具備(bei)多項唯一:
"唯一支持(chi)裸金(jin)屬能(neng)力的廠(chang)家(jia),裸金(jin)屬服(fu)務無虛擬化損耗,最大規格(ge)達到(dao)96核(he)4T。
"唯一支持100Gb的Infiniband網(wang)絡的廠(chang)家(jia)。
"唯(wei)一提(ti)供基于Infiniband網(wang)絡的(de)Lustre高性(xing)能并行文(wen)件處(chu)理系統(tong)的(de)廠家(jia),單個OSS存(cun)儲(chu)節點讀寫帶(dai)寬均(jun)能達到4.5GB/s,最(zui)(zui)高達到2TB/s,目前業界性(xing)能最(zui)(zui)高。
除此之外,華(hua)為云HPC也(ye)正在與AI技術進行深度(du)融合,提供更加創(chuang)新的(de)(de)資源(yuan)(yuan)服務。AI讓(rang)HPC實(shi)現更優化(hua)的(de)(de)資源(yuan)(yuan)分配和能(neng)源(yuan)(yuan)管理,HPC幫(bang)助AI實(shi)現更強大的(de)(de)算(suan)力(li),兩(liang)者結合幫(bang)助企業(ye)從容應對(dui)機器學習模型訓(xun)練不斷增長的(de)(de)計算(suan)需求。華(hua)為云HPC搭載最強的(de)(de)NVIDIATeslaV100GPU加速卡(ka),應用于AI訓(xun)練領(ling)域(yu),其訓(xun)練性(xing)能(neng)比上一代P100卡(ka)提升3倍多(duo)。
目(mu)前,華為(wei)云(yun)HPC解決(jue)方案(an)已在汽車(che)制造、基因測序(xu)、科(ke)研教育等領域為(wei)客戶(hu)成功部(bu)署了云(yun)上的高性能(neng)計算(suan)資(zi)源。其中汽車(che)制造行業,國(guo)內(nei)已有多家"財富"500強車(che)企選擇(ze)基于華為(wei)云(yun)建設HPC資(zi)源,用于新(xin)車(che)仿真測試。
除了聚焦(jiao)于(yu)自身技術能力的建設,華為云(yun)HPC解決(jue)方(fang)案(an)將持(chi)續(xu)與行業領先(xian)的廠家進行合作(zuo),如達(da)索系(xi)統、ESI、等(deng),雙(shuang)方(fang)進行聯合測(ce)試、基于(yu)客(ke)戶需求進行產品調優,未來,將為行業客(ke)戶提供最符合自身需求的解決(jue)方(fang)案(an)。
騰訊超算云
騰訊(xun)超算(suan)云(yun)提供了集(ji)合黑(hei)石物理服務(wu)器、云(yun)服務(wu)器(CVM)、存儲、網絡(luo)、批量計算(suan)(Batch)、深(shen)度(du)學習DI-X平臺等(deng)優勢產品的云(yun)端高(gao)性能計算(suan)解決方案。其有(you)三大特(te)點:
快(kuai)速(su)可獲(huo)取:用(yong)戶可即時(shi)獲(huo)取HPC資(zi)源(yuan)并(bing)快(kuai)速(su)擴容(rong),可通過HPC PaaS平臺按(an)小(xiao)時(shi)購買,也可按(an)月、按(an)季、按(an)年租用(yong)專屬(shu)HPC集(ji)群,減少了集(ji)群的建(jian)設周(zhou)期,也不用(yong)一次性巨(ju)額資(zi)金投入。
資源(yuan)靈活配(pei)置(zhi):使用(yong)者(zhe)可以根據應用(yong)需求創(chuang)建各種配(pei)置(zhi)的HPC 群集(ji),比如(ru)減少GPU服(fu)務(wu)器配(pei)比,增加FPGA服(fu)務(wu)器等。同時還能在技術革新后(hou),即時使用(yong)到換代機型,用(yong)戶不用(yong)再受限于HPC資源(yuan),加快研發(fa)速(su)度,節(jie)約(yue)研發(fa)成本。
高性(xing)能(neng)(neng)硬(ying)(ying)件:騰訊超算云(yun)采(cai)用(yong)基(ji)于英特爾至強(qiang)可擴展處理(li)器(qi)定制機型的(de)黑石(shi)服務器(qi),并針對HPC應用(yong)進行專門優化,高性(xing)能(neng)(neng)無虛擬化開銷。同時提供(gong)包括NVIDIA P100/V100 GPU機型、FPGA機型等在內的(de)各(ge)種(zhong)異構計算機型,加速多機并行應用(yong),讓應用(yong)享受最新的(de)硬(ying)(ying)件加速。
同(tong)時,騰訊超(chao)算(suan)云專門為HPC集群設計(ji)了高可(ke)用高帶寬(kuan)和可(ke)擴展性強(qiang)的(de)網絡架構,大幅提升網絡性能(neng)。其中,騰訊超(chao)算(suan)云提供(gong)40GE/100GE的(de)RDMA網絡,延時小于1.5us,還能(neng)兼(jian)容基于MPI的(de)傳統HPC應用;并(bing)提供(gong)GPUDirect RDMA功能(neng),使多(duo)機多(duo)GPU之間的(de)帶寬(kuan)和延遲(chi)性能(neng)得到(dao)大幅度(du)提升。
此外,為了應(ying)對(dui)高(gao)性(xing)能計(ji)算對(dui)存儲(chu)的高(gao)標準(zhun)需求,騰訊(xun)超算云(yun)提供(gong)文(wen)件(jian)存儲(chu)CFS和高(gao)性(xing)能并行文(wen)件(jian)系(xi)(xi)統,其中騰訊(xun)云(yun)并行文(wen)件(jian)系(xi)(xi)統基于騰訊(xun)分布式存儲(chu)架構(gou),能提供(gong)TBps級的吞吐(tu)帶(dai)寬和EB級文(wen)件(jian)系(xi)(xi)統。
基(ji)(ji)于(yu)優勢基(ji)(ji)礎(chu)能力,騰訊超算(suan)云還針對工(gong)業(ye)制造(CAD/CAE、碰撞、材料模擬等)、生(sheng)物基(ji)(ji)因(yin)和(he)人工(gong)智能等場景推出(chu)基(ji)(ji)于(yu)業(ye)務流的PaaS平臺和(he)行業(ye)應用的集成(cheng),讓客戶在(zai)使用高性能計算(suan)服務時專注產(chan)品研發(fa)和(he)創新(xin),無需關注底層集群和(he)調(diao)度系(xi)統,提升產(chan)品研發(fa)效率和(he)上(shang)市速(su)度。
超級(ji)計(ji)算(suan)機將向云靠攏
當人們遇到一(yi)個(ge)大到一(yi)臺計算(suan)機(ji)處(chu)理(li)器無法(fa)處(chu)理(li)的難題時,他們會(hui)怎么(me)做?無外(wai)乎是超級計算(suan)機(ji)或(huo)(huo)分(fen)布式計算(suan)方案,或(huo)(huo)者云計算(suan)方案。
甭管是超算方(fang)案還是云方(fang)案,應(ying)用肯定需要多處理器了共同完成(cheng)一個任務。
一臺(tai)計(ji)(ji)算機(ji)包含處理器(qi)和(he)存(cun)(cun)儲(chu)器(qi)。從本(ben)質上講,處理器(qi)執行指令,存(cun)(cun)儲(chu)器(qi)保存(cun)(cun)數據(ju)和(he)指令。對于(yu)一個(ge)簡單的基礎計(ji)(ji)算,或許(xu)一臺(tai)計(ji)(ji)算機(ji),一個(ge)處理器(qi)就夠(gou)了(le)。但是如果要處理許(xu)多不同(tong)的變(bian)(bian)量(liang)或大型數據(ju)集(ji),顯(xian)然一個(ge)處理器(qi)是不夠(gou)的,我們需要額(e)外(wai)的處理器(qi)來解決(jue)問題。我們現在有越來越多的場景(jing)需要使用大量(liang)的計(ji)(ji)算資(zi)源,比如實時天氣預報,航(hang)空航(hang)天和(he)生物醫(yi)學(xue)工程,核聚變(bian)(bian)研究和(he)核儲(chu)備(bei)管理等(deng)等(deng)。
面(mian)對這些問題的求解(jie),人(ren)(ren)們需(xu)要更復雜的系(xi)統(tong),可以(yi)更快和(he)更有效地處(chu)理數據。為(wei)了實(shi)現這一(yi)點,人(ren)(ren)們在一(yi)個(ge)系(xi)統(tong)里集(ji)成(cheng)(cheng)了成(cheng)(cheng)千上萬個(ge)處(chu)理器。
如(ru)果要采用多處(chu)理(li)(li)器方式(shi),我(wo)們有(you)(you)二種(zhong)選擇(ze),一個(ge)是(shi)超級(ji)計(ji)(ji)算(suan)機(ji)。超級(ji)計(ji)(ji)算(suan)機(ji)非常大而且昂貴。在這種(zhong)方案(an)中,計(ji)(ji)算(suan)機(ji)與其所(suo)有(you)(you)的處(chu)理(li)(li)器位于同一位置(zhi),所(suo)有(you)(you)的東西都通(tong)過(guo)本地網絡流動。另一個(ge)選擇(ze)在一個(ge)廣(guang)(guang)域(yu)網或(huo)互(hu)(hu)聯網上集成(cheng)各種(zhong)處(chu)理(li)(li)器,稱(cheng)之為(wei)分布式(shi)計(ji)(ji)算(suan)。這也是(shi)當下廣(guang)(guang)泛被接受的云計(ji)(ji)算(suan)模式(shi),處(chu)理(li)(li)器可以(yi)位于不(bu)同的地理(li)(li)位置(zhi),所(suo)有(you)(you)通(tong)信通(tong)過(guo)互(hu)(hu)聯網或(huo)廣(guang)(guang)域(yu)網。
那么(me)我們是采用超算還是云計算?
由于數據在(zai)超級計(ji)算(suan)(suan)機(ji)的(de)處(chu)理器(qi)處(chu)理得(de)如此之快,同一(yi)(yi)任(ren)(ren)務(wu)可以一(yi)(yi)臺(tai)超級計(ji)算(suan)(suan)機(ji)上計(ji)算(suan)(suan)沒有任(ren)(ren)何問題,這(zhe)非常適合那些需要實時(shi)處(chu)理的(de)應(ying)用程序。缺點(dian)是它們(men)的(de)成本(ben)往往高得(de)令人望而(er)卻步。它們(men)由昂貴(gui)的(de)處(chu)理器(qi)、快速內存、特別設(she)計(ji)的(de)組(zu)件和精心設(she)計(ji)的(de)冷卻機(ji)制組(zu)成。另外擴展一(yi)(yi)臺(tai)超級計(ji)算(suan)(suan)機(ji)并不(bu)容易(yi):一(yi)(yi)旦機(ji)器(qi)建(jian)好,加載(zai)額外處(chu)理器(qi)就不(bu)是個(ge)簡單(dan)任(ren)(ren)務(wu),這(zhe)需要啟(qi)動一(yi)(yi)個(ge)項目來(lai)完成它。
相比之(zhi)下,人們選擇云(yun)的(de)(de)分(fen)布(bu)式(shi)計(ji)(ji)算(suan)(suan)(suan)的(de)(de)一個(ge)原因是(shi)它的(de)(de)價格要便宜(yi)得多。分(fen)布(bu)式(shi)網(wang)絡(luo)的(de)(de)設(she)計(ji)(ji)可以(yi)非(fei)常復(fu)雜(za),但硬件(jian)組件(jian)和冷卻(que)不(bu)需(xu)要是(shi)高(gao)(gao)端的(de)(de)或專門設(she)計(ji)(ji)的(de)(de)。它可以(yi)無縫擴展(zhan):隨著額外的(de)(de)服務器(及其處理器)被(bei)添加到網(wang)絡(luo)中,處理能(neng)力也會隨之(zhi)增長。相比較于(yu)超級計(ji)(ji)算(suan)(suan)(suan)機的(de)(de)優勢在于(yu)通過快速(su)連接短(duan)距離發送(song)數(shu)據,云(yun)計(ji)(ji)算(suan)(suan)(suan)的(de)(de)分(fen)布(bu)式(shi)架(jia)構下數(shu)據是(shi)通過較慢的(de)(de)網(wang)絡(luo)傳輸的(de)(de)。所以(yi)云(yun)計(ji)(ji)算(suan)(suan)(suan)架(jia)構不(bu)適合(he)傳統意義上的(de)(de)高(gao)(gao)性能(neng)計(ji)(ji)算(suan)(suan)(suan)類(lei)應(ying)用,比如那些MPI類(lei)的(de)(de)應(ying)用。
顯然超算和(he)云不(bu)是零和(he)博弈,不(bu)同的應用場景決定(ding)了那種(zhong)方式(shi)更有性價比(bi)。
比如新郎新娘過幾天(tian)(tian)要結婚(hun)(hun),除了選(xuan)擇(ze)黃道吉日(ri)外,他(ta)們(men)還(huan)要對(dui)婚(hun)(hun)禮當天(tian)(tian)的(de)(de)天(tian)(tian)氣(qi)非常關(guan)注,然而看似簡(jian)單(dan)的(de)(de)問(wen)題(ti),其實回答(da)它并不是(shi)個簡(jian)單(dan)問(wen)題(ti)。天(tian)(tian)氣(qi)預(yu)報是(shi)極其復雜(za)和眾(zhong)所周知的(de)(de)難以預(yu)測。
一般(ban)(ban)氣象局使(shi)用(yong)(yong)超級計(ji)算機來進行天(tian)氣預報(bao)處理,為了(le)正(zheng)確(que)地(di)確(que)定(ding)某一地(di)區的(de)天(tian)氣可能如(ru)何(he)演變,超級計(ji)算機將(jiang)模擬(ni)大(da)數據,包(bao)含溫度、風、濕度、氣壓、陽光(guang)等隨時間變化的(de)巨大(da)數據集。為了(le)實(shi)時得到合理準確(que)的(de)答案,您必(bi)須非常快(kuai)速地(di)處理所(suo)有數據。我(wo)們(men)一般(ban)(ban)認為想要實(shi)時更新天(tian)氣預報(bao),那么(me)使(shi)用(yong)(yong)超級計(ji)算機是必(bi)要的(de),但是問題(ti)是如(ru)果(guo)這里有數百萬的(de)實(shi)時應用(yong)(yong)在等待(dai)中,該怎么(me)辦呢?
我們就不得不說云計算的優勢了,作為分布式計算機系統,云擁有一臺超級計算機所不具備的巨大數量的處理器和內存。所以對于那些對延遲不那么敏感的應用,使用云計算是個解決辦法。例如,當美國宇航局的噴氣推進實驗室(JPL )需要處理其火星探測器收集的大量圖像數據時,托管在云上的計算機集群是一個天然的好辦法。
云作為分布(bu)式(shi)計算(suan)的(de)(de)一種(zhong)形式(shi),云計算(suan)又定義的(de)(de)計算(suan)資源的(de)(de)提供方式(shi)是一種(zhong)服(fu)務(wu),這(zhe)意味著云廠商(shang)為這(zhe)種(zhong)分布(bu)式(shi)計算(suan)環境的(de)(de)性能,可靠(kao)性,可彈性完全負起了責(ze)任。
也就(jiu)是說用戶(hu)使用這些(xie)資源不再需要維護,更新,擴展。這些(xie)都有云(yun)服(fu)務(wu)商做了。
在(zai)了(le)解了(le)云計(ji)算(suan)和(he)超(chao)級(ji)計(ji)算(suan)的區別(bie),我們來看看一個云計(ji)算(suan)作為超(chao)級(ji)計(ji)算(suan)機的用(yong)途案例(引用(yong)David Stepania在(zai)其linkin的文章“Supercomputing vs. Cloud Computing“ )。
金(jin)融(rong)分析師布拉克斯頓·麥基(ji)(BraxtonMckee)身處(chu)華爾街(jie)競爭激烈的(de)世界。作為對沖基(ji)金(jin)Ufora的(de)創始人(ren),McKee開始在云計(ji)算(suan)(suan)領域進(jin)行探索,他知道云的(de)計(ji)算(suan)(suan)能力和其廣泛(fan)使(shi)用的(de)技(ji)術是前所未有的(de)。他開發(fa)了一套智能應用程(cheng)序(xu),該(gai)程(cheng)序(xu)可以隨著使(shi)用而(er)變得更(geng)加(jia)聰明,Mckee創建的(de)電子表(biao)格有多達100萬行和100萬列!而(er)這個計(ji)算(suan)(suan)傳統上需要超(chao)級計(ji)算(suan)(suan)機或者(zhe)至少是大型計(ji)算(suan)(suan)機來(lai)運(yun)行,現(xian)在靠(kao)云就(jiu)可以以低廉的(de)成本運(yun)算(suan)(suan)出來(lai),這得益(yi)于(yu)這些應用屬(shu)于(yu)大數據的(de)特點(dian)適合(he)云計(ji)算(suan)(suan)。
Kelly Bit. Rather解釋說:“他們(men)的(de)努(nu)力(li)值得(de)(de)注(zhu)意的(de)不是人(ren)工智能技術從(cong)科幻小(xiao)說到具體(ti)落(luo)地的(de)事實。”而是,“令(ling)人(ren)吃(chi)驚的(de)如(ru)此龐大(da)的(de)數據分析(xi)變(bian)得(de)(de)如(ru)此廉價,以至(zhi)于許多企業都很可(ke)以負擔得(de)(de)起(qi)。”
人工智(zhi)能和(he)機器學習已經(jing)被一些對沖基金使(shi)用多(duo)年(nian)了。如今(jin),Ufora和(he)類似的組織正(zheng)在使(shi)用云(yun)來運行復雜的預測(ce)模型(xing),否則這些預測(ce)模型(xing)將非常(chang)昂貴。
以前,McKee使(shi)用(yong)的(de)計算系統將需要(yao)幾個月(yue)的(de)開發和100多萬(wan)美元的(de)服(fu)務器(qi)投入。現(xian)在,他只需訪問云服(fu)務器(qi)可(ke)立即運行應用(yong)處理(li)這些數據即可(ke)。
與(yu)專用計算相比,云計算在(zai)數(shu)(shu)據分析問題的(de)速度要快得(de)多(duo),因(yin)此Mckee的(de)目標--讓計算機在(zai)他片刻休息的(de)時(shi)間內就能完(wan)成其工作--聽起來(lai)很(hen)有道(dao)理。Bit說:“他的(de)目標是(shi)讓每一(yi)個模型--不管涉及多(duo)少數(shu)(shu)據--都能在(zai)他的(de)辦(ban)(ban)公(gong)室廚房里煮一(yi)杯(bei)Nespresso Caredto咖啡(fei),然后走他的(de)辦(ban)(ban)公(gong)桌的(de)時(shi)候(hou)計算就能完(wan)成。”這聽起來(lai)很(hen)酷?
在人(ren)(ren)工智能(neng)的(de)機器學習方面(mian),云計算(suan)也(ye)大有可為。人(ren)(ren)們(men)已經認識到使用公(gong)共云運行(xing)(xing)復(fu)雜的(de)算(suan)法變得更加(jia)可能(neng)--更有效率,也(ye)更經濟。反過來,人(ren)(ren)工智能(neng)行(xing)(xing)業正在蓬勃發展。看(kan)看(kan)彭博社(Bloomberg)有關風險資本(ben)對(dui)人(ren)(ren)工智能(neng)的(de)信心的(de)數據就知道了(le):
風險投資人(ren)工(gong)智(zhi)能(neng)初創企業總數(shu)2014年(nian)16家(jia),總投資3億美(mei)元(yuan), 2010年(nian)2家(jia)總投資1500萬(wan)美(mei)元(yuan),你可以看(kan)到云的(de)(de)興起(qi)導致了人(ren)工(gong)智(zhi)能(neng)投資的(de)(de)快速推(tui)進。一(yi)般認為從事(shi)機器(qi)學習的(de)(de)公司專長在人(ren)工(gong)智(zhi)能(neng)的(de)(de)算(suan)法,其(qi)實(shi)擁有(you)樣(yang)本(ben)大數(shu)據和樣(yang)本(ben)數(shu)據分(fen)析(xi)的(de)(de)能(neng)力才是(shi)最重(zhong)要的(de)(de)。相對于封(feng)閉的(de)(de)系(xi)統(tong),云上的(de)(de)大數(shu)據分(fen)析(xi)能(neng)力就像開通一(yi)臺虛擬機一(yi)樣(yang)簡單(dan):它是(shi)即(ji)時(shi)的(de)(de)。正因(yin)為如(ru)此,基本(ben)上每個人(ren)都能(neng)獲得非常強(qiang)大的(de)(de)預測模型。
而對(dui)于(yu)(yu)傳統科(ke)研教(jiao)育的(de)(de)(de)超級(ji)計(ji)算(suan)(suan)(suan)機(ji)而言,向云方(fang)向移動開始顯現(xian)。當我(wo)們(men)討論超級(ji)計(ji)算(suan)(suan)(suan)機(ji)和云的(de)(de)(de)超級(ji)計(ji)算(suan)(suan)(suan)機(ji)潛力時,我(wo)們(men)真正(zheng)談論的(de)(de)(de)是高(gao)性能(neng)計(ji)算(suan)(suan)(suan)(HPC)的(de)(de)(de)日益增長的(de)(de)(de)價值和可訪問性。大學(xue)和私人公司(si)的(de)(de)(de)研究(jiu)人員需要高(gao)性能(neng)計(ji)算(suan)(suan)(suan)機(ji),他們(men)正(zheng)求助于(yu)(yu)公有云來提(ti)供這種(zhong)服務。
Idc的研究員史蒂夫康威(wei)(Steve Conway)表示(shi),使用(yong)云服務的hpc的可能性有點(dian)令人難以置(zhi)信。貝寶(bao)(PayPal)通過(guo)在高性能HPC環境下運行(xing),節(jie)省了7億美元。
IDC的預(yu)測顯示,高性(xing)能(neng)計(ji)算在這十(shi)年將(jiang)繼(ji)續穩步的大(da)幅度增長:
2018年(nian)高性能計算機硬件和(he)(he)軟件分別是(shi)147億(yi)美(mei)元和(he)(he)290億(yi)美(mei)元,而2013年(nian)分別是(shi)103億(yi)美(mei)元和(he)(he)200億(yi)美(mei)元
公司(si)轉(zhuan)向(xiang)使用高(gao)性能計(ji)算(suan)是為(wei)了更(geng)好地管理大數(shu)據任務。這(zhe)些系統(tong)現在對許(xu)多科學家(jia)、制藥研究人員、工程(cheng)師,甚(shen)至是情報界來(lai)說(shuo)都是必(bi)不可少的(de)工具。對于那些數(shu)據密集型的(de)應用正(zheng)從超級計(ji)算(suan)機轉(zhuan)向(xiang)云(yun)。
數(shu)(shu)據中(zhong)心(xin)專(zhuan)家(jia)(jia)ArchanaVenkatraman舉了(le)(le)一(yi)家(jia)(jia)美國公(gong)司(si)的(de)例子,該(gai)公(gong)司(si)“想要(yao)(yao)(yao)建(jian)(jian)造一(yi)臺15.6萬核心(xin)的(de)超級(ji)計算(suan)(suan)機(ji),用于分(fen)子建(jian)(jian)模(mo),以開發更高效的(de)太陽(yang)(yang)能電(dian)池板(ban)。”為(wei)了(le)(le)實現這一(yi)目標(biao),該(gai)公(gong)司(si)利(li)用了(le)(le)云(yun)的(de)廣(guang)泛(fan)分(fen)布的(de)資(zi)源特性,將跨(kua)多國的(de)資(zi)源聯(lian)系來(lai)作為(wei)一(yi)臺超級(ji)計算(suan)(suan)機(ji)系統(tong)來(lai)使用。為(wei)了(le)(le)完成這個(ge)項目,該(gai)公(gong)司(si)總(zong)共運行了(le)(le)1.21千(qian)兆字節,處理了(le)(le)205,000種可能的(de)太陽(yang)(yang)能電(dian)池板(ban)材料的(de)數(shu)(shu)量。通過云(yun)計算(suan)(suan)將原(yuan)來(lai)需要(yao)(yao)(yao)264計算(suan)(suan)機(ji)年(一(yi)臺普通計算(suan)(suan)機(ji)需要(yao)(yao)(yao)運行264年)濃縮(suo)成18個(ge)小(xiao)時,該(gai)公(gong)司(si)實際上創造了(le)(le)全球排名前50位的(de)超級(ji)計算(suan)(suan)機(ji)之(zhi)一(yi),而無需組裝任何物理部件(jian)。
云是總望所歸
云本質上是將(jiang)高性(xing)能計算(suan)大眾化。這(zhe)對于那些以前無法使用超(chao)(chao)級計算(suan)機的(de)人來說是個好消息。在超(chao)(chao)算(suan)在與(yu)云廠商合(he)作(zuo)之前,超(chao)(chao)算(suan)中心(xin)就不(bu)(bu)是個分(fen)布式(shi)架構(gou),而是集中式(shi)的(de)建設大型機,集中存儲和以太網(wang)網(wang)絡技(ji)術。這(zhe)種架構(gou)導致(zhi)了(le)(le)(le)超(chao)(chao)算(suan)不(bu)(bu)真(zhen)正的(de)100 %高可用。比如超(chao)(chao)算(suan)中心(xin)斷電了(le)(le)(le),一切將(jiang)會癱瘓,有(you)了(le)(le)(le)云情況就不(bu)(bu)同了(le)(le)(le),一個數據(ju)中心(xin)斷電了(le)(le)(le),其他地方的(de)數據(ju)中心(xin)可以繼續為客(ke)戶(hu)提供服務(wu)。
— 推薦(jian)閱(yue)讀 —
- 2022-03-22
- 2022-03-22
- 2022-03-22
- 2022-03-22
- 2022-03-18
- 2022-03-18
在線咨詢 MESSAGE