版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

[科普中國]-日超算性能10倍于神威太湖之光?

中國科普博覽
原創(chuàng)
中國科協(xié)、中科院攜手“互聯(lián)網(wǎng)+科普”平臺(tái),深耕科普內(nèi)容創(chuàng)作
收藏

在神威太湖之光和天河2號相繼奪得TOP500第一名的情況下,日本富士通宣稱要建造計(jì)算性能是神威太湖之光10倍的超算——Post-K,而且日本富士通還聯(lián)合ARM為新超算開發(fā)處理器。把時(shí)間往回?fù)?年,日本京(K)也曾占據(jù)TOP500榜首。在聯(lián)合ARM解決了處理器的問題后,日本就能建成1000P超算么?
從K到Post-K
其實(shí),日本超算也曾經(jīng)輝煌過,在2011年日本超算京(K)曾經(jīng)為例TOP500第一。日本超算“京”采用的處理器是富士通和甲骨文聯(lián)合研制的Sparc64-VIIIfx,Sparc64-VIIIfx是一款八核心處理器,主頻2.0GHz,峰值浮點(diǎn)性能128GFlops,Linpack測試的最大計(jì)算性能達(dá)到了10.51PFlops,也就是約為神威太湖之光的九分之一,雖然在現(xiàn)在來說,這個(gè)成績已經(jīng)比較一般了,但在2011年時(shí)候,還是稱雄一時(shí)的,位列TOP500榜首。
此外,在看重內(nèi)存帶寬和延遲的Graph500上,至今都有不俗的表現(xiàn)——2016年7月,在Graph500排行榜上,京連續(xù)第三次奪得冠軍,基準(zhǔn)測試得分為38621GTEPS,排名第二的是中國的神威太湖之光,成績?yōu)?3756GTEPS。Graph500對全系統(tǒng)的內(nèi)存帶寬和內(nèi)存延遲有很高的要求,而計(jì)算能力本身已經(jīng)不影響測試結(jié)果了,這種測試偏向于訪存密集型運(yùn)算,在大數(shù)據(jù)分析以及大規(guī)模圖表分析等場景下比較有意義。對于像神威太湖之光這樣專門針對特殊領(lǐng)域開發(fā)的超算,更加側(cè)重于Linpack性能,而在大規(guī)模圖表廣度優(yōu)先搜索方面非其所長,也不是神威太湖之光的主要應(yīng)用方向。
由于在財(cái)力上投入嚴(yán)重不足,日本在京之后,一直沒能拿出值得稱道的作品。不過,也許是受了神威太湖之光的刺激,或是其他什么原因,不久前,日本富士通發(fā)布PPT,要建設(shè)1000P超算,1000P超算是什么概念呢?神威太湖之光是100P超算,也就是說,Post-K的性能將會(huì)是神威太湖之光的10倍。
聯(lián)合ARM彌補(bǔ)處理器的不足
近年來,異構(gòu)超算已經(jīng)是大勢所趨,什么是異構(gòu)超算呢?異構(gòu)計(jì)算就是用不同的計(jì)算單元組成系統(tǒng)的計(jì)算方式,簡單的公式可以表示為“CPU+XXX”,在超算上已經(jīng)廣泛采用,比如天河2號就是CPU+眾核加速器,天河2A就是CPU+GPDSP,美國超算泰坦就是CPU+GPGPU。從中可以看出,在異構(gòu)超算已經(jīng)是大勢所趨,而且能夠取得更高的性能的情況下,要建設(shè)性能強(qiáng)悍的超算,如果沒有高性能的加速器顯然是不切實(shí)際的——眾所周知,神威太湖之光之所以能夠取得100P的性能,很大程度上得益于申威26010處理器的強(qiáng)悍性能。目前,日本富士通的京是一款同構(gòu)超算,采用了Sparc64-VIIIfx處理器,在沒有自己的眾和處理器做加速器的情況下,日本富士通聯(lián)合ARM開發(fā)加速器也就理所當(dāng)然了。
可能有人會(huì)疑惑了,ARM不是做手機(jī)、平板用的SOC么,怎么還能做超算?雖然ARM一直在嵌入式芯片上深耕,但也一直試圖進(jìn)入低功耗服務(wù)器市場,雖然在Intel至強(qiáng)D的阻擊下斬獲有限,但確實(shí)給那些多年來苦于Intel的廠商另外一個(gè)選擇。
在幾個(gè)月前,ARM還發(fā)布了矢量擴(kuò)展架構(gòu)(SVE)——矢量擴(kuò)展架構(gòu)可以提升向量,這意味著可以提升并行度。而向量既有定點(diǎn)也有浮點(diǎn),面向的是大型數(shù)據(jù)處理的需要。雖然對于服務(wù)器和超算而言,光靠向量還是不行的,但卻比沒有矢量擴(kuò)展架構(gòu)要強(qiáng)。而這次富士通聯(lián)合ARM,顯然是為了解決超算處理器的問題,而且和申威26010和Intel的KNL一樣,富士通聯(lián)合ARM開發(fā)的處理器很可能也會(huì)是一款眾核處理器。


超算的核心技術(shù)并不只有CPU
即便有了強(qiáng)悍的處理器,就能輕而易舉地建成世界第一的超算么?其實(shí),事情遠(yuǎn)遠(yuǎn)不止這么簡單。
社會(huì)上一直有一種流言,就是只要有足夠多、性能足夠強(qiáng)的處理器,就能做出世界第一的超算。但實(shí)際上,這種觀點(diǎn)是非常值得商榷的。超算是一個(gè)系統(tǒng),而并非是處理器的堆砌。
超算系統(tǒng)可以分為軟件系統(tǒng)和硬件系統(tǒng)兩部分。超級計(jì)算機(jī)硬件系統(tǒng)主要由運(yùn)算系統(tǒng)、互連系統(tǒng)、存儲(chǔ)系統(tǒng)、維護(hù)監(jiān)控系統(tǒng)、電源系統(tǒng)、冷卻系統(tǒng)和結(jié)構(gòu)組裝設(shè)計(jì)等部分組成。運(yùn)算系統(tǒng)負(fù)責(zé)邏輯復(fù)雜的調(diào)度和串行任務(wù),以及并行度高的任務(wù)。互連網(wǎng)絡(luò)將所有計(jì)算節(jié)點(diǎn)連接起來,使其成為一個(gè)整體。存儲(chǔ)系統(tǒng)負(fù)責(zé)數(shù)據(jù)交換和儲(chǔ)存。維護(hù)監(jiān)控系統(tǒng)保障超算不死機(jī)、不出錯(cuò)。電源系統(tǒng)包裝能源供應(yīng)。冷卻系統(tǒng)幫助超算降溫。結(jié)構(gòu)組裝設(shè)計(jì)是將上述系統(tǒng)裝載到一起,在保障性能的基礎(chǔ)上,實(shí)現(xiàn)機(jī)柜體積最小。超級計(jì)算機(jī)軟件系統(tǒng)主要包括操作系統(tǒng)、編譯系統(tǒng)、并行程序開發(fā)環(huán)境、科學(xué)計(jì)算可視化系統(tǒng)等重要組成部分。
由此可見,運(yùn)算系統(tǒng)、存儲(chǔ)系統(tǒng)、互聯(lián)系統(tǒng)、操作系統(tǒng)、基礎(chǔ)庫、應(yīng)用軟件等都是超算的重要組成部分,將CPU等同于超算的全部技術(shù)的說法顯然是非常不科學(xué)的。
有了處理器未必就能建成1000P超算
由于日本經(jīng)濟(jì)在廣場協(xié)議之后一直保持在低迷的狀態(tài),加上超算本來就屬于偏向國家工程的項(xiàng)目,而且相對較少的建造量和昂貴的價(jià)格都很難讓私人公司通過超算獲取高額利潤,在研發(fā)成本過于高昂的情況下,使得日本NEC、日立等大公司先后退出超算研發(fā)領(lǐng)域,唯有富士通還在苦苦支撐,而且日本政府的支持相當(dāng)不給力——京的研發(fā)經(jīng)費(fèi)一度遭到凍結(jié),直到數(shù)位日本科學(xué)家聯(lián)名向時(shí)任日本首相鳩山由紀(jì)夫上書陳明厲害關(guān)系,京的研發(fā)經(jīng)費(fèi)才解凍......對于向政府謀取經(jīng)費(fèi)以支持新超算研發(fā)的科學(xué)家,日本華裔女政客蓮舫(中國臺(tái)灣籍,原名謝蓮舫,就是在11月24日在參議院《跨太平洋伙伴關(guān)系協(xié)定》(TPP)特別委員會(huì)上對安倍晉三窮追猛打的那位)甚至反問道:“當(dāng)老二有什么不好?”
正是在這種大環(huán)境下,使得在過去幾年,中國超算技術(shù)突飛猛進(jìn),而日本卻沒有制造出比京更好的超算。要知道,技術(shù)發(fā)展有其規(guī)律,是一步一個(gè)腳印迭代演進(jìn)的,大躍進(jìn)式一口吃成一個(gè)胖子的做法并不可取。
正是在過去幾年缺課太多的情況下,哪怕日本富士通可以聯(lián)合ARM解決處理器的問題,但也要面對互聯(lián)、存儲(chǔ)、軟件等一系列問題。就以互聯(lián)網(wǎng)絡(luò)來說,由于超算的計(jì)算節(jié)點(diǎn)之間傳輸?shù)臄?shù)據(jù)量巨大,延遲要求嚴(yán)格,當(dāng)互聯(lián)網(wǎng)絡(luò)拖后腿的情況下,就會(huì)造成數(shù)據(jù)擁堵,大幅降低超算整機(jī)系統(tǒng)效率。而且超算的規(guī)模越大,對互聯(lián)網(wǎng)絡(luò)的要求也就越高。正是因?yàn)楦咚倩ヂ?lián)網(wǎng)絡(luò)的重要性,美國早就將高速互聯(lián)網(wǎng)絡(luò)列入對中國技術(shù)封鎖的名單。而日本在Post-K之前,K的計(jì)算性能只有10P,從10P迅速跨越到1000P,如果不謀求從美國獲取技術(shù),這對于富士通來說未必不是一個(gè)挑戰(zhàn)。
日本政府和理化所的表態(tài)相對理智現(xiàn)實(shí)
事實(shí)上,相對于富士通1000P超算的PPT,日本文部科學(xué)省和日本理化所的表態(tài)則謹(jǐn)慎的多,在2016年,日本文部科學(xué)省發(fā)表了后續(xù)基本設(shè)計(jì)方針:“在發(fā)展方針中,日本文部科學(xué)省不再追求世界第一的計(jì)算速度,而是將目標(biāo)由加快計(jì)算速度轉(zhuǎn)向了加強(qiáng)節(jié)能及便捷功能”。在美國鹽湖城SC16全球超算大會(huì)期間召開的第14屆HPC Connection Workshop中外超算高峰論壇(HPCC)上,日本理化所Mitsuhisa Sato透露了日本發(fā)展E級超算的“旗艦2020計(jì)劃”,將在2017年4月投入運(yùn)營Post K超級計(jì)算機(jī),其系統(tǒng)峰值性能約為25P, 1000P超算的升級計(jì)劃被排到了2020年。值得關(guān)注的是Post K的功耗為3.6兆瓦,性能功耗比接近神威太湖之光的水平,確實(shí)將日本建造最節(jié)能超算的計(jì)劃付諸于實(shí)踐。但從曾經(jīng)追求計(jì)算性能最強(qiáng)超算,到如今的追求最節(jié)能超算,想必日本從事超算建設(shè)的工程師們心中除了無奈只有苦笑吧。
在富士通以前,也有很多科技公司的PPT也非常漂亮,PPT上的技術(shù)指標(biāo)更是華麗無比,但產(chǎn)品上市后實(shí)際表現(xiàn)卻判若兩人。因此, PPT上的紙面技術(shù)指標(biāo)是一回事,能不能把1000P超算造出來就是另外一回事了。退一步說,即便日本將來真的建成了1000P的Post-K超算,但技術(shù)上的大躍進(jìn)必然會(huì)拉長研發(fā)周期,使日本的1000P超算將會(huì)晚于中國的1000P超算問世。

內(nèi)容資源由項(xiàng)目單位提供