北京大學(xué)選擇浪潮高性能計(jì)算研究大氣模擬
發(fā)布時(shí)間:2013/1/31 15:29:46 來源: 縱橫數(shù)據(jù)
日前,北京大學(xué)選擇浪潮集團(tuán)建設(shè)超級(jí)計(jì)算系統(tǒng)作為大氣模擬領(lǐng)域科研工作的高性能計(jì)算平臺(tái)。隨著社會(huì)經(jīng)濟(jì)的發(fā)展,政府、社會(huì)和公眾對氣象預(yù)報(bào)和服務(wù)提出了更高的要求,特別是一些特殊氣象保障任務(wù)需要預(yù)報(bào)員提供定點(diǎn)、定時(shí)、定量的精細(xì)氣象預(yù)報(bào)和服務(wù)。而對于現(xiàn)代天氣預(yù)報(bào)而言,為確保其實(shí)施的實(shí)效性和運(yùn)行的穩(wěn)定性,必然要求其建立在數(shù)值預(yù)報(bào)基礎(chǔ)之上,但數(shù)值模式普遍具有計(jì)算規(guī)模巨大、高精度等特點(diǎn),于是高性能計(jì)算機(jī)便成為了現(xiàn)代氣象研究的中流砥柱。數(shù)值天氣預(yù)報(bào)水平的高低已成為衡量世界各國氣象事業(yè)現(xiàn)代化程度的重要標(biāo)志。
中國是一個(gè)幅員遼闊的國家,在氣候上呈現(xiàn)多層次、多樣性、多變性等特點(diǎn),尤其是近幾年洪澇、干旱等自然災(zāi)害比較嚴(yán)重,及時(shí)、準(zhǔn)確的天氣預(yù)報(bào)逐步受到重視,建設(shè)更高效率的高性能計(jì)算機(jī)平臺(tái)不僅可以增強(qiáng)對天氣預(yù)測的準(zhǔn)確度,也為人工影響天氣提供了基礎(chǔ)的支撐。北京大學(xué)擁有中國唯一的大氣科學(xué)一級(jí)重點(diǎn)學(xué)科,近年來承擔(dān)多項(xiàng)國家科研項(xiàng)目,包括多項(xiàng)國家重點(diǎn)基礎(chǔ)研究發(fā)展規(guī)劃(“973”計(jì)劃)項(xiàng)目、國家高新技術(shù)研究發(fā)展計(jì)劃(“863”計(jì)劃)項(xiàng)目、國家重大科學(xué)研究計(jì)劃項(xiàng)目等,為更好推進(jìn)這一專業(yè)領(lǐng)域的科研工作,培養(yǎng)更多專業(yè)人才,他們希望構(gòu)建符合自身地球氣候科研教學(xué)需求的高性能計(jì)算平臺(tái)。
在該平臺(tái)建設(shè)中,主要面臨如下的挑戰(zhàn):
1、計(jì)算量巨大
基于氣候研究的專業(yè)軟件,如MM5、WRF、GRAPES和AREMS、CCSM等有著驚人的計(jì)算量需求。這是因?yàn)檐浖趯?shí)際應(yīng)用中需要有極高的實(shí)時(shí)性,必須在指定的時(shí)間內(nèi)完成運(yùn)算(一般不超過2小時(shí)),同時(shí)對氣候研究(如氣象預(yù)報(bào))的精度提出了越來越高的要求,需要將預(yù)報(bào)精度從幾百公里、幾十公里提高到幾公里,而這些都大幅度提高了計(jì)算量。另外從軟件的處理流程上看,一般分為前處理、主模式和后處理。前處理包括資料的下載、數(shù)據(jù)同化等等,后處理主要是指圖形化處理生成產(chǎn)品等,前/后處理一般對計(jì)算機(jī)要求不是太高;主模式是整個(gè)系統(tǒng)的主要部分,也是主要計(jì)算量所在,這個(gè)部分是對計(jì)算機(jī)性能(計(jì)算、通訊能力及整個(gè)系統(tǒng)的可靠性、穩(wěn)定性等)要求非常高。
2、通訊密集,通訊性能要求高
由于氣候模擬領(lǐng)域的應(yīng)用軟件大多為并行軟件,一般采用有限差分格點(diǎn)模式并行計(jì)算,所以高性能計(jì)算平臺(tái)在工作時(shí),各個(gè)CPU之間的通訊量很大。同時(shí)需要整個(gè)系統(tǒng)的通訊具有良好的穩(wěn)定性、可靠性,以滿足整體系統(tǒng)可靠、穩(wěn)定的工作需求。
3、整體建設(shè)方案要成熟,具有良好的性價(jià)比。
針對北京大學(xué)的具體應(yīng)用需求,浪潮高性能計(jì)算行業(yè)應(yīng)用專家針對CCSM模式應(yīng)用與具體的網(wǎng)絡(luò)工作環(huán)境,進(jìn)行了專業(yè)測試與驗(yàn)證,并根據(jù)測試的結(jié)果提供系統(tǒng)建設(shè)的專業(yè)建議和意見,在此基礎(chǔ)上提供了有針對性的系統(tǒng)構(gòu)建方案。方案拓?fù)鋱D如下:
方案主要特點(diǎn):計(jì)算節(jié)點(diǎn):采用浪潮雙路刀片計(jì)算節(jié)點(diǎn)構(gòu)建超級(jí)計(jì)算集群,達(dá)到10萬億次/秒的計(jì)算性能,滿足當(dāng)前科研對計(jì)算性能的需求;采用基于Intel全新的 32 nm Intel Westmere 處理器,在相同的芯片大小下能容納更多的運(yùn)算核心,使得CPU由原來的四核升級(jí)到六核,而且核心時(shí)脈提升空間進(jìn)一步擴(kuò)大,使其性能得到進(jìn)一步提升,同時(shí)功耗表現(xiàn)亦得到改善;
采用高密度浪潮NX560T刀片服務(wù)器作為計(jì)算節(jié)點(diǎn),在7U的空間內(nèi)可擴(kuò)展20個(gè)計(jì)算節(jié)點(diǎn),超高的計(jì)算密度為用戶后期擴(kuò)展帶來了方便,提供強(qiáng)勁的計(jì)算性能。
計(jì)算網(wǎng)絡(luò):每個(gè)計(jì)算節(jié)點(diǎn)均配置了40Gbps Infiniband高效的互聯(lián)網(wǎng)絡(luò),可以保持點(diǎn)對點(diǎn)40Gb/S的通信帶寬,而延遲僅為1.53微妙,可以充分利用計(jì)算資源,最大限度發(fā)揮系統(tǒng)的效能。較高的通信帶寬和較低的通信延遲,能夠更好的保證并行計(jì)算的效率,提高加速比。
管理網(wǎng)絡(luò):采用千兆以太網(wǎng)交換機(jī)組成,實(shí)現(xiàn)所有節(jié)點(diǎn)之間的管理信息通信。
IPMI管理網(wǎng)絡(luò):配置百兆交換機(jī),共同組成IPMI管理網(wǎng)絡(luò),連接所有本次新增的節(jié)點(diǎn)和原有節(jié)點(diǎn),對整套系統(tǒng)提供IPMI管理服務(wù)。
存儲(chǔ)系統(tǒng):滿足當(dāng)前和未來一段時(shí)間內(nèi)的計(jì)算數(shù)據(jù)存儲(chǔ)需求IO節(jié)點(diǎn):采用浪潮英信NF5220服務(wù)器,服務(wù)器做Raid 1提高節(jié)點(diǎn)數(shù)據(jù)安全性;存儲(chǔ)設(shè)備:浪潮 AS500G3 ,基于8Gb FC光纖盤陣存儲(chǔ)盤陣,提供64TB存儲(chǔ)空間同時(shí),提供高速I/O,保證實(shí)際的應(yīng)用需求;對于所有節(jié)點(diǎn)均配置1+1冗余服務(wù)器專用低功耗節(jié)能電源。圖形工作站:采用了浪潮專業(yè)圖形工作站。配置了2塊熱插拔硬盤,做Raid 1數(shù)據(jù)保護(hù);對于所有節(jié)點(diǎn)均配置1+1冗余服務(wù)器專用低功耗節(jié)能電源。
浪潮提供專業(yè)的的系統(tǒng)管理與作業(yè)調(diào)度系統(tǒng):部署TSJM1.0作業(yè)調(diào)度系統(tǒng),實(shí)現(xiàn)多用戶多作業(yè)的策略調(diào)度,提升資源利用率與管理效率;部署浪潮TSMM3.0監(jiān)控管理軟件,實(shí)現(xiàn)對整套系統(tǒng)的單一映射,從而為系統(tǒng)管理員提供監(jiān)控管理集群中各個(gè)節(jié)點(diǎn)的統(tǒng)一平臺(tái);浪潮TSDM集群部署軟件、浪潮睿捷集群備份軟件;Intel集群編譯、調(diào)試、數(shù)學(xué)庫等軟件、MPI、PVM、Open MP等并行環(huán)境。浪潮提供的系統(tǒng)構(gòu)建方案具有計(jì)算性能卓越、系統(tǒng)運(yùn)行穩(wěn)定可靠、功耗控制領(lǐng)先、監(jiān)控管理系統(tǒng)方便易用、系統(tǒng)開放易于擴(kuò)展、保護(hù)原有建設(shè)投資等特點(diǎn)。
作為領(lǐng)先的高性能計(jì)算產(chǎn)品與應(yīng)用創(chuàng)新領(lǐng)導(dǎo)廠商,浪潮一貫提倡深度挖掘行業(yè)應(yīng)用,提出HPC系統(tǒng)不僅要“好用”,更要“用好”的理念,在清華大學(xué)、吉林大學(xué)、西安交通大學(xué)、山東大學(xué)、華中科技大學(xué)、安徽大學(xué)、中國海洋大學(xué)、山東超算中心等先后建設(shè)了從數(shù)十萬億次到千萬億次的超級(jí)計(jì)算機(jī)平臺(tái),具有豐富的超算系統(tǒng)建設(shè)運(yùn)維經(jīng)驗(yàn)。據(jù)慧聰鄧白氏調(diào)研報(bào)告顯示,2010年浪潮在高校高性能計(jì)算市場占有率第一。
中國是一個(gè)幅員遼闊的國家,在氣候上呈現(xiàn)多層次、多樣性、多變性等特點(diǎn),尤其是近幾年洪澇、干旱等自然災(zāi)害比較嚴(yán)重,及時(shí)、準(zhǔn)確的天氣預(yù)報(bào)逐步受到重視,建設(shè)更高效率的高性能計(jì)算機(jī)平臺(tái)不僅可以增強(qiáng)對天氣預(yù)測的準(zhǔn)確度,也為人工影響天氣提供了基礎(chǔ)的支撐。北京大學(xué)擁有中國唯一的大氣科學(xué)一級(jí)重點(diǎn)學(xué)科,近年來承擔(dān)多項(xiàng)國家科研項(xiàng)目,包括多項(xiàng)國家重點(diǎn)基礎(chǔ)研究發(fā)展規(guī)劃(“973”計(jì)劃)項(xiàng)目、國家高新技術(shù)研究發(fā)展計(jì)劃(“863”計(jì)劃)項(xiàng)目、國家重大科學(xué)研究計(jì)劃項(xiàng)目等,為更好推進(jìn)這一專業(yè)領(lǐng)域的科研工作,培養(yǎng)更多專業(yè)人才,他們希望構(gòu)建符合自身地球氣候科研教學(xué)需求的高性能計(jì)算平臺(tái)。
在該平臺(tái)建設(shè)中,主要面臨如下的挑戰(zhàn):
1、計(jì)算量巨大
基于氣候研究的專業(yè)軟件,如MM5、WRF、GRAPES和AREMS、CCSM等有著驚人的計(jì)算量需求。這是因?yàn)檐浖趯?shí)際應(yīng)用中需要有極高的實(shí)時(shí)性,必須在指定的時(shí)間內(nèi)完成運(yùn)算(一般不超過2小時(shí)),同時(shí)對氣候研究(如氣象預(yù)報(bào))的精度提出了越來越高的要求,需要將預(yù)報(bào)精度從幾百公里、幾十公里提高到幾公里,而這些都大幅度提高了計(jì)算量。另外從軟件的處理流程上看,一般分為前處理、主模式和后處理。前處理包括資料的下載、數(shù)據(jù)同化等等,后處理主要是指圖形化處理生成產(chǎn)品等,前/后處理一般對計(jì)算機(jī)要求不是太高;主模式是整個(gè)系統(tǒng)的主要部分,也是主要計(jì)算量所在,這個(gè)部分是對計(jì)算機(jī)性能(計(jì)算、通訊能力及整個(gè)系統(tǒng)的可靠性、穩(wěn)定性等)要求非常高。
2、通訊密集,通訊性能要求高
由于氣候模擬領(lǐng)域的應(yīng)用軟件大多為并行軟件,一般采用有限差分格點(diǎn)模式并行計(jì)算,所以高性能計(jì)算平臺(tái)在工作時(shí),各個(gè)CPU之間的通訊量很大。同時(shí)需要整個(gè)系統(tǒng)的通訊具有良好的穩(wěn)定性、可靠性,以滿足整體系統(tǒng)可靠、穩(wěn)定的工作需求。
3、整體建設(shè)方案要成熟,具有良好的性價(jià)比。
針對北京大學(xué)的具體應(yīng)用需求,浪潮高性能計(jì)算行業(yè)應(yīng)用專家針對CCSM模式應(yīng)用與具體的網(wǎng)絡(luò)工作環(huán)境,進(jìn)行了專業(yè)測試與驗(yàn)證,并根據(jù)測試的結(jié)果提供系統(tǒng)建設(shè)的專業(yè)建議和意見,在此基礎(chǔ)上提供了有針對性的系統(tǒng)構(gòu)建方案。方案拓?fù)鋱D如下:
方案主要特點(diǎn):計(jì)算節(jié)點(diǎn):采用浪潮雙路刀片計(jì)算節(jié)點(diǎn)構(gòu)建超級(jí)計(jì)算集群,達(dá)到10萬億次/秒的計(jì)算性能,滿足當(dāng)前科研對計(jì)算性能的需求;采用基于Intel全新的 32 nm Intel Westmere 處理器,在相同的芯片大小下能容納更多的運(yùn)算核心,使得CPU由原來的四核升級(jí)到六核,而且核心時(shí)脈提升空間進(jìn)一步擴(kuò)大,使其性能得到進(jìn)一步提升,同時(shí)功耗表現(xiàn)亦得到改善;
采用高密度浪潮NX560T刀片服務(wù)器作為計(jì)算節(jié)點(diǎn),在7U的空間內(nèi)可擴(kuò)展20個(gè)計(jì)算節(jié)點(diǎn),超高的計(jì)算密度為用戶后期擴(kuò)展帶來了方便,提供強(qiáng)勁的計(jì)算性能。
計(jì)算網(wǎng)絡(luò):每個(gè)計(jì)算節(jié)點(diǎn)均配置了40Gbps Infiniband高效的互聯(lián)網(wǎng)絡(luò),可以保持點(diǎn)對點(diǎn)40Gb/S的通信帶寬,而延遲僅為1.53微妙,可以充分利用計(jì)算資源,最大限度發(fā)揮系統(tǒng)的效能。較高的通信帶寬和較低的通信延遲,能夠更好的保證并行計(jì)算的效率,提高加速比。
管理網(wǎng)絡(luò):采用千兆以太網(wǎng)交換機(jī)組成,實(shí)現(xiàn)所有節(jié)點(diǎn)之間的管理信息通信。
IPMI管理網(wǎng)絡(luò):配置百兆交換機(jī),共同組成IPMI管理網(wǎng)絡(luò),連接所有本次新增的節(jié)點(diǎn)和原有節(jié)點(diǎn),對整套系統(tǒng)提供IPMI管理服務(wù)。
存儲(chǔ)系統(tǒng):滿足當(dāng)前和未來一段時(shí)間內(nèi)的計(jì)算數(shù)據(jù)存儲(chǔ)需求IO節(jié)點(diǎn):采用浪潮英信NF5220服務(wù)器,服務(wù)器做Raid 1提高節(jié)點(diǎn)數(shù)據(jù)安全性;存儲(chǔ)設(shè)備:浪潮 AS500G3 ,基于8Gb FC光纖盤陣存儲(chǔ)盤陣,提供64TB存儲(chǔ)空間同時(shí),提供高速I/O,保證實(shí)際的應(yīng)用需求;對于所有節(jié)點(diǎn)均配置1+1冗余服務(wù)器專用低功耗節(jié)能電源。圖形工作站:采用了浪潮專業(yè)圖形工作站。配置了2塊熱插拔硬盤,做Raid 1數(shù)據(jù)保護(hù);對于所有節(jié)點(diǎn)均配置1+1冗余服務(wù)器專用低功耗節(jié)能電源。
浪潮提供專業(yè)的的系統(tǒng)管理與作業(yè)調(diào)度系統(tǒng):部署TSJM1.0作業(yè)調(diào)度系統(tǒng),實(shí)現(xiàn)多用戶多作業(yè)的策略調(diào)度,提升資源利用率與管理效率;部署浪潮TSMM3.0監(jiān)控管理軟件,實(shí)現(xiàn)對整套系統(tǒng)的單一映射,從而為系統(tǒng)管理員提供監(jiān)控管理集群中各個(gè)節(jié)點(diǎn)的統(tǒng)一平臺(tái);浪潮TSDM集群部署軟件、浪潮睿捷集群備份軟件;Intel集群編譯、調(diào)試、數(shù)學(xué)庫等軟件、MPI、PVM、Open MP等并行環(huán)境。浪潮提供的系統(tǒng)構(gòu)建方案具有計(jì)算性能卓越、系統(tǒng)運(yùn)行穩(wěn)定可靠、功耗控制領(lǐng)先、監(jiān)控管理系統(tǒng)方便易用、系統(tǒng)開放易于擴(kuò)展、保護(hù)原有建設(shè)投資等特點(diǎn)。
作為領(lǐng)先的高性能計(jì)算產(chǎn)品與應(yīng)用創(chuàng)新領(lǐng)導(dǎo)廠商,浪潮一貫提倡深度挖掘行業(yè)應(yīng)用,提出HPC系統(tǒng)不僅要“好用”,更要“用好”的理念,在清華大學(xué)、吉林大學(xué)、西安交通大學(xué)、山東大學(xué)、華中科技大學(xué)、安徽大學(xué)、中國海洋大學(xué)、山東超算中心等先后建設(shè)了從數(shù)十萬億次到千萬億次的超級(jí)計(jì)算機(jī)平臺(tái),具有豐富的超算系統(tǒng)建設(shè)運(yùn)維經(jīng)驗(yàn)。據(jù)慧聰鄧白氏調(diào)研報(bào)告顯示,2010年浪潮在高校高性能計(jì)算市場占有率第一。
本文來源:
http://666323.cn/article/380.html
[復(fù)制鏈接]
鏈接已復(fù)制