系統(tǒng)介紹
隨著數(shù)字經(jīng)濟(jì)發(fā)展和數(shù)據(jù)量爆發(fā)式增長(zhǎng),眾多研究和實(shí)際應(yīng)用領(lǐng)域需要超級(jí)計(jì)算和智能計(jì)算相結(jié)合進(jìn)行跨學(xué)科研究,異構(gòu)算力調(diào)度系統(tǒng)可通過對(duì)包括CPU、GPU等多種算力的調(diào)度使得一定范圍內(nèi)算力需求和供給達(dá)到平衡,同時(shí)可高效利用計(jì)算資源。
![1705949882183156.png 04-04-1.png]()
功能方案
1)適配層:通過構(gòu)建多種調(diào)度執(zhí)行服務(wù)和能力接口,對(duì)接超算和智算的云管平臺(tái)和計(jì)算節(jié)點(diǎn),進(jìn)行異構(gòu)算力能力接入。
2)能力層:提供異構(gòu)算力設(shè)施管理、混合調(diào)度、作業(yè)管理、異構(gòu)算力觀測(cè)等功能,實(shí)現(xiàn)異構(gòu)資源的統(tǒng)一管理、智能調(diào)度、一體監(jiān)控。
3)開發(fā)層:提供異構(gòu)算力調(diào)度開放能力,包括作業(yè)中心、客戶數(shù)據(jù)接口、算力查詢能力、數(shù)據(jù)上傳/下載能力、模型上傳/下載能力、鏡像部署能力等內(nèi)容。
技術(shù)特點(diǎn)
1、云原生技術(shù);
2、微服務(wù):采用微服務(wù)架構(gòu)設(shè)計(jì),能夠快速響應(yīng)業(yè)務(wù)變化,確保系統(tǒng)的高可用性和可擴(kuò)展性;
3、豐富的調(diào)度策略:支持負(fù)載均衡、資源限制、Gang調(diào)度、搶占調(diào)度、預(yù)留調(diào)度、回填調(diào)度等調(diào)度算法。
應(yīng)用場(chǎng)景
針對(duì)政府、電信運(yùn)營(yíng)商、科研機(jī)構(gòu)等各類有算力調(diào)度需求的企業(yè),如為生物、新型材料行業(yè)的計(jì)算機(jī)模擬、數(shù)據(jù)分析、科學(xué)計(jì)算、AI訓(xùn)練和推理等計(jì)算場(chǎng)景提供多租戶、多種作業(yè)任務(wù)管理、多資源池并網(wǎng)、多種異構(gòu)算力統(tǒng)一管理和智能調(diào)度的完整解決方案。