人工智能容器管理平臺(tái)主要負(fù)責(zé)對(duì)物理資源、虛擬資源、容器資源進(jìn)行管理和調(diào)度,其物理資源池由物理主機(jī)(CPU、GPU、AI、FPGA)和存儲(chǔ)設(shè)備組成。資源管理功能需要對(duì)物理機(jī)、虛擬機(jī)進(jìn)行管理,實(shí)現(xiàn)異構(gòu)資源統(tǒng)一納管、異構(gòu)資源虛擬化、資源結(jié)構(gòu)部署、硬件狀態(tài)實(shí)時(shí)監(jiān)控、網(wǎng)絡(luò)狀態(tài)監(jiān)控、實(shí)時(shí)告警通知及日志等綜合管理;容器管理需要實(shí)現(xiàn)容器狀態(tài)監(jiān)控、容器生命周期管理、容器智能調(diào)度、容器服務(wù)管理、告警及日志收集等綜合管理;通過(guò)基礎(chǔ)資源的管理,為AI技術(shù)提供智能部署、服務(wù)輸出、算力優(yōu)配等支撐,提供統(tǒng)一的標(biāo)準(zhǔn)服務(wù)接口。