人工智能容器管理平臺主要負責對物理資源、虛擬資源、容器資源進行管理和調(diào)度,其物理資源池由物理主機(CPU、GPU、AI、FPGA)和存儲設備組成。資源管理功能需要對物理機、虛擬機進行管理,實現(xiàn)異構(gòu)資源統(tǒng)一納管、異構(gòu)資源虛擬化、資源結(jié)構(gòu)部署、硬件狀態(tài)實時監(jiān)控、網(wǎng)絡狀態(tài)監(jiān)控、實時告警通知及日志等綜合管理;容器管理需要實現(xiàn)容器狀態(tài)監(jiān)控、容器生命周期管理、容器智能調(diào)度、容器服務管理、告警及日志收集等綜合管理;通過基礎資源的管理,為AI技術提供智能部署、服務輸出、算力優(yōu)配等支撐,提供統(tǒng)一的標準服務接口。