研究实现基于资源隔离与集中控制的IC云平台架构设计。在加速芯片方面,基于标准规范实现对GPU、FPGA、ASIC等异构加速芯片的多平台兼容,支持GPU多实例的灵活划分,平台支持通过管理界面动态调整GPU算力组合,从单卡多实例的细粒度划分,到多机多卡的大规模并行计算,最大限度释放算力资源。完成发明专利申请4项。 完善2条具体技术指标
-
资源隔离粒度:实现细粒度的资源隔离,支持对每个用户或每个任务的资源进行隔离,包括CPU、内存、存储等。同时,还需要支持对GPU等加速芯片的资源隔离,确保每个用户或任务获得足够的加速资源。
-
集中控制功能:实现集中控制功能,包括管理界面、API接口等形式,支持对整个平台的资源进行统一管理和调度。通过管理界面,可以实现对GPU算力组合的动态调整,从而满足不同用户或任务的需求。同时,还需要支持API接口,方便用户通过编程的方式进行资源调度和管理。
原文地址: https://www.cveoy.top/t/topic/siU 著作权归作者所有。请勿转载和采集!