月之暗面Kimi联合清华大学等开源共建大模型推理架构Mooncake
月之暗面科技有限公司与清华大学MADSys实验室联合发布了名为Mooncake的开源项目,该项目旨在构建以KVCache为中心的大模型推理架构。项目采用分阶段开源方式,逐步开源高性能KVCache多级缓存Mooncake Store的实现,并兼容各类推理引擎和底层存储/传输资源,旨在为大模型时代打造新型高性能内存语义存储的标准接口和参考实现方案。
月之暗面科技有限公司与清华大学MADSys实验室联合发布了名为Mooncake的开源项目,该项目旨在构建以KVCache为中心的大模型推理架构。项目采用分阶段开源方式,逐步开源高性能KVCache多级缓存Mooncake Store的实现,并兼容各类推理引擎和底层存储/传输资源,旨在为大模型时代打造新型高性能内存语义存储的标准接口和参考实现方案。