当前位置:主页 > 推荐 > 正文

GLM5.1REAP系列模型发布,提供多种量化与剪枝变体

发布时间:2026-04-22 已有: 位 网友关注

  币界网消息,4 月 22 日,近日,基于7440亿参数BF16模型GLM-5.1,GLM-5.1 REAP系列模型发布。该系列通过REAP剪枝和多种量化技术生成,旨在适配不同硬件。REAP剪枝通过评估混合专家模型中每个专家的贡献度,移除贡献最低的专家并重新编号路由门,以最小化质量损失。系列提供了包括BF16、NVFP4、GPTQ W4A16及GGUF格式在内的多种核心变体,参数规模从约285GB到1125GB不等,分别针对Hopper、Ampere、Blackwell等不同架构的GPU或CPU进行优化。所有模型均使用MIT许可证,并可通过sglang、vLLM或llama.cpp等引擎部署。

温馨提示:所有理财类资讯内容仅供参考,不作为投资依据。