发布时间:2026-05-27 已有: 位 网友关注
币界网消息,Math-AI团队发布了MathCode 0.2.0,采用前缀缓存请求整形与策略控制,将API成本降低达90%。新版本针对大模型在长程证明和多轮交互中的高额开销,优化提示词结构稳定性以提升prompt缓存命中率。该版本引入了前缀缓存请求整形诊断与策略控制机制,系统屏蔽提示词头部归属以保障结构稳定性,新增多断点缓存、显式最小前缀网关与空闲感知策略,通过底层请求形状对齐最大化原生缓存命中率,将长会话账单压至一成。此外,系统支持设定token预算上限,并限制嵌套命令上限防范无限循环,证明会话支持动态调整思考深度,提供不同等级别的思考深度选择。新版本还支持外接编译器作为子进程常驻运行,并将编译检查请求路由至相应接口,降低部署门槛。