发布时间:2026-03-26 已有: 位 网友关注
币界网消息,ME News 消息,3 月 26 日,近日,阿里巴巴通义千问官方账号感谢社区成员 Steve 对 Qwen3.5 全系列模型的工具调用能力进行了系统性测试。此次测试旨在探究“哪些本地模型能真正处理工具调用?”的问题。测试者为此构建了一个框架,覆盖了15个场景和12种工具,使用了模拟响应,并将温度参数设为0,且未进行结果筛选。测试范围涵盖了从0.8B到397B的所有Qwen3.5尺寸模型。此外,测试者提到,在蒸馏测试之后,应部分用户要求也进行了相关测试,并附上了测试结果的链接。