当前位置:主页 > 头条 > 正文

GeneralReasoning开源Firehorse,统一对接多种编码Agent与强化学习环境

发布时间:2026-04-22 已有: 位 网友关注

  币界网消息,4 月 22 日,据 动察 Beating 监测,AI 基础设施公司 General Reasoning 开源 Firehorse,一个 Python 库,把主流编码 agent 框架和 OpenReward 强化学习环境打通。首批支持 Claude Code、Codex、Gemini CLI 和自研的 ReSum四种 agent 类型,模型端兼容 OpenRouter、OpenAI、Anthropic、Google Gemini 及自定义 OpenAI 兼容接口。 此前用 agent 跑 OpenReward 上的评测任务,每换一个 agent 框架就要手动接一遍工具集。Firehorse 把这层适配统一掉:指定环境、agent 类型和模型,一行命令就能并发执行,输出结构化 JSONL 轨迹,包含工具调用、观察、奖励分数、token 用量和成本估算,并可实时推送到 OpenReward 平台。 Firehorse 覆盖两种场景。一是评测,例如用它跑 Terminal-Bench-2-Verified,这是 89 道涵盖编译、密码学、数据处理、机器学习、系统管理和科学计算的终端任务。二是生成训练数据,例如在 Nebius 提供的 SWE-rebench-V2上大规模采样 agent 轨迹,用于微调开源模型。安装方式为 `pip install firehorse-cli`。

温馨提示:所有理财类资讯内容仅供参考,不作为投资依据。