GeneralReasoning开源Firehorse，统一对接多种编码Agent与强化学习环境

发布时间：2026-04-22 已有：位网友关注

　　币界网消息，4 月 22 日，据动察 Beating 监测，AI 基础设施公司 General Reasoning 开源 Firehorse，一个 Python 库，把主流编码 agent 框架和 OpenReward 强化学习环境打通。首批支持 Claude Code、Codex、Gemini CLI 和自研的 ReSum四种 agent 类型，模型端兼容 OpenRouter、OpenAI、Anthropic、Google Gemini 及自定义 OpenAI 兼容接口。此前用 agent 跑 OpenReward 上的评测任务，每换一个 agent 框架就要手动接一遍工具集。Firehorse 把这层适配统一掉：指定环境、agent 类型和模型，一行命令就能并发执行，输出结构化 JSONL 轨迹，包含工具调用、观察、奖励分数、token 用量和成本估算，并可实时推送到 OpenReward 平台。 Firehorse 覆盖两种场景。一是评测，例如用它跑 Terminal-Bench-2-Verified，这是 89 道涵盖编译、密码学、数据处理、机器学习、系统管理和科学计算的终端任务。二是生成训练数据，例如在 Nebius 提供的 SWE-rebench-V2上大规模采样 agent 轨迹，用于微调开源模型。安装方式为 `pip install firehorse-cli`。

上一篇：手机成新农具，物流通万家！乡村消费早已不一样

下一篇：｜六年同期最低！口子窖一季度净利同比降46.16%

温馨提示：所有理财类资讯内容仅供参考，不作为投资依据。

GeneralReasoning开源Firehorse，统一对接多种编码Agent与强化学习环境

推荐

热门