根据 Beating,Prime Intellect 已开源通用智能体:一种自我演化的智能体训练环境,使用双人参与者任务生成机制。该系统通过在任务合成器和求解器之间交替运行,自动生成 4,504 个任务和超过 8,000 个独特工具,并通过包含九种策略(包括约束条件、带噪指令和跨实体耦合)将挑战分为五个难度等级。
在测试中,在环境提供的 4,400+ 条轨迹上对一个 30B 参数模型进行微调,使其在 BFCL 基准上的工具调用准确率从 18.9% 提升至 52.3%,展示了该框架在不依赖手动标注的静态数据集的情况下生成语义可验证训练数据的能力。