Codex 使用手写代码在流体控制方面优于 DRL,总成本为 14 美元

根据 Beating,OpenAI 训练后研究员 Paul Garnier 证明 Codex 5.5 能够在流体力学应用中生成可解释的控制代码,并在表现上优于深度强化学习基线。Garnier 并非训练神经网络,而是通过分析物理仿真,利用该模型对 Python 脚本进行迭代式精炼,在超过一半的测试场景中取得了更优的性能。

由 AI 生成的控制规则具有物理层面的可解释性,例如“当局部曲率超过阈值时延迟喷注”。与神经网络黑盒不同,这种基于代码的方法在分布发生变化时表现出更强的鲁棒性;当测试时长延长 4 倍时,传统的 DRL 模型崩溃了,而引入物理信息的代码仍保持稳定。实现完整控制策略消耗了 2100 万 tokens,总计低于 14 美元。

免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论