阅读时间 5 分钟

The First Rule of AI Trading Systems: LLMs Do Not Touch the Buy Button

LLM 可以写代码、总结研究、生成报告,但它不应该直接触达下单接口。把“语言模型”隔离在买卖按钮之外,是 AI 交易系统最重要的安全边界。

我们把这条规则写成一句话:

LLMs do not touch the buy button.

它不是一句口号,而是一条工程安全边界。因为一旦让语言模型直接触达交易执行接口,你面对的不是“模型偶尔写错”,而是“系统在错误的权限边界下稳定地做错事”。

这篇文章是 research only,not financial advice。并且,backtests are not live performance,not an instruction to trade。

如果你第一次看到 ProBitForge,建议先看项目定位:<https://www.probitforge.com/what-probitforge-is-building/>

1) 先讲清楚:LLM 擅长什么,不擅长什么

LLM 很擅长:

  • 写样板代码、重构脚手架、生成文档
  • 把分散的信息压缩成结构化摘要
  • 在你给定边界条件后产出候选方案
  • 帮你做“研究流程”的自动化与流水线化

LLM 不擅长:

  • 在真实资金约束下做一致的、可验证的最优决策
  • 在输入数据存在噪声、缺失、延迟时保持稳定
  • 在压力场景里持续遵循隐含规则(尤其是没有明确写进门禁/约束的规则)
  • 为每一次动作提供可审计的证据链

所以,我们给它一个清晰的位置:在执行链路之外,在研究与运维链路之内

2) 让 LLM 触达买卖按钮,会出现哪些失控模式

下面这些失控模式不是“理论上的担心”,而是工程上高概率发生的事情:

1. 提示词漂移与上下文污染 - 你以为模型在做 A,实际上它在上下文里接收了 B/C/D 的暗示。 - 更糟的是:漂移发生时很难复现,因为上下文是动态的。

2. 把“看起来合理”当成“事实正确” - LLM 的默认输出偏向“自洽叙事”,而不是“证据链正确”。 - 交易系统里,自洽不等于正确,尤其不等于可重复盈利。

3. 对边界条件的隐性忽略 - 例如滑点、费率、最小成交额、合约限制、资金费率异常、交易所风控等。 - 这些边界条件往往不是一句话能讲清的,也不是 prompt 里重复三遍就能保证不出错的。

4. 错误被执行层放大 - 一次错误判断如果能直接触发下单,系统就会把“错误”变成“确定的资金曲线损失”。 - 这不是研究误差,这是执行事故。

3) 真正要做的是:把 LLM 变成“离线脑”和“运维手”

我们推荐的架构是三层分离:

1. 研究层(LLM 可参与) - 选题、文献/资料整理、特征工程思路、实验计划草案 - 生成研究 memo、回测检查清单、风险复盘模板

2. 风控与编排层(LLM 可辅助,但必须门禁化) - 产出候选“意图”(intent)与建议参数范围 - 但所有进入执行层的东西必须通过明确门禁(gates),并落到事实账本里

3. 执行层(LLM 禁止触达) - 只接收结构化的意图与约束 - 只做“能否执行 + 如何稳定执行” - 记录完整的执行事实

这里有个关键点:把“建议”变成“意图”,再把“意图”变成“可执行命令”

LLM 可以给建议,但它给的建议必须:

  • 可被门禁验证
  • 可被事实账本记录
  • 可被回放与复盘
  • 可被拒绝并解释拒绝原因

4) 一条红线落地的工程手段

把“LLM 不触达买卖按钮”落地,你需要的不只是原则,还需要工程手段:

1. 权限隔离(最小权限原则) - LLM 侧没有交易所 key,甚至没有读到 key 的权限。 - LLM 只能写“草稿意图”到一个受控队列或数据库表里。

2. 执行前门禁 - 任意意图进入执行层之前,必须过门禁: - 反过拟合检查(walk-forward / OOS 约束) - 交易次数与样本外覆盖 - 风险阈值(最大回撤、连续亏损、波动异常) - 环境一致性(费用/滑点/流动性约束)

3. 事实账本与审计链 - 你要能追溯:这个意图来自哪个研究结论?哪份报告?哪次运行? - 失败时要能解释:是门禁拒绝了,还是执行失败了,还是交易所拒单了。

4. 人类在环(Human-in-the-loop)用于“发布”,不用于“救火” - 人类审批应该发生在“允许上线/允许执行策略变更”的阶段。 - 不是系统已经出事故了再靠人来救火。

5) 这和“让 AI 帮我们赚钱”并不矛盾

很多人误解这条红线:以为这是否定 AI 的价值。

恰恰相反,我们把 AI 的价值用在更确定的地方:

  • 帮我们更快地产出研究假设与实验计划
  • 帮我们更严格地执行一致的检查清单与门禁
  • 帮我们更低成本地写报告、做复盘、做归档
  • 帮我们把“工程纪律”落到脚本和流水线里

最终的目标不是“AI 下单”,而是“系统在正确边界下更稳定地学习与进化”。

6) 和上一条拆分原则的关系

如果你看过我们之前的系统拆分文章,会发现两者是一致的:

  • 执行层要稳定、可审计:<https://www.probitforge.com/what-probitforge-is-building/>
  • 决策层要门禁化、事实化
  • LLM 可以参与决策层的研究与编排,但必须被门禁与权限隔离约束

这篇文章依然是 research only,not financial advice;backtests are not live performance;not an instruction to trade。

下一篇我们会把“意图 + 门禁 + 事实账本”的链路写成一个可复用模板,让每一次策略候选的上线都变得更可控。