The First Rule of AI Trading Systems: LLMs Do Not Touch the Buy Button
我们把这条规则写成一句话:
LLMs do not touch the buy button.
它不是一句口号,而是一条工程安全边界。因为一旦让语言模型直接触达交易执行接口,你面对的不是“模型偶尔写错”,而是“系统在错误的权限边界下稳定地做错事”。
这篇文章是 research only,not financial advice。并且,backtests are not live performance,not an instruction to trade。
如果你第一次看到 ProBitForge,建议先看项目定位:<https://www.probitforge.com/what-probitforge-is-building/>
1) 先讲清楚:LLM 擅长什么,不擅长什么
LLM 很擅长:
- 写样板代码、重构脚手架、生成文档
- 把分散的信息压缩成结构化摘要
- 在你给定边界条件后产出候选方案
- 帮你做“研究流程”的自动化与流水线化
LLM 不擅长:
- 在真实资金约束下做一致的、可验证的最优决策
- 在输入数据存在噪声、缺失、延迟时保持稳定
- 在压力场景里持续遵循隐含规则(尤其是没有明确写进门禁/约束的规则)
- 为每一次动作提供可审计的证据链
所以,我们给它一个清晰的位置:在执行链路之外,在研究与运维链路之内。
2) 让 LLM 触达买卖按钮,会出现哪些失控模式
下面这些失控模式不是“理论上的担心”,而是工程上高概率发生的事情:
1. 提示词漂移与上下文污染 - 你以为模型在做 A,实际上它在上下文里接收了 B/C/D 的暗示。 - 更糟的是:漂移发生时很难复现,因为上下文是动态的。
2. 把“看起来合理”当成“事实正确” - LLM 的默认输出偏向“自洽叙事”,而不是“证据链正确”。 - 交易系统里,自洽不等于正确,尤其不等于可重复盈利。
3. 对边界条件的隐性忽略 - 例如滑点、费率、最小成交额、合约限制、资金费率异常、交易所风控等。 - 这些边界条件往往不是一句话能讲清的,也不是 prompt 里重复三遍就能保证不出错的。
4. 错误被执行层放大 - 一次错误判断如果能直接触发下单,系统就会把“错误”变成“确定的资金曲线损失”。 - 这不是研究误差,这是执行事故。
3) 真正要做的是:把 LLM 变成“离线脑”和“运维手”
我们推荐的架构是三层分离:
1. 研究层(LLM 可参与) - 选题、文献/资料整理、特征工程思路、实验计划草案 - 生成研究 memo、回测检查清单、风险复盘模板
2. 风控与编排层(LLM 可辅助,但必须门禁化) - 产出候选“意图”(intent)与建议参数范围 - 但所有进入执行层的东西必须通过明确门禁(gates),并落到事实账本里
3. 执行层(LLM 禁止触达) - 只接收结构化的意图与约束 - 只做“能否执行 + 如何稳定执行” - 记录完整的执行事实
这里有个关键点:把“建议”变成“意图”,再把“意图”变成“可执行命令”。
LLM 可以给建议,但它给的建议必须:
- 可被门禁验证
- 可被事实账本记录
- 可被回放与复盘
- 可被拒绝并解释拒绝原因
4) 一条红线落地的工程手段
把“LLM 不触达买卖按钮”落地,你需要的不只是原则,还需要工程手段:
1. 权限隔离(最小权限原则) - LLM 侧没有交易所 key,甚至没有读到 key 的权限。 - LLM 只能写“草稿意图”到一个受控队列或数据库表里。
2. 执行前门禁 - 任意意图进入执行层之前,必须过门禁: - 反过拟合检查(walk-forward / OOS 约束) - 交易次数与样本外覆盖 - 风险阈值(最大回撤、连续亏损、波动异常) - 环境一致性(费用/滑点/流动性约束)
3. 事实账本与审计链 - 你要能追溯:这个意图来自哪个研究结论?哪份报告?哪次运行? - 失败时要能解释:是门禁拒绝了,还是执行失败了,还是交易所拒单了。
4. 人类在环(Human-in-the-loop)用于“发布”,不用于“救火” - 人类审批应该发生在“允许上线/允许执行策略变更”的阶段。 - 不是系统已经出事故了再靠人来救火。
5) 这和“让 AI 帮我们赚钱”并不矛盾
很多人误解这条红线:以为这是否定 AI 的价值。
恰恰相反,我们把 AI 的价值用在更确定的地方:
- 帮我们更快地产出研究假设与实验计划
- 帮我们更严格地执行一致的检查清单与门禁
- 帮我们更低成本地写报告、做复盘、做归档
- 帮我们把“工程纪律”落到脚本和流水线里
最终的目标不是“AI 下单”,而是“系统在正确边界下更稳定地学习与进化”。
6) 和上一条拆分原则的关系
如果你看过我们之前的系统拆分文章,会发现两者是一致的:
- 执行层要稳定、可审计:<https://www.probitforge.com/what-probitforge-is-building/>
- 决策层要门禁化、事实化
- LLM 可以参与决策层的研究与编排,但必须被门禁与权限隔离约束
这篇文章依然是 research only,not financial advice;backtests are not live performance;not an instruction to trade。
下一篇我们会把“意图 + 门禁 + 事实账本”的链路写成一个可复用模板,让每一次策略候选的上线都变得更可控。