08 May 2026 阅读时间 5 分钟 Risk

The First Rule of AI Trading Systems: LLMs Do Not Touch the Buy Button

LLM 可以写代码、总结研究、生成报告，但它不应该直接触达下单接口。把“语言模型”隔离在买卖按钮之外，是 AI 交易系统最重要的安全边界。

我们把这条规则写成一句话：

LLMs do not touch the buy button.

它不是一句口号，而是一条工程安全边界。因为一旦让语言模型直接触达交易执行接口，你面对的不是“模型偶尔写错”，而是“系统在错误的权限边界下稳定地做错事”。

这篇文章是 research only，not financial advice。并且，backtests are not live performance，not an instruction to trade。

如果你第一次看到 ProBitForge，建议先看项目定位：<https://www.probitforge.com/what-probitforge-is-building/>

1) 先讲清楚：LLM 擅长什么，不擅长什么

LLM 很擅长：

写样板代码、重构脚手架、生成文档
把分散的信息压缩成结构化摘要
在你给定边界条件后产出候选方案
帮你做“研究流程”的自动化与流水线化

LLM 不擅长：

在真实资金约束下做一致的、可验证的最优决策
在输入数据存在噪声、缺失、延迟时保持稳定
在压力场景里持续遵循隐含规则（尤其是没有明确写进门禁/约束的规则）
为每一次动作提供可审计的证据链

所以，我们给它一个清晰的位置：在执行链路之外，在研究与运维链路之内。

2) 让 LLM 触达买卖按钮，会出现哪些失控模式

下面这些失控模式不是“理论上的担心”，而是工程上高概率发生的事情：

1. 提示词漂移与上下文污染 - 你以为模型在做 A，实际上它在上下文里接收了 B/C/D 的暗示。 - 更糟的是：漂移发生时很难复现，因为上下文是动态的。

2. 把“看起来合理”当成“事实正确” - LLM 的默认输出偏向“自洽叙事”，而不是“证据链正确”。 - 交易系统里，自洽不等于正确，尤其不等于可重复盈利。

3. 对边界条件的隐性忽略 - 例如滑点、费率、最小成交额、合约限制、资金费率异常、交易所风控等。 - 这些边界条件往往不是一句话能讲清的，也不是 prompt 里重复三遍就能保证不出错的。

4. 错误被执行层放大 - 一次错误判断如果能直接触发下单，系统就会把“错误”变成“确定的资金曲线损失”。 - 这不是研究误差，这是执行事故。

3) 真正要做的是：把 LLM 变成“离线脑”和“运维手”

我们推荐的架构是三层分离：

1. 研究层（LLM 可参与） - 选题、文献/资料整理、特征工程思路、实验计划草案 - 生成研究 memo、回测检查清单、风险复盘模板

2. 风控与编排层（LLM 可辅助，但必须门禁化） - 产出候选“意图”（intent）与建议参数范围 - 但所有进入执行层的东西必须通过明确门禁（gates），并落到事实账本里

3. 执行层（LLM 禁止触达） - 只接收结构化的意图与约束 - 只做“能否执行 + 如何稳定执行” - 记录完整的执行事实

这里有个关键点：把“建议”变成“意图”，再把“意图”变成“可执行命令”。

LLM 可以给建议，但它给的建议必须：

可被门禁验证
可被事实账本记录
可被回放与复盘
可被拒绝并解释拒绝原因

4) 一条红线落地的工程手段

把“LLM 不触达买卖按钮”落地，你需要的不只是原则，还需要工程手段：

1. 权限隔离（最小权限原则） - LLM 侧没有交易所 key，甚至没有读到 key 的权限。 - LLM 只能写“草稿意图”到一个受控队列或数据库表里。

2. 执行前门禁 - 任意意图进入执行层之前，必须过门禁： - 反过拟合检查（walk-forward / OOS 约束） - 交易次数与样本外覆盖 - 风险阈值（最大回撤、连续亏损、波动异常） - 环境一致性（费用/滑点/流动性约束）

3. 事实账本与审计链 - 你要能追溯：这个意图来自哪个研究结论？哪份报告？哪次运行？ - 失败时要能解释：是门禁拒绝了，还是执行失败了，还是交易所拒单了。

4. 人类在环（Human-in-the-loop）用于“发布”，不用于“救火” - 人类审批应该发生在“允许上线/允许执行策略变更”的阶段。 - 不是系统已经出事故了再靠人来救火。

5) 这和“让 AI 帮我们赚钱”并不矛盾

很多人误解这条红线：以为这是否定 AI 的价值。

恰恰相反，我们把 AI 的价值用在更确定的地方：

帮我们更快地产出研究假设与实验计划
帮我们更严格地执行一致的检查清单与门禁
帮我们更低成本地写报告、做复盘、做归档
帮我们把“工程纪律”落到脚本和流水线里

最终的目标不是“AI 下单”，而是“系统在正确边界下更稳定地学习与进化”。

6) 和上一条拆分原则的关系

如果你看过我们之前的系统拆分文章，会发现两者是一致的：

执行层要稳定、可审计：<https://www.probitforge.com/what-probitforge-is-building/>
决策层要门禁化、事实化
LLM 可以参与决策层的研究与编排，但必须被门禁与权限隔离约束

这篇文章依然是 research only，not financial advice；backtests are not live performance；not an instruction to trade。

下一篇我们会把“意图 + 门禁 + 事实账本”的链路写成一个可复用模板，让每一次策略候选的上线都变得更可控。

1) 先讲清楚：LLM 擅长什么，不擅长什么

2) 让 LLM 触达买卖按钮，会出现哪些失控模式

3) 真正要做的是：把 LLM 变成“离线脑”和“运维手”

4) 一条红线落地的工程手段

5) 这和“让 AI 帮我们赚钱”并不矛盾

6) 和上一条拆分原则的关系

You might also like...

ResumeGovernor: Root Cause Analysis of an Auto-Pause That Refused to Resume

Building a Self-Evolving Trading Research System

A Risk Log Template for Crypto Bots

Building a Memory Layer for Trading Research with Qdrant

How We Judge a Strategy Candidate Before Dry Run