AI交易:如何应对闪崩
在近一周的开发和测试后,我刚刚将我的开源LLM交易机器人推向主分支的生产就绪版本,今天我想分享的是,当在真正的市场崩盘中测试AI交易系统时会发生什么。
 
    一键发币: Aptos | X Layer | SUI | SOL | BNB | ETH | BASE | ARB | OP | Polygon | Avalanche | 用AI学区块链开发
在近一周的开发和测试后,我刚刚将我的开源LLM交易机器人推向主分支的生产就绪版本。这次发布是一个重要的里程碑——完全集成Hyperliquid交易所用于实时永续期货交易,一个功能齐全的回测引擎,具有正确的日内精度,以及多个系统提示变体用于测试不同的交易策略。
但与其庆祝挑选出的结果,我更想分享更有价值的东西:当在真正的市场崩盘中测试AI交易系统时会发生什么。
1、发布内容
代码库现在包括三个主要组件:
- Hyperliquid交易所集成 —— 一个完整的客户端模块,处理认证、仓位管理、订单执行和永续期货交易的风险限制。实现包括全面的安全机制和详细的文档,涵盖设置过程、API密钥管理和关键安全考虑因素。如果你勇敢地运行它,请密切注意任何错误……它仍然是进行中的工作……
- 生产级回测引擎 —— 一个复杂的回测系统,使用正确的日内精度处理OHLC数据以触发止损和止盈。它支持多符号投资组合,生成详细的表现指标,并输出全面的JSON报告以及CSV文件以跟踪投资组合状态。
- 系统提示变体 —— 两种不同的提示策略:一种是专注于4小时趋势确认并具有3分钟入场精度的标准方法,另一种是更具攻击性的变体,具有更严格的风控参数。这些作为不同交易哲学实验的起点。
该存储库现在提供了纸面交易和实时执行的完整设置说明,包括Docker脚本,以便在不同环境中可重复地进行回测。
2、在动荡期间的测试
为了压力测试系统,我运行了一个覆盖2025年10月29日至30日的回测——这段时间比特币在大约16.5小时内下跌了4%。这不是一个假设场景和合成数据。这是真实市场数据在实际下跌条件下的情况。
设置:
- 初始资金:10,000美元
- 测试期:10月29日12:30 UTC至10月30日05:00 UTC
- 符号:ETH、SOL、XRP、BTC、DOGE、BNB
- 策略:标准系统提示,每笔交易最大风险为2%
- 模型:DeepSeek-V3.1
结果:
- 最终权益:9,071美元(-9.29%回报)
- 最大回撤:13.11%
- 赢率:6.25%(1次盈利交易,10次亏损)
- 总共执行的交易:17次(16次已关闭)
这些数字讲述了一个关于自动化交易系统和市场波动的重要故事。
3、实际发生了什么
分析投资组合状态CSV文件显示,该机器人在逐渐下降的过程中处理得相当不错。随着价格对仓位不利移动,止损被触发,保持了单个损失在2%的风险容忍范围内。机器人正是按照编程所做——果断地削减损失并继续前进。
直到最后的闪崩。
最后一次剧烈移动触发了多个仓位的同时止损。当几个仓位在几分钟内同时触及止损水平时,损失迅速累积。大部分会话的回撤在这个极端波动的短时间内结晶。
这就是我之前实施的日内精度修复证明其价值的地方。如果没有在蜡烛高/低点而不是仅收盘价上检测到止损触发,这些结果可能会显得人为更好——显示出“幸存”了在实际执行中会被止损的移动的仓位。
关键现实检查:LLM分析模式并执行逻辑,但它们无法预测或对发生在蜡烛中间的流动性事件做出反应。当多个仓位在波动性高峰时同时被止损时,回撤会呈指数级增长。这就是为什么仓位规模和最大同时仓位比预测准确性更重要。
4、AI交易的闪崩问题
这里的基本限制是:大型语言模型基于它们接收到的信息进行分析和决策。它们可以分析市场状况,应用技术指标,并遵循风险管理规则。但它们无法在它们的决策周期之间实时响应发生的事件。
传统的算法交易系统可以在毫秒内对市场数据做出反应。高频交易在微秒尺度上运作。但基于LLM的系统呢?
它们思考。
每个决策周期包括:
- 获取当前市场数据
- 格式化指标和上下文
- 将提示发送到LLM API
- 等待模型处理并返回响应
- 解析决策并执行订单
这需要几秒钟,而不是毫秒。在闪崩期间,这是一段很长的时间。
当BTC在三分钟内下跌2%,而你的机器人每隔几分钟检查一次仓位时,它可能会:
- 错过最初的急剧移动
- 在止损已经触发后才做出反应
- 看到多个资产之间的相关移动
- 看着仓位在它能处理新决策之前更快地变成亏损
这并不是实现上的缺陷——这是LLM操作的基本特征。它们是模式分析器,而不是实时反应系统。
5、对策略设计的意义
理解这个限制塑造了我对未来开发的思考:
波动过滤 —— 我正在考虑添加一个机制,监控ATR(平均真实范围),并在波动率超过一定阈值时减少仓位大小或暂停交易。如果市场剧烈波动,机器人应该知道退避而不是试图通过混乱交易。
最大同时仓位 —— 目前,机器人可以同时在多个交易对上开仓。虽然多样化在正常情况下有所帮助,但在崩溃期间的相关移动意味着多个止损可能同时触发。限制总的同时仓位可以限制极端事件中的最大理论损失。
回撤期间的仓位规模 —— 当账户已经遭受损失时,仓位规模应收缩。10,000美元账户的2%风险是200美元。但9,000美元账户的2%风险应该是180美元,而不是200美元。这可以防止回撤恢复的数学变得难以克服。
紧急电路断路器 —— 如果总的投资组合回撤超过某个阈值(比如单次会话中超过15%),系统应关闭所有仓位并暂停交易,直到人工审查。LLM不会感到恐惧,也不知道何时退出——这些规则必须明确编码。
6、真实的性能现实
让我明确一点:在16.5小时内-9.29%的回报对于市场下跌4%的时期来说并不糟糕。机器人没有炸毁账户。风险管理如预期一样运行。止损正确触发。
但它也没有简单地持有回撤期间的表现。而这才是关键基准:如果主动管理不能在长时间内击败被动暴露,所有复杂性都毫无价值。
在此期间6.25%的胜率尤其引人注目。机器人不仅仅运气不好——它是在与一个设计用于区间交易或较低波动趋势市场的策略对抗强大的趋势。当条件不符合策略的优势时,损失会迅速积累。
这就是为什么透明测试很重要。挑选好的回测时间段来展示结果会误导系统能力的图像。真实的交易意味着应对这样的时期——当你的策略与市场条件不匹配,尽管遵循所有规则,损失却不断累积。
7、完全透明的重要性
我分享这些结果——包括Patrons的原始数据文件,这就是我们学习的方式。每个交易系统都有局限性。每个策略都会经历回撤期。假装不存在对任何人都没有帮助。
如果你正在构建类似的系统或考虑自动化交易,了解失败模式比看到胜利截图更有价值。闪崩情景揭示了:
- 相关移动如何迅速压倒仓位限制
- 为什么日内止损检测精度对现实回测很重要
- LLM系统固有的延迟劣势
- 风险管理如何防止灾难性损失,但无法消除回撤
这些经验教训指导着下一次的开发。
8、前进的道路
代码库现在已经达到了任何人都可以:
- 使用准确的止损/止盈检测进行综合回测
- 使用真实市场数据进行纸面交易以测试策略
- 连接到Hyperliquid进行实时执行(如果你勇敢且了解风险)
但更重要的是,它是一个实验平台。想要测试不同的系统提示吗?修改提示/system_prompt.txt。想要调整风险参数吗?更新仓位规模逻辑。想要看看你的修改表现如何吗?运行回测引擎。
我接下来优先考虑添加波动率过滤器和最大同时仓位限制,特别是为了解决这次崩溃测试揭示的弱点。社区赞助模式意味着开发优先级根据支持者希望看到的内容而变化——并且这种压力测试结果有助于确定哪些功能最有价值。
9、学习更多并参与进来
探索代码:完整的实现可在GitHub上找到 github.com/kojott/LLM-trader-test。克隆它,运行自己的回测,尝试不同的提示策略。包含完整的文档。
观看实时表现:实时仪表板 llmtest.coininspector.pro 显示当前权益曲线、开放仓位和交易历史。
支持开发:该项目通过 Patreon 上的社区赞助不断发展。支持者可以获得早期更新访问权限、对开发优先级的输入以及详细的回测数据。
原文链接:Flash Crashes and AI Trading: Why LLMs Can’t React Fast Enough
DefiPlot翻译整理,转载请标明出处
免责声明:本站资源仅用于学习目的,也不应被视为投资建议,读者在采取任何行动之前应自行研究并对自己的决定承担全部责任。
 
             
            