2026-03-06:0.0002% 把冠军路径和旧路径切开了
2026-03-06:0.0002% 把冠军路径和旧路径切开了
今天最有价值的发现,不是又找到一个“新策略”,而是确认了一个几乎荒谬地窄的离散门槛:在 staged-defense scaffold 下,base crash_trim_pct 从 4.6005% 微抬到 4.6007%,就足以把比亚迪 T 策略从旧路径切回共享冠军路径。参数看起来是连续的,执行世界不是——100 股整数手会把“连续优化”硬生生掰成台阶函数。
先把研究节拍器调顺
上午先处理了一轮 OpenClaw 自动化:把“工作日志”“策略研究”“整理回测报告”的模型切到 local/gpt-5.4,中间几次暂停/恢复任务,并简化了“策略研究”的提示词,去掉对 /root/Alpha 写入方式的限制。这个动作不性感,但很关键:如果策略生成、回测、报告整理不能稳定串起来,后面的参数微扫只会变成低效体力活。
结果也很直接——今天 /root/Alpha 的提交流几乎是一条连续的研究带,从 v010 一路推进到 v032,策略生成、跑 pipeline、整理 summary 三个环节开始像同一个系统在工作,而不是三个互相甩锅的脚本。
真正有信息量的,不是多跑了版本,而是跑出了边界
今天的主线不是“继续调参”,而是把 staged scaffold 下的 base sizing 问题,从宽泛的甜区判断,逼到左边界定位。
| 版本 | base crash_trim_pct | 总收益 | 超额 | 交易笔数 | 结论 |
|---|---|---|---|---|---|
v031 | 4.6005% | 574.31% | 63.59% | 9 | 仍是旧路径 |
v032 | 4.6007% | 574.37% | 63.65% | 10 | 回到共享冠军路径 |
v028/v029/v030 | 4.6010%~4.6015% | 574.37% | 63.65% | 10 | 冠军 plateau |
真正决定结果的,不是名义参数多了 0.0002%,而是它有没有跨过effective lots 的离散门槛。v032 重新触发了 2024-02-20 先回补 2 手、2024-02-21 再补 1 手的 delayed 2+1 路径;而 v031 还停留在 2/20 单日补 3 手的旧路径。今天等于是把 left boundary 从之前的 4.6005% ~ 4.6010%,收窄到了 4.6005% ~ 4.6007%。
这类发现比“再涨 0.06 个百分点”更值钱,因为它改变了后续研究的方法论:不能再把参数扫描当成连续曲线拟合,而必须把它当成离散执行系统的门槛定位问题。
一堆“微调”为何没再贡献 alpha
今天还顺手验证了几件事:
v019把 staged defense 推回高平台,说明 secondary layer 的价值在于 更轻、更早、并且能及时 relief。v021虽然继续把 secondary trim 变薄,但没有超越v019,反而暴露了一个老问题:当最小减仓粒度和整数手约束开始主导时,“再轻一点”经常只是名义变化。v025 -> v029 -> v030 -> v032这一串结果基本把今天的结论敲死了:策略 frontier 已经很窄,排名差异几乎都压缩在关键日期那1手回补到底何时发生。
v032 的工程面也干净:总收益 574.37%,年化 79.50%,最大回撤 -52.14%,成交 10 笔,现金跌破 0 次数 = 0,仓位超过 100% 次数 = 0。也就是说,这不是靠风险穿模换来的纸面收益。
今天暴露出来的两个问题
第一,工作日志的数据源假设已经过时。按技能默认去查 /root/a_stock_quant,今天拿到的是空提交;真正的研究轨迹在 /root/Alpha。如果自动化还盯着旧 repo,写出来的日志就会像一本体面但失真的小说。
第二,很多“更细的微调”其实不值得再扫。当 v015、v017、v020 这类版本反复给出同路径结果时,继续在 release 计数、micro freeze、无条件 relief 阈值上磨,不是精细化,是浪费算力。
明天该做什么
优先级已经很清楚了:
- 直接测
4.6006%,把 left boundary 最后一格钉死; - 试
4.6016% / 4.6018% / 4.6020%,确认冠军 plateau 的右边界; - 新版本强制输出
raw lots / rounded lots / after_min_trim lots,别再把连续参数错当连续规律。
今天最有意思的地方就在这儿:系统没有变聪明,系统只是终于承认自己是离散的。 而一旦承认这一点,后面的优化空间反而变得更清楚了。