2026-03-06：0.0002% 把冠军路径和旧路径切开了

今天最有价值的发现，不是又找到一个“新策略”，而是确认了一个几乎荒谬地窄的离散门槛：在 staged-defense scaffold 下，base crash_trim_pct 从 4.6005% 微抬到 4.6007%，就足以把比亚迪 T 策略从旧路径切回共享冠军路径。参数看起来是连续的，执行世界不是——100 股整数手会把“连续优化”硬生生掰成台阶函数。

先把研究节拍器调顺

上午先处理了一轮 OpenClaw 自动化：把“工作日志”“策略研究”“整理回测报告”的模型切到 local/gpt-5.4，中间几次暂停/恢复任务，并简化了“策略研究”的提示词，去掉对 /root/Alpha 写入方式的限制。这个动作不性感，但很关键：如果策略生成、回测、报告整理不能稳定串起来，后面的参数微扫只会变成低效体力活。

结果也很直接——今天 /root/Alpha 的提交流几乎是一条连续的研究带，从 v010 一路推进到 v032，策略生成、跑 pipeline、整理 summary 三个环节开始像同一个系统在工作，而不是三个互相甩锅的脚本。

真正有信息量的，不是多跑了版本，而是跑出了边界

今天的主线不是“继续调参”，而是把 staged scaffold 下的 base sizing 问题，从宽泛的甜区判断，逼到左边界定位。

版本	base `crash_trim_pct`	总收益	超额	交易笔数	结论
`v031`	`4.6005%`	`574.31%`	`63.59%`	`9`	仍是旧路径
`v032`	`4.6007%`	`574.37%`	`63.65%`	`10`	回到共享冠军路径
`v028/v029/v030`	`4.6010%~4.6015%`	`574.37%`	`63.65%`	`10`	冠军 plateau

真正决定结果的，不是名义参数多了 0.0002%，而是它有没有跨过effective lots 的离散门槛。v032 重新触发了 2024-02-20 先回补 2 手、2024-02-21 再补 1 手的 delayed 2+1 路径；而 v031 还停留在 2/20 单日补 3 手的旧路径。今天等于是把 left boundary 从之前的 4.6005% ~ 4.6010%，收窄到了 4.6005% ~ 4.6007%。

这类发现比“再涨 0.06 个百分点”更值钱，因为它改变了后续研究的方法论：不能再把参数扫描当成连续曲线拟合，而必须把它当成离散执行系统的门槛定位问题。

一堆“微调”为何没再贡献 alpha

今天还顺手验证了几件事：

v019 把 staged defense 推回高平台，说明 secondary layer 的价值在于 更轻、更早、并且能及时 relief。
v021 虽然继续把 secondary trim 变薄，但没有超越 v019，反而暴露了一个老问题：当最小减仓粒度和整数手约束开始主导时，“再轻一点”经常只是名义变化。
v025 -> v029 -> v030 -> v032 这一串结果基本把今天的结论敲死了：策略 frontier 已经很窄，排名差异几乎都压缩在关键日期那 1 手回补到底何时发生。

v032 的工程面也干净：总收益 574.37%，年化 79.50%，最大回撤 -52.14%，成交 10 笔，现金跌破 0 次数 = 0，仓位超过 100% 次数 = 0。也就是说，这不是靠风险穿模换来的纸面收益。

今天暴露出来的两个问题

第一，工作日志的数据源假设已经过时。按技能默认去查 /root/a_stock_quant，今天拿到的是空提交；真正的研究轨迹在 /root/Alpha。如果自动化还盯着旧 repo，写出来的日志就会像一本体面但失真的小说。

第二，很多“更细的微调”其实不值得再扫。当 v015、v017、v020 这类版本反复给出同路径结果时，继续在 release 计数、micro freeze、无条件 relief 阈值上磨，不是精细化，是浪费算力。

明天该做什么

优先级已经很清楚了：

直接测 4.6006%，把 left boundary 最后一格钉死；
试 4.6016% / 4.6018% / 4.6020%，确认冠军 plateau 的右边界；
新版本强制输出 raw lots / rounded lots / after_min_trim lots，别再把连续参数错当连续规律。

今天最有意思的地方就在这儿：系统没有变聪明，系统只是终于承认自己是离散的。 而一旦承认这一点，后面的优化空间反而变得更清楚了。