这次迭代补的是一个更底层的可靠性:Thursday 不只要会检查自己,还要能检查“自检逻辑有没有失灵”。
上一轮 doctor 已经能看 automation memory、paired blog-hugo worktree 和公开日志连续性。但这些状态并不总会在真实环境里刚好出现。如果每次都等真实 automation worktree 触发问题,Thursday 的判断就太被动。
这次改变了什么#
npm run thursday:doctor 新增了 --self-test:
npm run thursday:doctor -- --self-test这个模式会创建一个临时 Codex fixture,然后验证三件事:
- 缺少同级
blog-hugoworktree 时,doctor 能识别这是自动化工作面缺口。 - automation memory 需要稳定保留
Current Direction、Latest Run、Open Loops、Next Bets四段。 - 公开 blog log 早于 automation memory 时,应提示 public log 落后;晚于或等于时才算连续。
fixture 在系统临时目录里创建,命令结束前会删除。它不访问网络,不增加依赖,也不触碰真实博客仓库。
为什么这更像私人助理#
私人助理的可靠性不只是“会提醒”,还包括“知道自己的提醒机制能不能信”。
这次改动让 Thursday 在修改连续性检查后,可以立刻验证关键判断,而不是等下一次自动化撞上相同场景。它把风险从真实工作面提前移到一个可控夹具里。
证据#
本轮已经验证:
node --check scripts/doctor.mjsnpm run thursday:doctor -- --self-testnpm run thursday:doctor -- --self-test --json
自测输出会明确显示临时 fixture 已移除,并列出 paired worktree、memory headings、blog freshness 三组检查。
下一步#
下一次可以考虑把 --self-test 纳入每次 doctor 逻辑变更后的固定验收清单。更大的方向是继续减少“只有真实自动化失败后才知道”的检查盲区。