Files
reporting-governance-plugin/WORKFLOW.md

142 lines
7.8 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
## Subagent Timeout Rule
Subagent 指派後 **5 分鐘內若無結果**
1. 立刻查狀態done / active
2. 若無結果回拋或疑似轉發失敗 → **立刻重派**(不等待)
3. 若已 done 但結果未送達 → 以 `sessions_history` 直接拉取並同步到 Forum / 回覆
4. **同時立即向總管回報**,不可黑洞
## Communication Rule
- 先講結論
- 回覆簡短
- 若失敗,直接明講失敗與目前狀態
- 不要把失敗包裝成「進行中」
- **任何需要重啟 gateway 的動作,必須先取得總管明確同意,不能先做後報**
## Long-Task Governor Rule
- 只要工作**不是 ordinary single-turn general chat**,就必須套用 `skills/long-task-governor/SKILL.md`
- ordinary general chat 的判準:只有在「可單輪完整回完、無後續追蹤、無外部等待、無查檔/查系統/查資料、無 task state、無 checkpoint、無 subagent、無做到一半中間態」全部成立時才可視為一般 chat。
- **只要任一條件不成立,就視為 long task**。
- 一旦進入 long task
- 必須建立或更新最小 task record
- 必須使用五種正式狀態之一:`active / waiting_user / blocked / paused / pending_verification`
- 必須遵守 checkpoint 五欄格式
- 必須遵守 no-fake-progress 與 stop-clock gate
- 若回覆前其實已進入非一般 chat 工作流,卻仍以「普通聊天」方式直接回完,視為流程違規。
## Checkpoint Rule
- checkpoint **不是結案**;它只是長任務中的階段回報,不代表可以在送出後直接停住。
- checkpoint 發出後,只能進入以下其中一種狀態:
- **繼續執行**
- **待您回覆**
- **阻塞中**
- **Pending Verification**
- **禁止 checkpoint 後靜默停住**。若沒有後續行動、沒有明確等待對象、也沒有狀態轉移,則不應送出該 checkpoint。
- 每次 long task checkpoint 一律固定包含以下五欄:
- **目前狀態**
- **本段完成**
- **下一步**
- **下次回報條件**
- **是否需要您介入**
- 若 checkpoint 已承諾回報條件、時間點或觸發事件,但後續未依承諾履行,視為 **`checkpoint 失續`**。
- 若任務尚未結束,就必須在 checkpoint 後明確持續執行、等待回覆、標記阻塞,或進入 Pending Verification不得用 checkpoint 取代後續推進。
## Watchdog Rule
- **Checkpoint / gate / 自查** 是給 Eve 自己的內部規則;**watchdog** 則是外部巡查機制,兩者不能混為一談。
- watchdog 必須**獨立於 Eve 自己的記憶與自我提醒**;不能把「我心裡記得 10 分鐘要回報」當成 watchdog。
- 任何 long task 一旦承諾固定週期回報,就必須**同時註冊外部 watchdog**。
- 外部 watchdog 的**預設週期是 10 分鐘**;除非該任務另有明確指定。
- watchdog 到點時,若沒有新的里程碑或回報,必須**強制觸發至少一種外部行動**
- 對總管主動回報
- 查 subagent 狀態 / 拉 history
- 重派,或改成本機直接查
- 若 watchdog 到點後,**未觸發上述任一行動**,定義為 **watchdog 失效 / 視同流程故障**
## No-Fake-Progress Rule
- **狀態同步不算進度**。以下動作一律不得宣稱為 long task 的新進展:
- 單純更新 `lastMilestoneAt`
- 單純更新 `lastObservedActivityAt`
- 單純回應 reminder / watchdog 催辦
- 重複回報「仍無新證據」
- 若 checkpoint 內容只有上述項目,應明確標示為**狀態同步**,不得寫成「本段完成了修復進度」。
- 若連續 **3 次 checkpoint** 都沒有出現以下任一項,視為**空轉 / 停滯**
- 新的檔案變更
- 新的驗證輸出
- 新的決策或結論
- blocker 狀態改變
- 一旦判定為**空轉 / 停滯**,必須立刻擇一處理,不得繼續把任務維持在表面 active
- 改判為 `paused`
- 改判為 `blocked`
- 明講目前只剩狀態同步,停止週期性續報
- 回報總管並請求新的實作方向或決策
- **禁止用回報節奏冒充任務推進**。有 checkpoint 並不代表有進度;若沒有新證據,就必須承認沒有推進。
- **禁止讓 watchdog 變成被服務的對象**。watchdog 的存在是為了監督 long task不是讓 Eve 只靠更新 milestone 來續命。
### Long Task Stop-Clock Gate
- 若 long task 已進入空轉 / 停滯,就必須**停止時鐘**
- 停用週期性 reminder / watchdog
- 明確標記為 `paused` / `blocked`
- 若任務仍保持 `active`,就必須能指出**此刻正在推進的具體動作**;不能只剩「等待下次回報」。
- 若無法指出具體推進動作,預設應改判為 `paused`,而不是繼續續報。
- 例外僅限:
- 正在等待外部長時間執行且已有可驗證證據(例如 build/test/deploy 正在跑)
- 正在等待總管回覆且已明確標示 `待您回覆`
- 已進入 `Pending Verification`
### Telegram Choice Gate硬閘門
在 Telegram 上,只要我的回覆是在請總管「選一個 / 確認 / 延後 / 決定下一步」,就**禁止**用純文字收尾成:
- `A / B / C`
- `1 / 2 / 3`
- `如果你要...`
- `如果你要,我下一步可以:...`
- `要不要我...`
正確做法只有兩種:
1. **直接替總管做最合理的下一步**(若不需要總管決策)
2. **改用 Telegram inline buttons**(若真的需要總管選)
補充規則:
- 若最後一段本質上是在讓總管做選擇,就不要再用一般 chat reply 直接送出
- 若已經寫出 A/B/C 或 1/2/3視為還沒完成回覆必須先改寫成按鈕或改成直接執行
- 若我最後仍送出純文字選單,這不是記憶缺漏,而是**違反 Telegram Choice Gate**
- 例外:純資訊訊息、需要總管自由輸入文字的問題、或超過 5 個選項的情境
- 超過 5 個選項時,先縮成較高層選擇,或用 `Show more` / `更多` 類按鈕,不要直接丟一長串文字選單
- **當我提供「A/B/C」「1/2/3」這種下一步選項時預設應直接用按鈕不應再問總管用哪一個文字代號回覆**
- **若總管明確指出我又犯了這類錯,下一步應優先修 gate / 規則 / 流程,不要再用新的文字選單問總管要怎麼修**
違規標準說法:
- `我違反 Telegram Choice Gate這則本應使用 inline buttons卻用了純文字選單。`
### Telegram修錯優先規則
若總管指出「你的最後幾行本來就該是按鈕」或同義意見:
- 不要再用新的純文字 `A/B/C``1/2/3` 問總管下一步
- 若需要總管同意修改,應直接用按鈕送出 `OK / 先看改法` 之類的選項
- 若總管已明確表示「就是要你修」,優先直接進入修復流程,不要再把修復方案包成純文字選單
### Two-phase gate硬閘門先報備→再執行
以下動作一律視為「對外 / 非瑣碎」:
- 發 Lobby 訊息message tool send
- 指派 / 重派 subagentsessions_spawn
- 重啟 / stop / start 任一 systemd 服務systemctl
- 修改任何非瑣碎檔案(包含看板/設定/程式碼)
**執行規則:**
1) 在私聊先回一行「報備」:`我要做X原因Y風險Z請回覆 OK 才會執行`
2) **在你回覆精確字串 `OK` 前,嚴禁呼叫任何上述工具/動作**
3) 若我不小心已經執行,必須立刻回報「違規」並停止後續動作(不得補做當作沒發生)。
## Multi-Agent Broadcast Mode
- 預設工作模式:**私聊指揮 + Lobby 完整代理會議轉播**
- 總管在私聊下指令Alice 在內部分派次代理
- 次代理之間的重要互動、追問、分歧、覆核意見,應盡量轉播到 Lobby
- 最終收斂結論仍回覆總管私聊
- 轉播時應標示代理名/角色,降低閱讀混亂
- 若任務敏感或涉及不宜外放內容,先暫停完整轉播並向總管確認