v2026.4.23 — 圖片生成擴展 + GPT-5.5 + 安全大批次
發布日期:2026 年 4 月 23 日
定位:圖片提供商擴展 + GPT-5.5 預備 + 安全強化
Breaking Changes:無
核心亮點
1. OpenAI Codex OAuth 圖片生成
openai/gpt-image-2 現在可以走 Codex OAuth:
- 不需要
OPENAI_API_KEY - 直接用 ChatGPT 帳號跑圖片
- 也支援參考圖片編輯
2. OpenRouter 圖片生成
OpenRouter 支援圖片生成和參考圖片編輯:
- 用
OPENROUTER_API_KEY跑 OpenRouter 的圖片模型 - 經由
image_generate工具呼叫
3. 圖片生成更多控制
代理人可以請求提供商支援的品質和輸出格式:
- OpenAI 的 background、moderation、compression、user 等 hint 都可以透過
image_generate工具帶入 - 多參考圖編輯改用受保護的 multipart upload,恢復複雜的
gpt-image-2編輯
4. Subagents 可選的 forked context
原生 sessions_spawn 跑子代理時,新增可選的 forked context:
- 子代理可以繼承發起者的對話 transcript
- 預設仍保持乾淨隔離 session
- 包含 prompt 指引、context engine hook metadata、文件、QA 覆蓋
5. Pi 0.70.0 + GPT-5.5 預備
Bundled Pi 套件升到 0.70.0,OpenAI 和 OpenAI Codex 用 Pi 上游的 gpt-5.5 catalog metadata,本地僅保留 gpt-5.5-pro 的 forward-compat 處理。
6. Dreaming 改成獨立輕量代理跑
把 managed dreaming cron 從 heartbeat 解耦,改成 isolated lightweight agent turn:
- Heartbeat 對 default agent 關掉,dreaming 仍會跑
- 不會再被
heartbeat.activeHours跳過 openclaw doctor --fix會把舊的 main-session dreaming jobs 在持久化 cron config 裡遷移到新 shape
7. WebChat 圖片附件保留
WebChat 把圖片附件 offload 成 media refs,給 text-only 主模型用:
- 圖片不再被丟掉
- 配置的圖片工具仍能檢視原始檔
- 修復 #68513、#44276、#51656、#70212
8. 大批次安全修補(12+ 項)
- Discord:原生 slash 指令的頻道政策不能繞過 owner / member 限制
- Teams:強制 Bot Framework audience tokens 透過
appid或azp比對到設定的 Teams app(防 cross-bot replay) - WhatsApp:contact / vCard / location 結構化物件改用 fenced untrusted metadata JSON 渲染,限制隱藏的 prompt-injection
- Group 對話:頻道來源的群組名稱和參與者標籤改用 fenced untrusted metadata JSON
- Android:
ASK_OPENCLAWintents 不再自動傳送注入的 prompt,外部 app 動作只 prefill draft - Pairing:行動裝置 cleartext 配對需要私網 IP 或 loopback;
.local不再被當成安全 cleartext - Approvals:
config.apply/config.patch的 agent-driven 編輯改用允許清單(narrow allow),不再依賴黑名單 - Webhooks:
SecretRef來源的 webhook secrets 每次 request 重新解析,secrets reload立即撤銷舊 secret - MCP/tools:ACPX OpenClaw tools bridge 不能列出或呼叫 owner-only 工具(如
cron) - QQBot:
/bot-approve需要 framework auth - Anthropic CLI:
bypassPermissions從 OpenClaw 自己的 YOLO exec policy 推導,保留 explicit--permission-mode覆寫 - Secrets/Windows:file-backed secrets 移除 UTF-8 BOM,ACL 檢查 fail-closed
9. WebChat / 對話可靠度
- WebChat 把 text-only 模型回覆裡可以拿出的圖片附件保留住
- Stop 按鈕跨 Gateway 重連排隊,斷線中的 active run 在重連時取消
- Active 助理生成的圖片儲存成 authenticated managed media,配對裝置 token 也能 fetch
- WebChat session-mutation guard 擴展到
sessions.compact和sessions.compaction.restore
10. 外部頻道修復
- Telegram 媒體回覆把 markdown 圖片語法
解析成 outbound media payload(而不是純 URL) - Slack MPIM 群組 DM 分類成 group chat context,內部「Working…」trace 不會洩漏到房間
- BlueBubbles iMessage 優先於 SMS,不會靜默降級
- Voice-call realtime 等待 OpenAI session 配置完成才打招呼或轉發 buffered audio
升級建議
- 用 ChatGPT Plus / Pro 想跑圖片但沒有 API key 的客戶:可走 Codex OAuth
- 用 OpenRouter 的客戶:可以開始跑圖片
- 跑 dreaming 的客戶:建議升級避免 cron 路徑遺漏
- WebChat 配多模態的客戶:圖片附件不會再被丟掉
- 所有人:含大批次安全修補,建議升級