阅读提示:本文基于公开来源、官方文档、release note 和开发者仓库整理;正文中的事实以原文和官方文档为准。涉及价格、模型名、地区可用性、企业条款、版权、隐私和安全审计时,请回到原始来源复核。本文不构成法律、投资、采购、安全审计或上线建议,也不为任何工具或模型背书。

目录

  1. 60 秒速读
    1. 本周工具雷达图
  2. 本周更新雷达表
    1. CLI/本地 Agent
    2. 云端 PR Agent
  3. 本周核心工具变化矩阵
  4. 本周主线
    1. 主题一:Agent 执行边界与权限控制
    2. 主题二:团队协作与代码审查链路
  5. 同类工具横向对比
    1. 选型坐标图
  6. 纵向变化追踪
    1. 安全风险地图
  7. 安全、版权与免责声明
  8. 候选未入选
  9. 资讯与参考链接
    1. 本期资讯来源
    2. 延伸参考

60 秒速读

  • 一句判断:本期从 26 条候选里筛出 3 条入选更新,重点看工具或模型底座是否真的改变代码访问、执行权限、PR/Review、模型成本和企业治理。
  • 信号 1:Coding Agent 的竞争焦点正在从“能不能写代码”转向任务边界、权限策略、后台执行和审计链路。
  • 信号 2:本栏目不做排行榜,所有选型建议都按场景、证据等级和采用边界给出。
  • 信号 3:本期没有足够证据的候选会留在观察区,不写成功能结论。
  • 最值得试Codex 更新日志,先用隔离仓库验证。
  • 暂缓观察Claude Code 更新日志,本期仅作观察:公开页面未给出足够可核验的变更细节,暂不写成功能结论。
  • 关键风险:本文不构成法律、投资、采购、安全审计或上线建议,也不为任何工具或模型背书。

本周工具雷达图

本周更新雷达表

CLI/本地 Agent

工具 本期证据 本周变化 采用前先看
开源 Coding Agent arXiv AI Search 围绕「Probe-and-Refine Tuning of Repository … 版本、入口、权限范围
Cline Cline Releases 围绕「CLI v3.0.29」的更新;围绕「sdk/sdk/v0.0.51」的更新… 版本、入口、权限范围

云端 PR Agent

工具 本期证据 本周变化 采用前先看
Codex Codex Changelog Codex 更新日志 版本、入口、权限范围

本周核心工具变化矩阵

工具 状态 本周证据 说明
Codex 有变化 Codex Changelog Codex 更新日志
Claude Code 仅观察 Claude Code Changelog 本期仅作观察:公开页面未给出足够可核验的变更细节,暂不写成功能结论。
Antigravity 抓取失败 Google Antigravity Blog HTTP 404
Cursor 仅观察 Cursor Changelog 本期仅作观察:公开页面未给出足够可核验的变更细节,暂不写成功能结论。
Windsurf 仅观察 Windsurf Changelog 本期仅作观察:公开页面未给出足够可核验的变更细节,暂不写成功能结论。
GitHub Copilot 仅观察 GitHub Copilot Changelog 本期仅作观察:公开页面未给出足够可核验的变更细节,暂不写成功能结论。
Cline 有变化 10 条更新聚合 围绕「CLI v3.0.29」的更新;围绕「sdk/sdk/v0.0.51」的更新;围绕「sdk/core…
Kiro 仅观察 Kiro Changelog 本期仅作观察:公开页面未给出足够可核验的变更细节,暂不写成功能结论。
Qoder 无确认变化 https://qoder.com/en/changelog 本期公开来源没有进入正文,继续按既有状态观察
TRAE 无确认变化 https://www.trae.ai/changelog 本期公开来源没有进入正文,继续按既有状态观察
Zed 仅观察 Zed Releases 本期仅作观察:公开页面未给出足够可核验的变更细节,暂不写成功能结论。
Sourcegraph Cody 仅观察 Sourcegraph Changelog 本期仅作观察:公开页面未给出足够可核验的变更细节,暂不写成功能结论。

本周主线

本期更适合把 AI Coding 看成一套工程系统,而不是单个编辑器功能。进入正文的 3 条更新里,3 条来自官方、开发者 release 或研究来源;0 条若存在,也只能在证据包足够时作为谨慎观察。读这类工具更新时,最重要的不是“它声称能做什么”,而是它把代码库访问、终端执行、模型选择、PR/Review、价格和企业权限放在什么边界里。

  • Coding Agent 的竞争焦点正在从“能不能写代码”转向任务边界、权限策略、后台执行和审计链路。
  • 本栏目不做排行榜,所有选型建议都按场景、证据等级和采用边界给出。

主题一:Agent 执行边界与权限控制

这一组可以放在一起看:arXiv AI Search、Cline Releases 给出的不是孤立更新,而是同一条工程主线上的不同信号。围绕「Probe-and-Refine Tuning of Repository Guidance …」的更新;围绕「CLI v3.0.29」的更新 等入选资讯会在下面自然展开,并保留可回溯链接。

  1. 围绕「Probe-and-Refine Tuning of Repository Guidance …」的更新 是本主题下的可确认来源。arXiv AI Search 的原文关注 Probe-and-Refine、Tuning、Repository、指引 等变化,适合结合原始来源复核版本、适用范围和采用边界。它把工具使用、任务边界或自动执行能力推到更靠近工程系统的位置。 模型和价格信息会直接影响选型、预算、地域可用性和上线节奏。采用前要把边界看清:事实、参数、价格、地区可用性和采用边界仍需回到原始来源复核。
    本周同工具更新聚合:共 5 条同工具来源进入参考区,代表性线索包括 围绕「Probe-and-Refine Tun…、围绕「Calibration Without …;详细链接集中放在「本期资讯来源」。

  2. 围绕「CLI v3.0.29」的更新 是本主题下的可确认来源。Cline 的原文提到 CLI、v3.0.29、Cline、Releases 等变化,适合结合原始来源复核版本、适用范围和采用边界。模型/API 文档变化会影响可用能力、集成方式和评估口径。 放进开发流程时,重点不是演示效果,而是代码权限、测试证据、diff 可读性和回滚路径。采用前要把边界看清:国内模型/API 需要复核模型名、地区可用性、数据合规和价格策略。
    本周同工具更新聚合:共 10 条同工具来源进入参考区,代表性线索包括 围绕「CLI v3.0.29」的更新、围绕「sdk/sdk/v0.0.51」的更新;详细链接集中放在「本期资讯来源」。

主题二:团队协作与代码审查链路

这一组可以放在一起看:Codex Changelog 给出的不是孤立更新,而是同一条工程主线上的不同信号。Codex 更新日志 等入选资讯会在下面自然展开,并保留可回溯链接。

  1. Codex 更新日志 是本主题下的可确认来源。Codex 的原文提到 Codex、更新日志、OpenAI、开发者 等变化,适合结合原始来源复核版本、适用范围和采用边界。会影响开发者从需求澄清、代码修改到测试与 review 的工作流。 放进开发流程时,重点不是演示效果,而是代码权限、测试证据、diff 可读性和回滚路径。采用前要把边界看清:AI IDE 或 Coding Agent 需要关注代码权限、遥测、计费和生成代码审查。

同类工具横向对比

工具 类型 运行环境 代码访问边界 终端/文件权限 PR/Review 能力 模型/价格 企业治理 适用场景
Codex 云端 PR Agent / CLI Agent ChatGPT / CLI / 云端任务 按连接仓库、任务范围和运行环境决定 需要逐项确认文件写入、命令执行和沙箱边界 适合代码修改、审查、调试和 PR 交接 模型、套餐和云端执行成本需回官方页面复核 企业采用重点看审计、采购、数据处理和权限隔离 跨文件任务、PR 前修改、代码审查和现代化改造
开源 Coding Agent CLI/本地 Agent CLI / 本地或自托管环境 围绕本地仓库、模型 provider 和工具权限运行 重点看 shell、文件写入、密钥读取和 provider 配置 取决于具体项目,通常适合本地修改、测试和自动化脚本 多依赖 BYOK/provider 计费,需按模型实际成本评估 企业采用看许可证、维护状态、密钥管理和审计能力 可控本地工作流、自托管实验和开源可定制场景
Cline CLI/本地 Agent VS Code 扩展 / CLI / 本地 Hub 围绕本地客户端、Hub 和规则文件运行 重点看插件规则、MCP、终端执行和 tunnel 暴露 适合本地任务执行、规则驱动修改和多客户端协作 通常依赖所接模型/provider 的计费和额度 企业采用看插件、规则、密钥和局域网/隧道边界 本地 Agent、MCP 工具链和可定制规则工作流

选型坐标图

纵向变化追踪

工具 本周更新 上周状态 变化类型 是否影响选型 证据来源 未确认项
Codex Codex 更新日志 沿用上期公开状态;本栏目只在本周来源能确认的范围内写变化。 PR/Review 流程 可作为本周工具评估的一个证据信号。 Codex Changelog / 官方 changelog / docs / release note AI IDE 或 Coding Agent 需要关注代码权限、遥测、计费和生成代码审查。
开源 Coding Agent 围绕「Probe-and-Refine Tuning of Repository Gu… 沿用上期公开状态;本栏目只在本周来源能确认的范围内写变化。 PR/Review 流程 会影响工作流验证,适合用小任务试跑。 arXiv AI Search / 研究论文 / 预印本 事实、参数、价格、地区可用性和采用边界仍需回到原始来源复核。;国内模型/API 需要复核模型名、地区可用性、数据合规和价格策略。
Cline 围绕「CLI v3.0.29」的更新;围绕「sdk/sdk/v0.0.51」的更新;围… 沿用上期公开状态;本栏目只在本周来源能确认的范围内写变化。 PR/Review 流程 可作为本周工具评估的一个证据信号。 Cline Releases / 开发者仓库 / GitHub release AI IDE 或 Coding Agent 需要关注代码权限、遥测、计费和生成代码审查。;国内模型/API 需要复核模型名、地区可用性、数据合规和价格策略。

安全风险地图

安全、版权与免责声明

  • 事实免责声明:本文基于公开来源、官方文档、release note 和开发者仓库整理;价格、模型名、地区可用性、企业条款以原文为准。

  • 非建议声明:本文不构成法律、投资、采购、安全审计或上线建议,也不为任何工具或模型背书。

  • 版权与引用:不复制原文长段落,只做转述、摘要和分析;图片只使用安全的官方元数据图或非 icon 图片,并保留来源说明。

  • 代码版权/IP:生成代码进入生产前要复核版权归属、第三方许可证、训练数据透明度、相似代码风险和企业内部代码泄露风险。

  • 数据与隐私:逐项确认仓库上传、遥测、日志留存、数据驻留、企业隔离、zero retention、on-prem/air-gapped 选项。

  • 执行安全:重点检查终端命令、MCP 工具、文件写入、密钥读取、CI 权限、自动 PR、沙箱与审批机制。

  • 采购风险:价格、套餐、credit、BYOK、模型倍率、试用额度和区域限制变化快,不能只按本周文章做采购决策。

  • Codex:需要确认仓库上传、遥测、日志留存、数据驻留、企业隔离、zero retention、on-prem/air-gapped 选项。 重点检查终端命令、MCP 工具、文件写入、密钥读取、CI 权限、自动 PR、沙箱与审批机制。

  • 开源 Coding Agent:即使本期未出现明确隐私变更,也要确认是否读取仓库、日志、提示词和上下文片段。 重点检查终端命令、MCP 工具、文件写入、密钥读取、CI 权限、自动 PR、沙箱与审批机制。

  • Cline:即使本期未出现明确隐私变更,也要确认是否读取仓库、日志、提示词和上下文片段。 重点检查终端命令、MCP 工具、文件写入、密钥读取、CI 权限、自动 PR、沙箱与审批机制。

候选未入选

  • Claude Code 更新日志(Claude Code Changelog,可回到来源继续观察;本期仅作观察:公开页面未给出足够可核验的变更细节,暂不写成功能结论。):候选未入选,不作为功能结论。
  • 围绕「Cursor is your coding agent for building ambiti…」的更新(Cursor Changelog,可回到来源继续观察;本期仅作观察:公开页面未给出足够可核验的变更细节,暂不写成功能结论。):候选未入选,不作为功能结论。
  • 更新日志(Kiro Changelog,可回到来源继续观察;本期仅作观察:公开页面未给出足够可核验的变更细节,暂不写成功能结论。):候选未入选,不作为功能结论。
  • 更新日志(Windsurf Changelog,可回到来源继续观察;本期仅作观察:公开页面未给出足够可核验的变更细节,暂不写成功能结论。):候选未入选,不作为功能结论。
  • 围绕「Categories」的更新(GitHub Copilot Changelog,可回到来源继续观察;本期仅作观察:公开页面未给出足够可核验的变更细节,暂不写成功能结论。):候选未入选,不作为功能结论。
  • 围绕「Smart hover summaries are now generally availab…」的更新(Sourcegraph Changelog,可回到来源继续观察;本期仅作观察:公开页面未给出足够可核验的变更细节,暂不写成功能结论。):候选未入选,不作为功能结论。
  • 围绕「Releases」的更新(Zed Releases,可回到来源继续观察;本期仅作观察:公开页面未给出足够可核验的变更细节,暂不写成功能结论。):候选未入选,不作为功能结论。

资讯与参考链接

本期资讯来源

  • Codex 更新日志:Codex Changelog;原文标题:Codex changelog。Codex 的原文提到 Codex、更新日志、OpenAI、开发者 等变化,适合结合原始来源复核版本、适用范围和采用边界
  • 围绕「Probe-and-Refine Tuning of Repository Guidance …」的更新:arXiv AI Search;原文标题:Probe-and-Refine Tuning of Repository Guidance for Coding Agents。arXiv AI Search 的原文关注 Probe-and-Refine、Tuning、Repository、指引 等变化,适合结合原始来源复核版本、适用范围和采用边界
  • 围绕「Calibration Without Comprehension: Diagnosing t…」的更新:arXiv AI Search;原文标题:Calibration Without Comprehension: Diagnosing the Limits of Fine-Tuning LLMs for Vulnerability Detection in Systems Software。arXiv AI Search 的原文关注 Calibration、Comprehension、Diagnosing、Limits 等变化,适合结合原始来源复核版本、适用范围和采用边界
  • 围绕「v1.2.24-vscode」的更新:Continue Releases;原文标题:v1.2.24-vscode。Continue 的原文提到 v1.2.24-vscode、Continue、Releases、Stable 等变化,适合结合原始来源复核版本、适用范围和采用边界
  • 围绕「v1.2.23-vscode」的更新:Continue Releases;原文标题:v1.2.23-vscode。Continue 的原文提到 v1.2.23-vscode、Continue、Releases、Stable 等变化,适合结合原始来源复核版本、适用范围和采用边界
  • 围绕「v1.3.40-vscode」的更新:Continue Releases;原文标题:v1.3.40-vscode。Continue 的原文提到 v1.3.40-vscode、Continue、Releases、Pre-release 等变化,适合结合原始来源复核版本、适用范围和采用边界
  • 围绕「CLI v3.0.29」的更新:Cline Releases;原文标题:CLI v3.0.29。Cline 的原文提到 CLI、v3.0.29、Cline、Releases 等变化,适合结合原始来源复核版本、适用范围和采用边界
  • 围绕「sdk/sdk/v0.0.51」的更新:Cline Releases;原文标题:sdk/sdk/v0.0.51。Cline 的原文提到 sdk、v0.0.51、Cline、Releases 等变化,适合结合原始来源复核版本、适用范围和采用边界
  • 围绕「sdk/core/v0.0.51」的更新:Cline Releases;原文标题:sdk/core/v0.0.51。Cline 的原文提到 sdk、core、v0.0.51、Cline 等变化,适合结合原始来源复核版本、适用范围和采用边界
  • 围绕「sdk/agents/v0.0.51」的更新:Cline Releases;原文标题:sdk/agents/v0.0.51。Cline 的原文提到 sdk、Agent、v0.0.51、Cline 等变化,适合结合原始来源复核版本、适用范围和采用边界
  • 围绕「sdk/llms/v0.0.51」的更新:Cline Releases;原文标题:sdk/llms/v0.0.51。Cline 的原文提到 sdk、llms、v0.0.51、Cline 等变化,适合结合原始来源复核版本、适用范围和采用边界
  • 围绕「sdk/shared/v0.0.51」的更新:Cline Releases;原文标题:sdk/shared/v0.0.51。Cline 的原文提到 sdk、shared、v0.0.51、Cline 等变化,适合结合原始来源复核版本、适用范围和采用边界
  • 围绕「sdk/sdk/v0.0.50」的更新:Cline Releases;原文标题:sdk/sdk/v0.0.50。Cline 的原文提到 sdk、v0.0.50、Cline、Releases 等变化,适合结合原始来源复核版本、适用范围和采用边界
  • 围绕「sdk/core/v0.0.50」的更新:Cline Releases;原文标题:sdk/core/v0.0.50。Cline 的原文提到 sdk、core、v0.0.50、Cline 等变化,适合结合原始来源复核版本、适用范围和采用边界
  • 围绕「sdk/llms/v0.0.50」的更新:Cline Releases;原文标题:sdk/llms/v0.0.50。Cline 的原文提到 sdk、llms、v0.0.50、Cline 等变化,适合结合原始来源复核版本、适用范围和采用边界
  • 围绕「sdk/shared/v0.0.50」的更新:Cline Releases;原文标题:sdk/shared/v0.0.50。Cline 的原文提到 sdk、shared、v0.0.50、Cline 等变化,适合结合原始来源复核版本、适用范围和采用边界

延伸参考