发现 AI 代理的未来arrow_forward

SWE-AF

calendar_today收录于 2026年4月23日
category智能体与应用工具
code开源
Python工作流自动化多智能体系统AI代理智能体框架智能体与应用工具开发者工具/代码自动化/工作流/RPA

基于自然语言目标自动编排多角色 AI Agent 团队完成端到端软件工程的运行时,覆盖规划、编码、测试、合并到 Draft PR 全流程。

SWE-AF 是构建于 AgentField 控制平面之上的自主工程团队运行时。用户通过一次 API 调用传入自然语言目标和仓库地址,系统自动编排 22 个专业化 Agent(产品经理、架构师、编码员、审查员、测试员等),完成 PRD 生成、架构设计、Issue DAG 拆分、并行编码执行、三层自适应控制(内循环重试 → 中循环策略调整 → 外循环 DAG 重规划)、语义合并、验证修复循环,最终输出包含架构摘要和技术债务清单的 GitHub Draft PR。单次典型 build 编排 400–500+ Agent 调用。

核心能力

  • 一体化工程工厂:一次 API 调用从目标到 Draft PR
  • 单仓库与多仓库模式:支持跨代码库协调变更(主应用 + 共享库/微服务)
  • 三层自适应控制循环:内循环(单 Issue 重试,最多 5 次)→ 中循环(Issue Advisor 策略选择)→ 外循环(Replanner DAG 级重规划)
  • 难度感知执行:简单 Issue 快速通过,困难 Issue 触发更深适应
  • 运行时计划变更:Replanner 可动态增删 Issue 和依赖关系
  • 优雅降级 + 显式债务追踪:范围放宽时债务被分类、定级、传播到下游

并发与隔离

  • 结构化并发 + 屏障同步:按依赖层级并行执行,层级间通过 gate sequence 保证一致性
  • Agent 隔离 + 语义合并:每个 Issue 使用独立 git worktree,由 Merger Agent 做语义合并
  • 跨 Agent 知识传播:enable_learning=true 时,早期发现的代码规范和失败模式传播到下游
  • 持久化断点恢复:每阶段边界序列化 DAGState 到 checkpoint.json

多模型调度

  • 双运行时:claude_code(Claude 后端)和 open_code(OpenRouter / OpenAI / Google / Anthropic)
  • 按角色分配模型:如 coder 用 opus、qa 用 haiku、default 用 sonnet,覆盖 16 个角色键
  • 风险比例资源分配:needs_deeper_qa 标志将 Issue 路由到 2-call 或 4-call 路径

治理与溯源

  • 每个 Agent 拥有 DID(去中心化身份),通过 BIP-44 密钥派生
  • 每次 Agent 调用生成 VC(可验证凭证),含调用者/目标 DID、输入输出哈希、时间戳、密码签名
  • 所有 VC 组成工作流链,支持端到端溯源

22 个专业化 Agent

  • 规划层:Product Manager、Architect、Tech Lead、Sprint Planner、Issue Writer
  • 执行层:Coder、QA、Code Reviewer、QA Synthesizer、Retry Advisor、Issue Advisor、Replanner
  • Git/Merge 层:Git Init、Workspace Setup、Merger、Integration Tester、Workspace Cleanup
  • 验证/收尾层:Verifier、Fix Generator、Repo Finalizer、GitHub PR Creator

Build Pipeline 六阶段

  1. Plan + Git Init — 并行:规划链生成 PRD/架构/Issue DAG + Git 初始化
  2. Execute Issue DAG — 按依赖层级并行执行所有 Issue
  3. Verify-Fix Loop — Verifier 检查验收标准,失败则生成修复 Issue 回到执行
  4. Repo Finalize — 清理构建产物
  5. Push + Draft PR — 推送分支并创建 Draft PR

部署方式

  • Railway 一键部署(SWE-AF + AgentField + PostgreSQL)
  • Docker Compose(支持 worker 扩展)
  • 本地安装(Python >= 3.12)

适用场景:自主特性开发、跨仓库协调变更、大规模代码库重构与加固、API 触发式持续集成自动化。同系列 SEC-AF 可在构建后进行自动化安全审计。

待确认信息:Benchmark 95/100 评分仅见于 README 无独立第三方验证;JPMorgan、ServiceNow、NIH 使用 AgentField 平台但未明确是否使用 SWE-AF;swe-fast 模式与标准模式差异未详述;首次发布日期未确认。

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。

rocket_launch