发现 AI 代理的未来arrow_forward

Augustus

calendar_today收录于 2026年4月24日
category智能体与应用工具
code开源
大语言模型GoCLI智能体与应用工具模型与推理框架协议/API/集成安全/隐私

面向安全专业人员的 LLM 漏洞扫描框架,内置 210+ 对抗性攻击探针与 28 个 LLM Provider 集成,支持多轮对话攻击引擎与多种检测机制,以单二进制形式交付。

Augustus 是由网络安全公司 Praetorian 开源的大语言模型安全测试框架,以 Go 编写、单一二进制分发,专为安全专业人员设计。

攻击能力覆盖

内置 210+ 漏洞探针,横跨 47 个攻击类别:越狱攻击(DAN、AIM、AntiGPT 等)、提示注入(编码注入、Tag smuggling、FlipAttack)、对抗样本优化(GCG、PAIR、AutoDAN、TAP、DRA)、多轮对话攻击(Crescendo 渐进升级、GOAT 自适应切换、Hydra 回溯重试)、数据提取(API key 泄露、PII 提取)、上下文操纵(RAG 投毒、Context overflow)、格式利用(Markdown/YAML/JSON 注入、XSS)、Agent 攻击(多 Agent 操纵、Browsing 利用)等。提供 7 种 Buff 提示变换(编码、释义、诗歌化、低资源语言翻译等)可叠加至任意探针。

检测与评估体系

配备 90+ 检测器,涵盖模式匹配、LLM-as-a-Judge、HarmJudge(arXiv:2511.15304)、Perspective API 等机制。多轮攻击引擎采用三角色架构(Attacker / Target / Judge),迭代引擎支持 PAIR、TAP 等方法的候选剪枝与评分优化。

Provider 与部署集成

支持 28 个 LLM Provider(43 个 Generator 变体),覆盖 OpenAI、Anthropic、Azure、Bedrock、Vertex AI、Ollama、HuggingFace 等。通过自定义 REST 端点可对接任意 OpenAI 兼容 API,支持 Burp Suite/mitmproxy 代理拦截测试内部 LLM 服务。运行时具备 Goroutine 并发池、速率限制、重试与超时处理,输出支持 Table、JSON、JSONL、HTML 报告格式,适合企业 CI/CD 自动化流水线集成。

核心管道流程

Probe Selection → Buff Transformation → Generator Call → Detector Analysis → Result Recording

探针选择后,可选经过 Buff 变换层处理提示词,再由 Generator 发送至目标 LLM,响应经 Detector 分析后记录结果。插件注册机制通过 Go init() 函数实现探针、检测器、生成器的自动注册,新增攻击类型只需实现接口并在包中注册,无需修改核心代码。

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。

rocket_launch