Augustus

面向安全专业人员的 LLM 漏洞扫描框架，内置 210+ 对抗性攻击探针与 28 个 LLM Provider 集成，支持多轮对话攻击引擎与多种检测机制，以单二进制形式交付。

Augustus 是由网络安全公司 Praetorian 开源的大语言模型安全测试框架，以 Go 编写、单一二进制分发，专为安全专业人员设计。

攻击能力覆盖

内置 210+ 漏洞探针，横跨 47 个攻击类别：越狱攻击（DAN、AIM、AntiGPT 等）、提示注入（编码注入、Tag smuggling、FlipAttack）、对抗样本优化（GCG、PAIR、AutoDAN、TAP、DRA）、多轮对话攻击（Crescendo 渐进升级、GOAT 自适应切换、Hydra 回溯重试）、数据提取（API key 泄露、PII 提取）、上下文操纵（RAG 投毒、Context overflow）、格式利用（Markdown/YAML/JSON 注入、XSS）、Agent 攻击（多 Agent 操纵、Browsing 利用）等。提供 7 种 Buff 提示变换（编码、释义、诗歌化、低资源语言翻译等）可叠加至任意探针。

检测与评估体系

配备 90+ 检测器，涵盖模式匹配、LLM-as-a-Judge、HarmJudge（arXiv:2511.15304）、Perspective API 等机制。多轮攻击引擎采用三角色架构（Attacker / Target / Judge），迭代引擎支持 PAIR、TAP 等方法的候选剪枝与评分优化。

Provider 与部署集成

支持 28 个 LLM Provider（43 个 Generator 变体），覆盖 OpenAI、Anthropic、Azure、Bedrock、Vertex AI、Ollama、HuggingFace 等。通过自定义 REST 端点可对接任意 OpenAI 兼容 API，支持 Burp Suite/mitmproxy 代理拦截测试内部 LLM 服务。运行时具备 Goroutine 并发池、速率限制、重试与超时处理，输出支持 Table、JSON、JSONL、HTML 报告格式，适合企业 CI/CD 自动化流水线集成。

核心管道流程

Probe Selection → Buff Transformation → Generator Call → Detector Analysis → Result Recording

探针选择后，可选经过 Buff 变换层处理提示词，再由 Generator 发送至目标 LLM，响应经 Detector 分析后记录结果。插件注册机制通过 Go init() 函数实现探针、检测器、生成器的自动注册，新增攻击类型只需实现接口并在包中注册，无需修改核心代码。

相关项目

AUQ (Ask User Questions)

Memento MCP

agentgateway

保持更新