面向安全专业人员的 LLM 漏洞扫描框架,内置 210+ 对抗性攻击探针与 28 个 LLM Provider 集成,支持多轮对话攻击引擎与多种检测机制,以单二进制形式交付。
Augustus 是由网络安全公司 Praetorian 开源的大语言模型安全测试框架,以 Go 编写、单一二进制分发,专为安全专业人员设计。
攻击能力覆盖
内置 210+ 漏洞探针,横跨 47 个攻击类别:越狱攻击(DAN、AIM、AntiGPT 等)、提示注入(编码注入、Tag smuggling、FlipAttack)、对抗样本优化(GCG、PAIR、AutoDAN、TAP、DRA)、多轮对话攻击(Crescendo 渐进升级、GOAT 自适应切换、Hydra 回溯重试)、数据提取(API key 泄露、PII 提取)、上下文操纵(RAG 投毒、Context overflow)、格式利用(Markdown/YAML/JSON 注入、XSS)、Agent 攻击(多 Agent 操纵、Browsing 利用)等。提供 7 种 Buff 提示变换(编码、释义、诗歌化、低资源语言翻译等)可叠加至任意探针。
检测与评估体系
配备 90+ 检测器,涵盖模式匹配、LLM-as-a-Judge、HarmJudge(arXiv:2511.15304)、Perspective API 等机制。多轮攻击引擎采用三角色架构(Attacker / Target / Judge),迭代引擎支持 PAIR、TAP 等方法的候选剪枝与评分优化。
Provider 与部署集成
支持 28 个 LLM Provider(43 个 Generator 变体),覆盖 OpenAI、Anthropic、Azure、Bedrock、Vertex AI、Ollama、HuggingFace 等。通过自定义 REST 端点可对接任意 OpenAI 兼容 API,支持 Burp Suite/mitmproxy 代理拦截测试内部 LLM 服务。运行时具备 Goroutine 并发池、速率限制、重试与超时处理,输出支持 Table、JSON、JSONL、HTML 报告格式,适合企业 CI/CD 自动化流水线集成。
核心管道流程
Probe Selection → Buff Transformation → Generator Call → Detector Analysis → Result Recording
探针选择后,可选经过 Buff 变换层处理提示词,再由 Generator 发送至目标 LLM,响应经 Detector 分析后记录结果。插件注册机制通过 Go init() 函数实现探针、检测器、生成器的自动注册,新增攻击类型只需实现接口并在包中注册,无需修改核心代码。