一个使用多模态大语言模型优雅解决 hCaptcha 验证码挑战的项目,不依赖用户脚本或第三方验证码服务。
一分钟了解#
hCaptcha Challenger 是一个创新的验证码解决工具,它使用人工智能技术来自动完成 hCaptcha 挑战。该项目不依赖任何用户脚本或第三方验证码服务,而是通过实现特定接口实现"AI对AI"的解决方案。适合需要自动化处理网页验证码的开发者、研究员或自动化测试人员使用。
核心价值:通过多模态大语言模型技术,实现无需人工干预的 hCaptcha 自动解决方案。
核心能力#
1. 多类型验证码支持#
- 图像标签二分类:使用 ResNet ONNX 模型进行分类
- 图像区域选择(点选):使用 YOLOv8 ONNX 检测模型识别点击区域
- 图像区域选择(框选):使用 YOLOv8 ONNX 分割模型识别边界框
- 图像拖放任务:使用空间思维链技术实现拖放操作
- 多选题:使用 ViT ONNX 零样本学习模型处理
2. 高级任务处理#
- 排名策略:使用嵌套模型集合优化选择策略
- 自监督挑战:使用 CLIP-ViT 模型处理未知类型的验证码
- 智能代理工作流:使用多模态大语言模型实现复杂的代理任务处理
3. 完整工作流支持#
- 自动化 CI/CD 流程:包含哨兵和收集器自动化任务
- 数据集管理:支持 VCS 和标注功能
- 模型训练与验证:提供 ResNet 和 YOLOv8 的训练/验证流程