一个开源的多智能体系统,能够将学术论文自动转换为可编辑的学术海报,支持多种模型组合,包括GPT-4o和本地开源模型。
一分钟了解#
Paper2Poster是一个多智能体系统,能从学术论文PDF文件自动生成可编辑的PowerPoint海报。它采用自上而下、视觉循环的生成方法,通过多个AI协同工作提取论文关键内容并生成视觉上吸引人的海报。研究人员、学生和学术工作者可以利用此工具快速将复杂的学术论文转化为简洁明了的海报形式,适用于学术会议、展示和分享。
核心价值:大幅减少学术海报制作时间,将冗长论文转化为视觉清晰的海报,同时保持学术准确性。
快速上手#
安装难度:中 - 需要Python环境、多个依赖项和API密钥配置
# 安装依赖
pip install -r requirements.txt
# 安装LibreOffice
sudo apt install libreoffice
# 安装poppler
conda install -c conda-forge poppler
适合我的场景吗?
- ✅ 快速学术会议海报生成:一键将论文转换为海报,节省数小时手动设计时间
- ✅ 多种模型选择:可根据预算和性能需求选择GPT-4o或开源模型
- ❌ 精确视觉定制:目前更注重内容自动提取,不如专业设计软件灵活
- ❌ 完全离线使用:某些功能需要API访问
核心能力#
1. 多智能体系统#
- PosterAgent采用自上而下的视觉循环多智能体架构,从论文PDF生成可编辑的PPTX海报 实际价值:智能协调多个AI助手分工合作,确保海报内容全面且结构合理
2. 灵活模型组合#
- 支持多种LLM/VLM组合,包括GPT-4o和本地开源模型(Qwen-2.5-7B-Instruct) 实际价值:可根据性能需求和预算选择不同模型组合,平衡效果与成本
3. 智能内容提取#
- 自动提取论文核心内容,包括摘要、方法、结果等关键部分 实际价值:避免人工阅读长篇论文的繁琐,快速获取并呈现最有价值的信息
4. 自动化logo集成#
- 支持自动搜索并添加机构和会议logo,支持本地和在线搜索 实际价值:增强海报专业性和品牌识别度,省去手动搜索和添加logo的时间
5. YAML样式定制#
- 通过YAML配置文件实现全局和单海报的样式自定义 实际价值:提供灵活性,允许用户根据会议要求或个人喜好调整海报外观
技术栈与集成#
开发语言:Python 主要依赖:vLLM(开源模型部署)、Libreoffice(文档处理)、poppler(PDF处理)、OpenAI API(GPT-4o)、Google Search API(logo搜索) 集成方式:命令行工具、API、Docker容器
维护状态#
- 开发活跃度:非常活跃,2025年多次更新添加新功能
- 最近更新:最近添加了Gradio演示、Docker支持、logo自动搜索等功能
- 社区响应:项目已被NeurIPS 2025数据与基准测试轨道接受,显示学术认可
文档与学习资源#
- 文档质量:全面
- 官方文档:README中包含详细的安装和使用指南
- 示例代码:提供多种模型组合的命令行示例
商用与许可#
许可证:未知(项目中未明确说明)
- ✅ 商用:未知
- ✅ 修改:未知
- ⚠️ 限制:未知