一个用于角色扮演的可训练智能体,通过学习人物的实际经历、特征和情感来模拟历史人物,无需额外提示或参考文档。
一分钟了解#
Character-LLM是一个专门用于角色扮演的可训练智能体,可以像贝多芬、克利奥帕特拉、苏格拉底等历史人物一样思考和回应。与简单的提示代理不同,Character-LLMs经过专门训练,拥有详细的角色相关知识和代表性性格特点,无需每次都提供提示词。
核心价值:通过经验重建技术生成多样化训练数据,使AI能够真实模拟历史人物的行为、语言和知识体系。
快速上手#
安装难度:高 - 需要GPU基础设施和专业AI知识
# 克隆仓库
git clone https://github.com/choosewhatulike/trainable-agents.git
cd trainable-agents
# 安装依赖
pip install -r requirements.txt
# 下载模型权重
# 需要先有基础模型(llama-7b),然后应用权重差
适合我的场景吗?
- ✅ 角色扮演游戏开发:需要真实历史人物互动的场景
- ✅ 教育应用:让学生与历史人物对话学习
- ✅ 创意写作辅助:提供特定角色风格的对话和互动
- ❌ 简单聊天机器人:无需特定角色扮演功能
- ❌ 商业应用:模型和数据仅限学术研究使用
核心能力#
1. 真实角色扮演 - 历史人物准确模拟#
Character-LLMs能够像特定历史人物一样思考和回应,包括使用符合人物特点的语气、方式和词汇,拥有该人物的完整知识体系。 实际价值:创建真正栩栩如生的历史人物交互体验,增强教育和娱乐应用的真实感
2. 角色特定知识库 - 详尽的人物背景#
每个角色模型都包含大量针对特定人物的训练数据,场景数量平均1600个,词汇量75.4万,对话轮次13.2轮。 实际价值:确保角色回答符合历史事实和人物特点,避免与角色身份不符的回答
3. 经验重建技术 - 高质量数据生成#
通过独特的经验重建流程,使用GPT-3.5-turbo生成详细和多样化的人物经历数据,包括场景提取、互动生成和幻觉保护场景。 实际价值:减少人工数据收集成本,提高角色模型质量和一致性
4. 多人物支持 - 九大历史人物#
提供贝多芬、克利奥帕特拉、伏地魔、斯巴达克斯、赫敏、牛顿、凯撒、苏格拉底和马丁·路德·金等九个历史人物的预训练模型。 实际价值:无需从零开始训练,可直接使用高质量的历史人物模型
5. 分布式训练支持 - 高效模型训练#
支持多GPU分布式训练,可在8个A100 GPU上完成30-45分钟的模型训练。 实际价值:加速大规模角色模型的训练过程,提高研究效率
技术栈与集成#
开发语言:Python 主要依赖:FastChat, Transformers, Hugging Face Hub, PyTorch 集成方式:API / SDK / Library
生态与扩展#
- 插件/扩展:基于FastChat框架,支持扩展功能
- 集成能力:可与现有的LLM生态系统集成,支持模型权重差分应用
维护状态#
- 开发活跃度:活跃开发项目,有定期更新
- 最近更新:最近有维护活动,支持模型训练和推理
- 社区响应:学术研究社区有相关讨论,适合研究和实验
商用与许可#
许可证:代码Apache-2.0,数据CC BY-NC 4.0
- ✅ 商用:代码允许商用,模型和数据仅限学术研究
- ✅ 修改:允许修改代码和模型
- ⚠️ 限制:模型和数据不能用于商业目的
文档与学习资源#
- 文档质量:全面
- 官方文档:https://github.com/choosewhatulike/trainable-agents
- 示例代码:提供单轮和多轮对话示例,角色创建教程