微调训练的数据集

使用trl库做微调时, 对数据集的要求是:

如果是多轮对话场景:

jsonl 文件，且需符合以下要求:

1.每行是一个独立的 JSON 对象;

2 每个对象须包含一个键名为 messages 的数组，数组不能为空;

3.messages 中每个元素必须包含 role 和 content 两个字段:

4.role 只能是 system,user 或 assisiant;

5.如果有 system 角色消息, 需在数组首位;

6.第一条非 system 消息必须是 user 角色;

7.user 和 assisiant 角色的消息应当交替、成对出现，不少于1对;

如果是指令微调场景:

jsonl 文件，且需符合以下要求:

1.每行是一个独立的 JSON 对象;

2 每个对象须包含且只能包含一个键名为 text 的键值对，值不能为空;

posted on 2025-03-21 21:52 paulwong 阅读(44) 评论(0) 编辑收藏所属分类: AI-FINE-TUNNING


只有注册用户登录后才能发表评论。




网站导航: 博客园 IT新闻 Chat2DB C++博客博问管理
相关文章: 微调训练的数据集大模型训练的几个阶段搭建llamafactory微调、评估、测试和量化环境微调资源 AI微调框架axolotl安装微调llama3大模型(2) - 使用ollama搭建chatbot 微调llama3大模型(1) - 使用Llama Factory微调llama3大模型

paulwong