首页技术区最新随笔(rss) RSS

微调训练的数据集

使用trl库做微调时, 对数据集的要求是:

如果是多轮对话场景:
jsonl 文件,且需符合以下要求:
1.每行是一个独立的 JSON 对象;
2 每个对象须包含一个键名为 messages 的数组,数组不能为空;
3.messages 中每个元素必须包含 role 和 content 两个字段:
4.role 只能是 system,user 或 assisiant;
5.如果有 system 角色消息, 需在数组首位;
6.第一条非 system 消息必须是 user 角色;
7.user 和 assisiant 角色的消息应当交替、成对出现,不少于1对;

如果是指令微调场景:
jsonl 文件,且需符合以下要求:
1.每行是一个独立的 JSON 对象;
2 每个对象须包含且只能包含一个键名为 text 的键值对,值不能为空;

2025-03-21 21:52 作者: paulwong【评论:0】【阅读:20】 

零基础IM开发入门(五):什么是IM系统的端到端加密?

     摘要: 本文由夏冰软件cc分享,下文进行了排版和内容优化。1、引言本文接上篇《什么是IM系统的消息时序一致性?》,本篇将通俗易懂地讲解IM系统中的端到端加密原理,为了降低阅读门槛,相关的技术概念会提及但不深入展开。IM即时通讯系统的技术本质是“即时消息技术”,是互联网实时互动场景的底层架构,包括聊天、直播、在线客服等业务领域在内,所有需要实时互动、高实时性的场景,都需要用到IM技术...  阅读全文

2025-03-20 11:11 作者: Jack Jiang【评论:0】【阅读:19】 

大模型训练的几个阶段

大模型开发出来后, 一般要经过以下几个阶段的训练:

预训练(Pre-Trained)
单纯提供文本: {"text":"..."}
训练模型由第一个文字开始, 预测后面的文字, 直到结束.
这种模型只会做完成文本的任务

监督微调(Supervised Fine Turning)
为了使模型能完成根据指令完成回答, 而不是随机生成回答
提供的文本: {"instruction":"...", "output":"..."}

高效参数微调(Parameter Efficient Fine Turning)
只调整部分参数, 具体实现方法有LoRA

参考:
https://github.com/huggingface/smol-course/blob/main/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb



2025-03-18 13:14 作者: paulwong【评论:0】【阅读:30】 

支持百万人超大群聊的Web端IM架构设计与实践

     摘要: 本文由vivo互联网服务器团队Cai Linfeng分享,来自公众号“ vivo互联网技术”,原题“百万级群聊的设计实践”,下文进行了排版优化和内容修订。1、引言现在IM群聊产品多种多样,有国民级的微信、QQ,企业级的钉钉、飞书,还有许多公司内部的IM工具,这些都是以客户端为主要载体。而且群聊人数通常都是有限制,微信正常群人数上限是500,QQ200...  阅读全文

2025-03-13 13:36 作者: Jack Jiang【评论:0】【阅读:34】 

大模型微调后的评估指标

     摘要: 大模型微调后的评估指标是衡量模型性能的关键,通常根据任务类型和具体需求选择不同的评估指标。以下是一些常见的评估指标及其适用场景: 1. 分类任务 准确率(Accuracy):预测正确的样本占总样本的比例。 适用场景:类别分布均衡的任务。 精确率(Precision):预测为正类的样本中,实际为...  阅读全文

2025-03-12 10:08 作者: paulwong【评论:0】【阅读:69】 

视频直播技术干货(十三):B站实时视频直播技术实践和音视频知识入门

     摘要: 本文由B端技术中心资深开发工程师马家忆分享,原题“B站在实时音视频技术领域的探索与实践”,下文进行了排版和内容优化。1、引言直播行业从传统的娱乐直播发展到教育直播、电商直播等形式,产生了很多新的玩法。传统的直播是一位主播展示才艺,观众通过弹幕、送礼物等方式进行互动。随着网络质量不断地提高,用户也对直播平台产生的新的要求,实时互动直播的场景就出现了,观众可以同时观看多位主播之...  阅读全文

2025-03-06 11:46 作者: Jack Jiang【评论:0】【阅读:22】 

即时通讯初学者必知必会的20个网络编程和通信安全知识点

     摘要: 本文引用自公众号“计算科学与信息化”,原题“运维必知的20个网络安全知识点!”,下文进行了排版和内容优化。1、引言即时通讯IM应用开发的初学者很容易迷失在网络编程的复杂性以及通信安全的各种概念里,本文不涉及深度理论知识,尽量通过一句话或几句话让你快速了解20个相关的网络编程和通信安全知识点,希望能助你愉快地开始即时通讯应用开发。技术交流:- 移动端I...  阅读全文

2025-02-27 13:04 作者: Jack Jiang【评论:0】【阅读:52】 

探讨组合加密算法在IM中的应用

     摘要: 1、前言本文深入分析了即时通信(IM)系统中所面临的各种安全问题,综合利用对称加密算法(DES算法)、公开密钥算法(RSA算法)和Hash算法(MD5)的优点,探讨组合加密算法在即时通信中的应用。技术交流:- 移动端IM开发入门文章:《新手入门一篇就够:从零开发移动端IM》- 开源IM框架源码:https://github.com/JackJiang2011/MobileIMSDK(备用地址点此...  阅读全文

2025-02-26 11:32 作者: Jack Jiang【评论:0】【阅读:26】 

技 术 改 变 世 界

宣传语

网站分类

其他分类

Google站内搜索

 

24小时内最热随笔

统计信息

订阅

Blog客户端API

推荐客户端

博客排行榜[前100人]