文章
24
标签
4
分类
10
首页
留言板
找文章
标签
分类
时间轴
统计
工具
在线markdown
在线push
利器
VSCode:微软旗下的跨平台代码编辑软件
MobaXterm:超好用的全能远程终端
CopyTranslator:“复制即翻译”的外文辅助阅读翻译解决方案
Zotero:便于收集、组织、引用、共享的文献管理工具
Zeal:离线文档浏览器,其灵感来自 OS X平台上的 Dash,目前支持 Window 和 Liunx,基于 QT5
Ditto:强大的Windows剪贴板增强工具
Wise System Monitor:监控从系统到本地网络的所有运行情况
QtTabBar:在Windows资源管理器中使用多标签功能扩展工具
Multrin:“窗口合并”辅助小工具
Wox & Everything:基于名称快速定位文件和文件夹的搜索工具
ScreenToGif:快速录制屏幕指定区域并保存为动图文件
Mathpix Snipping:识别数学公式并转换成LaTeX
Space Sniffer:磁盘空间分析工具
友链
关于
LOUIS' BLOG
搜索
首页
留言板
找文章
标签
分类
时间轴
统计
工具
在线markdown
在线push
利器
VSCode:微软旗下的跨平台代码编辑软件
MobaXterm:超好用的全能远程终端
CopyTranslator:“复制即翻译”的外文辅助阅读翻译解决方案
Zotero:便于收集、组织、引用、共享的文献管理工具
Zeal:离线文档浏览器,其灵感来自 OS X平台上的 Dash,目前支持 Window 和 Liunx,基于 QT5
Ditto:强大的Windows剪贴板增强工具
Wise System Monitor:监控从系统到本地网络的所有运行情况
QtTabBar:在Windows资源管理器中使用多标签功能扩展工具
Multrin:“窗口合并”辅助小工具
Wox & Everything:基于名称快速定位文件和文件夹的搜索工具
ScreenToGif:快速录制屏幕指定区域并保存为动图文件
Mathpix Snipping:识别数学公式并转换成LaTeX
Space Sniffer:磁盘空间分析工具
友链
关于
大模型应用开发三板斧——SFT
发表于
2024-10-15
|
更新于
2024-11-29
|
自然语言处理
|
字数总计:
6
|
阅读时长:
1分钟
|
阅读量:
|
评论数:
Hey, password is required here.
文章作者:
徐耀彬
文章链接:
http://louishsu.xyz/2024/10/15/%E5%A4%A7%E6%A8%A1%E5%9E%8B%E5%BA%94%E7%94%A8%E5%BC%80%E5%8F%91%E4%B8%89%E6%9D%BF%E6%96%A7%E2%80%94%E2%80%94SFT.html
版权声明:
本博客所有文章除特别声明外,均采用
CC BY-NC-SA 4.0
许可协议。转载请注明来自
LOUIS' BLOG
!
上一篇
Arxiv每日速递(2024-11-29)
下一篇
🎨 Stable Diffusion 提示词指南书
评论
徐耀彬
💭这个人很懒,什么都没有留下
文章
24
标签
4
分类
10
Follow Me
公告
记录和分享一些学习和开源内容,若有问题可通过邮箱is.louishsu@foxmail.com联系,欢迎交流!!
目录
1.
LLM训练-sft
1.1.
背景篇
1.1.1.
Special Token
1.1.2.
耗时问题
1.1.3.
与 pretrain 的区别
1.1.4.
幻觉问题
1.2.
数据篇
1.2.1.
数据多样性
1.2.2.
数据生产
1.2.2.1.
生产 prompt
1.2.2.2.
生产 answer
1.2.2.3.
小结
1.2.3.
数据飞轮
1.2.4.
专项数据
1.2.4.1.
RAG
1.2.4.2.
Agent / function_call
1.2.4.3.
长文本
1.2.4.4.
复杂指令
1.3.
训练篇
1.3.1.
训练框架
1.3.2.
炼丹技巧
1.3.3.
拟合问题
1.3.3.1.
欠拟合
1.3.3.2.
过拟合
1.3.3.3.
小结
1.3.4.
夹逼准则
1.3.4.1.
经验分享
1.3.4.2.
实战思路
1.4.
评估篇
1.4.1.
评估方式
1.4.2.
评估分析
1.5.
总结篇
1.5.1.
结语
1.5.2.
致谢
2.
SFT的局限性
2.1.
sft 无法提供负反馈
2.2.
sft 不具有“向后看”的能力
最新文章
Arxiv每日速递(2024-11-29)
2024-11-29
大模型应用开发三板斧——SFT
2024-10-15
🎨 Stable Diffusion 提示词指南书
2024-02-03
Transformer语言模型的位置编码与长度外推
2023-10-22
vLLM:利用分页缓存和张量并行提高大模型2~4x推理速度
2023-09-22
本地搜索