大模型底下的踩和赞是如何进一步影响到大模型的

19次阅读

共计 99 个字符，预计需要花费 1 分钟才能阅读完成。

大模型了解的比较模糊，主流的大模型平台对话框底下的踩和赞应该就是 RLHF 的前置步骤，即数据的收集，收集了之后一般是怎么影响到模型的呢，是不是还要隔一段时间将数据处理成指令数据集的格式，进行一轮微调？大模型底下的踩和赞是如何进一步影响到大模型的

正文完

底下收集模型

发表至： V2EX

2024-05-08

0

这种地图边界应该怎么画

求/购分级读物: 牛津书虫事实系列（Oxford Bookworms Factfiles）

Firefox 的 DNS over HTTPS 为什么总是在我没有 IPv6 地址的情况下解析出 IPv6 导致上不了网？排查了半天才发现这个我不小心打开的选项

请问 v 友们有没有关于大模型的历史讲解的相关资料,想要了解下。

如何实现撸车自由——DIY 洗车经验分享（装备篇）

Face To All, turn your face photo to stylized photos – https://facetoany.com

热门文章