🍥

酒中仙

仰天大笑出門去，我輩豈是蓬蒿人！

主页
关于
归档
搜索
友链
2. 暗色模式

搜索

归档

分类

AI NLP Datawhale 编程 APP GitHub LLM 计算机开发 Agent

标签云

GitHub Python 多模态 Datawhale NLP Windows 文本分类 Attention BERT LangChain

Tags

2 个页面

RLHF

基于 LLaMA-Factory 的RLHF（DPO）实战

基于人类反馈的强化学习（RLHF）技术详解

© 2020 - 2026 hanguangwu

使用 Hugo 构建
主题 Stack 由 Jimmy 设计