Peter Think Tank
  • 首页
  • 归档
  • 标签
  • 关于
  • 友链
  • 文档
    主题博客 配置指南 图标用法

共计 7 篇文章


2025

04-19
RLHF(三):基于TRL的GrpoTrainer详解
04-18
RLHF(二):偏好数据采集
04-17
RLHF(一):LLM post-training
02-20
Path-Level GNN-Based Retrievers
02-20
GraphRAG综述
02-18
Graph + RAG
02-17
大模型显存占用计算

搜索

Hexo Fluid