强化学习系列(一):基础概念 三要素:rewards, actions, states 马尔可夫奖励过程:马尔可夫奖励过程可以表示为 $<S,P,R,\gamma>$,其中: $S$ 为状态集合; $P$ 为状态转移矩阵,$P_{ss’}=P[S_{t+1}=s’|S_t=s]$; $R$ 为奖励函数,$R_s=E[R_{t+1}|S_t=s]$; $\gamma 2025-03-05 #AI #Algorithm
Solidity智能合约 安装Remix-ide先排个雷,目前官方提供的remix-ide desktop版能安装,但是跑不起来,我在github release列表下了latest version,启动后就是漫长的白屏,网上给的解释是需要修改代理ping通github,但是我这边是能ping通的,多次尝试无果后我选择使用Remix-Ethereum IDE + 本地 remixd。remixd是Remix IDE提供的一 2025-03-01 #Web3
区块链入门指南 区块链与加密货币入门指南基础篇:区块链与加密货币基础学习目标 理解区块链基本原理 掌握加密货币基础知识 了解DeFi生态系统 尝试链上交互 核心学习资源1. 入门 视频教程: 3Blue1Brown的”比特币和区块链是如何工作的” - 通过可视化方式解释区块链的基本原理 在线课程: Coursera - 区块链基础知识 & PKU学生区块链中心WEB3新人公开课 书籍: 《精通比特币》( 2025-03-01 #Web3
命名实体识别&关系抽取 小结 BIO标记法B-(Begin):表示一个实体的开始(首个 token)。 I-(Inside):表示实体的内部(除首个 token 以外的部分)。 O-(Outside):表示非实体的 token。 例如:**”Apple Inc. is based in California.” BIO 标注: Token BIO 标签 Apple B-ORG Inc. I-ORG is O 2025-02-21 #NER
GraphRAG综述 Sec.1 传统RAG系统面临的挑战复杂的查询理解:传统的 RAG 方法依赖于简单的关键字匹配和向量相似性技术,不足以捕捉准确和全面所需的深层语义细微差别和多步骤推理过程。例如,当询问概念 A 和概念 D 之间的联系时,这些系统通常只检索直接相关的信息,而错过了像 B 和 C 这样可以弥合关系的关键中间概念。这种狭窄的检索范围限制了 RAG 的能力,使其无法进行广泛的上下文理解和复杂的推理 集成来 2025-02-20 #LLM #RAG #Graph
Path-Level GNN-Based Retrievers 1.GNN-RAG: Graph Neural Retrieval for Large Language Model Reasoning 开源代码:https://github.com/cmavro/GNN-RAG Motivation: 将GNN的推理能力和LLM的语言理解能力相结合用于知识图谱问答 Methodology:首先,GNN 对密集的 KG 子图进行推理,以检索给定问题的答案候选者。 2025-02-20 #LLM #RAG #Graph
Graph + RAG Graph + RAG图RAG相比于传统RAG的优势: 多跳推理能力 2. 关系建模能力 3. 高效的知识更新与管理 4. 减少检索的噪声和生成的幻觉 最近看了几篇图RAG的论文: G-Retriever: Retrieval-Augmented Generation for Textual Graph Understanding and Question Answering(https:// 2025-02-18 #LLM #RAG
关于模型padding左对齐和右对齐的问题 最近微调模型进行原因预测任务训练的时候,在eval阶段进行推理生成时遇到了一个警告:“A decoder-only architecture is being used, but right-padding was detected! For correct generation results, please set padding_side='left' when initia 2025-02-17 #Bug #Code
大模型显存占用计算 1. 显存单位换算在讨论显存占用时,首先要明白“B”和“G”的含义。通常,“B”指的是十亿(1B = 10^9),而“G”则表示千兆字节(1G = 10^9字节)。例如,1B参数意味着有10亿个参数。显存的单位通常以字节计算,而1个字节等于8位。🎈如果使用全精度训练(fp32),每个参数需要占用32位(即4个字节),因此1B的参数需要占用4GB的显存。🎈如果使用半精度(fp 2025-02-17 #LLM #Code
人工智能竞赛汇总 1.人工智能竞赛平台 Biendata:Data Competition Community - Biendata介绍: 2018 年 5 月,人工智能和大数据的竞赛平台 Biendata 完成天使轮融资,由DeepTech深科技投资,旨在打造中国人工智能赛事顶级 IP,赛事相关媒体运营。Biendata 的比赛客户既包括今日头条、知乎、摩拜、搜狐等企业,也包括了 IEEE、ACM、中国计算机学 2025-02-01 #Study