所有文章
系列
生活
标签
足迹
关于
取消
所有文章
系列
生活
标签
足迹
关于
大模型
2026
NF4 量化大模型
02-17
LoRA&QLoRA
02-16
MiniMind 学习指北(六):LoRA
02-13
模型的 generate 方法
02-11
MiniMind 学习指北(五):SFT
02-10
MoE 混合专家模型
02-06
MiniMind 学习指北(四):评估
01-25
MiniMind 学习指北(三):预训练
01-24
MiniMind 学习指北(二):Tokenizer
01-23
MiniMind 学习指北(一):Model
01-22
2025
CS336 Assignment 1: Tokenizer & Transformer
12-31
CS336 Lecture 3: Architectures & Hyperparameters
12-19
CS336 Lecture 2: Computing
12-19
CS336 Lecture 1: Tokenization
12-17
KVCache
12-03
RoPE
11-28