LoRA训练经验总结（很多人咨询, 分享在这里）

By - george
Posted on 2026年3月3日2026年3月24日
Posted in 学习

LoRA训练经验总结（很多人咨询, 分享在这里）

一、核心理论：函数空间模型

所有模型都在同一个函数空间中：

ZIB（基础模型） = f(x) 原点
ZIT（加速模型） = f(x) + a(x) # a是加速偏移
Moody Real（风格模型） = f(x) + b(x) # b是风格偏移

函数空间的特点：

连续且平滑（输入微小变化导致输出微小变化）
微调模型是原点的一阶偏移
偏移可以叠加，但因为空间非线性，叠加效果不一定完美

二、训练策略：为什么选ZIB

在ZIB上训练：

text

你的LoRA = 训练结果 - ZIB = delta_you（相对于原点的一阶偏移）
应用到任何模型M（= ZIB + delta_m）：
结果 = ZIB + delta_m + delta_you（两个一阶偏移叠加）

在微调模型上训练：

text

在M（= ZIB + delta_m）上训练：
你的二阶偏移 = 训练结果 - M
应用到其他模型N（= ZIB + delta_n）：
结果 = ZIB + delta_n + (训练结果 - ZIB - delta_m)
      = ZIB + delta_n + delta_you - delta_m  # 混入了-delta_m

结果：偏差不可控，生成成功率降低

三、数据准备：纯净性原则

问题：LoRA会学到数据中的所有特征

面部素材中的身体、背景都会被学习
这些干扰信息会导致原模型混淆
表现为生成图像畸形概率增加

解决方案：

目标明确：只训练面部就用纯面部素材
统一尺寸：1024×1024清晰面部
覆盖全面：不同角度、表情
标注完整：配合详细提示词

四、加速模型的理解

登山类比：

ZIB：之字形上山，每一步都稳（50步）
ZIT：修索道直接到山腰（20步）

本质：加速模型改变了函数路径

跳过了中间步骤
在某些区域有”跳跃”
函数平滑性降低

理论上：ZIT – ZIB 可以提取为”加速LoRA”

但技术上实现有难度（转换器问题）
且应用到其他模型时效果可能不完美

五、最佳实践建议

基础模型选择：始终用ZIB训练
数据质量：纯净、高清、多角度
预期管理：理解偏移叠加有局限
问题诊断：生成畸形时，首先检查数据纯净度和基础模型选择

总结：LoRA训练的本质是在函数空间中计算一阶偏移。选择正确的原点（ZIB）和纯净的数据，才能得到通用稳定的LoRA。任何引入二阶偏差的做法，都会导致不可控的结果。

x

一、核心理论：函数空间模型

所有模型都在同一个函数空间中：

ZIB（基础模型） = f(x) 原点
ZIT（加速模型） = f(x) + a(x) # a是加速偏移
Moody Real（风格模型） = f(x) + b(x) # b是风格偏移

函数空间的特点：

连续且平滑（输入微小变化导致输出微小变化）
微调模型是原点的一阶偏移
偏移可以叠加，但因为空间非线性，叠加效果不一定完美

二、训练策略：为什么选ZIB

在ZIB上训练：

text

你的LoRA = 训练结果 - ZIB = delta_you（相对于原点的一阶偏移）
应用到任何模型M（= ZIB + delta_m）：
结果 = ZIB + delta_m + delta_you（两个一阶偏移叠加）

在微调模型上训练：

text

在M（= ZIB + delta_m）上训练：
你的二阶偏移 = 训练结果 - M
应用到其他模型N（= ZIB + delta_n）：
结果 = ZIB + delta_n + (训练结果 - ZIB - delta_m)
      = ZIB + delta_n + delta_you - delta_m  # 混入了-delta_m

结果：偏差不可控，生成成功率降低

三、数据准备：纯净性原则

问题：LoRA会学到数据中的所有特征

面部素材中的身体、背景都会被学习
这些干扰信息会导致原模型混淆
表现为生成图像畸形概率增加

解决方案：

目标明确：只训练面部就用纯面部素材
统一尺寸：1024×1024清晰面部
覆盖全面：不同角度、表情
标注完整：配合详细提示词

四、加速模型的理解

登山类比：

ZIB：之字形上山，每一步都稳（50步）
ZIT：修索道直接到山腰（20步）

本质：加速模型改变了函数路径

跳过了中间步骤
在某些区域有”跳跃”
函数平滑性降低

理论上：ZIT – ZIB 可以提取为”加速LoRA”

但技术上实现有难度（转换器问题）
且应用到其他模型时效果可能不完美

五、最佳实践建议

基础模型选择：始终用ZIB训练
数据质量：纯净、高清、多角度
预期管理：理解偏移叠加有局限
问题诊断：生成畸形时，首先检查数据纯净度和基础模型选择

山波之家

LoRA训练经验总结（很多人咨询, 分享在这里）

一、核心理论：函数空间模型

二、训练策略：为什么选ZIB

三、数据准备：纯净性原则

四、加速模型的理解

五、最佳实践建议

x

一、核心理论：函数空间模型

二、训练策略：为什么选ZIB

三、数据准备：纯净性原则

四、加速模型的理解

五、最佳实践建议

Previous Article

Next Article

发表回复取消回复

搜索

关于本站

联系我们

山波之家

LoRA训练经验总结（很多人咨询, 分享在这里）

一、核心理论：函数空间模型

二、训练策略：为什么选ZIB

三、数据准备：纯净性原则

四、加速模型的理解

五、最佳实践建议

x

一、核心理论：函数空间模型

二、训练策略：为什么选ZIB

三、数据准备：纯净性原则

四、加速模型的理解

五、最佳实践建议

Previous Article

Next Article

发表回复 取消回复

搜索

关于本站

联系我们

发表回复取消回复