写给物理学家的生成模型(AI文献阅读)
type
status
date
slug
summary
tags
category
icon
password
(2024-06-15) 写给物理学家的生成模型
Author: 王磊; 张潘;
Journal: 物理, 53(6): 368-378, 2024.
Journal Tags:
Local Link: 王磊和张潘 - 2024 - 写给物理学家的生成模型.pdf
DOI: 10.7693/wl20240602
Abstract: 科学研究的本质在于创造。生成式人工智能为更有创意的科学探索打开了无尽的想象空间。作为生成式人工智能的核心,生成模型学习数据样本背后的概率分布,并据此随机采样生成新的样本。生成模型和统计物理在本质上是同一枚硬币的两面。文章从物理的视角介绍扩散模型、自回归模型、流模型、变分自编码器等现代生成模型。生成模型在原子尺度物质结构的生成与设计中展现出巨大的潜力。不仅如此,基于和统计物理的内在联系,生成模型对于优化“大自然的损失函数”——变分自由能具有独特的优势,这为求解困难的统计物理和量子多体问题提供了新的可能。同时,物理学的洞察也在推动生成模型的发展和创新。通过借鉴物理学原理和方法,还可以设计出更加高效、更加统一的生成模型,以应对人工智能领域中的挑战。
Tags: 生成模型,统计物理,相对熵,最大似然估计,变分自由能
Note Date: 2025/7/17 10:23:33
一、读懂论文所需基础知识
1. 概率分布基础
- 通俗理解:描述事件发生的可能性。例如天气预报中“下雨概率60%”就是一个概率分布。
- 关键概念:
- 联合概率
p(x,y):两个事件同时发生的概率(如“高温且下雨”)。 - 条件概率
p(x|y):在事件y发生的前提下,x发生的概率(如“下雨时出现洪水的概率”)。 - 贝叶斯公式:
p(x|y) ∝ p(x)p(y|x),用于反向推理(如根据症状推断疾病)。
2. 统计物理核心概念
- 玻尔兹曼分布:
p(x) = e^{-E(x)}/Z E(x):系统能量(如原子排布的不稳定程度)Z(配分函数):概率归一化系数,计算难度极高
- 相变:温度变化导致物质状态突变(如冰→水→气),对应概率分布形态突变。
3. 生成模型vs判别模型
机器学习任务
├─ 判别模型 → 性质预测 p(y|x)
│ │
│ └─ 示例:AlphaFold预测蛋白质结构
│
└─ 生成模型 → 学习数据分布 p(x)
│
└─ 生成新样本 → 示例:Chroma设计新蛋白质
4. 神经网络基础
- 可理解为“万能函数拟合器”,通过调整神经元连接权重学习数据规律。
二、论文核心内容解读
1. 核心思想(对应引言)
- 物理与AI的统一:自然界的玻尔兹曼分布
p(x)∝e^{-E(x)}与生成模型学习的数据分布本质相同。
- 生成能力=理解:费曼名言“不能创造便不理解”是生成式AI的哲学基础。
2. 四大生成模型详解
(1) 扩散模型
- 物理类比:分子动力学模拟
- 关键过程:
- 前向扩散:数据逐步加噪(类似分子热运动)
- 反向生成:学习得分函数
∇ln p(x)(类似受力方向)

(2) 自回归模型
- 工作方式:像写小说逐字生成
- 物理启示:变量排序影响学习效率(如晶体结构按原子序生成)
(3) 流模型
- 核心公式:
p(x)=q(z)|∂z/∂x| z:隐变量(类似物理中的“准粒子”)|∂z/∂x|:体积变化修正因子

(4) 变分自编码器
- 物理对应:吉布斯变分原理
- 损失函数:
L = KL散度 + 重构误差
3. 物理应用突破
材料生成(图3案例)


量子多体问题
- 变分自由能计算:
F = tr(ρlnρ) + tr(ρH)
- 创新解法:
- 自回归模型→经典概率分布
- 流模型→量子波函数

三、关键术语解析
1. 生成模型
- 通俗说:学习数据“套路”后自动创作的AI(如AI绘画)
- 物理映射:≈ 求解体系的概率分布
2. 相对熵(KL散度)
- 定义:
KL(q∥p) = ∫q(x)[ln q(x)-ln p(x)]dx
- 类比:两个概率分布间的“距离”(非对称)
如:理想气体模型 vs 真实气体分布的差异
3. 变分自由能
- 公式:
F = ∫p(x)[(1/β)ln p(x)+E(x)]dx
- 物理意义:平衡能量与熵的“自然损失函数”
4. 得分函数(Score Function)
- 计算:
∇ln p(x)
- 物理本质:概率梯度(类比分子受力方向)
5. 涌现现象
- 案例:大语言模型突然掌握语法规则
- 物理对照:相变(如磁性材料在居里温度突变)
6. 配分函数 Z
- 痛点:高维积分难以计算
- 生成模型对策:通过可逆变换规避计算(流模型)
Prev
时间、信息与人工智能(AI文献阅读)
Next
人工智能和数据驱动的计算模拟(AI文献阅读)
Loading...