写给物理学家的生成模型(AI文献阅读)

type
status
date
slug
summary
tags
category
icon
password

(2024-06-15) 写给物理学家的生成模型

Author: 王磊; 张潘;

Journal: 物理, 53(6): 368-378, 2024.

Journal Tags:

Local Link: 王磊和张潘 - 2024 - 写给物理学家的生成模型.pdf


Abstract: 科学研究的本质在于创造。生成式人工智能为更有创意的科学探索打开了无尽的想象空间。作为生成式人工智能的核心,生成模型学习数据样本背后的概率分布,并据此随机采样生成新的样本。生成模型和统计物理在本质上是同一枚硬币的两面。文章从物理的视角介绍扩散模型、自回归模型、流模型、变分自编码器等现代生成模型。生成模型在原子尺度物质结构的生成与设计中展现出巨大的潜力。不仅如此,基于和统计物理的内在联系,生成模型对于优化“大自然的损失函数”——变分自由能具有独特的优势,这为求解困难的统计物理和量子多体问题提供了新的可能。同时,物理学的洞察也在推动生成模型的发展和创新。通过借鉴物理学原理和方法,还可以设计出更加高效、更加统一的生成模型,以应对人工智能领域中的挑战。

Tags: 生成模型,统计物理,相对熵,最大似然估计,变分自由能

Note Date: 2025/7/17 10:23:33

一、读懂论文所需基础知识

1. 概率分布基础

  • 通俗理解:描述事件发生的可能性。例如天气预报中“下雨概率60%”就是一个概率分布。
  • 关键概念
    • 联合概率 p(x,y):两个事件同时发生的概率(如“高温且下雨”)。
    • 条件概率 p(x|y):在事件y发生的前提下,x发生的概率(如“下雨时出现洪水的概率”)。
    • 贝叶斯公式p(x|y) ∝ p(x)p(y|x),用于反向推理(如根据症状推断疾病)。

2. 统计物理核心概念

  • 玻尔兹曼分布p(x) = e^{-E(x)}/Z
    • E(x):系统能量(如原子排布的不稳定程度)
    • Z(配分函数):概率归一化系数,计算难度极高
  • 相变:温度变化导致物质状态突变(如冰→水→气),对应概率分布形态突变。

3. 生成模型vs判别模型

机器学习任务 ├─ 判别模型 → 性质预测 p(y|x) │ │ │ └─ 示例:AlphaFold预测蛋白质结构 │ └─ 生成模型 → 学习数据分布 p(x) │ └─ 生成新样本 → 示例:Chroma设计新蛋白质

4. 神经网络基础

  • 可理解为“万能函数拟合器”,通过调整神经元连接权重学习数据规律。

二、论文核心内容解读

1. 核心思想(对应引言)

  • 物理与AI的统一:自然界的玻尔兹曼分布 p(x)∝e^{-E(x)} 与生成模型学习的数据分布本质相同。
  • 生成能力=理解:费曼名言“不能创造便不理解”是生成式AI的哲学基础。

2. 四大生成模型详解

(1) 扩散模型

  • 物理类比:分子动力学模拟
  • 关键过程
      1. 前向扩散:数据逐步加噪(类似分子热运动)
      1. 反向生成:学习得分函数∇ln p(x)(类似受力方向)
        1. notion image

(2) 自回归模型

  • 工作方式:像写小说逐字生成
    • 物理启示:变量排序影响学习效率(如晶体结构按原子序生成)

    (3) 流模型

    • 核心公式p(x)=q(z)|∂z/∂x|
      • z:隐变量(类似物理中的“准粒子”)
      • |∂z/∂x|:体积变化修正因子
        • notion image

    (4) 变分自编码器

    • 物理对应:吉布斯变分原理
    • 损失函数L = KL散度 + 重构误差

    3. 物理应用突破

    材料生成(图3案例)

    notion image
    notion image

    量子多体问题

    • 变分自由能计算F = tr(ρlnρ) + tr(ρH)
    • 创新解法
        1. 自回归模型→经典概率分布
        1. 流模型→量子波函数
          1. notion image

    三、关键术语解析

    1. 生成模型

    • 通俗说:学习数据“套路”后自动创作的AI(如AI绘画)
    • 物理映射:≈ 求解体系的概率分布

    2. 相对熵(KL散度)

    • 定义KL(q∥p) = ∫q(x)[ln q(x)-ln p(x)]dx
    • 类比:两个概率分布间的“距离”(非对称)
      • 如:理想气体模型 vs 真实气体分布的差异

    3. 变分自由能

    • 公式F = ∫p(x)[(1/β)ln p(x)+E(x)]dx
    • 物理意义:平衡能量与熵的“自然损失函数”

    4. 得分函数(Score Function)

    • 计算∇ln p(x)
    • 物理本质:概率梯度(类比分子受力方向)

    5. 涌现现象

    • 案例:大语言模型突然掌握语法规则
    • 物理对照:相变(如磁性材料在居里温度突变)

    6. 配分函数 Z

    • 痛点:高维积分难以计算
    • 生成模型对策:通过可逆变换规避计算(流模型)
     
    Prev
    时间、信息与人工智能(AI文献阅读)
    Next
    人工智能和数据驱动的计算模拟(AI文献阅读)
    Loading...