机器学习和第一原理模型的集成(AI文献阅读）

type

status

date

slug

summary

(2022) Integration of machine learning and first principles models (机器学习和第一原理模型的集成)

Author: Lokesh Rajulapati; Sivadurgaprasad Chinta; Bala Shyamala; Raghunathan Rengaswamy;

Journal: AIChE Journal, 68(6): e17715, 2022.

Journal Tags:

Local Link: Rajulapati 等 - 2022 - Integration of machine learning and first principles models.pdf

DOI: 10.1002/aic.17715

Abstract Translation: 模型构建和参数估计是广泛用于化学，生物，冶金和制造业的传统概念。早期建模方法的重点是数学上捕获建模者的过程知识和领域专业知识。这样开发的模型称为第一原理模型（或白框模型）。随着时间的流逝，计算能力变得更便宜，并且可以使用大量数据进行建模。这导致了尖端机器学习模型（黑框模型）和人工智能（AI）技术的发展。混合模型（灰色框模型）是第一原理和机器学习模型的组合。混合模型的开发吸引了研究人员的注意，因为这结合了两种建模范式的最佳状态。最近对该领域的关注源于对可解释的AI（XAI）的兴趣，这是AI系统变得更加普遍的关键要求。这项工作旨在确定和分类文献中可用的各种混合模型，这些模型将机器学习模型与不同形式的域知识整合在一起。总结了诸如增强的预测能力，外推能力和其他优势之类的好处。本文的目的是合并混合建模领域已发表的语料库，并开发一个综合框架来了解所介绍的各种技术。该框架可以进一步用作探索几种模型之间合理关联的基础。

Tags:

Note Date: 2025/7/17 21:16:37

一、科研小白需掌握的基础知识

1. 第一性原理模型（First Principles Models, FP）

定义：基于物理/化学定律（如质量/能量守恒、牛顿力学）构建的数学模型，通常表现为微分方程（ODE/PDE）、代数方程或其组合。

核心知识：

守恒定律：质量/能量/动量守恒方程（e.g., 反应器物料平衡方程：dCA/dt = F/V*(CAf - CA) - r）
本构关系：描述物质特性的方程（e.g., 阿伦尼乌斯方程：k = k0*exp(-Ea/RT)）
局限性：复杂系统存在未建模动力学（如湍流、多相流），计算成本高。

2. 机器学习模型（Machine Learning Models, ML）

定义：从数据中学习输入-输出映射关系的黑箱模型（e.g., 神经网络、支持向量机）。

核心知识：

监督学习：训练带标签数据集（e.g., 用反应温度、浓度预测反应速率）。
过拟合问题：模型过度拟合噪声，泛化能力差（需正则化/交叉验证）。
典型架构：

前馈神经网络（FNN）：基础多层感知机
循环神经网络（RNN）：处理时序数据（e.g., LSTM）
卷积神经网络（CNN）：处理空间数据（e.g., 湍流场）

3. 混合模型（Hybrid Models, HM）

核心思想：融合FP的物理可解释性与ML的数据拟合能力，形成"灰箱模型"。

典型范式：

串联结构（Serial HM）：ML估计FP中的未知参数（e.g., 神经网络预测反应速率常数k）
并联结构（Parallel HM）：ML补偿FP的结构误差（e.g., 用残差网络修正理想反应器模型）

二、论文精读解析

1. 混合建模的驱动需求（Section 1）

FP痛点：复杂过程（如生物反应、湍流）存在未建模动力学，导致"工厂-模型失配"。

ML痛点：需大量训练数据、缺乏外推能力、可能违反物理约束（e.g., 预测负浓度）。

HM核心价值： ✅ 提升预测精度与外推能力 ✅ 降低数据需求 ✅ 嵌入物理约束（e.g., 质量守恒）

2. 分类框架（Section 2）

概念谱系（图2）：按物理知识完整性构建FP-ML连续体

实现框架（表1）：

类型	特点	案例
集总参数模型（LPM）	ML估计FP中的复杂参数（e.g., 反应速率）	生物反应器生长率预测 [12]
残差模型（RM）	ML补偿FP的结构误差	CSTR混合不足修正 [18]
物理约束模型（FPCM）	将物理定律嵌入ML架构/损失函数	湍流模型嵌入不可压缩性 [95]

3. 关键案例解析

药物共溶剂溶解度预测（Section 2.2.1）

问题：传统模型（Jouyban-Acree）需实验标定参数，成本高。
HM方案：

结果：HM预测精度显著优于传统模型（图1）：

Paracetamol in Dioxane and Water at 298k

Paracetamol in Dioxane and Water at 303k

CSTR残差建模（Section 2.2.2）

问题：简化FP模型忽略温度对速率常数的影响。
HM方案：

结果：测试集MSE趋近于0（表2），实现一步预测。

4. 前沿方向（Section 4）

物理引导AI（Physics-Guided AI）

PGNN架构：在损失函数中加入物理约束（e.g., 湖泊密度-温度关系 [48]）
哈密顿神经网络：强制能量守恒（dH/dt=0）[91]

自动化科学（Automated Science）

符号回归工具：Eureqa [26], SINDy [25] 从数据发现方程
AI Feynman算法：递归分解高维问题 [49]

三、关键术语详解

术语	定义	应用场景
外推能力（Extrapolation）	模型在训练数据范围外的预测能力	HM通过物理约束提升外推可靠性（e.g., 反应器扩产）
可解释AI（XAI）	使ML决策过程可被人类理解	PGNN中物理损失函数提供解释性
物理引导神经网络（PGNN）	在NN训练中硬性嵌入物理约束（架构设计）或软性约束（损失函数）	流体力学中强制满足连续性方程 [28]
符号回归（Symbolic Reg.）	从数据自动发现数学表达式（e.g., `F = k*x`）	从湍流数据发现新本构关系 [26]
结构PCA（sPCA）	利用流程拓扑约束改进主成分分析	化工网络故障检测 [88]