基于机器学习的材料设计(AI文献阅读)
type
status
date
slug
summary
tags
category
icon
password
(2024) 基于机器学习的材料设计
Author: 赵纪军;
Journal: 物理, 53(7): 450-459, 2024.
Journal Tags:
Local Link: 赵纪军 - 2024 - 基于机器学习的材料设计.pdf
DOI: 10.7693/wl20240703
Abstract: 近年来,计算机算力的飞速提升推动了科学计算和人工智能领域的突破性进展。这两个领域深度融合,共同催生了数据驱动的变革性科学研究范式。作为人工智能技术的代表,机器学习为材料的计算设计带来了前所未有的发展机遇,当前的应用方向主要包括性质预测、合成预测、知识发现、生成式逆向设计等。文章将简要介绍该领域的研究进展,并展望未来发展方向与挑战。
Tags:机器学习,材料设计,材料合成,生成模型
Note Date: 2025/7/17 12:13:26
一、科研小白必备基础知识
1. 材料计算科学基础

- 密度泛函理论(DFT):通过求解薛定谔方程计算材料电子结构,是材料模拟的黄金标准(论文中所有数据库如MP/OQMD均基于DFT)。
- 高通量计算:自动化批量执行DFT计算构建材料数据库(如论文提到的MP含12万晶体数据)。
2. 机器学习核心概念

- 特征工程:将晶体结构转化为机器学习可处理的描述符(如论文中的晶体图、SLICES编码)。
- 评估指标:MAE(平均绝对误差,单位meV/atom)、决定系数R²(越接近1越好)。
3. 关键交叉知识
- 材料热力学:形成能(稳定性判据,负值稳定)、能隙(半导体特性)。
- 晶体学基础:晶格、配位环境、对称性(影响图神经网络设计)。
二、论文核心内容精读
1. 机器学习材料设计四大方向

2. 关键技术突破详解
(1)性质预测:晶体图卷积神经网络(CGCNN)

- 创新点:将晶体结构表示为图数据,保留原子邻域拓扑关系。
- 性能:形成能预测MAE=39 meV/atom(接近DFT计算误差)。
(2)合成预测:理性规划策略

- 原理:基于热力学(反应能)和动力学(界面能)量化合成难度。
- 案例:成功指导BaTiO₃/LiCoO₂等复杂氧化物合成。
(3)逆向设计:生成模型对比
模型类型 | 代表工作 | 优势 | 论文案例 |
VAE | Noh (2019) | 结构隐空间连续 | 生成V-O亚稳结构 |
扩散模型 | Zeni (2024) | 高保真结构生成 | 无稀土永磁体设计 |
SLICES编码 | Xiao (2023) | 字符串高效表示晶体 | 14种新型半导体 |
3. 未来挑战(论文Section 6)
- 数据瓶颈:实验数据稀缺,DFT数据存在系统性误差。
- 模型泛化:当前模型多为任务专用,需发展"材料大模型"。
- 实验验证:生成材料合成成功率低(如逆向设计仅千分之一验证)。
三、关键术语深度解析
1. 材料科学术语
术语 | 物理意义 | 机器学习中的作用 |
形成能 | 材料热力学稳定性指标 | ML预测核心(负值=稳定) |
能隙 | 电子跃迁所需最小能量 | 半导体/光电器件设计依据 |
德拜温度 | 晶体原子振动最高频率 | 超导体筛选关键特征(图2) |
2. 机器学习术语
(1)图神经网络(GNN)

- 创新:直接处理非欧几里得数据(晶体结构),优于传统描述符。
(2)多保真度学习
- 问题:DFT数据(低保真)与实验数据(高保真)混合训练。
- 方案:分层建模(Morgan团队能隙预测MAE=0.23eV)。
(3)潜在空间(Latent Space)
- 在生成模型中:高维结构→低维向量,通过操纵向量实现属性控制(如Ye的磁体设计)。
结论建议
- 学习路径:先掌握DFT基础(推荐书《Electronic Structure》),再学习PyTorch Geometric图神经网络实操。
- 工具推荐:Materials Project数据库 + CGCNN开源代码复现。
- 研究前沿:关注扩散模型在跨尺度材料生成(从晶体到介观结构)的应用。
Prev
人工智能和数据驱动的计算模拟(AI文献阅读)
Next
深度学习与第一性原理计算(AI文献阅读)
Loading...