加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • 数据为中心的方法正在改变材料科学范式
    • 什么是材料信息学?
    • 没有一刀切的方法
    • 生成式算法与判别式算法
    • MI的新进展
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

AI设计引爆材料革命

03/28 11:47
1154
阅读需 14 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

2023年11月底,Google旗下DeepMind在《自然》(Nature)上发表重磅论文,称已开发出用于材料科学的人工智能AI)强化学习模型GnoME(Graph Networks for Materials Exploration),并通过该模型和高通量第一性原理计算寻找到38万余个热力学稳定的晶体材料。“为人类增加了800年的智力积累,”文章中提到,极大加快了发现新材料的研究速度。

稍后,微软发布材料科学领域的AI生成式模型MatterGen,可根据所需材料性质按需预测新材料结构。“MatterGen模型可大幅提升新材料的按需研发效率”,微软总裁布拉德·史密斯说道。

今年1月,微软与美国能源部下属西北太平洋国家实验室(PNNL)合作,利用AI和高性能计算,从3200万种无机材料中筛选出一种全固态电解质材料,完成了从预测到实验的闭环。据称,该技术有助于研发下一代锂离子电池材料。

Meta和字节跳动也布局了材料研发方向。Meta AI与美国高校合作开发了行业顶级的催化材料数据集Open Catalyst Project和有机金属框架吸附数据集OpenDAC。这些科技巨头凭借专有技术开辟了无机材料科学的新赛道。

不过,3月初,UCSD教授、Materials Project发起人Shyue Ping Ong表示:“《自然》根本不应该发表谷歌的上述论文,因为它违反了FAIR(可发现、可访问、可互操作、可重用)的数据原则。谷歌决定不共享用于生成式模型的数据,甚至不共享模型结果本身,唯一共享的数据是模型最终发现的稳定晶体,这让人难以复现模型。”

数据为中心的方法正在改变材料科学范式

材料科学是一门重要科学,也是近代工业高速发展的支柱。在漫长的人类文明中,从石器时代到青铜器时代,再到铁器时代,无不与材料息息相关。近年来,AI技术引入科研形成了一个重要的交叉学科。

IDTechEx高级技术分析师Sam Dale认为,材料信息学(MI)代表了数据革命对材料研发的影响。以数据为中心的设计和发现方法,包括数据基础设施、机器学习(ML)和AI的显著进步,正在改变材料科学家和工程师的工作范式,使材料更快地推向市场,并推动朝着新的方向发展。

一系列战略方法已经出现,领先玩家和通过数据驱动方法开发的商业化材料正在出现。AI的影响涵盖了材料科学领域的许多相关项目。对底层技术的分析揭开了这一快速增长的研发数字化转型领域的神秘面纱。Sam Dale预计,到2034年提供材料信息服务的公司收入的复合年增长率将达11.5%,超过7亿美元。研发范式的转变使未来10年成为快速应用的最佳时机。

什么是材料信息学?

材料信息学(MI)是利用以数据为中心的方法来推进材料科学,设计新材料、发现特定应用的材料并优化材料的处理方式。数据驱动方法的影响从研发的开始直到结束,包括假设创建、数据处理、获取和分析以及知识的最终提取。

MI不仅可用于预测给定材料的特性,甚至可以从材料的期望特性进行逆向设计,从而缩短材料设计中昂贵的试验和重复搜索。加速创新的“正向”(为输入材料实现特性)只是其一种应用,理想化的解决方案是实现“逆向”(在给定所需特性的情况下设计材料)。

Sam Dale认为,MI的挑战与其他AI主导的领域(如自动驾驶汽车或社交媒体)非常不同。由于这一领域正处于萌芽阶段,数据基础设施并不完善,MI算法对于给定实验数据来说往往太不成熟。稀疏、高维、有偏差和噪声的数据随处可见,而利用领域知识是大多数方法的重要组成部分。

与认知相反,MI并不会取代研究科学家。MI软件提供商的作用是将材料科学家的工作与数据科学家的工作结合起来,使其成为一套赋能技术,利用科学家的专业知识加速研发进程。对许多人来说,梦想的最终目标是让人类监督一个自动运行的实验室。

没有一刀切的方法

随着时间推移,部署MI的战略方法将不断增加。研发数字化转型的组织复杂性是阻碍MI部署的一个关键问题,而MI可能阻碍MI SaaS(软件运营服务)产品的部署,更不用说内部开发了。最终,MI提供商的作用是弥合材料科学家和数据科学家/工程师之间的差距。

在技术方法方面有多种形式,因为每个场景的解决方案都非常不同。显然,每种途径都不一定相互排斥。类似的是,“大量数据”的定义可能会有很大的变化,并将对所使用的ML模式产生很大影响;数据也可能有偏见,难以准确表示。

Sam Dale指出,在开发探索过程中,重要的是利用所知道的东西探索新的领域。在改进任何模型时,都在寻找新的数据,更重要的是收集的新数据点,以提高模型和输出的准确性。

收集新数据的主要方式有两种,即Exploration(探索)和Exploitation(利用),在强化学习中,Exploration是开发未知领域,而Exploitation是利用已知知识。

Exploitation旨在根据当前信息做出最佳决策,其中agent(智能体,在此是ML算法)希望预测具有最佳结果的候选者;Exploitation希望收集更多信息以做出最佳决策,通过选择agent寻找不确定性最高的区域。

一般来说,应该在这些方法中找到一种平衡,以便在扩大总知识库的同时有效地使用信息。最常见的方法是Epsilon-Greedy策略(算法),在每次迭代中随机选择一个探索性或开发性策略。探索率(Exploration Rate)ε在开始时被设置为1,以确保对空间的探索,但以设置的速率向0衰减,以确保随着迭代进展和对决策空间的更多了解,策略变得可以利用。

生成式算法与判别式算法

Sam Dale解释说,算法之间的显著区别在于生成式模型和判别式模型。判别式模型试图确定条件概率(p(y|x)):即,在给定x(分子表示)的情况下,观察性质y(如带隙能或溶剂化能(solvation energy))的概率。

相反,生成式模型试图确定联合概率分布p(x,y),以观察分子表示和物理性质的概率。通过将概率限制在分子(x)或性质(y)上,即可获得直接设计(p(y|x))和逆向设计(p(x|y)的概念。因此,生成式模型可以是可逆的。这导致人们最近越来越意识到这些技术的力量,特别是在大型语言模型(LLM)和文本生成式模型方面,这两种模型的用途都是生成AI。

至于LLM的科学能力,它包括以下四个方面:

一是改进界面,使之更加智能化、人性化和高效化,提升用户体验和满意度。LLM可理解并生成自然语言,更好地与用户交互;优化搜索和推荐系统,更准确地识别用户意图,返回更精准的结果;识别出界面中存在的问题,并提供相应的优化建议;

二是数据发现,凭借其深度的语言理解和生成能力,帮助研究人员更高效、准确地从大量数据中提取、整理和分析有用信息,为科学研究和商业决策提供有力支持。

三是可查询专家,LLM充当“实验室助理”可赋能设计实验过程。通过检索增强生成(RAG)回答专业问题,汇集来自多个文献源的有用建议,如Fehrmann MaterialsX针对合金开发的MatGPT。

四是预测建模,虽然用LLM作为预测agent代替更专业的机器过程效率较低,也可能比“传统” ML模型(如随机森林)预测精度差些,但其优点是将上下文和领域知识结合起来,就像将其纳入LLM的初始提示一样简单。

现在,化学和材料科学家的数据库越来越多,都可以被视为数据存储库。有些是开放访问的,有些则不是;一些由公共或其他非营利机构经营,另一些由私营企业经营。其中大多数都有特定的专业领域,旨在成为该主题所有数据的主要来源。其他公司的目标是成为材料和化学领域的权威中心。这可能在更大程度上使化学和材料科学“民主化”。

MI的新进展

几十年来,许多行业都采用上述类似的设计方法,这项颠覆性技术对目前材料科学领域的影响主要有:

一是利用其他行业的AI驱动解决方案的改进,包括利用LLM简化MI;

二是数据基础设施的改进,从开放访问数据存储库到基于云的研究平台;

三是意识、教育和跟上创新步伐的需要,AI的繁荣只会加速这一需求。

四是确定了在研发过程中使用先进ML技术的三个优势:①加强对候选者的筛选和研究领域的界定,减少开发新材料的实验次数及寻找新材料或新关系,从而缩短上市时间;②训练数据可基于内部实验、计算模拟和/或来自外部数据存储库;③增强的实验室信息学和高通量实验或计算将成为许多项目不可或缺的一部分。

近年来,从初创公司到老牌巨头,材料行业玩家对研发数字化转型要求的认识加速了MI的采用。伴随2023年AI爆火,人们对MI的兴趣只增不减。过去,采用AI的推动力来自组织内部的自下而上,而越来越多的推动来自于渴望展示AI在其业务中影响的高管。2024年将是材料信息SaaS公司投资最有利的一年,将超过2019年的高点。

早在生成式AI被公众广泛知晓之前,它就已被应用于MI。生成式模型的影响在2023年更加普及,ChatGPT等服务背后强大的LLM占据了头条。LLM也给MI带来了变化。

随着检索能力的增强,将LLM转变为可查询专家,Fehrmann MaterialsX等新势力和Citrine informatics等老牌公司的服务中已体现了这一点。LLM在材料研究方面令人兴奋的潜力在于:使用自然语言作为界面可使学习曲线变平,MI软件客户群可能扩展到材料最终用户。

采用MI通常有几种核心方法:完全内部运作、与外部公司合作,或作为联合体或合资企业的一部分运作。

日立等主要公司此前曾向外部提供内部开发的MI平台,但2023年汉高将其端到端研究平台Albert Invent剥离为一家外部公司,将其作为客户参与进来,出现了更灵活且资金充足的小型组织。2024年也许会出现更多类似的分拆,因为企业试图从其内部开发的平台中获得更多投资回报,同时避免与竞争对手的利益冲突。

最后,从地理位置来看,采用AI技术的许多最终用户在日本,而许多新兴的外部公司来自美国,最著名的财团和学术实验室都分布在这两个国家。“对任何设计材料或用材料设计的公司来说,忽视这种研发转型都将是一个重大疏忽,错过这一转变将付出高昂的代价,”Sam Dale说。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
ATXMEGA16A4U-AUR 1 Microchip Technology Inc IC MCU 8BIT 16KB FLASH 44TQFP

ECAD模型

下载ECAD模型
$2.86 查看
ATSAMA5D35A-CN 1 Atmel Corporation RISC Microprocessor, 536MHz, CMOS, PBGA324, 15 X 15 MM, 1.40 MM HEIGHT, 0.80 MM PITCH, GREEN, MO-275KAAE-1, LFBGA-324
$13.79 查看
FT232RL-REEL 1 FTDI Chip USB Bus Controller, CMOS, PDSO28, 10.20 X 5.30 MM, GREEN, SSOP-28

ECAD模型

下载ECAD模型
$4.79 查看

相关推荐

电子产业图谱

“TechSugar”微信公众号分享独家观点,做你身边值得信赖的新媒体,提供有深度、有广度的原创文章。