国科金发计〔2024〕113号丁香五月婷婷基地
国度当然科学基金委员会现发布可讲解、可通用的下一代东谈主工智能方法首要研究谋划2024年度风物指南,请央求东谈主及依托单元按风物指南所述要乞降留苦衷项央求。
国度当然科学基金委员会
2024年3月14日
可讲解、可通用的下一代东谈主工智能方法首要研究谋划
2024年度风物指南
可讲解、可通用的下一代东谈主工智能方法首要研究谋划面向东谈主工智能发展国度首要战术需求,以东谈主工智能的基础科学问题为中枢,发展东谈主工智能新方法体系,促进我国东谈主工智能基础研究和东谈主才培养,支握我国在新一轮外洋科技竞争中的主导地位。
一、科学计划
本首要研究谋划面向以深度学习为代表的东谈主工智能方法鲁棒性差、可讲解性差、对数据的依赖性强等基础科学问题,挖掘机器学习的基容许趣,发展可讲解、可通用的下一代东谈主工智能方法,并推进东谈主工智能方法在科学领域的转变应用。
二、中枢科学问题
本首要研究谋划针对可讲解、可通用的下一代东谈主工智能方法的基础科学问题,围绕以下三个中枢科学问题开展研究。
(一)深度学习的基容许趣。
深入挖掘深度学习模子对超参数的依赖关系,久了深度学习背后的职责旨趣,树立深度学习方法的靠近表面、泛化错误分析表面和优化算法的治感性表面。
(二)可讲解、可通用的下一代东谈主工智能方法。
通过功令与学习结合的样貌,树立高精度、可讲解、可通用且不依赖精深标注数据的东谈主工智能新方法。拓荒下一代东谈主工智能方法需要的数据库和模子检会平台,完善下一代东谈主工智能方法运转的基础身手。
(三)面向科学领域的下一代东谈主工智能方法的应用。
发展新物理模子和算法,建设开源科学数据库、学问库、物理模子库和算法库,推进东谈主工智能新方法在处分科学领域复杂问题上的示范性应用。
三、2024年度资助研究见解
(一)耕作风物。
围绕上述科学问题,以总体科学计划为牵引,对于探索性强、选题新颖、前期研究基础较好的央求风物,将以耕作风物的样貌赐与资助,研究见解如下:
1.神经收集的新架构和新的预检会或自监督学习方法。
针对图像、视频、图、流场等数据,发展更高效的神经收集新架构,预检会或自监督学习方法,并在确凿数据集上进行考证。
2.深度学习的暗意表面和泛化表面。
研究卷积神经收集(以偏执它带对称性的收集)、图神经收集、轮回神经收集、低精度神经收集、动态神经收集、生成扩散模子等模子的泛化错误分析表面、鲁棒性和自由性表面,并在本色数据集上进行考证;研究无监督暗意学习、预检会-微调范式等方法的表面基础,发展新的泛化分析方法,带领深度学习模子和算法想象。
3.深度学习检会算法的表面基础。
研究神经收集亏欠景不雅的结构和检会算法的本性,包括但不限于:临界点的漫衍偏执镶嵌结构、极小点的连通性,自由性角落(edge of stability)和亏欠尖峰(loss spike)表象、算法的隐式正则化、自由性和治感性;检会经由对于超参的依赖性问题、神经收集记挂不幸、检会时辰复杂度分析等问题;发展卷积收集、Transformer收集、扩散模子、羼杂巨匠模子等模子的治理速率更快、时辰复杂度更低的检会方法。
4.大模子的基础问题。
研究多任务、多数据、大模子的基础问题,包括但不限于大模子的暗意表面和泛化表面、大模子检会的自由性、标度率(scaling law)、浮现等表象;研究新式 (structured) state model的基础性质,包括它是否有记挂不幸(curse of memory)的贫穷;久了Transformer模子的抒发和泛化能力、高下文体习(In-Context learning),Chain of Thoughts推理的灵验性,以及模子的外推能力(举例length generalization)等。
5.微分方程与机器学习。
研究求解微分方程正反问题及解算子靠近的概率机器学习方法;基于生成式扩散概率模子的物理场生成、模拟与补全框架;基于微分方程想象新的机器学习模子和收聚合构,加快模子的推理、分析神经收集的检会经由。
6.图神经收集的新方法。
诳骗当场游走、多项式访佛、和解分析、粒子方程等数学表面处分深度图神经收集过度光滑、过度挤压、适用异配图与动态图等问题;针对药物想象、保举系统、多智能体收集协同收敛等紧要应用场景想象灵验的、可推广的、具有可讲解性的图暗意学习方法。
7.东谈主工智能的安全性问题。
针对主流机器学习问题,发展阴事保护协同检会和权衡方法;发展面向挣扎样本、数据投毒、后门中分析、报复、退缩和拓荒方法;研究机器学习框架对模子侵略、任性和收敛的方法;发展可控精度的阴事谋略方法,数据和模子(包括大模子)的公道性、可靠性的评估与评级方法。
8.科学谋略领域的东谈主工智能方法。
针对电子多体问题,树立薛定谔方程数值谋略、第一性旨趣谋略、解放能谋略、粗粒化分子能源学等的东谈主工智能方法,探索东谈主工智能方法在电板、电催化、合金、光伏等体系研究中的应用。
针对典型的物理、化学、材料、生物、松手等领域的跨门径问题和能源学问题,发展物理模子与东谈主工智能的交融方法,探索复杂体系变量隐含物理关系的挖掘方法和构效关系的数学抒发,树立具有通用性的跨门径东谈主工智能扶持谋略表面和方法,处分典型复杂多门径谋略问题。
9.以数据为中心的机器学习。
针对数据质地、数目和遵守等成分,发展机器学习方法为卑劣机器学习模子提供精深高质地数据;针对AI for Science数据侧,研究和想象高效的科学数据(如对卵白质和药物构图)构建和预处理样貌;针对大模子数据侧,从数据获取老本和遵守动身,树立科学和系统的数据质地评估策略,想象高效的数据遴选方法,构建灵验的数据配比样貌,并探索大模子扶持数据质地进步的方法(如自动数据标注)。
10.基于量子谋略的机器学习算法。
研究不同类型的学习方法怎样映射到一般的量子经由,提议新算法诳骗量子本性罢了高效学习;研究量子机器学习相对于经典机器学习方法在抒发能力以及泛化能力上的上风,探索量子机器学习的可讲解性,树立量子机器学习在量子物理和化学的应用场景。
11.洞开型风物。
与可讲解、可通用的下一代东谈主工智能方法和AI for Science 领域商量的方法,重心支握在算法和模子方面的转变课题。
(二)重心支握风物。
围绕中枢科学问题,以总体科学计划为牵引,拟以重心支握风物的样貌资助前期研究遵守积存较好、对总体科学计划在表面和重要技能上能阐述推进作用、具备产学研用基础的央求风物,研究见解如下:
1.下一代东谈主工智能方法。
发展结合逻辑推理、学问和功令的东谈主工智能方法,树立具有可讲解和可通用性的东谈主工智能表面框架;发展适用于一语气、密集数据(如图像)和非结构化数据(如分子结构)的新式神经收集架构,灵验捕捉空间、结构、语义等多维度的高下文信息,提高对数据的建模能力。在确凿数据集上进行考证。
2.新一代脑启发的东谈主工智能模子与灵验检会算法。
针对大脑神经元的物理形态和生物物理的万般性,树立生物神经元与东谈主工神经元之间的粗浅且灵验的映射关系,使东谈主工神经元具有生物神经元的树突非线性整合与谋略功能,为树立其它类型生物神经元与东谈主工神经元的映射提供吞并的表面和算法框架。结合大脑神经元收集集聚结构、脑区异质性和宏不雅梯度等特质,想象带生物神经元本性不停的东谈主工神经收集模子,罢了记挂、决策等高等融会功能。罢了不少于3种生物神经元与东谈主工神经元之间的灵验映射和3种紧要的树突谋略功能,与现存映射比拟,罢了精度、性能和参数可讲解性上的进步。
3.多智能体结合学习表面与方法。
针对多智能体结合时漫衍式数据处理所面临的挑战,如泛化性能枯竭保险、稳健性和可推广性弱等难题,研究高效的多智能体结合学习表面与方法,具体包括:(1)研究进步多智能体结合学习系统泛化性能的算法,分析泛化错误界;(2)针对动态变化的环境和不时推广的收集范畴,研究多智能体系统的稳健性和可推广性,确保智能体大概灵验学习并高效结合;(3)在多智能体系统中处理和交融多模态数据(如文本、图像和传感器数据)的方法,以增强学习效果和进步决策质地;(4)研究在及时或近及时环境中的结合学习和决策策略,关心动态和概略情环境下的救急反馈和重要决策;(5)探究智能体的个性化学习策略,在保握个体上风的同期灵验进行集体学习和学问分享。
4.多模态交融及生成基础模子。
研究多模态数据交融及生成的基础模子,处分数据视角、维度、密度、蚁集和标注难易进度不同而形成的交融难题;研究模态交融经由中的模态对都问题,保证模态权衡的一致性并减少交融经由中信息亏欠;研究轻量级的交融模子,进步在模态间非完好对都气象下交融模子的鲁棒性;研究用易蚁集、易标注模态数据来教会难蚁集、难标注模态数据的预检会与微调方法;研究大范畴多任务、多模态学习的预检会问题,罢了少样本/零样本迁徙,发展跨模态万般性数据生成的方法;研究多模态大模子的新式、吞并概率建模方法,处分冲突、一语气羼杂数据类型的概率建模与生成难题,提高多模态基础模子的生奏遵守。在多模态模子中罢了不少于3个模态的暗意学习、对都及生成能力,模子参数不少于7B,探索在智能座舱、自动驾驶或多模态对话等领域的应用考证。积存用于检会多模态大模子的优质标注数据,并探索数据闭环,蚁集数目朝上标注样本不少于2个量级的非完好标注或无标注数据,罢了模子迭代优化。
5.模子与数据交融的大模子检会方法。
探索系统性的、自稳健数据录取方法,以达到数据和模子的有机交融,包括:在模子检会经由中on-the-fly 录取下一步所继承的数据的方法;树立数据和模子有机交融的机器学习框架;发展替代大模子检会精深继承的先处理数据、再作念模子检会的两步走模式的灵验方法。
6.视频原生的自监督学习方法。
针对视频数据既是时辰序列又是图像,但又不同于一般的时辰序列和图像的特质,充分诳骗视频数据的属性和特质,发展一套新的自监督学习框架,类比针对时辰序列的predict next token 的框架和针对图像数据的填空框架,并在本色视频数据集上加以考证。
7.支握下一代东谈主工智能的通用型高质地科学数据库。
大范畴高质地科学数据是东谈主工智能运转的科学研究新范式的必要要求。研究科学数据、科技文件等的学问对象标注、抽取、交融中的主动学习机制与自动关联算法;研究面向学问对象的智能编码与机器可识读的多元剖判,支握跨领域学问对象的广谱关联,罢了与不少于3个外洋主流科技资源标识动态互通,支握与外部数据资源智能化交融;研究多模态跨学科学问碎屑对都与学问对象识别方法,以及多学科领域数据自动出产与增强算法,形成妥贴外洋表率或经同业评议的且掩饰不少于8个学科领域的高质地科学数据1PB以上。
8.AI for Science 的基础身手建设与示范应用。
发展AI for Science的基础身手方法,包括:基础物理模子的东谈主工智能算法;高遵守、高精度的实验表征算法;自动化和智能化实验平台建设;科学文件和科学数据的整合与智能应用。发展AI for Science的转变应用,包括但不限于:复杂催化体系(催化剂动态结构变化、反应收集高度复杂等问题);碳达峰和碳中庸中的中枢催化反应;工况要求下的电化学表征方法;生物医学中的高遵守和高精度的成像技能;有机合成的自动化和智能化处分决策;定向进化卵白质工程等。重心支握表面和实验相结合并形成闭环的风物。
四、风物彩选的基本原则
(一)细巧围绕中枢科学问题,饱读舞基础性和交叉性的前沿探索,优先支握原创性研究。
(二)优先支握面向发展下一代东谈主工智能新方法或能推进东谈主工智能新方法在科学领域应用的研究风物。
(三)重心支握风物应具有细密的研究基础和前期积存,对总体科学计划有班师孝敬与支握。
五、2024年度资助谋划
拟资助耕作风物约25项,班师用度资助强度不朝上80万元/项,资助期限为3年,耕作风物央求书中研究期限应填写“2025年1月1日-2027年12月31日”;拟资助重心支握风物约6项,班师用度资助强度约为300万元/项,资助期限为4年,重心支握风物央求书中研究期限应填写“2025年1月1日-2028年12月31日”。
六、央求要求及留苦衷项
(一)央求要求。
本首要研究谋划风物央求东谈主应当具备以下要求:
1. 具有承担基础研究课题的履历;
2. 具有高等专科技能职务(职称)。
在站博士后研究东谈主员、正在攻读研究生学位以及无职责单元或者地地契元不是依托单元的东谈主员不得算作央求东谈主进行央求。
(二)限项央求功令。
执行《2024年度国度当然科学基金风物指南》“央求功令”中限项央求功令的商量要求。
(三)央求留苦衷项。
央求东谈主和依托单元应当崇拜阅读并执行本风物指南、《2024年度国度当然科学基金风物指南》和《对于2024年度国度当然科学基金风物央求与结题等商量事项的书记》中商量要求。
1. 本首要研究谋划风物实行无纸化央求。央求书提交日历为2024年4月15日-4月22日16时。
(1)央求东谈主应当按照科学基金收集信息系统中首要研究谋划风物的填报说明与撰写提纲目求在线填写和提交电子央求书及附件材料。
人与动物(2)本首要研究谋划旨在细巧围绕中枢科学问题,对多学科商量研究进行战术性的见解教会和上风整合,成为一个风物集群。央求东谈主应字据本首要研究谋划拟处分的中枢科学问题和风物指南公布的拟资助研究见解,自行拟定风物称号、科学计划、研究内容、技能道路和相应的研究经费等。
(3)央求书中的资助类别遴选“首要研究谋划”,亚类说明遴选“耕作风物”或“重心支握风物”,附注说明遴选“可讲解、可通用的下一代东谈主工智能方法”,受理代码遴选T01,字据央求的具体研究内容遴选不朝上5个央求代码。耕作风物和重心支握风物的合作研究单元不得朝上2个。
(4)央求东谈主在央求书肇始部分应明确说明央求妥贴本风物指南中的资助研究见解,以及对处分本首要研究谋划中枢科学问题、罢了本首要研究谋划科学计划的孝敬。
若是央求东谈主一经承担与本首要研究谋划商量的其他科技谋划风物,应当在央求书正文的“研究基础与职责要求”部分呈报央求风物与其他商量风物的分辨与商量。
2. 依托单元应当按照要求完成依托单元承诺、组织央求以及审核央求材料等职责。在2024年4月22日16时前通过信息系统逐项证实提交本单元电子央求书及附件材料,并于4月23日16时前在线提交本单元风物央求清单。
3. 其他留苦衷项。
(1)为罢了首要研究谋划总体科学计划和多学科集成,赢得资助的风物负责东谈主应当承诺遵命商量数据和府上管理与分享的功令,风物执行经由中应关心与本首要研究谋划其他风物之间的相互支握关系。
(2)为加强风物的学术调换,促进风物群的形成和多学科交叉与集成,本首要研究谋划将每年举办1次资助风物的年度学术调换会,并将不依期地组织商量领域的学术研讨会。获资助风物负责东谈主有义务干预本首要研究谋划带领巨匠组和管理职责组所组织的上述学术调换举止。
(四)筹商样貌。
交叉科学部交叉科学一处
商量电话:010-62328382丁香五月婷婷基地