|
【引言】 機器學(xué)習(xí)方法正在成為眾多學(xué)科科學(xué)探究的一部分。 機器學(xué)習(xí)(ML)是可以從數(shù)據(jù)中學(xué)習(xí)計算機算法的研究和構(gòu)建。我們腦海里對新材料的發(fā)現(xiàn)以及化學(xué)合成基本還停留在傳統(tǒng)的研究人員身穿白大褂,手里拿著各種化學(xué)試劑的場景。殊不知這幾年人工智能的發(fā)展已經(jīng)應(yīng)用到了各個領(lǐng)域,人工智能真正讓人們接受應(yīng)該是AlphaGo大戰(zhàn)圍棋天才柯潔而一戰(zhàn)成名。它能通過數(shù)據(jù)記錄上百個頂級棋手的下棋行為,通過大數(shù)據(jù)分析,后臺的優(yōu)化算法而做到越賽越勇。在材料化學(xué)領(lǐng)域人工智能也在發(fā)揮著越來越重要的作用,往往研究人員想盡腦汁做不出來的東西它可以經(jīng)過成千上萬次的計算給出最優(yōu)答案。 【成果簡介】 北京時間2018年4月13日,Science在線發(fā)表了普林斯頓大學(xué)Abigail G. Doyle、Merck Sharp & Dohme公司Spencer D. Dreher(共同通訊)等人題為“Predicting reaction performance in C–N cross-coupling using machine learning”的文章,團隊證明了機器學(xué)習(xí)可以用來預(yù)測多維化學(xué)空間中合成反應(yīng)的性能,使用通過高通量實驗獲得的數(shù)據(jù)。通過創(chuàng)建腳本來計算和提取原子,分子和振動描述符,用于鈀催化的Buchwald-Hartwig芳基鹵化物與4-甲基苯胺在各種潛在抑制添加劑存在下的交叉偶聯(lián)反應(yīng)。使用這些描述符作為輸入和反應(yīng)產(chǎn)量作為輸出,表明隨機森林算法提供了比線性回歸分析顯著改進的預(yù)測性能。 【圖文導(dǎo)讀】 圖1 ML在反應(yīng)預(yù)測中的應(yīng)用
圖2 測試集性能圖
文獻鏈接:Predicting reaction performance in C–N cross-coupling using machine learning(Science,2018,DOI:10.1126/science.aar5169 |