近期,我校生物工程学院生物资源与生物炼制研究团队近期,我校生物工程学院生物资源与生物炼制研究团队Sam课题组在机器学习驱动木质素高效增值转化方面取得重要进展,研究成果“Scalable lignin monomer production via machine learning guided reductive catalytic fractionation of lignocellulose”正式发表于Advanced Science 。
木质纤维生物质是自然界中最丰富的可再生资源之一,其高效利用对于推动可持续生物经济发展具有重要意义。其中,木质素作为唯一可再生的芳香族高分子聚合物,被认为是制备高附加值化学品(如愈创木酚、紫丁香酚等)的理想原料。然而,生物质天然抗降解特性以及木质素结构的复杂异质性,仍然制约木质素的高效分离与解聚转化。近年来,“木质素优先”型还原催化分馏(RCF)策略因其在保留多糖组分的同时能实现木质素的选择性分离与高效转化,已成为生物质精炼领域的研究热点。然而,RCF过程受底物组成、溶剂性质、催化剂类型及操作条件等多因素耦合影响,传统的试错式优化方法不仅效率低、成本高,也在很大程度上制约了其工业化进程。
针对这一挑战,孙付保教授团队提出了一种基于机器学习(ML)驱动的RCF智能建模与优化策略。研究团队对Scopus数据库中的相关文献进行了系统梳理,从54项研究中提取出3451个有效实验数据点,建立了一个覆盖多维实验参数的综合数据库。在此基础上,研究人员将13个关键输入变量划分为四类:底物组成(纤维素、半纤维素、木质素及β-O-4键含量);溶剂性质(极性与相对能量差RED);催化剂特征(金属/碳比及负载量);操作条件(反应时间、温度、总压力、生物质负载量及搅拌转速)。在构建与比较多种先进机器学习模型后,结果表明,极端梯度提升回归模型(eXtreme Gradient Boosting Regression,XGBR)在木质素单体产率预测中表现最为优异,相关系数达到R = 0.80–0.86,预测误差较低(均方根误差RMSE = 3.99–8.31,平均绝对误差MAE = 2.85–6.90)。特征重要性分析结果显示,操作条件对模型输出的影响最大(40–57%),其次为底物组成(25–43%)和催化剂-溶剂性质(14–21%)。值得注意的是,实验结果与模型预测的总单体产率误差仅为2%–2.6%,充分验证了模型的稳健性与高精度。此外,经济分析结果显示,在假设每年处理约1.4亿吨白杨生物质的条件下,该方法可减少约2060万吨二氧化碳排放,并节省约47.29亿美元的社会经济成本。总之,该策略不仅通过降低工艺优化试错成本显著提升了木质素单体转化效率,也为建立智能化木质纤维素生物炼制技术提供了新思路与技术支撑。
江南大学Meysam Madadi副研究员和2024级博士生Ehsan Kargaran为该论文共同第一作者,江南大学孙付保教授和布鲁塞尔自由大学Keikhosro Karimi教授以及都柏林城市大学Vijai Kumar Gupta教授为该论文共同通讯作者。上述研究工作得到国家重点研发计划(2025YFA0921201)和国家自然科学基金(22278189;22478154)以及中央高校基础研究基金(江南大学,JUSRP202501024)等资助。近年来,我校生物工程学院孙付保教授团队在木质纤维原料的绿色生物加工制造方面取得明显进展,相关成果陆续发表在Chemical Engineering Journal (2025, 507: 160332; 2024, 481: 148713)、Journal of Colloid and Interface Science (2025, 687: 786-800)、Bioresource Technology (2025, 430: 132594)、Energy (2025, 320: 135520)等本领域权威期刊。
原文链接:https://doi.org/10.1002/advs.202510496

图文摘要(一)

图文摘要(二)