大数据能力提升项目|学生成果展系列之四

这篇具有很好参考价值的文章主要介绍了大数据能力提升项目|学生成果展系列之四。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

大数据能力提升项目|学生成果展系列之四

导读

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

回首2022年,清华大学大数据能力提升项目取得了丰硕的成果,同学们将课程中学到的数据思维和技能成功地应用在本专业的学习和科研中,在看到数据科学魅力的同时,也将自己打造成为了交叉复合型的创新型人才。下面让我们通过来自8个院系的10位同学代表一起领略他们的风采吧!

分子间作用对茂金属催化剂的作用机制

大数据能力提升项目|学生成果展系列之四

亮点

(1)建立分子间作用对催化性能进行调控的理论方法。

(2)建立统计模型,评估不同级别理论方法对外加稠环芳烃化合物配体的催化的能量与几何描述能力。

(3)通过理论分析结果,可视化分子间作用力,并阐明面面构型稠环芳烃二聚体配体的分子间作用力对新型茂钛金属催化剂的调控作用。

大数据能力提升项目|学生成果展系列之四

大数据能力提升项目|学生成果展系列之四

大数据能力提升项目|学生成果展系列之四

本工作着重关注的芳氧基茂钛金属催化剂的一系列单芳烃配体及其面-面构型的二聚体配体的理想构型,其结构示意图如Fig.1所示。其中,a表示单芳烃配体,序号1,2,3,4和5分别对应苯(C6H6)、萘(C10H8)、蒽(C14H10)、芘(C14H10)、蒽(C16H10)和六氟苯(C6F6);b表示单芳烃对应的二聚体配体。

大数据能力提升项目|学生成果展系列之四

Fig.1MolecularstructuresofauxiliaryligandsR[R=a1)C6H6,a2)C10H8,a3)C14H10,a4)C16H10,a5)C6F6andtheirsandwichdimers,b1)C6H6…C6H6,b2)C10H8…C10H8,b3)C14H10…C14H10,b4)C16H10…C16H10,b5)C6F6…C6F6]tomodifyhalf-titanocenecomplex.

Fig.2展示了扫描精度为0.01Å时二聚体配体能量随构型变化的势能面,涉黑色原点为在ωB97XD/6-311++g(d,p)的几何构型上采用CCSD/cc-pVTZ高精度方法优化得到的能量,方法依赖性整体高于基组依赖性,其中,M06-2X-D3方法对相互作用能有所高估;B3LYP-D3(BJ)方法对有所低估,但基组上升到3Zeta时,B3LYP-D3(BJ)和ωB97XD方法能量计算差距减小。整理来看,M06-2X-D3结合带有弥散函数的基组对能量描述较好。B3LYP-D3(BJ)和ωB97XD对相互作用能有1-2kcal·mol-1的高估。六氟苯(C6F6)的几何和能量描述误差大于其他结构。

大数据能力提升项目|学生成果展系列之四

Fig.2Potentialenergycurves(kcal·mol-1)forseriesinteractionstructures(seeFig.1)ofsandwichdimerligands,a)C6H6…C6H6,b)C10H8…C10H8,c)C14H10…C14H10,d)C16H10…C16H10,e)C6F6…C6F6.

Fig.3总结了Fig.2所示势能面曲线驻点对应的二聚体几何结构及相互作用能,箱线图展示了不同方法的几何及能量优化结果。可以看出,六氟苯(C6F6)二聚体最优构型面心距离与萘(C10H8)二聚体相近,烷烃二聚体面心距离基本与相互作用能负相关,即二聚体最优构型面心距离越小,相互作用能越大。计算方法的依赖性整体高于基组依赖性,B3LYP-D3(BJ)方法,特别是结合6-31++g(d,p)基组,可能对最优构型的面心距离有所高估;能量描述方面,B3LYP-D3(BJ)方法结合2Zeta基组6-31g(d,p)和6-31++g(d,p)可能对最优构型的作用能有所高估,M06-2X-D3方法结合2Zeta基组则可能对最优构型的作用能有所低估。

大数据能力提升项目|学生成果展系列之四

Fig.3Interactionenergies(kcal·mol-1)foroptimizedsandwichdimerstructuresbasedonthepotentialenergycurves(seeFig.2).

能量分解是将分子作用力分解成不同物理成分,从而能从能量角度更深入地了解相互作用的本质,其中一种是对称匹配微扰理论

(Symmetry-AdaptedPerturbationTheory,SAPT)。SAPT可以将相互作用能分解为四部分:交换(exchange)、诱导(induction)、静电(electrostatics)和色散(dispersion)。Fig.4的箱线图展示了对5种芳烃二聚体的12种方法优化构型通过PSI4程序采用二阶微扰SAPT2结合jun-cc-pVDZ基组进行能量分解的计算结果。其中,交换能描述分子近距离出现的交换互斥作用,数值为正且越大越不利于分子间的结合,其顺序为:b1<b2<b5<b3<b4;诱导能描述分子电荷相互极化和相互转移的作用,数值为负且绝对值越大越有利于结合,其顺序(绝对值)为:b1<b2<b3<b4<b5;静电能描述片段间经典库仑作用,数值为负且绝对值越大表示吸引作用越大,越有利于结合,其顺序(绝对值)为:b1<b2<b5<b3<b4;色散表示为瞬时偶极之间产生的吸引作用,绝对值越大越有利于结合,其顺序(绝对值)为:b1<b2<b5<b3<b4。总结来看,除C6F6外,交换、诱导、静电和色散相互作用均随环数增多而增加。

大数据能力提升项目|学生成果展系列之四

Fig.4SAPT2components(kcal·mol-1)ofthedifferencebetweenoptimizedsandwichdimerstructures(seeFig.2).

为考察能量分解各弱相互作用的物理成份与二聚体最优构型、作用能的关系,采用

Lasso(Leastabsoluteshrinkageandselectionoperator)方法进行特征选择后建立多元回归模型。Lasso方法特征选择结果表示,df=3为选择贡献较大的三个特征诱导(induction)、静电(electrostatics)和色散(dispersion),不利于结合的交换(exchange)贡献最小;df=2为选择贡献最大的两个特征静电(electrostatics)和色散(dispersion)。以df=3和df=2与基于ωB97XD/6-311++G(d,p)方法得到的二聚体最优构型和基于耦合簇方法CCSD/cc-pVTZ和双杂化泛函方法PWPB95-D3/def2-QZVPP得到的高精度作用能建立多元回归模型,结果如Fig.5所示,可以看出所选择特征均能较好的拟合几何与能量。df=3时能量预测残差约为±0.2kcal·mol-1,几何预测残差约为±0.02Å;df=2时能量预测残差约为±0.5kcal·mol-1,几何预测残差约为±0.04Å。

大数据能力提升项目|学生成果展系列之四

Fig.5ResultsofmultifactorlinearregressionanalysisbetweenSAPT2components(seeFig.4)andoptimizedenergiesandstructuresofsandwichdimers(seeFig.2).

为对比不同计算方法和基组对相互作用的描述性能,用R2描述Fig.5拟合优度并展示在Fig.6中,数值越大表示方式的描述性能越好。可以看出,残差较大的两特征(df=2,为静电和色散)的R2普遍小于三特征(df=3,为诱导、静电和色散);基组依赖性普遍高于方法依赖性。在能量描述方面,带有弥散函数的6-31++(d,p)和6-311++(d,p)基组R2普遍大于不带有弥散函数的6-31(d,p)和6-311(d,p)基组,在几何描述方面,基组的弥散函数优势在df=2时更为明显。

大数据能力提升项目|学生成果展系列之四

Fig.6Performanceofdifferentmethods(seeFig.5)topredictinteractionenergiesandstructuresofsandwichdimersbySAPT2components.

为进一步探索分子间相互作用对茂钛金属催化剂几何参数的影响,本文通过建立片段(O、Ti、Cl、茂和配体)ADCH电荷和几何参数的LASSO回归,进行特征选择,结果如Fig.11所示。Fig.11(a)和(b)分别展示了超参数Lambda优化过程中,各特征系数变化以及误差的变化值,当误差最小时,Cl和茂的系数为0,说明Cl和茂的电荷变化对几何参数影响较小,O、Ti和配体的电荷影响较大。Fig.11(c)和(d)分别展示了选用O、Ti和配体的电荷对O-Ti键长和R-O-Ti键角的拟合情况,进一步证明O、Ti和配体的ADCH电荷(CO,CTiandCLigands)是影响几何参数的重要因素,对键长LO−Ti的预测性能要优于对键角AR−O−Ti的预测。

大数据能力提升项目|学生成果展系列之四

Fig.11Effectsofmolecularfragmentchargesongeometricparametersofhalf-titanocenecomplex,a)thevariationofcoefficientsandb)errorbarswiththehyperparameterlambdaofLASSOregression;resultsofmultiplelinearregressiontopredictc)LO−Tiandd)AR−O−Tibasedonfeatureselection.

编辑:文婧

校对:程安乐文章来源地址https://www.toymoban.com/news/detail-414312.html

到了这里,关于大数据能力提升项目|学生成果展系列之四的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包