5月17日,国家杰青、山东大学数学与交叉科学研究中心杨建益教授做客南开大学生命科学学院“人工智能生物学”讲座,为本科生精心策划并呈现了一堂既引人入胜又充满启迪的学术课程,主题为“AI赋能蛋白质与RNA结构预测”。
课上,杨建益教授首先点明了AI在生物医药领域日益增强的影响力和在未来生物学研究中不可忽视的潜力,进而引出利用人工智能训练神经网络并应用在蛋白质和RNA结构预测的可能性。杨教授介绍了传统的蛋白质结构预测方法以及历史上的结构预测“函数式”程序,通过介绍PCSB数据库中历经几十年的的大数据积累量,强调了用于训练AI的足够数据量的重要性。杨老师以“Alphafold”为例,介绍了AI相比于人类在预测蛋白质结构方面巨大的优势和革命性的影响,并点明了AI训练的三大因素:大数据,良好的硬件,深度学习算法。
接着,杨建益教授详细介绍了早期进行蛋白结构预测的“两步走”通用模型,包括“数据库查找序列”,“同源蛋白筛选”,“模型建立”,“二维结构预测”,“三维结构预测”等,图文并茂,生动地为同学们介绍了2020年发布的Alphafold1和trRosetta两种“两步走”大模型的诞生历史和优缺点。接着,杨老师又引出了最新的“一步走”大模型建立方法,该方法跳过了二维结构预测步骤,所有数据优化都由神经网络完成,目前已经诞生了AlphaFold2和RoseTTAFold两种“一步走”大模型,这种大模型克服了原有“两步走”方法的冗余陈杂和自身噪点过多的缺点,在如今的AI预测蛋白结构领域拥有很大的影响力。
杨建益教授详细讲解了其课题组联合自主开发的trRosetta大模型,指出该大模型在算法方面的创新和优势。该模型采用“一步走”方法,仅使用AI完成二维平面的构建,二维到三维的跨越全部由数学最小化函数完成。该模型克服了“一步走”的固有缺陷,避免了丢失重要细节信息,又进一步提升了预测效率和准确性,使得该模型在过去几年获得了大量的引用的迭代使用。最后,杨建益教授介绍了目前通过AI预测RNA结构的困难之处主要是现有数据的缺乏。
在课程临近尾声之际,杨教授对精准预测蛋白质和RNA的动态结构的未来发展进行了富有前瞻性的展望。他对微蛋白的AI预测理论立刻引发了同学们的热烈反响。大家纷纷表示,这种分析思路突破了以往静态分析的局限性,为AI在结构生物学领域的实际应用打下了坚定的基础。同时,同学们也对杨教授提出的这一创新性思路表示出极大的兴趣和好奇,纷纷提出自己的疑问和看法。面对同学们的踊跃提问,杨教授耐心地进行了解答。整堂课程在热烈的气氛中圆满结束。
为拓宽学生知识边界和学术视野,把握“人工智能”时代脉搏,深入了解人工智能在生物学领域的前沿应用与发展趋势,生命科学学院为本科生精心策划开设“人工智能+”课程,旨在邀请人工智能与生物医学交叉领域的多位专家授课,为我校不同专业的学生提供丰富的跨学科学习资源。