清华主页 EN
导航菜单
求真大讲堂预告 | 第七十五讲:非编码RNA的语言模型及其在疾病门诊上的应用


编码非RNA的语言模型及其在疾病诊断上的应用


主讲人:鲁志

时间:10月26日(周日)15:30

地点: 宁斋

直播:校内【荷塘雨课堂】

校外b站【THU求真书院】


主讲人介绍

鲁志博士,清华大学科学学院长聘副教授,特别研究员,博士生导师,“生物信息学”教育部重点副主任,部“青年长江学者”,国家“优秀青年”基金和“霍英东”青年基金获得者。2003年中国科学技术大学生命学院本科,2008年获美国罗切斯特大学的生物物理学博士,2008-2010年在耶鲁大学从事生物信息学的博士后研究, 2011年加入清华大学建立生物信息学实验室,历任Tenure-Track助理教授、副教授(长聘)。鲁志博士的实验室主要从事跟非编码RNA有关的生物信息学研究,包括1)AI驱动的脑模型,2)生信驱动的精准医疗两个重点方向。发表国际重要期刊文章70余篇(Science, Nature, Cell, Nature Comp. Sci., PNAS,e-Life, Nuc. Acids. Res.,Genome生物学,生物信息学等),共引用近2万次,其中以通讯作者身份发表的30余篇(高被引4篇)。

宣讲摘要

本实验室的主要研究方向是开发基于非编码RNA的生物信息学方法(http://software.ncRNAlab.org),用于:1)人工智能驱动的RNA建模;2)生物信息学驱动的精准医疗。非编码RNA是生物学中蛋白质基因不可或缺的补充。我们开发生物信息学方法,从结构和转录后调控(例如剪接和编辑)等多个角度探索非编码RNA的调控作用。我们还开发单细胞总RNA测序技术,并结合ATAC-seq等其他组学数据,构建细胞内外编码和非编码基因的多组学图谱。

1)人工智能驱动的RNA建模。不同领域的新方法和新思维的引入往往能带来该学科的突破性进展,因此我们特别关注将最新计算领域(例如基于大型语言模型的新型人工智能技术)的新技术和新思维引入生物数据。我们开发新型RNA模型,以探索RNA(尤其是非编码RNA,ncRNA)的结构、调控和靶标等基础科学问题。最终,这些新型模型将引领精准医疗、酶和药物设计进入一个新时代。

2)生物信息驱动的精准医疗。对于复杂疾病而言,准确选择最佳诊断和治疗方案至关重要,但也极具挑战性。例如,不同药物和免疫疗法的获益群体尚不明确,这就需要精准的指导和生物标志物。我们从多组学和单细胞水平研究患者各种免疫细胞中编码和非编码基因的调控图谱。结合血浆中的cfDNA/cfRNA和临床数据,我们开发了多模态人工智能模型,用于对癌症和自身免疫性疾病等复杂疾病进行精准诊断、预后、分型和治疗。