清华主页 EN
导航菜单
求真大讲堂讲座回顾|第四十九讲: 生成式人工智能与大模型:特点、启示及思考

引言

求真书院强调通识教育,旨在培养大师级“通才”。“求真大讲堂”是求真书院学生的通识必修环节,由求真书院院长丘成桐先生倡议设立,主题内容包罗万象,从人文诗词到天文科技,从沟通表达到艺术美学,皆聘请在各相关领域的知名学者讲授。求真书院鼓励学生通过汲取不同领域的知识,丰富学科知识体系,更充分地迎接未来的挑战。跟随大师步伐,共赴求真求美之旅。

主讲人

孙茂松教授,清华大学计算机科学与技术系长聘教授(曾先后任该系主任、党委书记),清华大学人工智能研究院常务副院长,清华大学计算机学位分委员会主席,欧洲科学院外籍院士,国际计算语言学学会(ACL)会士,中国人工智能学会会士,中国中文信息学会会士。研究领域为自然语言处理、人工智能、大模型、计算社会人文及计算教育学等。国家重点基础研究发展计划(973计划)项目首席科学家,国家社会科学基金重大项目首席专家。在国内外一流学术会议和重要刊物上发表论文数百篇,Google Scholar论文引用逾4万次。带领清华大学研发团队研制了我国第一个大规模中文在线开放课程平台“学堂在线”,已发展成世界第二大慕课平台,学习者遍布全球,累计注册超过1亿人。领衔研制出“九歌”人工智能中国古典诗歌写作系统,已为用户写诗约3500万首。主要学术兼职包括:清华大学-新加坡国立大学下一代搜索技术联合研究中心联席主任,新加坡国立大学访问教授,中央音乐学院兼职教授,国务院学位委员会第六、八届计算机学科评议组成员,教育部教学信息化与教学方法创新指导委员会副主任委员,国家语言文字工作委员会第三届科研规划领导小组顾问,国内核心期刊《中文信息学报》主编,《数字人文》共同主编等。2016年获“全国优秀科技工作者”。

讲座内容概述

孙茂松教授首先介绍了生成式人工智能与大模型的基本概念,强调了这两者在人工智能领域中的重要性。他详细解释了生成式人工智能的原理以及大模型在其实现中的关键作用。本报告将深入浅出地评介生成式人工智能的主要特点,扼要讨论其可能带给我们的启示(如人类创新范式的可能改变),并就相关技术哲学、大模型+X、开发利用、人才培养、科技伦理等问题进行初步的思考。

生成式人工智能的发展历程

孙教授回顾了生成式人工智能的发展历程。他提到,生成式人工智能的概念虽然早已存在,但直到近些年才得到了广泛的关注和应用。这主要得益于计算能力的提升和大数据的积累,使得大规模训练生成模型成为可能。

大模型的崛起

大模型是生成式人工智能的核心。在自然语言处理领域,大模型已经取得了显著的进展,例如GPT-3,它通过读取大量的互联网数据进行训练,展现了强大的语言生成能力。孙教授还强调了大模型在其他领域的应用潜力,如图像生成、音乐创作等。

生成式人工智能的实际应用

在讲座中,孙教授通过具体案例展示了生成式人工智能的实际应用:

  1. 文本生成:通过大模型,可以生成高质量的文章、对话和代码等,极大地提高了生产效率。

  2. 图像生成:生成对抗网络(GANs)在图像生成领域表现突出,可以生成逼真的图像,广泛应用于艺术创作和设计。

  3. 医学研究:在药物设计和疾病诊断中,生成式人工智能可以通过模拟实验加速研究进程。

当前面临的挑战

尽管生成式人工智能和大模型展示了巨大潜力,孙教授也指出了当前面临的挑战:

  1. 计算资源:大模型的训练需要巨大的计算资源,普通研究机构难以负担。

  2. 数据质量:模型的效果高度依赖于训练数据的质量,低质量数据可能导致不准确或有偏差的结果。

  3. 伦理和隐私:生成式人工智能的广泛应用引发了对数据隐私和伦理问题的担忧,需要制定相关的法律和规范。

未来展望

孙教授对生成式人工智能与大模型的未来发展充满信心。他认为,随着技术的不断进步,这些模型将在更多领域实现突破,推动各行业的创新和变革。孙教授鼓励与会者积极参与相关研究,抓住时代的机遇。

总结

此次讲座内容丰富,深入浅出,既有理论高度,又有实际案例,使听众对生成式人工智能与大模型有了更全面的认识和思考。讲座在热烈的掌声中圆满结束,大家期待未来能有更多类似的精彩讲座。