7月3日上午,上海交通大学第225期大师讲坛在理科群楼6号楼300号报告厅举行。美国科学院院士、美国国家医学院院士、哈佛大学统计学系及生物统计学系终身教授林希虹应邀作题为“Build an end-to-end scalable and interpretable data science ecosystem by integrating statistics, ML, and domain sciences”的学术报告,引领交大师生了解学科前沿、开阔学术视野。本次大师讲坛由上海交通大学研究生院主办、数学科学学院协办,数百位师生听取了本次报告。
活动伊始,数学科学学院院长楼元向林希虹院士致以热烈欢迎,详细介绍了林院士的科研经历及其在统计学、生物医学和公共卫生等方面的杰出学术成就。
大师讲坛组委会联合数学科学学院精心制作了“科普三分钟”视频,向在座师生简要介绍了全基因组测序的历史与应用,以及其与现代统计学习方法和数据科学的结合。
林希虹院士的讲座首先从数据公平性的重要性出发,指出在大数据背景下,数据偏差的问题比数据的方差更为关键,深入探讨了统计学、机器学习(ML)方法与工具在这一生态系统中的核心作用,强调了统计学作为学习数据并考虑不确定性的科学,在解决复杂现实世界问题和促进可信决策中的关键性。通过分析全基因组测序数据和电子健康记录等案例,林院士讨论了一些可扩展、可解释的统计和机器学习方法、工具和数据科学资源,利用大型注释数据库、汇总统计、稀疏性和集合方法来说明要点。此外,林院士讨论了构建生态系统的挑战与机遇,特别强调了在高维数据分析中的可拓展问题,并介绍了如何使用线性混合模型和集成检验方法来增强罕见变异关联检验的能力。讲座最后,林院士鼓励听众拥抱新技术,培养跨学科思维,深入交流合作,以开放心态推动科学发展。
在交流提问环节,现场师生们踊跃提问,就如何开展跨学科研究等问题进行了深入探讨。林院士对各个问题给予了耐心细致的解答。
讲座最后,楼元教授向林院士赠送了大师讲坛证书和定制纪念品,并再次对林院士所带来的精彩报告表示感谢。
最后,与会人员与林院士合影留念,活动在热烈友好的氛围中圆满结束。此次报告深入浅出、内容翔实,不仅为交大师生提供了一个与世界知名学者面对面交流的宝贵平台,开阔了交大师生的学术视野,还为学生们播撒下了潜心学术的理想种子,唤起了学生们对科学探索的向往与热情。
视频链接:https://v.sjtu.edu.cn/#/playDetail?id=13490