2018年12月7日下午,北京大学数学科学学院艾明要教授应邀来我院在综合楼601举办了一场题为“Optimal Subsampling Algorithm for Big Data Generalized Linear Models ”的讲座,该讲座由王启华老师主持,学院部分老师以及研究生参加了此次讲座。
讲座伊始,王启华老师为在座各位介绍了艾明要教授的学历背景以及学术成就。随后艾明要教授引出了大数据的概念,并以解决大数据为前提开始进行接下来的讲解。艾教授将讲座内容分为三大部分。第一部分,艾教授基于大数据集的计算、储存及可视化问题,介绍了最优抽样方案的背景,简要回顾了广义线性模型的基本知识,并总结了前人就这一问题提出的最优抽样方案。针对二元响应变量,前人在logistic回归模型中提出A-最优性准则(OSMAC)下的最优抽样方法;在第二部分中,艾教授老师将这一方法推广到具有典范链接函数的广义线性模型中,建立了一般二次抽样算法估计量的一致性和渐近正态性,推导出A-和L-最优准则下的最优抽样概率;第三部分则是为我们展示了不同模型设置下的模拟结果,并与已有的方法相比,新方法的均方误差更小,且抽样用时更短,也说明新方法更便于大数据的应用。
在讲座中,我院老师和同学们与艾明要教授进行了热烈的讨论,进一步深入了解了这一新抽样方法的前景与应用,极大地开阔了学术视野。
友情链接: 浙江工商大学统计学院 | 中国人民大学统计学院 | 厦门大学计划统计系 | 中国统计学会 |
版权所有 ©2017 浙江工商大学统计学院 All Right Reserver. Email:tjx@zjgsu.edu.cn 技术支持:名冠电子商务
地址:浙江省杭州市下沙高教园区学正街18号 联系电话:(86)571-28008085 浙ICP备15014656号 浙公网安备33011802000512号