著名统计学家佘轶原加入西湖大学 数据科学新高地!西湖大学迎来了一位新成员——国际知名统计学家佘轶原教授,他已正式加入并担任理学院和理论科学研究院讲席教授。他的到来吸引了多位老师前来交流探讨。
统计学作为数据科学的核心基础,在机器学习、人工智能等领域发挥着重要作用,广泛应用于自然科学、工程技术及社会科学等诸多领域。佘轶原的研究涵盖高维统计、机器学习、优化技术、大数据分析及稳健统计,属于统计学、数学和计算机科学的深度交叉领域。他在北京大学接受了数学与计算机方向的系统训练,随后赴美攻读统计学,并在斯坦福大学获得博士学位。2018年,他在佛罗里达州立大学晋升为正教授,现全职加盟西湖大学。佘轶原教授是美国统计学会会士、数理统计学会会士及国际统计学会当选会员,曾荣获美国国家科学基金会职业生涯奖。他的加入将为西湖大学在统计学科布局上增添关键一环,并致力于打造学校在数据科学及其交叉领域的研究与人才培养新高地。
许多人误以为统计学只是数据的简单收集与整理,实际上这只是起点。统计学更关注如何通过数据推断总体规律,并为实际决策提供坚实的理论依据。作为国家一级学科,统计学不仅严谨且富有实践价值,早已深度融入社会生活和各类科学领域。“统计学是一门以数据为核心、研究与应对不确定性的科学。”佘轶原说。
不确定性来源于测量误差、个体差异、抽样偏差等,统计学通过严谨的分析与建模帮助我们理解并量化这些不确定性,提升科学推断和决策的可靠性。近年来火热的人工智能也离不开统计学的支持。马斯克曾表示:“机器学习的本质就是统计学。”理想的模型不仅需要在给定数据上实现良好的拟合效果,更重要的是具备统计上的有效性,即能够适应更广泛、更一般的未知情境。这种能力被称为“泛化能力”。
佘轶原的研究重点之一是高维统计领域,其核心挑战在于样本量远低于变量维度,导致“维度灾难”。然而,现代统计学发现现实世界的数据常常蕴含内在的简洁性,如稀疏性或低秩性。利用这一洞察,依然能够从中获得精准的预测与稳健的推断。他的研究致力于融合非渐进性理论分析、高效的优化算法与先进的正则化技术,深入挖掘数据背后的内在关联,使高维信息变得清晰且可解释。
现实中数据往往并不“干净”,异常值、标记错误、高杠杆点等现象随处可见。这些异常数据可能严重影响传统估计和推断方法。佘轶原教授创新性地构建了稳健损失函数与高维统计正则化之间的理论桥梁,通过融合稀疏约束与非凸优化技术将异常检测与参数估计统一于同一框架。他提出了具备有限样本理论保证的新方法和高效算法,应用于大数据分析。
在统计学家眼中,世界充满不确定性,人类获取的数据也自然蕴含随机性与变异性。面对现实数据的复杂性,我们依然渴望确定,在偶然中捕捉必然。这正是统计与数据科学令人着迷之处,正如佘轶原教授所说——寻幽入微,知常达变。