本期内容

本期沙龙第一位嘉宾是来自普度大学的邱怡轩,他分享的话题是“统计模型、数值计算与编程实现之间的关系”,又名“公式与代码之间隔了几本线性代数”:

现在我们都知道,统计与计算已经密不可分,各种灵活强大的编程语言让大部分学统计做统计的人都可以快速地实现许多简单或复杂的统计模型。而当现在大家都在谈论大数据的时候,人们的关注点开始从“如何算得对”向“如何算得快”进行转变。

就拿统计里面最经典的多元回归来说,在我们随手就可以lm()或者proc glm的时候,我们是否细想过它们背后的实现是怎样的?统计课本告诉我们

yhat = X(X'X)^(-1)X'y

你或许也曾写过

x %% solve(t(x) %% x) %% t(x) %% y

这样的代码(问题在哪儿?),但这都不是计算的真相。这一期沙龙里我们来八一八做回归的一百种方式(夸张了些!),一步一步揭开高性能计算的神秘面纱。

推荐阅读

Matrix decompositions for regression analysis: http://pages.stat.wisc.edu/~st849-1/lectures/Orthogonal.pdf

Fast and Elegant Numerical Linear Algebra Using the RcppEigen Package(第4节): http://www.jstatsoft.org/index.php/jss/article/view/v052i05/v52i05.pdf

第二位嘉宾是来自西安交通大学管理学院的常象宇教授,他将介绍用统计模型模型去描述社交网络的特性。

关于我们

统计之都(COS,http://cos.name)海外线上沙龙是COS海外会员的线上学习交流活动,每期由一位或多位嘉宾通过视频形式主讲分享,主持人和嘉宾可以通过视频直接互动交流,其他参加沙龙活动的观众可以通过Google+观看直播并以文本形式提问,无法在直播时间看视频的听众也可以随后在Youtube上看重播,国内观众可以在 http://meetup.cos.name 看重播。

本次视频同时会搬运到B站,欢迎前去欢乐弹幕:http://space.bilibili.com/22035559