来自加州大学伯克利分校的助理教授丁鹏将为我们介绍他最近的文章,Sensitivity Analysis Without Assumptions。
随后来自华盛顿大学的助理教授黄帅将作品评。
在第二期沙龙出过镜的在d-Wise公司任Life Science Consultant胡江堂将分享他近些年读过的儿童/青少年文学。据称这些书可以帮忙回答小孩子一些措不及防的问题,比如为什么狐狸可以偷鸡吃。
这周请到的嘉宾有威斯康辛大学统计博士在读的罗兰和江麒,以及威斯康辛大学博士毕业,现就职于亚马逊的左辰。他们讲为我们分享在美求学、工作的见闻与心得。
这周我们请到了今年的John Chambers 统计软件奖的三位获奖者:来自西蒙弗雷泽大学的何通,来自华盛顿大学的陈天奇,以及来自普度大学的邱怡轩。
来自爱荷华州立大学的博士生潘岚锋将介绍“Latent Finite Mixture Model and False Discovery Rate”以及使用Julia的技巧。
同为爱荷华州立大学博士生的王芯将分享modeling for large spatial datasets方面的文章。
来自eBay的分析师陈丽云将为我们分享她在三藩American Economic Association大会的见闻。
上期嘉宾来自Seven Bridges Genomics的殷腾飞这期将继续来沙龙做客,这次他分享“美国生物信息公司做产品经理和产品研发的体验和创业公司的文化”。
来自爱荷华州立大学的博士生主伟呈将为我们分享shiny在统计研究中的应用。涉及的内容有:
同样来自爱荷华州立的刘美玲将分享出国留学的经验。
本期沙龙请到了三位嘉宾。
来自Seven Bridges Genomics的殷腾飞,为我们介绍生物数据云计算技术NCI Cancer Genomics Cloud。
芝加哥大学的博士生肖楠和杜克大学博士后李妙竹会为我们介绍hdnom和liftr包的开发。
本期沙龙第一位嘉宾是来自普度大学的邱怡轩,他分享的话题是“统计模型、数值计算与编程实现之间的关系”,又名“公式与代码之间隔了几本线性代数”:
现在我们都知道,统计与计算已经密不可分,各种灵活强大的编程语言让大部分学统计做统计的人都可以快速地实现许多简单或复杂的统计模型。而当现在大家都在谈论大数据的时候,人们的关注点开始从“如何算得对”向“如何算得快”进行转变。
就拿统计里面最经典的多元回归来说,在我们随手就可以lm()或者proc glm的时候,我们是否细想过它们背后的实现是怎样的?统计课本告诉我们
yhat = X(X'X)^(-1)X'y
你或许也曾写过
x %% solve(t(x) %% x) %% t(x) %% y
这样的代码(问题在哪儿?),但这都不是计算的真相。这一期沙龙里我们来八一八做回归的一百种方式(夸张了些!),一步一步揭开高性能计算的神秘面纱。
Matrix decompositions for regression analysis: http://pages.stat.wisc.edu/~st849-1/lectures/Orthogonal.pdf
Fast and Elegant Numerical Linear Algebra Using the RcppEigen Package(第4节): http://www.jstatsoft.org/index.php/jss/article/view/v052i05/v52i05.pdf
第二位嘉宾是来自西安交通大学管理学院的常象宇教授,他将介绍用统计模型模型去描述社交网络的特性。