同样是在kdd给talk,alex的另一个学生先被他带去各公司巡回预演,觉得slides不够fancy给他重做了,然后前晚还跑去google给他打印了poster。。。当我问alex要不要也给我看看的时候,他轻松的说,你可以的。。然后就在我给talk的时候出去玩冰桶了。。。 三个bound不如一个heuristic,三个heuristic不如一个trick。Neural Networks Tricks of the Trade,第二版,近800页tricks大汇总。问alex说这本书怎么样,alex说,你应该看看,不过要偷偷的[偷笑] 🔗 网页链接 感觉比说走就走的旅行更高大上一点:说给就给的报告。明天复旦,5小时,机器学习,优化,大数据,请大家轻拍。下班直接奔来上海的路上[哈哈] Joseph在ICML的tutorial关于大规模机器学习系统的报告很赞,slides在 🔗 网页链接 两个李沐 我们将介绍联合百度IDL,CMU和Google力量做的一个开源分布式机器学习系统。可以一个小时内在0.6P数据上训练一个600亿特征的模型。敬请期待 2014年6月13日,YOCSEF学术报告会“大数据时代的机器学习”将在中科院计算所四层报告厅举行,邀请清华大学张长水、北交大于剑、微软亚洲研究院李沐、淘宝徐盈辉、百度李沐担任特邀讲者,报告会由郭莉、李学龙、胡清华担任执行主席。会议详情及报名方式见:🔗 网页链接 住在宇宙正中心五道口号称五星的文津,竟然热水都不提供。。。这是特意吐槽北京有多热吗。。。 CMU计算机今年本科申请人数已经是01年dot-com泡沫最顶峰时期的2倍了。不知道这算是活过来了呢?还是进入新的泡沫了? 数了数,艾美奖比炸药奖加图灵奖等等之和还要多,隔壁楼那群“疯子”不容小瞧阿 🔗 网页链接 //@卡内基梅隆大学校友会 : 校友一枚!惊奇地发现他在1996年的Star Trek里面饰演的是发明人类史上第一艘曲速飞船的科克兰教授,实现了人类与外星人的第一次接触。太激动了! //@机器人小i : 太混乱了: Brin has become romantically involved with a Google employee, that employee had also at one point been involved with another Googler.... Google有那么有魅力的妹子么...//@机器人小i : what!!!我现在心中的男神和曾经dream company的女神 展开全文 【谷歌联合创始人布林婚变】谷歌联合创始人谢尔盖·布林与23and Me联合创始人安妮·沃西基,原本是硅谷最高调的夫妇之一,但他们却在几个月前分居,原因很可能是布林在谷歌公司内部发生了婚外情。布林和沃希基今年均已40岁,他们6年前结婚,并育有两个孩子,尚未正式离婚。 🔗 网页链接 这个时代真没隐私阿。gps数据精度平均是10m。如果你经常用手机刷weibo,那么某浪基本就可以知道你住那里,在哪里上班,怎么去上班。平常喜欢去哪,经常和谁在一起等等... 最后两天,想利用GPS数据和地球上的所有公路网和建筑设施来对人类行为建模的宏大项目估计搞不定了。最初灵感来自动物学家在动物身上装GPS来研究群体生活习惯。花了很多时间折腾各种新鲜的东西,可能稍微提升了下品味,但牺牲了短期目标,本有希望用熟悉的东西糙快猛的搞定 今下午Hinton的学生讲他们用Convolutional NN跑imagenet的工作,核心思想是几个trick和hack。会间被ML大佬们狂问为什么,结果回答基本是:不要问我为什么,我也知道这个不怎么make sense,但它就work,而且大家都觉得它work。然后会后瞧见了大佬们的疯狂吐槽。唉,这帮不搞CV不懂欣赏trick的MLer... 展开全文 今年CMU机器学习课程期末考题,12道题,满分120. 时间是3小时,可以翻书和携带算盘之类工具(例如 http://t.cn/zWI3Jhb)大家试试哈。答案过几天放出来,正在努力写中。地址 🔗 网页链接 因为暑假去加州,所以在匹兹堡的公寓的一间房在6,7,8月空余。虽然不大,但走路去CMU和匹大分别只用15和20分钟。短住免费,常住350刀一月。有兴趣私信哈。(ps. 没翻出屋里的照片,只找到张窗外的和两张楼下的) 原来CMU集群比起度厂来只强不弱啊!例如下面我拖出来的这个,64核,128G内存,Tesla K20x(2688核,6G内存),10G以太网,40G infiniband。只是凡事都要自己动手。。。当了一下午OP,满手都是血。。。 商学院(cmu tepper)也谈big data了,准备过去围观一下 一开始很欣赏羽泉那晚完美的表演,后仔细想想,林志炫更值得敬佩。他选的那两首歌很明显是要表达自己,满足自己内心,而不是一味取悦大家。我觉得我做研究也应该这样,不要一味追热,不求当风口的猪,不是像以前那样舞着大棒四处灌水。而且坚持自己的观点,做觉得有意义的,能从学到东西的问题 跟@余凯_西二旗民工 撞衫了,刚好今天我也挑战了下口语,一个小时讲完HMM, Kalman filter和probabilistic models for unsupervised learning slides在这里 🔗 网页链接 招聘季最后一个talk,也是今年system最强candidate,matei zaharia。spark和mesos作者,横扫sigcomm, sigmod, nsdi best paper。默默觉得cmu招不到此人。他的工作很完整,从底层集群资源管理mesos,到计算模型spark (in memory hadoop),到上层应用:实时流计算和sql。很值得学习 🔗 网页链接 展开全文 大数据:“人工特征工程+线性模型”的尽头 - 11年的时候我加入百度,在凤巢使用机器学习来做广告点击预测。当时非常惊讶于过去两年内训练数据如此疯狂的增长。大家都在热情 (图片2张) 原文地址: 🔗 网页链接 Quoc Le今天来cmu讲他在google做的large scale deep learning。alex很兴奋,边听边跟我吐槽,说这个不优,那里不好,连个概念都搞错了。好一阵之后累了,喝口水休息下。结果这时quoc突然冒一句,这些idea都来自alex... alex一口水喷在键盘上... 展开全文 python年的目标之一是用熟python。多年前二选一时选了perl,现在看起来python的功能更加强大 #算法书# officemate从IOI摸回来一本,是华沙大学多年积累下来的算法题集。每个人出两道题,题目都相当不简单,尤其是现在已经是教授了的。华沙大学号称说英语的大学里算法竞赛最强,实在不是浪得虚名。 🔗 网页链接 #book# 最近跟好几好友聊到机器学习教材,我感觉是Machine Learning A Probabilistic Perspective是目前最好的入门教材。介于纯Bayesian的PRML和纯frequentist的ESL之间,覆盖到了最近的内容,例如deep learning。缺点是百科全书般太厚,写得不够优美。在豆瓣上维护了一个list: 🔗 网页链接 展开全文