//@王斌_ICTIR : 转//@徐君_ : SMIR 2014的邀请报告云集了IR和NLP的大牛,UMass的Bruce Croft教授、微软研究院的Jianfeng Gao研究员、CMU的Ed Hovy教授、马里兰大学的Doug Oard教授和阿姆斯特丹大学的Maarten de Rijek教授将与大家探讨信息检索和自然语言处理中的语义匹配,敬请期待! 展开全文 语义匹配(Semantic Matching)是信息检索与自然语言处理的核心问题之一,欢迎大家关注与投稿SIGIR 2014 Workshop on Semantic Matching in Information Retrieval (SMIR 2014) 🔗 网页链接 。时间:7月11日,地点:澳大利亚黄金海岸,投稿截止日期:5月10日。 @李航博士 展开全文 【侯世达:大数据不美,没有品位,我不喜欢】三十多年前,侯世达靠一本《集异璧》,把许多青年才俊拐入了人工智能这条道上。但是……他如今对人工智能的思考,却和现在流行的那类人工智能研究大相径庭。侯世达认为思考是一件涉及品味和美的事情,现在的AI毫无洞见可言:🔗 网页链接 薛宇:加州大学伯克利分校的帕切特教授(左)连发三文抨击“网络皇帝”、美国东北大学的巴拉巴西教授(中)的“发现”狗屁不通;同时还抨击生物信息领域大牛、MIT的凯利斯副教授(右)“不诚实和欺诈”,这下,整个生信领域像是被丢进了颗重量级的核弹。🔗 网页链接 真皮沙发,请前排就坐~ 并发导论。来自网易的寻寒同学写了一篇并发导论,文章写的很详细,介绍很多并发的基础知识,如内存重排,锁,cache等。 🔗 网页链接 "不,你还不是数据科学家。" ---- IBM Watson执行架构师Swami Chandrasekaran绘制了一张相当漂亮的数据科学技能地图。他认为应当掌握的领域包括基础数学,统计,编程,机器学习,自然语言处理,可视化,大数据,数据摄入,数据变换,工具箱等。大图地址:🔗 网页链接 《大数据技术基础》教程(共283页)已经正式发布(下载地址:http://t.cn/8k96Zhm),从一个数据库研究者的角度介绍大数据技术。历时半年,根据大量网络资料整理汇编,厦门大学数据库实验室林子雨老师团队精心制作,与大家分享。本教材已经用于厦大计算机系研究生教学,包含全套教材和讲义PPT。 展开全文 千万别让老爸带孩子,他们一认真北鼻就惨了。。。。[哈哈] //@图灵郭志敏 : 前20的榜单里有@图灵教育 的《C++Primer中文版(第4版) 》、《编程珠玑(第2版) 》《大数据•互联网大规模数据挖掘与分布式处理 》、《Python基础教程(第2版) 》,恭喜译者@王斌_ICTIR 老师,有你的一本译著哟 //@出版人周筠 : 《2013 年上半年亚马逊(中国)计算机图书 Top 100 排行榜》1.数学之美、2.鸟哥的Linux私房菜、3.浪潮之巅、4.C++Primer中文版(第4版) 、6.C程序设计语言、7.算法导论、11.编程珠玑、14.Java编程思想、19.Python基础教程…… 链接:🔗 网页链接 cc@亚马逊图书音像 /m/@王斌_ICTIR : Mark//@还是地雷 : //@西瓜大丸子汤 : 这个报告有趣的一点是最后把随机森林方法也视为深度学习的一个变种。也就是在rbm和autoencoder之外,古老的决策树方法也可以容纳进深度学习的框架。这非常有意思,因为随机森林有很多rbm等没有的优点。wise.io的出现,看来也是恰逢其时了 展开全文 🔗 网页链接 来自google的这个报告说,在各种半结构化特征学习算法中,简单的随机森林方法random forest取得了最好的结果。他们本来最感兴趣的是深度学习方法,但是最终的结果并不出众。一共比较了两百多种方法亲自为《机器学习实战》制作的新宣传banner,已经准备在当当上专题了,嘿嘿!希望这本书能像《大数据》一样大卖,重印时找译者请吃冰淇淋 @王斌_ICTIR @张栋_机器学习 目前本书在当当(排名第5)http://t.cn/zH4E5SC、卓越均已上市(排名第6)。京东(http://t.cn/zHGWbLE)稍后也会上市。 展开全文 【Twitter的系统编程】Twitter工程师Marius Eriksen的演讲PPT,具体讲解了Twitter系统编程,大量使用Scala。英文🔗 网页链接 ,译文🔗 网页链接 。 正在研究 Techu,考虑使用它。这是一套用来实时索引与搜索的开源 REST API。 🔗 网页链接 很久没写文章了,专门为 @课程图谱 写了一篇技术软文 “如何计算两个文档的相似度(一)” 🔗 网页链接 , 如果您浏览后觉得有点用,欢迎转发和评论,您的传播,是对我最大的支持,谢谢。 刚看当当7日畅销榜,我们的《大数据:互联网大规模数据挖掘与分布式处理》重回榜首啊!晒晒@王斌_ICTIR 中科院信息工程研究所网络信息安全方向因报考过线人员不足,仍有部分博士生名额空缺。现寻求今年报考科学院的考生,要求满足科学院基本分数线,从事网络与信息方向的研究工作。有意者请发邮件至wangyange@iie.ac.cn @王斌_ICTIR 求转发 给定一个带权无向图G=(V,E)和一个正整数b,分割图G的顶点集V为若干个子集,使得每个子集的顶点数不超过b,并且割边(两个顶点在不同子集中的边)之和最小。该问题应该是个比较经典的NP难问题,请求老师们的解决方法以及近优程度@刘铁岩 @唐杰THU @白硕SH @王斌_ICTIR 有论文(WWW 2011的《Limiting the Spread of Misinformation in Social Networks》)提到了一个词misinformation. Google上翻译为误传。请问老师,我能把这个词理解为虚假信息或错误信息吗?@白硕SH @王斌_ICTIR 如果不能,那么虚假信息应当如何翻译呢?false information? 展开全文