对命名实体识别与消歧(Named Entity Recognition/Disambiguation)与词义消歧(Word Sense Disambiguation)有兴趣的同学注意了:ACL主席Gertjan van Noord等欧洲NLP科学家近日编撰了一篇非常棒的报告,汇总了大量的实体识别与消歧,词义消歧数据集,工具集。强烈推荐!🔗 网页链接 展开全文 这些年,我们遇到的雾霾。。依次拍摄于2009年10月28日,2010年1月18日,2011年2月17日,2011年12月10日,2012年1月6日,2012年10月20日,2012年12月11日,2013年1月14日,2013年10月21日。 【谷歌资助研发的翻墙软件uProxy】据报道,谷歌日前在纽约展示了一款名为“uProxy”网络代理软件,该软件旨在帮助用户绕过网络审查,自由访问互联网。"uProxy"项目由华盛顿大学和非功利组织Brave New Software研发,由谷歌提供资金资助。"uProxy"目前还在测试阶段,申请测试链接为:uproxy.org 展开全文 //@Mr_侠游山水 : 心如刀割般痛,久不能平静,曾有过类似的感受 。会给予这对母子以帮助,祝今后一切安好 。//@沈阳张晶 : 刚接的法院电话通知,夏俊峰以火化,明天9点去领取骨灰,谢谢大家陪伴我。//@沈阳张晶 : 夏俊峰求他们给我们一家合个影,被拒绝,说给他自己留个影,也不可以,为什么 展开全文 去看守所会见夏俊峰最后一面.在路上[泪][泪] 我在:🔗 网页链接 //@pascal_de_chine_ACL_group : 我觉得这就是dl最大的问题了:太脏太乱不成理论体系 凭经验瞎调 hinton组大量实验结果都很难重复 特别是learning rate怎么设?完全是瞎搞么 给你一个新dataset 立马挂掉 要重调这些hyperparameters 可是大数据上调一遍这么久 让工业界怎么用啊 展开全文 终于知道hinton的弟子们厉害在哪里了。除了paper写得又快又好,hack和调参的功夫更是出神入化。想重复他们的实验都是有极高难度的 我在:域清街 //@pascal_de_chine_ACL_group : 大家通常以为python和perl一样是脚本语言,而核心需要c++/java写,这其实大错特错:python不是用来写小脚本的,而是用来写核心大程序的。小脚本/regexp用awk就搞定了,比perl还方便。就像你说的,perl你写一个小脚本很爽,但换个人或者你自己一个月以后看就疯了 展开全文 KDD 2013下个月就要在芝加哥开幕了,看了一下会议安排和论文列表,发现"大数据"已经被列为一个session的标题了。Research Program: 🔗 网页链接 52nlp网站早上挂了,然后有好几名同学通过评论或者私信通知我,非常感谢大家;目前网站换了一个IP,过会儿应该可以访问了,国内解析的比较慢,要是在国外应该访问正常了 #课程评论# “Coding the Matrix: Linear Algebra through Computer Science Applications” 🔗 网页链接 比较关注这门线性代数的应用课程,所以昨天课程开始后就看完了第1周(week 0)的视频,主要是课程介绍以及讲了一些数学预备知识,包括函数,复数域以及伽罗瓦域或者有限域中的GF2...展开全文 推荐一个Python机器学习工具包Scikit-learn以及相关视频--Tutorial: scikit-learn - Machine Learning in Python - Scikit-learn个好东西,文档配套的非常完善。下面这个youku视频上找到的一个tutorial,荣誉属于@road2stat 🔗 网页链接 (分享自 @52opencourse_挖课) 展开全文 自动客服,不过搞错了//@课程图谱 : 回复@北京长城宽带 : 这是挖关键词自动回复的吧? //@北京长城宽带 : 愿您网络生活,畅爽无忧!@北京长城宽带 带宽极致 , 惊喜无限! 小编今天的心情是极好的,所以也希望您的心情也是哇哇滴好哦。在网络上,我关注您,因为北京长城宽带愿将关爱传递给您。 展开全文 "Networks: Friends, Money, and Bytes" 我们已经生活在网络世界里,在这里交朋友,玩游戏,刷微博等等等等,我们越来越离不开网络。这门课程试图通过20个和移动互联网,Web以及Internet相关的实际问题来介绍来自于苹果、谷歌,Faceboo 🔗 网页链接 @课程图谱 六年前的今天和老婆相识于合肥,今天和老婆同游于大连老虎滩,前几天有朋友说看到52nlp的第一反应是"我爱你老婆",我觉得挺不错的。 TED公开课: Jane McGonigal - 游戏创造美好生活 - 我爱公开课 这是最近看到的一个令人震撼的TED演讲,如果公开课也用游戏机制来设计,相信大家学习的效果会好很多 🔗 网页链接 (分享自 @52opencourse_挖课) 北京森林工作室汉语句义结构标注语料库(BFS-CTC)共享资源 | 我爱自然语言处理 🔗 网页链接 有同学在52nlp上分享了这个资源,并提供3000句句义结构标注语料和语料查看工具的下载,更多可去该工作室申请,感兴趣的同学可以关注 "概率语言模型及其变形系列-PLSA及EM算法" 本系列博文介绍常见概率语言模型及其变形模型,主要总结PLSA、LDA及LDA的变形模型及参数Inference方法。by @杨柳Larry | 我爱自然语言处理 🔗 网页链接