被微博屏蔽 『中国如何缺席ChatGPT盛宴』『NLP圈的小家碧玉,CV圈的隔行隔山,出国交流减少,互联网交流不通。这些因素叠加起来,整个中文世界,形成了一个信息茧房。10年来,我们以为自己积攒了AI算法、数据、应用的优势,如今情况变成了中美扩大的技术鸿沟。这时候,我们甚至没有一个新闻调查,把这件事的来龙去脉,挖它个底朝天。另一个问题是,我们的中文互联网不足以提供高质量的训练数据。什么是高质量的数据?比如维基百科、高质量的活跃论坛、专业新闻、学术论文、高质量代码、图书。我们看看GPT–3的训练数据是什么。权重最大的数据集是OpenWebText(开源版本),数据是从Reddit论坛上收集的URL,再把内容抓取下来。Common Crawl是一个开放的互联网数据存档(英文占一半,中文大概5%)。其他一些代表性的数据包括Wikipedia 维基百科,Books开放图书,Stack Exchange 技术问答社区,Github 代码,ArXiv论文,RealNews 新闻存档,PubMed 医疗数据。可以看到,由中文互联网产生的数据,比例低到可以忽略。这也是困扰很多试图训练中文大模型的问题,但实际上,ChatGPT的用中文沟通的能力,已经远超那些专门的中文大语言模型了,背后原因是GPT隐式学到的翻译能力。没有好的中文数据,我们就只能搭全球互联网的数据顺风车。上面这些优质数据的产生,需要开放的社区,我们似乎无解。』收起
长图 展开全文 被微博屏蔽 SPAM 5月20日,网易有道词典引入Wikipedia (维基百科)优质内容,全新改版百科功能。朋友们点击新版词典的“百科”标签搜索英文词条,就能得到来自Wikipedia 的英文百科,阅读时还可借助取词功能,获取专业释义、读音和例句。是不是很棒?快来试试吧!此次更新仅限IOS版,安卓版随后上线,敬请期待。 展开全文 记得刚开始看文献的时候,Google translate和Wikipedia 始终开着呀!第一天只看4页文献,而且看完根本不知道讲什么[挖鼻屎]到后来一天十六页,现在一个下午可以看完一份四十多页的paper,真不容易!速度提高了,也可以看到whole picture而不会被details分心。看来近一个月的努力真真是没有白费! 展开全文 白痴才会完全照搬呢!你可以参考嘛!看别人总结的攻略是一回事 旅行当然是要用自己的眼睛去发现真实的美呀 规划的是费用 而不是风景 //@木遥 : 这种旅行还有什么意思,一点变数都没有的按表操课走马观花在家对着 google earth 和 Wikipedia 就可以做了啊。 泰国-印度尼西亚-柬埔寨-新加坡-马来西亚-日本-韩国的7国之行。提前近两个月时间筹备,买机票、定行程、订酒店、办签证...确认每一个出游的细节。经过回来后的结算,预算和实际花费几乎一致,非常圆满的一次出行,极具参考价值哦~🔗 网页链接 #穷游好帖# (图/穷游er echojulylee) 【百度地图称不走谷歌地图付费路 免费开放API】4月13日消息,谷歌宣布Google Maps API 开始限制使用次数,并对超出使用次数进行收费以来,一部分网站开始放弃使用 Google Maps API,转而使用免费开源地图服务Open Street Map,继Foursquare 与iphoto后,Wikipedia 的官方移动客户端也弃Google maps。 展开全文 新苏尔镇 Malpol 艺术工作室,一名工匠正在制作「维基百科纪念雕像」(Wikipedia Monument),波兰。这座雕像由美国雕塑家 Mihran Hakobyan 设计,以此向维基百科致敬,将于10月22日在波兰 Slubice 市中央广场亮相。 Ins被禁时群情激愤,你们真的有这么迫切的需要去使用Facebook, twitter吗?你们在上面有这么多重要朋友,导致你接受不到他们的newsfeed会痛不欲生?我很怀疑。花钱买vpn居然只是为了socialnetwork, 理解无能。直到前天古老师说BBC News被禁了, wikipedia 也阵亡了,有多少英语学习者是每天要用到这些啊 展开全文 已经有些地方的朋友和我说Wikipedia 已经打不开了,看来另一个大站又要倒下了,我就想问问,现在国内的学生不科学上网怎么写的论文?用百度?哈哈 今天wiki中文的特色条目太劲爆了……是wikipedia 求被墙的节奏吗…… 看wikipedia 到这里我真是笑瞎了[笑cry]....后天deadline我现在还在查资料写不出论文明天摘柿子心情不开森! WIKIPEDIA 上遊Shanghai Rush,但到現在都沒有深圳衛視,說明些什麼?@TAR极速前进 Google + Wikipedia +Copy/Paste = Homework done! 你妹!写essay为啥没办法这样呢? //@好东西传送门 : 转发理由:包括n-gram,带Freebase标注的8亿文档, Wikilinks 4000万页面链接标注,人工标注的wikipedia 公众人物到Freebase映射, 3900万Wikipedia Infobox编辑历史,词与实体的映射 Google近年来发布的有关文本挖掘、自然语言处理的数据集。🔗 网页链接 //@DURA海 : 罗斯柴尔德家族兴盛的历史,早已在19世纪末结束了,今天的罗斯柴尔德只是一家在全球排名十几到二十名的投资银行,规模不大,也没有什么呼风唤雨的能力。《货币战争》的危言耸听,其实根本没有任何证据。---by wikipedia //@KASHGAR灿烂 美媒报道,罗斯柴尔德家族在伦敦邀请了全球最富250人开会,与会者控制着大概全球1/3可投资金额(30万亿美元左右)。30万亿美元什么概念?中国2013年GDP9.18万亿美元,罗家控制热钱相当于中国三年GDP总额!微评:据说罗家是共济会老板,共济会想控制人类,中俄是共济会一直未能控制国家,警惕@宋鸿兵 展开全文 免费图片资源集,据网文整理,无法链接的如Flickr等未收:Getty,🔗 网页链接 ;Rijks Studio,🔗 网页链接 ;Calisphere,🔗 网页链接 ;NASA,🔗 网页链接 ;National Gallery of Art ,http://t.cn/8sNjR3d;Wikipedia Featured Pictures,🔗 网页链接 展开全文 完蛋了…wikipedia 一直打不开我的稿子要怎么办…gmail也只能用手机才能看了…[喵喵] 现代人已经很难想象,如果没有 Google、Wikipedia 、GPS、iPad……世界会是什么样子?人类大脑的神奇之处在于,一旦一个基本的新工具出现,它就会围绕这一工具重新塑造自己。(《加速时代,学点什么?》,新知) 在百度搜东西,第一个词条居然是wikipedia 而不是百度百科,惊了,震惊程度不亚于打开浏览器可以流畅使用Google 新买的surface 3,开机后访问google,报告https证书问题。访问wikipedia ,证书就好。总之就是部分https报证书问题,部分不报。来回折腾几下后总算想明白了。。。 原力,就是人类永无穷匮的求知欲。犹太人的一句格言:“人类一思考,上帝就发笑”,这一方面是自嘲,另一方面也是自省。互联网的兴起,让《大英百科全书》迅速贬值,Google和Wikipedia 汇整全球信息,成为内容的索引,而Facebook和各种社区提供用户之间的互动功能,搭建沟通的桥梁。 展开全文 这也太垄断了吧,Google香港都上不了,我想翻墙看YouTube结果无法打开网上应用店。对于用惯Google、YouTube、wikipedia 查大资料的人,百度就是一坨屎,眼睛瞟到都会吐的,更别谈用了。不过它也真是运气好,要不是government屏蔽,Google一进来它连死都不知道怎么死的,祈求上天大陆永远上不了吧 展开全文 全球排名前三位的网站google、facebook、YouTube全部被封,排名第四的Yahoo旗下的雅虎香港、雅虎台湾等被屏蔽,排名第六的Wikipedia 旗下的中文维基百科许多词条被屏蔽。我朝在对信息进行封锁的方面有超越朝鲜问鼎全球之势! 早!“It is our choices, Harry, that show what we truly are, far more than our abilities.” (J.K. Rowling, Harry Potter and the Chamber of Secrets)還記得書裡的這句話嗎?譯成中文吧![咖啡][微风][太阳](wikipedia 圖) 展开全文 维基百科失散多年的兄弟Wikia获得1500万美元D轮融资,用于拓展亚洲业务 | Wikia是Wikipedia 创始人Wales爵士创办的的盈利性 UGC 网站,他们目前在全球已经有1.2亿用于,最活跃的是其游戏社区。该轮融资的领投方Digital Garage会帮助Wikia建立在日本的广告和支付体系。🔗 网页链接 by@zuo_36kr 展开全文 #美国历史上的今天# 1916年8月25日, 国会通过法案,成立国家公园管理局,隶属内政部(现译国内资源部)。今天,该机构拥有2万多工作人员,管辖401个国家公园,每年接待2亿7千5百万访客,2014年度预算为26亿多美元。(图片:Wikipedia )#新鲜科技# Google 神器,寻找万事万物的答案,Google 现有的 Knowledge Graph 技术通常会以一块信息板的样式,出现在搜索结果的右边,回答一些 Wikipedia 上可以找到的信息。「Knowledge Vault(知识库)」的论文,这个新的技术会自动搜括网页,寻找并整理上面的信息,再找出信息与信息间的关连。展开全文 Wikipedia is my task to browse every day.From now on,I am a foreigner in China.Hold it ,everything will be OK!After searching for the Wikipedia of Machiavelli, I think I didn’t get the real thoughts of this great master. More modification should be added to my paper… 展开全文