用户sweetglue的头像

sweetglue

查看新浪微博主页
  • 用户头像

    sweetglue

    今天中文维基百科首页的特色条目是某广场事件。无论那件事各方的对错,出现这个条目在首页最终还是会严重影响维基百科一直试图树立的作为公正百科形象。即便是一个以接受读者捐赠为其主要盈利模式的网站,也总该为自己的前途考虑一下。
    原微博
  • 用户头像

    sweetglue

    测试语料是什么?其他大多是拿sighan05数据评测的,但如果用半年的会包含05的测试数据。如果不是同样的测试数据那没有可比性。此外crf用的工具以及线程数也会影响速度 //@KothUp: crf加word2vec特征,其他没什么特别
    人民日报半年语料,用来训练分词,64W句子训练,16W测试,半小时完成,速度够快吧。在测试集上F值貌似也是达到新高 : P = 0.971422, R = 0.974580, F-score = 0.972998 没用任何词性特征,网上看用词性特征最多也就到96.6%,还巨慢。
    转发 7评论 11
    原微博
  • 用户头像

    sweetglue

    @hihzy @Justdustinwind 已经登上了回国的飞机,明天ICL的同志们在瓜分他们带回去的美食时,不要忘了谴责一下这种把我一个人扔在印度的行为。明天蹭过COLING的午餐后打算和@lauPeiP 去体验一下印度火车...
    原微博
  • 用户头像

    sweetglue

    1. 微博附图
    原微博