- 人民日报半年语料,用来训练分词,64W句子训练,16W测试,半小时完成,速度够快吧。在测试集上F值貌似也是达到新高 : P = 0.971422, R = 0.974580, F-score = 0.972998 没用任何词性特征,网上看用词性特征最多也就到96.6%,还巨慢。
- word2vec中的hs还是算了,倒是可以对word2vec产生的词向量做层次聚类,然后编码,再对这个编码好的,再用hs方式训练语言模型//@德川: 也就是最大似然啦 梯度下降求解几组参数 //@德川: 是交叉熵 词向量是得到语言模型时的副产品,hs方法主要是为了降低语言模型最后求解的复杂度。 //@微博Koth: 更正下展开全文
- 其实在百度的有哪位是由于HRMM而来的,微博上火热,其实贵度内部不起涟漪,袒胸露乳也不会是主流文化。。。。如果是,技术宅过5-10年不难成为有文化的流氓的代名词了。。
我发现很多对女人态度很混乱,找女强人做老婆,找女员工谈感情。我过去也差点犯了这样的错误,还好自己琢磨能力强,醒悟快。记住:员工是用来赚钱的,要找工作优秀的;老婆是用来生活、睡觉、生孩子的,要找温柔、爱家、聪明高个健康美女,你一定会深爱这样的老婆的。女子无才便是德,一定不要弄错了!