笨笨大萝卜
中文分词没有你想象中那么复杂。很多搜索的实现都是基于分词的。开源的实现都有。唯一要增加的是歧义的处理。//@linhwa: 技术上目前只有谷歌能做到,总不能让方滨兴去求谷歌吧,太掉价不说,很有可能还碰一鼻子灰...//@笨笨大萝卜: 我一直认为不是基于分词算法的汉字屏蔽只是一个hack方案。 展开全文我做编辑时老碰上网络严打,全员轮值,某回周末值班接到投诉电话:“为啥顾城的诗不让评论?”我说:“能评呀,大概是你发的内容里有敏感词被屏蔽了。”对方立马跟我急了:“我就写了一句话,黑夜总会过去,光明才是永恒的。你说说哪个词敏感了?黑夜,光明,还是永恒?!”我淡定地回答:“夜总会。” 转发 1评论 0 原微博