• 用户头像

    笨笨大萝卜

    中文分词没有你想象中那么复杂。很多搜索的实现都是基于分词的。开源的实现都有。唯一要增加的是歧义的处理。//@linhwa: 技术上目前只有谷歌能做到,总不能让方滨兴去求谷歌吧,太掉价不说,很有可能还碰一鼻子灰...//@笨笨大萝卜: 我一直认为不是基于分词算法的汉字屏蔽只是一个hack方案。
    展开全文
    我做编辑时老碰上网络严打,全员轮值,某回周末值班接到投诉电话:“为啥顾城的诗不让评论?”我说:“能评呀,大概是你发的内容里有敏感词被屏蔽了。”对方立马跟我急了:“我就写了一句话,黑夜总会过去,光明才是永恒的。你说说哪个词敏感了?黑夜,光明,还是永恒?!”我淡定地回答:“夜总会。”
    1. 微博附图
    转发 1评论 0
    原微博