• 用户头像

    nzinfo

    老师木没写过分词。 //@柱子-_-张金柱: 老师木说的太好了,当时的老师就是这意思,可惜后面没跟进。 //@章成志: //@马少平THU: 再加一点,不同应用对分词的要求也是不一样的,比如搜索和理解,在一个应用中好的分词,在另一个中不一定好。
    (有监督)分词,在两个词字之间是否存在边界,取决于一系列证据(特征),既可以是字本身的,也可以是更大范围内的上下文特征。那位百度的同学认为模型不重要,我是不认同的。条件随机场是集成各种线索(证据或特征)的最佳选择了,本质是结构化输出的最大熵模型。有人说字典更重要,但字典可用来作特征啊。
    展开全文
    转发 1评论 0
    原微博