交给机器1000篇文章作样本。每一个字都可以做奇异值分解,就是100万个词在3百万的语义空间上可以投影出他的绝对坐标,再与另一个正交主题矩阵关联,就可以知道这个主题下关键因素需要跟踪的词汇和统计权重。跟踪内容的可以动态调整和不断增加。这是大数据做主题内容聚合,比传统搜索技术做舆情的优势。