#
中文分词(Chinese Word Segmentation),将中文语句切割成单独的词组。英文使用空格来分开每个单词的,而中文单独一个汉字跟词有时候完全不是同个含义,因此,中文分词相比英文分词难度
windows下安装SCWS的中文扩展:去官网下载php_scws.dll(PHP-5.2.x根据php版本选择) 、XDB 词典文件(简体中文(UTF-8)可选gbk,也可以把两个词典文件都下载)、
背景:最近部门领导交给笔者一个任务,想要从记录用户聊天记录的数据表中,找出用户对哪些问题比较关心(即:用户咨询过程中问到的哪些词语出现的频率最高),以便后期适当的做些业务的调整,改变推广策略等等聊天记
//正向最大匹配分词算法 ,耗时长,这并不是一个很好的算法,我的这个输出是逆向输入的 using System; using System.Collections.Gen