温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

wordmesh特性有哪些

发布时间:2021-12-18 13:47:30 来源:亿速云 阅读:150 作者:iii 栏目:大数据

这篇文章主要介绍“wordmesh特性有哪些”,在日常操作中,相信很多人在wordmesh特性有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”wordmesh特性有哪些”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

词云图相当于数据分析第一步-描述性统计。它能让我们更方便的从文本中抽取关键词,更好的把握文本的整体信息。

wordmesh使用spacy包里预装的语言模型来构建文本特征、基于图的算法来提取关键字、多维缩放以将这些关键字放在画布上等。

wordmesh特性:
  • 关键词抽取:除了基于词频的抽取方式,wordmesh还支持基于textrank、sgrank和bestcoverage的抽取方法。

  • 词语聚类:可以基于语义相似性、共线性和其他属性,在画布上绘制词语

  • 关键词过滤: 抽取的关键词可以基于该词语pos-tag或者命名实体过滤

  • 字体颜色和字体大小:字体的大小和颜色可以基于词频、pos-tag(情感极性)等进行设置。

 
例子

这是力导向(force-directed)算法的可视化。 这些单词是使用《international law》教科书中的textrank提取的,并根据它们的共现频率在画布上组合在一起。 颜色表示单词的pos标签。

wordmesh特性有哪些

这个是史蒂夫乔布斯在斯坦福的毕业典礼演讲。关键字使用textrank提取,并根据其textrank得分进行聚类。字体颜色和字体大小也是textrank得分的函数。

wordmesh特性有哪些

这是来自相同的文本,不过这里是基于关键字的共现频率进行了聚类。 相同聚类词语使用相同的标准来指定颜色。从单词的位置可以看出这一点。 你可以看到像'hungry'和'foolish'这样的词汇被组合在一起,因为它们在文本中彼此接近,作为着名引语“Stay hungry. Stay foolish”的一部分。

wordmesh特性有哪些

这是特朗普与希拉里克林顿之间2016年美国总统辩论中使用的所有形容词。 单词根据其含义进行聚类,字体大小表示使用频率,颜色对应于使用它们的候选者。  

wordmesh特性有哪些

到此,关于“wordmesh特性有哪些”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注亿速云网站,小编会继续努力为大家带来更多实用的文章!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI