温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

怎么用Python进行数据分析

发布时间:2021-11-02 15:02:47 来源:亿速云 阅读:178 作者:iii 栏目:编程语言

这篇文章主要讲解了“怎么用Python进行数据分析”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么用Python进行数据分析”吧!

评论情感倾向

先调用百度AI来分析微博和b站的评论情感倾向。

知乎的回答字数过多,做情感分析肯定不准确,就没做分析。

from aip import AipNlp
""" 你的 APPID AK SK """
APP_ID = '你的APP_ID'
API_KEY = '你的API_KEY'
SECRET_KEY = '你的SECRET_KEY '
client = AipNlp(APP_ID, API_KEY, SECRET_KEY)
text = "XXXXXXXX"
""" 调用词法分析 """
response = client.sentimentClassify(text)
# "sentiment":2,    //表示情感极性分类结果  0:负向,1:中性,2:正向
# "confidence":0.40, //表示分类的置信度
# "positive_prob":0.73, //表示属于积极类别的概率
# "negative_prob":0.27  //表示属于消极类别的概率
for info in response['items']:
    if info ['sentiment'] == 2:
        print("正向")
    if info ['sentiment'] == 0:
        print("负向")
    if info['sentiment'] == 1:
        print("中性")
    print("可信度:",info['confidence'])
    print("属于积极类别的概率是:",info['positive_prob'])
    print("属于消极类别的概率是:",info['negative_prob'])

需要注意的是,在各个平台评论最多的“奔涌吧,后浪!”,在百度AI中是个消极句子,需要特殊处理。

结果如下:

怎么用Python进行数据分析

怎么用Python进行数据分析

非常明显,b站的弹幕正向居多,而微博的评论负向居多。

词云

通过上文的情感分析,各家平台的用户对于《后浪》的态度各异,他们又是如何评价的呢?

统计评论和回答中的高频词,制作词云看一下吧。

from scipy.misc import imread
from wordcloud import WordCloud, ImageColorGenerator

isCN = 1 # 0:英文分词  1:中文分词
back_coloring_path = '浪花.jpg'          # 设置背景图片路径
text_path = 'reviews.txt'               # 设置要分析的文本路径
stopwords_path = 'stop_word.txt'        # 停用词词表
imgname1 = '词云图.png'  # 保存的图片名字1(只按照背景图片形状) 
back_coloring = imread(back_coloring_path)     # 设置背景图片 

wc = WordCloud(#font_path = font_path          # 设置字体
                font_path='C:\Windows\Fonts\simfang.ttf',
                #font_path='hanyiqihei.ttf',
                background_color = 'white',    # 设置背景颜色
                max_words = 3000,              # 设置显示的最大词数
                mask = back_coloring,          # 设置背景图片
                max_font_size = 200,           # 设置字体最大值
                min_font_size = 20,             # 设置字体最小值
                random_state = 42,             # 随机有N种配色方案
                width = 2000 , height = 1720 ,margin = 4 )
words = {}
for i in word_counts:
    words['{}'.format(i[0])] = i[1]
    
wc.generate_from_frequencies(words) 
# txt_freq例子为 { word1: fre1, word2: fre2,  word3: fre3,......,  wordn: fren }

plt.figure() 

怎么用Python进行数据分析

b站

怎么用Python进行数据分析

知乎

怎么用Python进行数据分析

感谢各位的阅读,以上就是“怎么用Python进行数据分析”的内容了,经过本文的学习后,相信大家对怎么用Python进行数据分析这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是亿速云,小编将为大家推送更多相关知识点的文章,欢迎关注!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI