Python爬取并分析全球最美Top100女神榜单的数据,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。
最近一段时间,国外媒体TOP BEAUTY WORLD选取了全球最帅男性和最美女性前100名,肖战成为了该排行榜历届以来首位登顶的亚洲人。这一消息立刻成为了流量的热点。
小编特地去查了一下,想看一下榜单中的最美小姐姐的信息。可是现在还没有最美小姐姐的文字榜单信息。但是小编却查到了2019年年底发布的上一届的全球最美女性前一百名的详细榜单,包含了姓名、国籍和职业等信息。
首先,我们要获取到想要的数据,包括小姐姐的照片,姓名以及国籍等信息。由于网页属于静态网页,因此可以直接分析网页源代码,获取到我们需要的数据即可。程序如下图所示:
获取到数据后,我们来对数据进行一下清晰,并看一下从数据中能获得什么信息。
1).大洲信息统计
可以看到,全球一百名美女来自了除南极洲之外的其他六个大洲,其中来自亚洲的国家是最多的,欧洲和北美洲紧随其后。
2).国籍信息统计
对于美女国籍的统计和可视化处理,是一件非常麻烦的事情,这里需要针对数据进行耐心的判断处理,虽然非常消耗时间,但是好在数量并不是很多,如下图所示:
可以看到,这一百名美女中,来自美国的是最多的,当然,不可否认的是很多都是持有美国和其他国家的双重国籍身份的。来自英国的是13名美女,当然也是有许多是持有双重国籍的身份。
而第三名的中国和韩国则是完全不存在双重国籍的问题。从全球的分布范围来看,非洲和欧洲的人数直观看上去非常的少,尤其是意大利、法国等一些欧洲国家,都没有如选前100名的美女出现。
3).职业分析
对于榜单中美女们的职业,这里也是非常的集中,只有三种职业:模特、演员、歌手。毫无疑问,每一个职业都是需要自身的条件非常的完美。
上述程序中,通过向FaceScore函数传递图片的路径,在FaceScore函数中,通过get_file_content函数将图片以二进制形式读取;
并通过base64库进行编码后,作为params参数post给请求url链接。并解析url链接返回的信息,提取返回信息中的颜值打分数据;
运行上述的程序后,我们就会得到关于100名美女的AI颜值打分。这里 我们为大家展示一下,颜值打分前五名都有哪些明星。
看完上述内容,你们掌握Python爬取并分析全球最美Top100女神榜单的数据的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注亿速云行业资讯频道,感谢各位的阅读!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。