本篇内容主要讲解“怎么用Python爬取并简单分析A股公司数据”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么用Python爬取并简单分析A股公司数据”吧!
requests模块;
bs4模块;
lxml模块;
pyecharts模块;
wordcloud模块;
jieba模块;
以及一些Python自带的模块。
安装Python并添加到环境变量,pip安装需要的相关模块即可。
目标网站:
http://www.askci.com/reports/
需要爬取的数据如下图所示:
懒得动脑子了,直接借助BeautifulSoup提取的这些数据,简单粗暴,源代码如下:
完整源代码详见个人主页或私信获取相关文件中的Spider.py文件。
运行效果截图如下:
All done~
在数据爬取部分,我们共获得了3573条A股公司数据,下面我们就来简单地可视化分析一波吧~
首先让我们来看看A股公司的区域分布吧:
其中A股公司超过三百家的省份有:
广东
北京
浙江
江苏
接下来再来看看A股公司的收入情况吧:
其中主营业业务收入TOP10为:
再来看看A股公司的员工数量呗:
再来看看A股公司的上市时间分布呗:
其中,2013年上市的公司数量最少(2个);2017年上市的公司数量最多(438个)。
OK,要不我们再来看看A股公司所在的行业类型占比TOP10吧:
到此,相信大家对“怎么用Python爬取并简单分析A股公司数据”有了更深的了解,不妨来实际操作一番吧!这里是亿速云网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。