Python爬取松松博客大全分析各地博客分布趋势

懂得了简单得Python迫不急待都要去爬取许多网站,获取数据满足自己的好奇心。闲来没事使用Requests 和BeatfulSoup爬取松松博客大全,获取到的博客地址看看都哪里的人最喜欢建网站写博客。

松松博客大全中除了3个小栏目不是按照地区分类的,其他三十多个分类都有明确的地区分类,这个分类是申请的博客作者自己填写,准确性上应该是可以参考的。从分类栏目的博客名字和地址爬取整理可以得到地区分类图表,对比数据发现今年11月到12月的一个月时间内博客数增长远远小于以往PC互联网发展的高速时间,只有在经济发达地区和人口文化大省存有微小的增长。
Python爬取松松博客大全分析各地博客分布趋势

微小的增长变化没有改变地区vs博客数量直方图变化,这个态势估计在未来的一段时间内有不会有大变化。各地区博客/作者数量基本上符合指数趋势,排列上和各地区的GDP排列还有点类似。

Python爬取松松博客大全分析各地博客分布趋势

最亮眼的数字是广东地区以2642个博客网站数量,比后两地总和还多,不得不佩服岭南地区巨大的人口和丰厚的经济给了当地网络发展注入了巨大活力。



您可以选择一种方式赞助本站

支付宝转账赞助

支付宝扫一扫赞助

微信钱包扫描赞助

目前评论:1   其中:访客  0   博主  0

  1. avatar peelonion
    下一步爬取404网站,剔除已经失效的网站,看看还有多少网站死亡了。
评论加载中...

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

图片 表情