扯扯网页 博客导航里有多少网站活着? 抱着一直想扒一扒所谓的全国最大的只管收录,不管筛选的博客导航站里面到底有多少网站是活着的想法,花了大量的时间让程序代码对导航站里面的近一万八千个网站挨个访问,最后得出一份在测试环境下相对准确的数据。 成功正常访问网站Ac... 2022年08月10日 评论 2 阅读 1,412 views 阅读全文
产品项目 关键词查看用户喜欢的app应用 通过评论中词频变化可以得出用户在抱怨什么问题,同样可以抓取他们的文本中的名词看用户喜欢或者在意的app应用,从来判断该应用对于产品是否要做加法。 获取一定数量的客户Q&A文本使用nltk库代码分词处理其中相关的a... 2022年07月06日 评论 3 阅读 774 views 阅读全文
扯扯网页 过去一年博客网站增长情况 以国内博客界最大的博客导航网站卢松松导航收录的网站数量来看过去一年内博客网站增长情况,今年6月数据看同比去年6月子增长了2.9%。疫情以来受到群众空余时间变多,网络技术5G的普及,增长最大的是短视频的播发增长,原有的图文... 2022年06月11日 发表评论 阅读 1,060 views 阅读全文
产品项目 Jira上几个软件项目JIRA问题抓取分析 最近项目都接近尾声,本着好奇的心里抓取了JIRA 上面几个软件问题的历史数据做分析,发现些有趣的事情。 这几个软件项目的问题参与者涉及了几个不同时区的虚拟团队,有位于东八区的帝都也有位于西八区的漂亮国。刚好JIRA 系统... 2022年06月06日 发表评论 阅读 778 views 阅读全文
产品项目 Calman 导入TV画质调整后的第三方测评反馈 去年研究了几个月Calman软件,最后终于把事情做成导入在产品开发中。可能是产品的名气不够,经过漫长的推荐和好多轮的投票等待,上周末终于可以看到公布的测评反馈结果了。 这个产品本身只是basic entry-level ... 2022年03月07日 发表评论 阅读 945 views 阅读全文
Python Python所写豆瓣读书的爬虫,方便大家搜罗各种美美书 源代码来自Lanbing,喜欢读书和不断学习的朋友可以电脑访问他的网站好书推荐:http://sobook.lanbing510.info/。 import time import requests ... 2022年03月02日 评论 1 阅读 6,679 views 阅读全文
Python 爬取.com 产品信息和图片 为了帮朋友上架一个合作方的产品到他的电子商务网站上,因为对方没有整理图片并打包,每上一个图片要从对方的网站上保存下来显然是费时费力的。为此特意花了几秒钟给编写了个小爬虫,喝杯奶茶的时间搞定全部图片,并... 2022年02月28日 发表评论 阅读 670 views 阅读全文
聊聊电子 教你如何认清电源认证标准 现在电脑上的设备越来越多,能耗也日渐增大,没有一个功率强大的电源,就有可能损坏主板、硬盘等部件,缩短电脑的正常使用寿命。目前市场上的电源品种繁多,从几十元到上百元都有,如何选择一部优质的电源,主要得看... 2021年12月11日 发表评论 阅读 1,234 views 阅读全文
零碎思绪 可以让你少奋斗10年的工作经验 第一:不要认为停留在心灵的舒适区域内是可以原谅的。 每个人都有一个舒适区域,在这个区域内是很自我的,不愿意被打扰,不愿意被push,不愿意和陌生的面孔交谈,不愿意被人指责,不愿意按照规定的时限做事,不... 2021年12月11日 发表评论 阅读 677 views 阅读全文
零碎思绪 不要为这五类人打工! 当初选择做技术,最主要的原因,是出于对科学技术的纯洁性的热爱,对人情世故的厌恶。但专于技术的工程师,要想有份有前途的工作,找到可以长久做下去的公司。“良禽择木而栖,贤臣择主而侍”,遇到下面五类性格的老... 2021年12月11日 发表评论 阅读 810 views 阅读全文