最终决定还是将网站的百度广告去掉
网站的百度广告挂了应该有好几年了,当初想着是蚊子再小也是肉,有一点算一点,刚上线广告的时候每个月还有点收益,访问量跟点击量或多或少都有一些,到后面就几乎就没有了,收益到目前为止少得可怜,因为没有实名认证,所以收益一直在账户上。
总体收益就是两顿饭钱,网站现在每天的访问量在三四百左右,其中有一部分应该是爬虫的数据,因为之前也说过每天的接口请求好几千,但是实际访问量并没有那么多,而且从日志上看就是一些爬虫在不停的访问网站。

其中有一个爬虫印象比较深,不知道是专业做网站渗透的还是真的是爬虫,它会不停对文章的id进行递增再进行访问,类似post/101,post/102这种,如果你的网站数据库的id是采用的这种递增方式的话,那么就着了它的道了,因为它可以不停的进行递增爬取,但是这个对我的网站无效。
因为最开始设计的也是mysql的递增id,后面又加了兼容uuid的方案,有很长一段时间两种方式都支持访问,也就是可以通过递增的id遍历数据库的数据,但是只限于部分数据,因为我在代码中做了限制,id超过多少以后就必须以uuid访问。
后面再对项目做升级的时候考虑到这种情况其实没有必要,就把兼容的自增id方式去掉了,也就是说只能通过uuid的方式来访问了,所有现在的文章id就是uuid,这种格式是没法通过自增来访问的。
当时采用这种方案其中一部分原因也是因为爬虫的问题,因为当时的访问量也比较大,大部分也都是爬虫,网站也因为爬虫的原因宕机过好多次。
虽然现在的uuid格式看起来回比较长,像下面这种,但是确实能屏蔽掉一部分爬虫,虽然现在每天还有不少爬虫再通过自增id的方式再对网站进行爬取,但是似乎也没有必要进行限制,因为我对接口做了限流控制,基本上超过一定的并发接口回直接返回错误,这样能大大较少网站的压力。
https://www.dsiab.com/post/d7d0bc6f-d37a-11f0-8799-52540025eaec说回网站的广告数据,目前广告的展现量如下,代码位展现量平均再800次左右,页面的访问量每天平均在300次左右,但是收益都是0。

不知道其他厂商的广告的展现量有没有按次数给予收益,反正百度的广告是没有的,虽然一再听到百度对个人网站是不管不问的,但是从实际情况来看,就算是吧。
基于种种原因,加上广告没有收益,还不如去掉广告,所以就决定下线广告啦。
而且最近一段时间百度的收录在不断的下降,从当初的二十几万的收录想下降到现在的不到两万,而且还在不停的减少,感觉有一点累了,顺其自然吧。
