分类:开发笔记

  • 网站指定是被爬虫爬了
    今天登录网站后台发现今天的访问量为七万四千多,这个访问量指所有文章的访问量,具体是指每次文章接口被调用访问量会+1,所以瞬间感觉到网站应该是被爬了,虽然平常也有一些爬虫在爬,但是平常的访问量是保持在七千左右,今天的访问量明显异常,差不多是平常的十倍,为什么能这么肯定是爬虫呢,因为pv跟uv的访问量跟平常差不多,所有唯一的原因就是爬虫在工作了。虽然我能知道我的网站www.dsia
  • 网站新增总字数统计
    继昨天实现了如何统计单篇文章字数后,突然想看看目前我在网站上发表的文章总共的字数,于是简单的将这个想法付诸实践了,有一个问题就是之前的文章并没有保存这个字数,所以为了实现这个小目标,只能挨个把要统计的文章重新编辑保存,只有这样字数的字段才能保存到数据库。保存到数据库后在mysql只需要通过 select sum() 就能查询所有行中某个字段的汇总,如下代码就是我的网
  • 如何统计一篇文章的字数
    我们经常看到一些文章会显示字数和阅读完大概几分钟这个功能,提前给读者一个信息可以让读者决定是否继续阅读。这个功能虽然看起来就是统计字数,但是其实也比较麻烦,因为一般情况下文章的内容属于富文本,富文本通常是一段包含文字、图片的字符串,而且里面是包含一些html标签的,如果要统计字数需要去除这些无效的内容,当然你可以在实现统计的时候通过正则表达式去掉这些标签,但是可能并不能完全去除
  • 为什么还在使用传统的富文本编辑器而不使用markdown编辑器
    近些年使用markdown语法的编辑器越来越多,比如我所知的掘金社区,以及前段时间注明的由免费转向收费的typora编辑器等,都是使用的markdown编辑器,但是我在使用传统的富文本编辑器,至少现阶段都还是在使用,不排除以后也会使用markdown编辑器,但是其实两者并不冲突,可以同时使用。不使用的原因有几点,第一点就是需要学习markdown的语法,虽然不算多也比较容易上手
  • 从日志看到网站在被人使用php攻击
    最近升级了宝塔面板,看到新增了一个安全分析的功能,可以看到当前站点的日志分析情况。从扫描结果来看,分xss、sql、php攻击等类型,简单看了一些这几种类型的分析,xss基本上都是一些正常数据,扫描日志也大致正常,只有php攻击这一项能清楚的看到有人在使用php注入代码攻击网站。<img src="https://source.dsiab.com/upload/2
  • 给网站添加了每日一句小功能
    昨天给网站添加了一个小功能,就是在登录后台管理系统后,在页面的顶部能看到一个每日一句的文字。这个都是平常收集的好的文字,每次登录后看到这些文字都能感受到不同时代的人在文字间传达的信息。我记得最早在wordpress 这个系统的时候也有类似这样一个功能,它是作为wordpress的一个插件,开启后会在右上角显示好像是莎士比亚作品中的句子。其实很多网站跟
  • 给网站添加了文章自动保存功能,为了避免因为用户登录信息超时导致数据丢失
    今天在网站写完一片文章后点击保存的时候提示用户信息失效,直接退出到了登录页面,导致之前写的内容没有保存,数据全部丢失。之前就有预料到会出现这种情况,所以写的时候中间特地复制了一下内容,但是没想到后面有不小心复制了一下其他数据导致剪贴板的数据被覆盖,之前写的文章召回。出现这个问题的原因是因为目前网站的设置的超时时间为两小时,在这个时间内不与服务器有请求交互的情况下,
  • 如何使用ip2region实现通过ip地址查到ip归属地
    最近看到ip2region这个开源库,它是一个离线 IP 数据管理框架和定位库,简单说就是通过Ip地址可以查询到对应的归属地,比如通过1.2.3.4 这个地址可以查询到属地为【美国|0|华盛顿|0|谷歌】。<span style="font-size: 14
  • 爬虫太多添加robots文件来禁止一些爬虫访问网站
    自从网站的统计插件升级后,每天的uv/pv数据直线下降,但是每天的访问量却没有变化,访问量笔者采用的是统计每篇文章接口的调用量,所有有理由怀疑是爬虫导致的。之前网站一直都是没有做任何限制的,但是从某一天后发现网站运行比较慢,从登录后台管理的情况看尤为明显,页面加载都要一两秒,之前都不会出现这种情况。所以今天给网站添加了一个robots.txt文件来禁止一些爬虫,从
  • 更新统计插件让网站的统计功能更强大效果更好
    这个周末更新了一些网站的功能,主要是更新后台管理首页统计数据模块功能。更新这个模块的原因主要是更新了统计插件,之前引入的统计插件会经常获取不到数据,还会记录一些无效信息,经过这次的优化,功能精简许多。首先去掉了客户端唯一识别id,虽然之前处于某些原因加上这个字段,想着以后用来识别新老用户,但是最终决定不实现这个功能,所有在这个版本就删除了,因为这个功能引

暂无数据