42
www.dao.js.cn
回复讨论
1
登录后可参与回复讨论。

如图所示,我不知道这些数据是否都是存在我们自己的服务器内,例如官方站,it之家直接收录了一个一万多个,那是不是某个表直接来了个一万的数据?我不太理解,所以才发这个建议的。那我的建议是什么呢?这个feed的任务调度,我觉得只需要获取某个站点的最新十条数据,就可以了。没有新内容就不要执行这个站点,有了新内容计算已经收录个数,只保留10个就行了。不然我们那天要换服务器,或者要用其他方式部署的时候,这个类似于it之家的1万条数据,有点可怕了。我只知道是不是每个数据都是一行表,还是仅仅的只说了这个站点收录了多少。
一,只展示每个站点最新十条(没有必要巨量的把第三方站点内容插入数据库,避免司法裙带关系);
二,减少调度确定“真”新内容加入计算凑出最新十条(简化管理流程与后台响应速度);
三,增可自动审核新文章内容方式(自动化流程);
四,新增明确的前端收录提醒,因为曾经部分聚合因为俩小姐姐被收录了之后,又反悔了,说feed聚合采集他们数据,说他搞主义,被迫关站,而那次的事件是有三个feed聚合同时关站了(且是当时流量巨大的feed聚合)
五,自动申请审核通过机制(用户可通过dns、文件、head模式,自动上线属于自己的站点内容,解放管理员双手)。
@熊猫 本文是充分的站在网站信息安全及数据响应速度的双重考虑下背景前提下,发出的想法。