WordPress开源自动采集文章插件
- 是一款能够帮助你网站自动化的工具。自动采集,自动发布,省心省力。
- 他有一些初始化学习的例子有: 微信采集 简书采集 御龙在天新闻采集 寻仙新闻采集 心理咨询师新闻采集 虎扑新闻采集 直播8新闻采集,
- 并支持爬取任意网站列表详情页面 如(今日头条, 腾讯新闻, 简书, 知乎 …)
注: 坚持以开源学习,和大家使用最方便为宗旨!
- 采集是完全内嵌到wordpress插件里面,不需要脱离wordpress。
- 不会安装其他任何第三方软件,功能强大。相比其他插件, 胖鼠很有优势。
- 是使用 Html,Jquery语法 爬取和剔除数据. 比其他采集器,更灵活
- 设计思想分三大块= ①爬虫模块, ②配置模块, ③数据模块
- ①爬虫模块主要使用配置模块的各种特色配置来爬取数据.
- ②配置模块为爬虫模块提供支持。
- ③数据模块支撑胖鼠各种特色发布功能!
安装插件
他的作用
- 自动任务: 可以自动采集文章, 也可以自动发布文章.
- 手动执行: 自动时间没到? 咱们手动来.
- 文章过滤: 再用不用担心爬取重复啦.
- 站群: 定时发布,维护站群好帮手.
- 导入数据: 一键导入,站群导入.
- 导入数据: 爬回来的数据预览, 单数据发布.
- DEBUG模式: 帮你调试配置规则.
- 分页爬取: 爬取目标站历史文章.
- 手动配置采集规则采集任何网站 : 只要你只会一点点Html JQery即可写规则。如果你会一点点Html Jquery。自己搞应该没一点毛病。
- 例:你可以用爬虫盯着 某新闻网站的 热门新闻列表页 当出现热点事件,他们第一时间更新文章。我们自动定时爬虫就抓到了。