插件发布
插件名称: |
飞速采集 |
插件来源: |
原创插件 |
适用版本: |
Discuz! X3 |
语言编码: |
GBK简体 UTF8简体 |
最后更新时间: |
2017-05-25 |
插件作者: |
feisuweb |
插件简介: |
飞速采集是一款无需编写任何采集规则就能直接抓去文章标题与内容的网页采集抓去插件,
直接将网址复制到网址输入框,点击 飞速抓取 ,就能讲网页的标题,正文内容 放到论坛帖子的 标题与内容编辑框中去,
本插件不依赖任何第三方服务器,就能识别出95%的文章标题与内容,免去了复制与粘贴的过程,
提高的发帖效率,实现文章抓取与采集 简单快速。
功能介绍:
以下是本插件的支持情况
支持采集的网站程序类型清单:
1.Discuz论坛程序网站(本版本只支持普通帖子内容采集).
2.Wordpress程序网站
3.Dedecms网站程序平台
4.PHPCMS网站程序
5.支持90%左右的博客新闻类文章,因为基于文字密度算法提取
目前已经测试的网站清单:
1.百度新闻(文字新闻)
2.Chinaz站长网(文章)
3.A5站长网(文章)
4.discuz.net(普通帖子)
5.新浪新闻(文字新闻) 如:http://news.sina.com.cn/china/xl ... yfkqks4395760.shtml
6.今日头条(文字新闻) 如: http://www.toutiao.com/a6422510639991095553/
7.凤凰网 (文字新闻) 如: http://news.ifeng.com/a/20170521/51132280_0.shtml
8.腾讯新闻 (文字新闻) 如:http://news.qq.com/a/20170521/008153.htm
9.CSDN博客 如: http://blog.csdn.net/zhw309/article/details/8786081
10.Dedecms 如:http://www.dedecms.com/news/foreign/2013/0725/33157.html
不支持以下网站采集:
1.网易新闻:http://news.163.com/
2.PHPWind论坛
3.百度贴吧
4.目前不支持https开头的网址.
.....等等,很多其他没有测试过的网站.
关于内容图片:
本采集插件只采集了文字部分内容,图片部分直接调用了远程的图片,
由于很多网站采取了防盗图的功能,所以有部分网站,采集的内容图片会无法显示.
如需要采集图片,请用discuz自带的下载远程图片功能. |
功能更新
1.无规则正文采集.
2.自动识别页面编码.
3.自动去除不需要的html.
4.无需链接云服务器,本地采集.
5.支持设置使用的用户组.
6.支持设置指定的版块.
7.后台控制开关.
8.支持discuz论坛采集.
9.支持自动去除超链接功能.
这段时间收到不少用户的五星评价,但是从安装与卸载数据看,40%的用户选择了卸载,
在此想发个帖次出来,寻找测试用户,帮忙把发现的问题,以留言方式反馈给我们。
如果有更好的点子,我们也会采纳进来,加入到插件里面来。
插件安装地址:
https://addon.dismall.com/?@fs_collection.plugin
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|