Quantcast
Channel: 火车采集器官方博客
Browsing all 15 articles
Browse latest View live

Image may be NSFW.
Clik here to view.

火车采集器二维码识别插件,已增加V7版本

维码就是这样的东东。 有的手机站在下载时必须要使用二维码,然后用手机去识别下载。这时,我们可以使用二维码识别。 目前的二维码识别做的比较好的开源项目为 http://code.google.com/p/zxing/ 其中C#的使用代码如下: http://blog.csdn.net/NickWar/archive/2010/06/21/5684134.aspx...

View Article



Image may be NSFW.
Clik here to view.

Google翻译插件V7版,支持多种翻译方式

该插件会利用google的在线翻译功能,将各种语言进行翻译。需要注意的是,使用该插件的翻译后采集速度将会受到一些影响。插件会将内容标签中的语言进行翻译。 注意事项 :您的采集器的版本必须是V7系列才可以使用。 使用方法: 1.下载插件 将本文中的插件下载后放在 Plugins\LocoySpider 目录下。 2.在编辑任务的文件保存部分C#插件部分启用该插件...

View Article

百度相关搜索插件V7版(最后更新2012.11.23)

这个插件为C#版,可以抓取百度的相关搜索词。适用于火车采集器V7版。 使用方法:新建标签“标题”和“相关搜索”。插件会将标题的内容放在百度上搜索,然后将搜索结果保存在“相关搜索” 标签中。 默认的搜索结果中多个词是用半角逗号 ", "来分隔.如果您需要自定义,请 新加一个标签  "分隔符",...

View Article

ShopEx图片上传模块(带插件)

该Web发布模块可以实现先上传图片,再最后提交数据时将图片信息一并发上去。实现了以前采集器无法实现的功能。 该模块中的插件代码在 http://board.locoy.com/?post=97    相关日志:新浪爱问共享资料下载插件火车采集器二维码识别插件,已增加V7版本使用插件配合采集器过滤不需要的数据(PHP)百度相关搜索插件V7版(最后更新2012.11.23)jin11颜色尺码获取插件

View Article

火车采集器v7版有道翻译插件

火车采集器v7版本默认带了有道插件并提供了源代码,但是基本是大部分不会编译,所以我们按谷歌翻译插件的使用重新改写了一下插件,请需要的朋友按 http://board.locoy.com/?post=94 的进行操作。需要注意的一点是,翻译方向 里的内容是不一样的。翻译方向标签没有的话是从中文翻译成英文。其它的方向如下:   中文到日语:ZH_CN2JA 中文到韩语:ZH_CN2KR...

View Article


58验证码识别(最后更新2013.1.26)

之前的由于要每个2天切换插件dll,十分麻烦。 今天发的这个版本将之前所有不同dll的数据合并了,程序会自动识别号码图片是否变化。 方法如下: 1.下载附件中的【58规则】解压并导入。 2.下载【58验证码.dll】这个附件, 【58验证码.dll】提取出来,直接解压缩到Plugins\LocoySpider\ 这个目录下。 3.在编辑任务,选择该插件! 如有问题,谢谢反馈...

View Article

Image may be NSFW.
Clik here to view.

火车采集器v7版新浪评论采集插件

这个插件是对多页中的第一个页面进行了分析,获取到分页总数,然后生成了分页让采集器下载,涉及的代码为         public List<string> GetPagesUrl(int level, string pageurl, string html, string pagesStyle, string pagesCombine)         {...

View Article

Image may be NSFW.
Clik here to view.

百度文库文档下载插件

该插件可以下载百度文库中积分为0的文档。用户需要在登录的情况下使用。注意要填写cookie和user-agent,在登录时要进入到文库页面。最后的结果会保存在本地采集器Wenku目录下。 如果您的采集器版本是9.28号前版本,请自动升级或是手动更新到9.28及以后版本 http://board.locoy.com/?post=95...

View Article


火车采集器v7新浪博客文章发布模块

利用该发布模块,可以将采集来的数据发到新浪博客上去。使用方法也极其简单。 1.以单个用户来发文章 在设置发布配置时,选择使用数据包登录方式,然后填写用户名和密码即可。发布模块会自动去登录新浪并保持登陆状态。注意,发布时,时间间隔要长,一般建议3分钟以上,否则很快被封号的。单用户列表可以刷新列表。   2.用多个用户轮流发帖...

View Article


Image may be NSFW.
Clik here to view.

新浪爱问共享资料下载插件

该插件可以下载0积分的资料。演示如图。需要注意的是,火车采集器要更新到2012.11.22号的版本,不更新会出错,更新地址http://board.locoy.com/?post=95。更新完了后再导入这个规则。...

View Article

单条记录下载文件名加自增ID

有的朋友需要在一条记录中,对所有的图片按_1,_2这样的方式标记所有文件或是图片,这时,使用插件是比较方便的方式。现在我们收集了所有客户的该类需求,编写了一个功能比较完善的插件,供大家使用。 该插件支持按所有文件,按标签,按目录,按扩展名自增命名文件名。使用方法如下: a.如果只是选中该插件,默认是按所有文件,从1开始命名。...

View Article

Image may be NSFW.
Clik here to view.

火车采集器伪原创插件(最后更新20140603)

注意:该插件需要火车采集器8.4版本或以上才可以使用,最新版本下载 http://board.locoy.com/?post=166 该伪原创工具目前分两部分, 1.命令行调用伪原创 这个可以使用现成的一些伪原创软件,传一个文本地址和输出文本地址给程序,然后采集器获取处理后的数据。 2.奶盘伪原创 调用在线服务实现伪原创。...

View Article

bing翻译插件(最后更新20140830)

1、把插件放到采集器  \Plugins\   里 2、打开采集器 3、规则里面设置 3.1、定义    翻译方向  标签 ,比如汉译英的就是 zh-CHS>en 3.2、定义    翻译标签  标签 ,比如翻译标题内容标签内容就是 标题,内容   3.3、设置插件使用   Bing翻译   翻译方向  对照表   立陶宛语-->lt 罗马尼亚-->ro...

View Article


百度翻译

支持多语言翻译 支持多级翻译比如 英翻译俄语,再俄语翻译法语; 全局延时提交数据 每条数据延时 3 秒 ,每个内容延时 1 秒 防止封IP, 支持大部分HTML的代码翻译,不受影响,目前 提取HTML里的内容是用正则 >(?<content>[\s\S]*?)< 所以,您的内容里有 < 将会影响内容提取。 翻译标签自定义,翻译语言自定义   zh: 中文 jp: 日语...

View Article

火车采集器伪原创插件V9版

压缩包中有2个文件,"火车伪原创插件.dll"这个文件放到Plugins目录下。“火车伪原创插件配置工具.exe”这个文件放在采集器根目录下,和LocoySpider.exe放在同一目录。 通过使用配置工具来填写账号、密码等信息,配置好之后,新建任务,创建"标题"和"内容"标签,然后在其他设置中->插件->采集结果处理插件,选择"火车伪原创插件.dll"。 火车伪原创插件.zip...

View Article

Browsing all 15 articles
Browse latest View live




Latest Images