火车头采集器采集梨视频(原创)

准备工作

下载火车头采集器(7.6破解版),百度一下就有

《火车头采集器7.6破解版闪退解决办法》

再看本文之前需要有火车头采集器使用基础

分析目标站点

以“搞笑”为例(http://www.pearvideo.com/category_7)

1、列表、分页

由于目标站点和一般的站点的分页方式不一样,使用Google、或者其他浏览找到分页方式

《火车头采集器采集梨视频(原创)》

http://www.pearvideo.com/category_loading.jsp?reqType=5&categoryId=7&start=24&mrd=0.8454637756481935&hotContIds=1216256,1215984,1216367

http://www.pearvideo.com/category_loading.jsp?reqType=5&categoryId=7&start=36&mrd=0.8454637756481935&hotContIds=1216256,1215984,1216367

通过上面链接分析得到,每次分页只有红色数字部分改变。

访问上面的网址得到如下页面,我们采集这个页面就可以了《火车头采集器采集梨视频(原创)》

2、分析视频源地址

打开一篇文章,查看源代码可以找出视频相关地址

《火车头采集器采集梨视频(原创)》

写采集规则

通过上面的对目标网站分析之后,采集规则就很好写了。

1、采集网址规则

第一页的链接为0,不是1

公差为12(不明白的看上面链接分析)

《火车头采集器采集梨视频(原创)》

2、多级网址获取

关系:列表网址–>文章网址–>视频地址

在第1步的时候已经填写了列表网址,这里只要采集文章和视频地址就可以了

《火车头采集器采集梨视频(原创)》《火车头采集器采集梨视频(原创)》

在写脚本规则之前把采集内容规则里自带的删除掉

《火车头采集器采集梨视频(原创)》

脚本规则:

原网页源代码:

再添加一个视频地址获取规则:

原网页源代码:

测试采集结果

《火车头采集器采集梨视频(原创)》

点赞
  1. 夏日博客说道:

    火车头实在过于强大。

  2. 中青看点是真的吗说道:

    文章大有看点,支持!

  3. 中医秘方说道:

    一言不发岂能证明我来过了?!

发表评论

电子邮件地址不会被公开。 必填项已用*标注