火车头采集器采集梨视频(原创)

2017年12月06日 1763点热度 1人点赞 3条评论

准备工作

下载火车头采集器(7.6破解版),百度一下就有

《火车头采集器7.6破解版闪退解决办法》

再看本文之前需要有火车头采集器使用基础

分析目标站点

以“搞笑”为例(http://www.pearvideo.com/category_7)

1、列表、分页

由于目标站点和一般的站点的分页方式不一样,使用Google、或者其他浏览找到分页方式

http://www.pearvideo.com/category_loading.jsp?reqType=5&categoryId=7&start=24&mrd=0.8454637756481935&hotContIds=1216256,1215984,1216367

http://www.pearvideo.com/category_loading.jsp?reqType=5&categoryId=7&start=36&mrd=0.8454637756481935&hotContIds=1216256,1215984,1216367

通过上面链接分析得到,每次分页只有红色数字部分改变。

访问上面的网址得到如下页面,我们采集这个页面就可以了

2、分析视频源地址

打开一篇文章,查看源代码可以找出视频相关地址

写采集规则

通过上面的对目标网站分析之后,采集规则就很好写了。

1、采集网址规则

第一页的链接为0,不是1

公差为12(不明白的看上面链接分析)

2、多级网址获取

关系:列表网址-->文章网址-->视频地址

在第1步的时候已经填写了列表网址,这里只要采集文章和视频地址就可以了

在写脚本规则之前把采集内容规则里自带的删除掉

脚本规则:

原网页源代码:

再添加一个视频地址获取规则:

原网页源代码:

测试采集结果

唯一度

上善若水,水利万物而不争。

文章评论

  • 夏日博客

    火车头实在过于强大。

    2018年01月13日
  • 中青看点是真的吗

    文章大有看点,支持!

    2017年12月19日
  • 中医秘方

    一言不发岂能证明我来过了?!

    2017年12月10日