
下载君使用教程
访问深度:不要设置太高,因为这东西是超级指数型增长的,比如设置3,就能发现几千新页面(网站不同,这个也不同)。图片线程:也不要太高,够用就行,高了一方面对网站不友好,另一方面则有可能因为访问频次太高而被Ban掉,得不偿失。要以时间换空间。
工具只需要正确配置网页元素的xpath就可以愉快的运行了,所以重点还是介绍一下如何正确使用xpath。我们拿一个网页举例(可不能拿漂亮小姐姐举例):

使用chrome浏览器打开网页,可以看到我们想要的文章内部图片一共15张,其他图片不是我们要的。
在目标图片上右键,选择【检查】,打开网页元素页面:

在元素上,右键>copy>copy xpath,如下图:

我们将得到这么一条xpath:
//*[@id="syno-nsc-ext-gen3"]/div[3]/div[3]/div[1]/div[1]/ul/li[7]/img