网站链接抓取器-sitemap生成器[长江博客自用软件]

今天推荐一款 网站链接抓取器(长江博客自用软件),输入网站地址可抓取该网站下所有本站链接地址,生成sitemap文件。

图片[1] - 网站链接抓取器-sitemap生成器 - 长江博客
长江博客自用sitemap生成器

先说一下作用

网站链接抓取器顾名思义,主要是用来抓取网站链接的。

也就是输入一个网站的首页地址,然后软件可以把整个网站页面地址给抓取下来并保存。有啥作用呢?

1、制作网站地图

使用软件保存的TXT。直接上传到网站根目录就可以成为一个简单的TXT网站地图。

制作成网站地图后,可到 http://zhanzhang.baidu.com/sitemap/index 进行提交,以增加收录。

2、检查失误。

所谓的失误,是指某些后台链接。不想让用户知道的。但是由于不小心在程序的某个地方有该网页的链接自己没注意到。这时候就可以使用软件把整个网站的链接抓取下来。然后检查看看有没有敏感链接。

3、检查收录。

可以查看一下百度对本站的索引量。然后使用软件把网站的所有链接都抓取下来。看看数量上的差距是否比较大。如果差距过大,则要注意是否空间不稳定或者文章质量太低或者暴光率太低。

使用方法

1、输入需要抓取的网站首页地址。

2、设置线程数量。(线程越少,速度越慢,耗CPU及网速越低,越不容易漏掉链接。线程越多,速度越快,耗CPU及网速越高,漏抓取机率高。)

3、设置包含或排除规则

  • “包含”的意思是指只保留符合此规则里的链接。如果留空,则保留所有链接。
  • “排除”的意思是指不保留符合此规则里的链接。如果留空,则不排除任何链接。

4、选择抓取后的链接保存地址。(注:如果选择的TXT名称为 abc.txt的话。软件会保存为 abc_*.txt 的形式)

5、选择每个TXT保存的条数。(以第3条举例,如果这里设置为5000,当abc_1.txt保存的链接数到达5000,后面的链接会自动保存到abc_2.txt里,依此类推。)

6、开始用起来吧!

下载地址

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享
评论 共6条

请登录后发表评论