一款非常不错的扒站、网站采集工具-httrack
一款非常不错的扒站工具-httrack,下面是摘自百科的介绍
HTTrack是一个自由、开源的网络爬虫以及离线浏览器。它的作者是Xavier Roche,在GNU通用公共许可协议下发布。 用户可以通过HTTrack把互联网上的网站页面下载到本地计算机上。在默认设置下,HTTrack对网站页面的下载结果是按照原始站点相对链接的结构来组织的。
编写语言: C语言
这个好牛x的不说,,,首发时间竟然是1998 年 5 月,而官网最近更新的版本是2017年。。。
要知道这是免费开源的软件,想想国产的软件 有几个能够坚持几十年去更新免费开源的软件呢?
安装很简单
详细文档可以参考官网
https://www.httrack.com/ http://www.httrack.com/page/2/en/index.html
下面是mac os 系统下安装httrack
brew install httrack
具体操作请看下图,很简单的英文,经常接触网络的人都看得懂了
brew的教程参考以下文章
查看httrack 帮助,,,使用以下命令
httrack --help