linfan's blog

用Shell实现简单的Web爬虫

对于结构不太复杂的网页,使用grep和sed分析提取目标URL,之后使用wget下载。

以下是两个例子。

  • 抓取煎蛋“妹子图”栏目
  • 抓取Panoramio网站某个用户上传的所有照片

Comments