根据使用场景,网络爬虫可分为 通用爬虫 和 聚焦爬虫 两种。
通用爬虫
通用网络爬虫 是 搜索引擎抓取系统(Baidu、Google、Yahoo等)的重要组成部分。主要目的是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。
<< 2024-4 >>
Sun
Mon
Tue
Wed
Thu
Fri
Sat
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30