第2章 爬虫基础

2.1 HTTP基本原理

2.1.1 URI和URL

URI:
URL:

2.1.2 超文本

2.1.3 HTTP和HTTPS

2.1.4 HTTP请求过程

2.1.5 请求

2.1.6 响应

2.2 网页基础

2.2.1 网页的组成

2.2.2 网页的结构

2.2.3 节点树及节点间的关系

2.2.4 选择器

2.3 爬虫的基本原理

2.3.1 爬虫概述

2.3.2 能抓怎样的数据

2.3.3 JavaScript渲染页面

2.4 会话和Cookies

2.4.1 静态网页和动态网页

2.4.2 无状态HTTP

2.4.3 常见误区

2.4.4 参考资料

2.5 代理的基本原理9

2.5.1 基本原理

2.5.2 代理的作用

2.5.3 爬虫代理

2.5.4 代理分类

2.5.5 常见代理设置

2.5.6 参考来源