Python Network Programming 简明教程
Python - HTTP Response
http 或超文本传输协议在客户端服务器模型上运行。通常,Web 浏览器是客户端,而托管网站的计算机是服务器。在收到客户端的请求后,服务器生成响应并以特定格式将其发送回客户端。
在收到并解读请求消息后,服务器会使用 HTTP 响应消息进行响应:
A Status-line
Zero or more header (General|Response|Entity) fields followed by CRLF
An empty line (i.e., a line with nothing preceding the CRLF)
indicating the end of the header fields
Optionally a message-body
下列各节将解释 HTTP 响应消息中使用的每个实体。
Message Status-Line
状态行由协议版本后跟一个数字状态代码及其关联的文本短语组成。元素由空格 SP 字符分隔。
Status-Line = HTTP-Version SP Status-Code SP Reason-Phrase CRLF
Status Code
状态代码元素是 3 位整数,其中状态码的第一位定义了响应的类型,而最后两位没有分类作用。第一位有 5 个值:
S.N. |
Code and Description |
1 |
*1xx:信息性*这意味着请求已被接收,且进程正在继续。 |
2 |
*2xx:成功*这意味着该操作已成功接收、理解并被接受。 |
3 |
*3xx:重定向*这意味着必须采取进一步措施才能完成请求。 |
4 |
*4xx:客户端错误*这意味着该请求包含不正确的语法或无法满足。 |
5 |
*5xx:服务器错误*这意味着服务器未能满足的一个明显有效的请求。 |
HTTP 状态代码是可扩展的,且 HTTP 应用程序无需理解所有已注册状态代码的含义。
Using Python Requests
在以下 Python 程序中,我们使用 urllib3 模块来发出 http GET 请求并接收包含数据的响应。它还提供响应代码,该代码也由模块中的函数管理。PoolManager 对象处理连接池的所有详细信息并处理线程安全。
import urllib3
http = urllib3.PoolManager()
resp = http.request('GET', 'http://tutorialspoint.com/robots.txt')
print resp.data
# get the status of the response
print resp.status
当我们运行以上程序时,我们得到以下输出:
User-agent: *
Disallow: /tmp
Disallow: /logs
Disallow: /rate/*
Disallow: /cgi-bin/*
Disallow: /videotutorials/video_course_view.php?*
Disallow: /videotutorials/course_view.php?*
Disallow: /videos/*
Disallow: /*/*_question_bank/*
Disallow: //*/*/*/*/src/*
200