在Python爬虫中,状态码(Status Code)是HTTP响应状态码,它表示服务器对客户端请求的响应状态。状态码由三个数字组成,每个数字代表不同的响应类型。爬虫程序可以根据状态码来判断请求是否成功,以及发生了何种错误,从而做出相应的处理。
`200`:请求成功,服务器已成功处理请求。
`201`:请求成功,并且服务器创建了新的资源。
`400`:客户端请求有语法错误,服务器无法理解。
`404`:请求的资源不存在,如页面未找到。
`500`:服务器内部发生错误。
`100`:继续,服务器已接收到请求的第一部分,客户端应继续发送请求的剩余部分。
`101`:切换协议,服务器已理解客户端请求,并准备切换协议。
爬虫在发送请求并接收响应时,会检查状态码,如果状态码表示请求成功(如200或201),爬虫会继续处理响应数据。如果状态码指示有错误(如404或500),爬虫可能会忽略该响应或采取其他错误处理措施。