好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

主頁 > 知識庫 > 學(xué)習(xí)Python爬蟲前必掌握知識點

學(xué)習(xí)Python爬蟲前必掌握知識點

熱門標(biāo)簽:打印谷歌地圖標(biāo)注 看懂地圖標(biāo)注方法 蘇州人工外呼系統(tǒng)軟件 電話外呼系統(tǒng)招商代理 佛山通用400電話申請 電話機(jī)器人貸款詐騙 廣東旅游地圖標(biāo)注 京華圖書館地圖標(biāo)注 淮安呼叫中心外呼系統(tǒng)如何

常見的協(xié)議

http和https
http協(xié)議:
超文本傳輸協(xié)議,是一個發(fā)布和接受HTML頁面的方法,端口是80

https 協(xié)議:http協(xié)議的加密版本,在HTTP下加上了ssl層,端口是443

下面訪問的是美團(tuán)的官網(wǎng):
可以看到端口是443

URL和RUI

常見的請求方式

http協(xié)議規(guī)定了瀏覽器與服務(wù)器進(jìn)行數(shù)據(jù)交互過程中必須要選擇一種交互方式
在http協(xié)議中定義了8中請求方式,常見的是get和post請求

get請求: 一般只從服務(wù)器獲取數(shù)據(jù)下來,并不會對服務(wù)器資源產(chǎn)生任何的影響。


請求的時候關(guān)注:

url請求方式請求頭

post請求: 向服務(wù)器發(fā)送數(shù)據(jù)(登陸),上傳文件等,會對服務(wù)器資源產(chǎn)生影響的時候,會使用post請求。

不過有些網(wǎng)站做了反爬蟲機(jī)制,你去查看信息,也是使用post請求,所以我們寫爬蟲的時候,一定要分析網(wǎng)站。

常見的請求頭參數(shù):

http協(xié)議中,向服務(wù)器發(fā)送一個請求,數(shù)據(jù)分為三部分:

  • 把數(shù)據(jù)放在url中
  • 數(shù)據(jù)放在body中,(post請求)
  • 數(shù)據(jù)放在head中

常見的請求頭參數(shù):

  • user-agent :瀏覽器名稱
  • referer: 當(dāng)前這個請求從哪個url過來的
  • cookie:http 協(xié)議是無狀態(tài)的,也就是一個人發(fā)送了兩次請求,服務(wù)器沒有能力知道這兩個請求是否來自同一個人。

常見的相應(yīng)狀態(tài)碼

  •  200 請求正常,服務(wù)器正常返回數(shù)據(jù)
  • 301 永久重定向
  • 404 請求的url在服務(wù)器上找不到
  • 418 發(fā)送請求遇到服務(wù)器端的反爬蟲,服務(wù)器拒絕相應(yīng)數(shù)據(jù)
  • 500 服務(wù)器內(nèi)部錯誤,可能是服務(wù)器出現(xiàn)了bug

HTTP的請求相應(yīng)過程

使用瀏覽器進(jìn)行網(wǎng)站分析

我們要分析的網(wǎng)站為: movie.douban.com

  • Elements: 用于分析網(wǎng)站的結(jié)構(gòu)

在頁面上的呈現(xiàn)的內(nèi)容,在Elements都會有相應(yīng)的元素。

  • Console: 這里會打印招聘信息,警告等等。

  • Sources
  • Network : 在顯示頁面的時候,產(chǎn)生的所有請求

headers 頭部信息

 session 與cookie

session代表的是服務(wù)器和瀏覽器的一次會話過程
session 是一種服務(wù)器端的機(jī)制,用來存儲特定用戶的會話所需要的信息,保存在內(nèi)存,緩存,或者數(shù)據(jù)庫中。

cookie
cooke是由服務(wù)器端生成后發(fā)送給客戶端,cookie是保存在客戶端的

cookie原理:
1) 創(chuàng)建cookie
2) 設(shè)置存儲cookie
3) 發(fā)送cookie
4) 讀取cookie

到此這篇關(guān)于學(xué)習(xí)Python爬蟲前,需要先掌握哪些知識內(nèi)容的文章就介紹到這了,更多相關(guān)學(xué)習(xí)Python爬蟲掌握知識內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • 利用Python網(wǎng)絡(luò)爬蟲爬取各大音樂評論的代碼
  • 使用Selenium實現(xiàn)微博爬蟲(預(yù)登錄、展開全文、翻頁)
  • 一文讀懂python Scrapy爬蟲框架
  • Python爬蟲分析微博熱搜關(guān)鍵詞的實現(xiàn)代碼
  • 用python爬蟲爬取CSDN博主信息

標(biāo)簽:湖州 衡水 呼和浩特 中山 江蘇 股票 駐馬店 畢節(jié)

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《學(xué)習(xí)Python爬蟲前必掌握知識點》,本文關(guān)鍵詞  學(xué)習(xí),Python,爬蟲,前必,掌握,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《學(xué)習(xí)Python爬蟲前必掌握知識點》相關(guān)的同類信息!
  • 本頁收集關(guān)于學(xué)習(xí)Python爬蟲前必掌握知識點的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    主站蜘蛛池模板: 少妇真人直播免费视频| 免费的特黄特色大片| 特级毛片全部免费播放器| 丰满级A片直播免费下载观看 | 曰本还a大片免费无播放器| 成人扒开??伸进???91动漫| 又白又嫩的乳[13p]| 美女A级毛片免费观看| 兽人之强养雌性| 征服我的美艳的岳李雪梅| www.射射| 夫妇交换做爰3| 《教室里的激情》在线观看| 羞羞漫画网站免费| 97av在线视频| 双性老师灌满浓jing上课h| 微拍 福利 视频 国产| 又黄又爽又色刺激的视频| 国产精品岛国久久久久| 337p粉嫩大胆噜噜噜鲁 | 超级乱淫伦短篇在车上| 学校短裙白丝系列短篇小h| 嗯嗯好深| 一级做人爰全过程全视频| 中文字幕人妻色偷偷久久m3u8| 大炕上偷欢(乱Lun合集1)| 99在线观看免费| 一色屋免费视频精品软件验证码| 搡老女人ⅩXXX搡老女| 亚洲男人第一天堂| 久久久久精品波多野结衣无码蜜桃 | 国产精品视频福利| 免费无码又爽又刺激A片男男小说| 导航福利视频| 黄色不要钱| 黄页网站在线看| 午夜无码人妻AV大片| 《貂蝉艳史》在线观看| 小婷好湿?好紧?太爽了视频| 日韩午夜欧美精品一二三四区| 成人福利免费观看体验区|