好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

主頁 > 知識庫 > Python爬蟲之自動爬取某車之家各車銷售數據

Python爬蟲之自動爬取某車之家各車銷售數據

熱門標簽:地圖標注面積 所得系統電梯怎樣主板設置外呼 市場上的電銷機器人 北京電銷外呼系統加盟 佛山400電話辦理 朝陽手機外呼系統 儋州電話機器人 小蘇云呼電話機器人 北瀚ai電銷機器人官網手機版

一、目標網頁分析

目標網站是某車之家關于品牌汽車車型的口碑模塊相關數據,比如我們演示的案例奧迪Q5L的口碑頁面如下:

https://k.autohome.com.cn/4851/#pvareaid=3311678

為了演示方式,大家可以直接打開上面這個網址,然后拖到全部口碑位置,找到我們本次采集需要的字段如下圖所示:

采集字段

我們進行翻頁發現,瀏覽器網址發生了變化,大家可以對下如下幾頁的網址找出規律:

https://k.autohome.com.cn/4851/index_2.html#dataList
https://k.autohome.com.cn/4851/index_3.html#dataList
https://k.autohome.com.cn/4851/index_4.html#dataList

對于上面寫網址,我們發現可變部分是車型(如4851)以及頁碼(如2,3,4),于是我們可以構建url參數如下:

# typeid是車型,page是頁碼
url = f'https://k.autohome.com.cn/{typeid}/index_{page}.html#dataList'

二、數據請求

通過簡單的測試,發現似乎不存在反爬,那就簡單了。

我們先引入需要用到的庫:

import requests
import pandas as pd
import html
from lxml import etree
import re

然后創建一個數據請求的函數備用:

# 獲取網頁數據(傳遞參數 車型typeid和頁碼數)
def get_html(typeid,page):
    # 組合出請求地址
    url = f'https://k.autohome.com.cn/{typeid}/index_{page}.html#dataList'
    # 請求數據(因為沒有反爬,這里沒有設置請求頭和其他參數)
    r = requests.get(url)
    # 請求的網頁數據中有網頁特殊字符,通過以下方法進行解析
    r = html.unescape(r.text)
    # 返回網頁數據
    return r

請求來的數據就是網頁html文本,我們接下來采用re解析出一共多少頁碼,再用xpath進行采集字段的解析。

三、數據解析

由于需要進行翻頁,這里我們可以先通過re正則表達式獲取總頁碼。通過查看網頁數據,我們發現總頁碼可以通過如下方式獲取:

try:
    pages = int(re.findall(r'共(\d+)頁',r)[0])
# 如果請求不到頁數,則表示該車型下沒有口碑數據
except :
    print(f'{name} 沒有數據!')
    continue

總頁碼采集

關于待采集字段信息,我們發現都在節點div[@class="mouthcon-cont-left"]里,可以先定位這個節點數據,然后再進行逐一解析。

待采集字段信息所在節點

此外,我們發現每一頁最多15個車型口碑數據,因此我們每頁可以定位15個待采集信息數據集,遍歷采集代碼:

divs = r_html.xpath('.//div[@class="mouthcon-cont-left"]')
# 遍歷每個全部的車輛銷售信息
for div in divs:
    # 找到車輛銷售信息所在的地方
    mt = div.xpath('./div[@class="choose-con mt-10"]')[0]
    # 找到所需字段
    infos = mt.xpath('./dl[@class="choose-dl"]')
    # 設置空的字典,用于存儲單個車輛信息
    item = {}
    # 遍歷車輛信息字段
    for info in infos:
        key = info.xpath('.//dt/text()')[0]
        # 當字段為購買車型時,進行拆分為車型和配置
        if key == '購買車型':
            item[key] = info.xpath('.//dd/a/text()')[0]
            item['購買配置'] = info.xpath('.//span[@class="font-arial"]/text()')[0]
        # 當字段為購車經銷商時,需要獲取經銷商的id參數,再調用api獲取其真實經銷商信息(這里有坑)
        elif key == '購車經銷商':
            # 經銷商id參數
            經銷商id = info.xpath('.//dd/a/@data-val')[0] +','+ info.xpath('.//dd/a/@data-evalid')[0]
            # 組合經銷商信息請求地址
            jxs_url = base_jxs_url+經銷商id+'|'
            # 請求數據(為json格式)
            data = requests.get(jxs_url)
            j = data.json()
            # 獲取經銷商名稱
            item[key] = j['result']['List'][0]['CompanySimple']
        else:
            # 其他字段時,替換轉義字符和空格等為空
            item[key] = info.xpath('.//dd/text()')[0].replace("\r\n","").replace(' ','').replace('\xa0','')

四、數據存儲

由于沒啥反爬,這里直接將采集到的數據轉化為pandas.DataFrame類型,然后存儲為xlsx文件即可。

df = pd.DataFrame(items)
df = df[['購買車型', '購買配置', '購買地點', '購車經銷商', '購買時間', '裸車購買價']]
# 數據存儲在本地
df.to_excel(r'車輛銷售信息.xlsx',index=None,sheet_name='data')

五、采集結果預覽

整個爬蟲過程比較簡單,采集下來的數據也比較規范,以本文案例奧迪Q5L示例如下:

到此這篇關于Python爬蟲之自動采集某車之家各車銷售數據的文章就介紹到這了,更多相關Python采集汽車銷售數據內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python腳本實現自動登錄校園網
  • python自動化運維之Telnetlib的具體使用
  • 還在手動蓋樓抽獎?教你用Python實現自動評論蓋樓抽獎(一)
  • Python 如何實現文件自動去重
  • python趣味挑戰之爬取天氣與微博熱搜并自動發給微信好友
  • python 利用PyAutoGUI快速構建自動化操作腳本
  • Python實現智慧校園自動評教全新版

標簽:云南 江蘇 酒泉 龍巖 寧夏 商丘 金融催收 定西

巨人網絡通訊聲明:本文標題《Python爬蟲之自動爬取某車之家各車銷售數據》,本文關鍵詞  Python,爬蟲,之,自動,爬取,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python爬蟲之自動爬取某車之家各車銷售數據》相關的同類信息!
  • 本頁收集關于Python爬蟲之自動爬取某車之家各車銷售數據的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 19?韩国美女vip韩宝贝| 闺蜜隔壁嗯啊娇喘| 国产在线丝袜精品一区免费| 国产在线视频网址| 午夜丁老福利无码中文字幕视频| 真浪小sao货是不是又想要了| 女人脱了内裤让男人猛戳口述| 屁屁影院CCYYCOM发布地| 日韩欧美在线| 小丹的嫩苞又嫩又紧又湿| 午夜色在线| 又爽又黄又无遮挡网站| 又粗又深又猛又爽A片免费看网站 ASian国模人体pics人 | freehd18sex| 大乳老师婬荡呻吟HD| 老师机影院| 精品国产91在线| 女友闺蜜2伦理| 秋霞午夜伦高清在线观看| 啊轻点灬太粗嗯太深了校园视频 | 国产美女一级A片免费| 杨幂醉酒视遭强在线播放| 涩涩鲁亚洲精品一区二区| 色夜夜摸狠狠摸日日视频| 青青草手机视频在线观看| 欧美一级特黄aaaaaa在线看首页| 亚洲无人岛视频免费看| 日本一区二区三区高潮喷水 | 97超级碰久久久久香蕉人人| 99ri在线视频| 湖南张丽大战黑人hd视频| 色94色欧美sute亚洲线路一久| 国产三级日本三级在线播放| 久久精品亚洲AV一区二区| 老湿机福利区试看三分钟 | 激烈吮乳吃奶头多p欧美| 波多野结衣痴女系列| 玉米地被老头添的好爽视频| 美女一级毛片免费视频| 免费观看视频的app| 小寡妇又粗又硬好爽|