前言
本文結構如下:
1、爬取某東暢銷商品數據
2、清洗數據并并進行簡單分析
3、將數據進行可視化展示
數據的字段如下:

一共爬取了243條某東暢銷商品數據
一、獲取數據
1. 分析網頁
在編寫代碼之前,先來分析一波網頁。

上面是某東的暢銷商品,通過辰哥分析分析,該網頁有異步加載(前面10個商品是靜態加載,剩下的是動態異步加載),因此我們需要寫了個請求去獲取數據。
2. 獲取靜態網頁商品鏈接
商品的銷售、評論等數據在商品詳情頁,這里先獲取商品詳情頁鏈接

結果如下:

3. 獲取動態網頁商品鏈接
通過抓包可以獲取到動態加載鏈接,并獲取到商品標題和商品id(這里的商品id可以用于后面拼接商品詳情頁鏈接)


獲取json數據后,提取出商品標題和商品ID

4. 獲取打折、原價、秒殺價
通過商品ID可以獲取到商品打折、原價、秒殺價(這里有接口,接口是通過抓包獲取的,感興趣的可以去自己去嘗試,不明白的可以直接使用)

這里將該功能封裝成函數,通過傳入商品ID就可以獲取該商品的商品打折、原價、秒殺價
結果如下:

5. 獲取評論數、好評數、中評數、差評數、好評率
通過商品ID可以獲取到評論數、好評數、中評數、差評數、好評率(同樣這里有接口,接口是通過抓包獲取的,感興趣的可以去自己去嘗試,不明白的可以直接使用)

結果如下:

6. 保存到excel
接著開始遍歷商品,并通過ID去獲取商品的銷售情況(步驟4和步驟5的函數),最后把數據保存到execl
定義表頭

寫入數據

其中的get_price和CommentCount是步驟4和步驟5的函數。count是excel中行數,因此在循環中count+1,依次寫入下一行。
最終保存結果

一共爬取了243條某東暢銷商品數據
二、數據分析可視化
1.數據清洗

需要清洗的內容,主要有圖中這三列(標題、打折、好評數)。
清洗目標:
標題過長(長度控制在10內),不方便后面的畫圖
打折字段中含有折字,在進行排序時不能直接轉數值型。
好評數中的萬,轉為具體數值,如1.2萬轉為12000

清洗結果:

2.可視化-商品打折力度
從清洗后數據中取出:商品名稱和打折這兩列,進行【排序】從打折最大到打折最小。最后取出前15名進行可視化
核心代碼****如下:

可視化效果:

3.可視化-好評率統計
從數據中取出:好評率這列,對不同的好評率進行統計,如好評率是100%(1)的商品多少件,好評率99%(0.99)的商品多少件等。

核心代碼****如下:

可視化效果:

3.可視化-暢銷商品銷量排行
從數據中取出:商品名稱和評論數這兩列,這里根據評論數去作為銷售依據,對商品的銷量進行排序(高到低),并取出前15名進行可視化。
核心代碼****如下:

可視化效果:

4.可視化-暢銷商品前15名原價與秒殺價對比
在上面的分析中可以知道暢銷商品的銷量前15名,這里將這15件商品的原價和秒殺價進行可視化對比。
核心代碼****如下:

可視化效果:

到此這篇關于用Python爬取618當天某東熱門商品銷量數據,看看大家喜歡什么!的文章就介紹到這了,更多相關Python爬取商品銷量數據內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- Python爬蟲實戰之爬取京東商品數據并實實現數據可視化
- Python實現數據可視化看如何監控你的爬蟲狀態【推薦】
- Python 爬取淘寶商品信息欄目的實現
- 基于Python爬取京東雙十一商品價格曲線
- Python通過正則庫爬取淘寶商品信息代碼實例