岳在我胯下哭泣,小浪货腿张开水好多呀H,九色91POPNY??蝌蚪新疆

主頁 > 知識庫 > python爬蟲之爬取筆趣閣小說

python爬蟲之爬取筆趣閣小說

前言

為了上班摸魚方便，今天自己寫了個爬取筆趣閣小說的程序。好吧，其實就是找個目的學習python，分享一下。

一、首先導入相關的模塊

import os
import requests
from bs4 import BeautifulSoup

二、向網站發送請求并獲取網站數據

網站鏈接最后的一位數字為一本書的id值，一個數字對應一本小說，我們以id為1的小說為示例。

進入到網站之后，我們發現有一個章節列表，那么我們首先完成對小說列表名稱的抓取

# 聲明請求頭
headers = {
	'User-Agent': 'Mozilla/5.0 (Windows NT 10.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.182 Safari/537.36'
}

# 創建保存小說文本的文件夾
if not os.path.exists('./小說'):
    os.mkdir('./小說/')
    
# 訪問網站并獲取頁面數據
response = requests.get('http://www.biquw.com/book/1/').text
print(response)

寫到這個地方同學們可能會發現了一個問題，當我去正常訪問網站的時候為什么返回回來的數據是亂碼呢？

這是因為頁面html的編碼格式與我們python訪問并拿到數據的解碼格式不一致導致的，python默認的解碼方式為utf-8，但是頁面編碼可能是GBK或者是GB2312等，所以我們需要讓python代碼很具頁面的解碼方式自動變化

#### 重新編寫訪問代碼
```python
response = requests.get('http://www.biquw.com/book/1/')
response.encoding = response.apparent_encoding
print(response.text)

'''
這種方式返回的中文數據才是正確的
'''

三、拿到頁面數據之后對數據進行提取

當大家通過正確的解碼方式拿到頁面數據之后，接下來需要完成靜態頁面分析了。我們需要從整個網頁數據中拿到我們想要的數據(章節列表數據)

1.首先打開瀏覽器

2.按F12調出開發者工具

3.選中元素選擇器

4.在頁面中選中我們想要的數據并定位元素

5.觀察數據所存在的元素標簽

'''
根據上圖所示，數據是保存在a標簽當中的。a的父標簽為li，li的父標簽為ul標簽，ul標簽之上為div標簽。所以如果想要獲取整個頁面的小說章節數據，那么需要先獲取div標簽。并且div標簽中包含了class屬性，我們可以通過class屬性獲取指定的div標簽，詳情看代碼~
'''
# lxml: html解析庫 將html代碼轉成python對象，python可以對html代碼進行控制
soup = BeautifulSoup(response.text, 'lxml')
book_list = soup.find('div', class_='book_list').find_all('a')
# soup對象獲取批量數據后返回的是一個列表，我們可以對列表進行迭代提取
for book in book_list:
    book_name = book.text
    # 獲取到列表數據之后，需要獲取文章詳情頁的鏈接，鏈接在a標簽的href屬性中
    book_url = book['href']

四、獲取到小說詳情頁鏈接之后進行詳情頁二次訪問并獲取文章數據

book_info_html = requests.get('http://www.biquw.com/book/1/' + book_url, headers=headers)
book_info_html.encoding = book_info_html.apparent_encoding
soup = BeautifulSoup(book_info_html.text, 'lxml')

五、對小說詳情頁進行靜態頁面分析

info = soup.find('div', id='htmlContent')
print(info.text)

六、數據下載

with open('./小說/' + book_name + '.txt', 'a', encoding='utf-8') as f:
    f.write(info.text)

最后讓我們看一下代碼效果吧~

抓取的數據

到此這篇關于python爬蟲之爬取筆趣閣小說的文章就介紹到這了,更多相關python爬取小說內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

python 爬取國內小說網站
Python爬蟲入門教程02之筆趣閣小說爬取
python 爬取小說并下載的示例
python爬取”頂點小說網“《純陽劍尊》的示例代碼
Python爬取365好書中小說代碼實例
Python實現的爬取小說爬蟲功能示例
Python scrapy爬取起點中文網小說榜單

標簽：日照赤峰陽泉雙鴨山克拉瑪依貴州臨汾金華

巨人網絡通訊聲明：本文標題《python爬蟲之爬取筆趣閣小說》，本文關鍵詞 python,爬蟲,之爬,取筆,趣閣,；如發現本文內容存在版權問題，煩請提供相關信息告之我們，我們將及時溝通與處理。本站內容系統采集于網絡，涉及言論、版權與本站無關。

下面列出與本文章《python爬蟲之爬取筆趣閣小說》相關的同類信息！

python爬蟲之爬取筆趣閣小說

10-18

中牟百應電銷機器人加盟（中牟百應電銷機器人

本文目錄一覽：1、跟電話機器人公司協作,上圈套了怎么辦2、為什么越來越多的人挑選電話機器人項目創業3、電話機器人...

11-29

新一線城市研究所、ofo聯合發布：南京每天超2千人騎車起點為新街口地鐵

第一財經·新一線城市研究所與ofo小黃車最新聯合發布了“共享單車城市出行大數據”，并解讀了南京整座城市的共享單車出...

10-16

蘇州電銷機器人免費領（智能電銷機器人購買）

本篇文章給我們談談姑蘇電銷機器人免費領，以及智能電銷機器人購買對應的知識點，期望對各位有所協助，不要忘了保藏本...

11-06

PowerShell ISE自動化簡單示例

PowerShell ISE的自動化不依賴與任何第三方的框架和工具，因為PowerShell ISE本身就是可編程的。非常高大上地被稱作為PowerShell抽...

10-18

$[city_name]電銷卡哪里購買好（電銷電話卡哪個比較便宜）

今天給各位分享電銷卡哪里購買好的知識，其中也會對電銷電話卡哪個比較便宜進行解釋，如果能碰巧解決你現在面臨的問題...

06-02

杭州電話外呼系統價格（杭州呼叫中心）

本文目次一覽： 1、外呼零碎幾何錢一個月？ 2、德律風外呼零碎幾何錢？ 3、電銷外呼零碎幾何錢一個月？ 4、外呼零碎一個...

11-25

南通高頻電銷卡批發

南通高頻電銷卡批發本公司目前已經與多家虛擬運營商聯簽約，共創虛商大業，提供了業務整合的平臺！服務宗旨：只給客...

11-15

如何獲得沒有地圖標注商家信息？如何獲得位置信息？

C#如何獲得百度地圖點上的信息框？百度地圖是提供了一個js API 你需要什么需要用js獲取，在ajax發到后臺去如何采集百度地...

11-26

辦理400電話打破企業“生死劫”（企業400電話辦理怎樣做）

11-07

極光大數據：國內手機市場年中大盤點

2017 年第二季度，蘋果十周年新機型蓄勢待發。安卓陣營華為衛冕銷量冠軍，vivo則登上亞軍寶座。中國領先的移動大數據辦事...

10-16

許昌手機外呼系統（電銷手機外呼系統）

本文目錄一覽：1、外呼體系是怎樣用的？2、外呼體系怎樣用？我也是做電銷的，打電話打多了就會被封號3、什么是網絡電話...

11-29

保定市防封高頻電話卡便宜

全國建“合伙人”制分公司有了戰略和產品，開拓用戶是分享通信集團下一步的重心。據了解，分享通信集團以“分享”的理...

02-15

聯通400電話固定費用400電話辦理具體的收費標準是什么？

作為全國統一的強大虛擬總機，400電話號碼沒有9位數字，都是從400開始的，但是運營商不同，數字段不同。聯通400電話目前...

01-13

為什么企業對 400 電話感興趣？（企業對400電話感興趣原因是什么）

很多企業都非常重視電話業務，所以選擇一個非常合適的電話號碼對企業來說也很重要企業對400電話感興趣原因是什么在掌...

07-21

麗水電銷機器人廠家

匯港通科技組裝于2018年，是一家潛心于大中小企業精準經營銷售和企業管理效勞處置計劃的供給商。呼叫中心經營管理，巨...

10-31

蘇州電銷機器人哪家有賣（蘇州家用機器人）

本文目錄一覽： 1、電話銷售機器人哪個好2、電銷機器人都有哪些性價比高的品牌？3、電話ai機器人在哪能買4、電銷機器人...

11-27

徐州電話機器人廠家招聘（江蘇機器人廠招聘）

本文目錄一覽： 1、怎么查詢個人征信報告？ 2、越來越多人做電銷機器人了，電銷機器人哪家好呢？ 3、沒有用的比較好的電...

11-25

400電話，走進行業領先的推廣

400電話，這是一個選擇永久性號碼的平臺，也是很多行業進入到發展階段過程中所需要把握的一種宣傳模式，到底怎么樣才能...

03-12

電銷防封軟件真的可以防封號嗎?

現在的電銷行業越來越難做了，原因無他，就是運營商封號太嚴重了。每天打不了多少電話就會有封號的危險。這對電銷業務...

12-03

品牌商標轉讓一般要多少天才能進行使用？

現在要以什么樣的方式，才可以快速完成品牌商標轉讓流程呢？對此有疑問的朋友，只要不斷了解相關的事情，很快就會知...

10-23

化妝品商標注冊

化妝品作為一種品牌盈利能力很強的產品，商標注冊顯然是最重要的。銷售的作用反而是其次，生產環節的盈利能力最差。從...

10-23

400電話資費400元電話資費標準

400電話資費400元電話資費標準以下內容由巨人小編整理發布。 50元/月，83元/月，138元/月。400電話已經成為企業的必須品，...

02-20

加速AI應用，思必馳在2019全球人工智能產品應用博覽會

5月9日，由蘇州市人民政府、新一代人工智能產業技術創新戰略聯盟共同主辦的2019全球人工智能產品應用博覽會（以下簡稱全...

10-19

電銷團隊怎么抓人（電銷團隊犯法嗎）

今天給各位分享電銷團隊怎么抓人的知識，其中也會對電銷團隊犯法嗎進行解釋，如果能碰巧解決你現在面臨的問題，別忘了...

08-27

網上購買物聯卡靠譜嗎

在這個萬物互聯的時代，針對于企業設備聯網的物聯卡就顯得格外重要了，而共享單車，移動支付，智慧城市，自動售賣機等...

11-07

佛山銷售外呼系統收費（外呼營銷違法嗎）

本文目錄一覽： 1、外呼體系多少錢一個月？2、電銷外呼體系多少錢一個月？3、電銷外呼體系一個月貴嗎？4、外呼體系裝置...

04-22

觀察呼叫中心外包運營有感

09年6月下旬的某日，盆地中的臺北天氣悶熱，電腦慣例地持續收到各方郵件。剛巧公務纏身，本想只要不是緊急狀況就先擱著...

10-22

電銷團隊海報手繪（電銷團隊名稱和激勵口號）

本文目錄一覽： 1、海報怎樣畫手繪2、制造手繪POP海報的6大過程與技巧3、手繪POP海報的過程及技巧4、怎樣手繪pop海報5、手...

04-22

南京房產外呼電話一企嗨呼叫系統,AXB線路廠家-實力認證

一企嗨電話營銷系統 1．當前的電銷場景有哪些困擾？ 1）手機.卡頻繁被封，電銷業務難以啟動； 2）銷售人員號碼被標注，...

12-17

東莞財稅專用ai電話機器人價格-哪家專業？

東莞財稅專用ai電話機器人價格反正我是無法理解的。值得一提的是在這份榜單中，呼叫中心系統服務商的表現給人眼前一亮...

05-17

商務部與加拿大中國貿易理事會服務外包合作交流會成功舉行

10月4日，商務部與加中貿易理事會在加拿大多倫多舉辦了2013年中加服務外包合作交流會。加中貿易理事會Neil Tait副主席和中...

10-22

關于大都會人壽電銷是外包么的信息

本篇文章給大家談談大都會人壽電銷是外包么，以及對應的知識點，希望對各位有所幫助，不要忘了收藏本站喔。本文目錄...

08-28

智呼寶ai電話機器人（電話智能機器人）

本文目次一覽： 1、什么是AI智能德律風呆板人？ 2、智能德律風呆板人可行嗎？ 3、AI智能德律風呆板人 4、ai智能德律風呆板...

11-25

400電話續費的套餐還是和以前一樣的吧？

400電話新續費的套餐跟之前簽訂的合同是一樣的，除非您要提高續費的標準，只能提高不能降低。...

12-22

Javascript中使用exec進行正則表達式全局匹配時的注意事項

本文就是介紹在使用 Javascript 中使用 exec 進行正則表達式全局匹配時的注意事項。先看一下常見的用法：復制代碼代碼如下...

10-18

中高端服務外包人才來錫創業可獲安家費補貼

無錫服務外包企業若獲得世界500強企業的大額外包合同，本地工業企業若向123計劃企業發包，符合這樣的條件都將得到獎勵。...

10-22

伊娃機器人效果怎么樣

時代在發展，科技在進步，無論你的企業在行業中處于什么樣的地位，無論你的企業在市場上占多大的份額，無論你的企業在...

10-31

云呼叫中心年增近20% 獲電商企業青睞

中國軟件資訊網消息，近期，基于云計算技術的呼叫中心受到業界的關注，并逐步成為了企業發展電子商務的新動力。由于云...

10-22

linux學習筆記

linux目錄架構 / 根目錄 /bin 常用的命令 binary file 的目錄 /boot 存放系統啟動時必須讀取的檔案，包括核心 (kernel) 在內 /boot/gr...

10-20

centos安裝php5、卸載php、安裝php7的教程

首先安裝php5很簡單 yum install php 然后如果不想用php5的話那就卸載吧注意只使用yum remove命令是行不通的那我們先 yum remove p...

10-16

上海電銷公司外呼用什么軟件

上海電銷公司外呼用什么軟件,辦理上海電銷外呼軟件,上海電銷軟件辦理防封號電銷軟件，提供多種防封解決方案，支持各地...

12-03

電銷機器人對電銷行業有著積極的促進作用

電銷機器人對電銷行業有著積極的促進作用，電銷機器人，讓客戶服務體驗更順暢。電銷機器人外呼系統顛覆傳統自動外呼只...

10-31

外呼系統外地手機號（外呼電話號碼）

本文目錄一覽： 1、外埠手機號碼一天撥打20個外埠號碼會封號么？ 2、外呼體系若何用？我也是做電銷的，打電話打多了就會...

11-26

電銷外呼線路都有哪些

電銷外呼線路都有哪些優質的電銷線路，全國套餐可選。企業呼叫中心、業務系統統一接入。解決封號難題，提供呼出率！...

12-03

電話機器人有法律效應（電話機器人違法嗎）

本文目錄一覽：1、076912345打電話是機器人會不會坐牢2、公司老板把電話號碼數據給我導入到電話機器人群呼系,我會涉嫌違法...

06-20

微軟頒布頒發為Win10秋季更新10586延長6個月更新支持

目前，Windows10 共計有 5 個正式版，從Version 1507(Build 10240)到最新的1709(Build16299 秋季創意者更新)。因為敦促升級的緣故，微軟...

10-15

鄭州防封卡外呼系統是什么（外呼防封號系統）

本文目錄一覽： 1、什么是網絡電話外呼體系？2、外呼體系是什么?3、外呼體系是怎樣用的？什么是網絡電話外呼體系？你加...

11-28

長沙電銷外呼系統介紹（呼叫中心電銷系統）

本篇文章給大家談談長沙電銷外呼系統介紹，以及呼叫中心電銷系統對應的知識點，希望對各位有所幫助，不要忘了收藏本站...

11-06

400電話中國移動移動400電話怎么樣

移動400業務就是互聯網上提到的400電話，類似于800電話，都是提供給企業的直線電話業務。與800不同的是，400電話是一項業...

01-13

黑龍江電銷外呼系統好用嗎（電銷外呼系統哪個

本文目錄一覽：1、外呼體系好用嗎？2、電銷客外呼體系這個體系好用么？3、外呼體系怎么？好用么？4、外呼體系好用不?哪...

11-29

python爬蟲之爬取筆趣閣小說

10-18

本頁收集關于python爬蟲之爬取筆趣閣小說的相關信息資訊供網民參考！

推薦文章

上一篇：python獲取淘寶服務器時間的代碼示例

下一篇：python文件名批量重命名腳本實例代碼

一起分享吧

好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

python爬蟲之爬取筆趣閣小說

目錄

前言

一、首先導入相關的模塊

二、向網站發送請求并獲取網站數據

三、拿到頁面數據之后對數據進行提取

四、獲取到小說詳情頁鏈接之后進行詳情頁二次訪問并獲取文章數據

五、對小說詳情頁進行靜態頁面分析

六、數據下載