目錄
- 一、導讀
- 二、前戲
- 三、Python標準庫
- 四、科學計算與統計
- 五、數據處理與分析
- 六、可視化
- 七、機器學習、深度學習和強化學習
- 八、自然語言處理
一、導讀
通常,開發大量原始代碼是一個費時費力的工作而且有時候有很多專業知識我們不可能都一 一弄懂,為了避免這種情況,我們會盡可能多地使用庫中已有的類來創建對象,通常僅需要一行代碼。因此,庫能夠幫助我們使用適量的代碼執行重要的任務。我想這也是為什么python能夠活躍在我們身邊的原因之一吧,歡迎大家點贊收藏,日后學習。
二、前戲
剛才忘了說了,大家在用python的時候我還是推薦大家下一個集成開發環境Anaconda
這里面能夠更好的管理這些第三方庫文件,其好處只有你真正用過才知道老規矩想用的話自己查, 老師說過: “程序員最長走的兩條路一是自己去百度;二是找別人幫你百度?。?!” 這真的是名言
三、Python標準庫

有時候你可能想不到python標準庫里面有這么多工功能,Python標準庫提供了豐富的功能,包括文本/二進制數據處理、數學運算、函數式編程、文件/目錄訪問、數據持久化、數據壓縮/歸檔、加密、操作系統服務、并發編程、進程間通信、網絡協議、JSON / XML /其他Internet數據格式、多媒體、國際化、GUI、調試、分析等。下面列出了一部分Python標準庫模塊。
- difflib:差異計算工具
- collections:建立在列表、元組、字典和集合基礎上的加強版數據結構。
- csv:處理用逗號分隔值的文件。
- datetime, time:日期和時間操作。
- decimal:定點或浮點運算,包括貨幣計算。
- doctest:通過驗證測試或嵌入在docstring中的預期結果進行簡單的單元測試。
- json:處理用于Web服務和NoSQL文檔數據庫的JSON(JavaScript Object Notation)數據。
- math:常見的數學常量和運算。
- os:與操作系統進行交互。
- queue:一種先進先出的數據結構。
- random:偽隨機數操作。
- re:用于模式匹配的正則表達式。
- sqlite3:SQLite關系數據庫訪問。
- statistics:數理統計函數,如均值、中值、眾數和方差等。
- sys:—命令行參數處理,如標準輸入流、輸出流和錯誤流。
- timeit:性能分析。
- string:通用字符串操作
- textwrap:文本填充
- unicodedata:Unicode字符數據庫
- stringprep:互聯網字符串準備工具
- readline:GNU按行讀取接口
- rlcompleter:GNU按行讀取的實現函數
Python擁有一個龐大且仍在快速增長的開源社區,社區中的開發者來自許多不同的領域。該社區中有大量的開源庫是Python受歡迎的最重要的原因之一。

許多任務只需要幾行Python代碼就可以完成,這會令人感到很神奇。下面列出了一些流行的數據科學庫。

四、科學計算與統計
- NumPy(Numerical Python):Python沒有內置的數組數據結構。它提供的列表類型雖然使用起來更方便,但是處理速度較慢。NumPy提供了高性能的ndarray數據結構來表示列表和矩陣,同時還提供了處理這些數據結構的操作。
- SciPy(Scientific Python):SciPy基于NumPy開發,增加了用于科學處理的程序,例如積分、微分方程、額外的矩陣處理等。scipy.org負責管理SciPy和NumPy。
- StatsModels:為統計模型評估、統計測試和統計數據研究提供支持。
- IPython是Python科學計算標準工具集的組成部分,它可以把很多東西聯系到一起,有點類似一個增強版的Python shell。目的是為了提高編程,測試和調試Python代碼的速度,好像很多國外的大學教授,還有Google大牛都很喜歡用IPython,確實很方便。
五、數據處理與分析

pandas:一個非常流行的數據處理庫。pandas充分利用了NumPy的ndarray類型,它的兩個關鍵數據結構是Series(一維)和DataFrame(二維)。
modin[14] pandas加速庫,接口語法與pandas高度一致
dask[15] pandas加速庫,接口語法與pandas高度一致
plydata[16] pandas管道語法庫
六、可視化
Pyecharts Echarts 是個由百度開源的數據可視化,憑借著良好的交互性,精巧的圖表設計,得到了眾多開發者的認可。而 Python 是門富有表達力的語言,很適合用于數據處理。當數據分析遇上數據可視化時pyecharts 誕生了
Matplotlib:可高度定制的可視化和繪圖庫。Matplotlib可以繪制正規圖、散點圖、柱狀圖、等高線圖、餅圖、矢量場圖、網格圖、極坐標圖、3D圖以及添加文字說明等。
Seaborn:基于Matplotlib構建的更高級別的可視化庫。與Matplotlib相比,Seaborn改進了外觀,增加了可視化的方法,并且可以使用更少的代碼創建可視化。
七、機器學習、深度學習和強化學習

- scikit-learn:一個頂級的機器學習庫。機器學習是AI的一個子集,深度學習則是機器學習的一個子集,專注于神經網絡。
- Keras:最易于使用的深度學習庫之一。Keras運行在TensorFlow(谷歌)、CNTK(微軟的深度學習認知工具包)或Theano(蒙特利爾大學)之上。
- TensorFlow:由谷歌開發,是使用最廣泛的深度學習庫。TensorFlow與GPU(圖形處理單元)或谷歌的定制TPU(Tensor處理單元)配合使用可以獲得最佳的性能。TensorFlow在人工智能和大數據分析中有非常重要的地位,因為人工智能和大數據對數據處理的需求非常巨大。
- OpenAI Gym:用于開發、測試和比較強化學習算法的庫和開發環境。
- pytorch Pytorch是torch的python版本,是由Facebook開源的神經網絡框架,專門針對 GPU 加速的深度神經網絡(DNN)編程。Torch 是一個經典的對多維矩陣數據進行操作的張量(tensor )庫,在機器學習和其他數學密集型應用有廣泛應用。與Tensorflow的靜態計算圖不同,pytorch的計算圖是動態的,可以根據計算需要實時改變計算圖。但由于Torch語言采用 Lua,導致在國內一直很小眾,并逐漸被支持 Python 的 Tensorflow 搶走用戶。作為經典機器學習庫 Torch 的端口,PyTorch 為 Python 語言使用者提供了舒適的寫代碼選擇。
八、自然語言處理

- NLTK(Natural Language Toolkit):用于完成自然語言處理(NLP)任務。
- TextBlob:一個面向對象的NLP文本處理庫,基于NLTK和模式NLP庫構建,簡化了許多NLP任務。
- Gensim:功能與NLTK類似。通常用于為文檔合集構建索引,然后確定另一個文檔與索引中每個文檔的相似程度。
到此這篇關于Python的這些庫,你知道多少?的文章就介紹到這了,更多相關Python庫內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- python 內置庫wsgiref的使用(WSGI基礎入門)
- Python實現socket庫網絡通信套接字
- Python標準庫之typing的用法(類型標注)
- Python趣味挑戰之turtle庫繪畫飄落的銀杏樹
- 讓文件路徑提取變得更簡單的Python Path庫
- 關于python3安裝pip及requests庫的導入問題