Python 是很流行和使用比較廣泛的編程語言之一,它已經超越了業界許多編程語言,名列前茅。它在開發人員中流行的原因有很多,最重要的一點就是它有大量的庫供用戶使用。Python 的易用性、靈活性吸引了許多開發人員為機器學習創建新的庫。有一個庫大家必都會介紹,就是TensorFlow,這里就不多說了。那么,以下就是今日份干貨,大家有什么自己最喜歡的庫也可以在評論中留言分享~
1.Keras
Keras是由python編寫的機器學習API,其運行在機器學習的優秀平臺TensorFlow上。好處在于可以很快地實現網絡模型的搭建,數據輸入輸出也很方便,讓你可以專注于網絡模型本身,適合新手。比較大的缺點就是慢!作為高層API,推理速度等等肯定沒tf,mxnet那些快。
2. PyTorch
它的特點:處理N維度張量,和numpy類似,但是可以在GPU上運行。支持自動微分來構建和訓練大型的神經網絡。
3. fastai
用過的都說好,通過利用當下優秀的技術實踐,fastai極快地簡化了訓練過程也加速了神經網絡。只要一個API就包含了幾乎所有常見的深度學習應用。
4. JAX
Jax 是 Autograd 和 XLA 的結合用來提供高性能機器學習研究。作為 Autograd 的更新版本,JAX 可以自動微分原生 Python 和 Numpy 函數??赏ㄟ^ loops、branches、recursion 和 closures,進行微分,并且能夠對導數的導數求導。支持反向模式微分通過 grad。
5. FastText
它是一個可以讓你高效學習單詞表意和句子分類的庫。
6. spaCy
spaCy v3.0具有所有新的基于transformer的管道,讓spaCy的準確率達到SOTA。你可以使用任意預訓練transformer來訓練你自己的管道,也可以在多組件和多任務之間共享transformer。spaCy的transformer支持與PyTorch和HuggingFace transformers庫的集成,在管道中可以訪問許多預訓練模型。
7. gensim
它通過使用大型語料庫進行主題建模、文檔索引和相似性檢索。目標受眾是自然語言處理(NLP)和信息檢索(IR)社區。
8. NLTK
它是自然語言工具箱,是一整套針對自然語言處理研究和開發的開源Python模塊、數據集和教程。
9. TextBlob
簡單,Python風格,是一個用于處理文本數據的庫。它為潛入常見的自然語言處理(NLP)任務提供了一個簡單的API,例如詞性標注,名詞短語提取,情感分析,分類,翻譯等。
10. Pillow
它是個對用戶十分友好的PIL分支。PIL是Python圖像庫。
11. OpenCV
開源計算機視覺庫。
12.LightGBM
它可以幫助開發人員使用重新定義的基本模型,即決策樹來構建新的算法。LightGBM 的特點:計算速度快、生產效率高、直觀、易于使用。這個庫提供了高度可擴展、優化和快速的梯度增強實現,這使它在機器學習開發者中很流行。
13.Pandas
Pandas是Python中的一個機器學習庫,它提供高級的數據結構和各種各樣的分析工具。主要是能夠使用一個或兩個命令轉換復雜的數據操作。它還有許多內置的分組、數據組合、過濾和時間序列功能的函數。當和其他庫一起使用時,Pandas保證了高性能和良好的靈活性。
14..Numpy
數組接口是 Numpy 的最佳特性。它非常容易理解和使用,讓復雜的數學實現變得非常簡單。廣泛使用,因此有很多開源貢獻者。該接口可用于將圖像、聲音和其他二進制原始流表示為 n 維實數數組。
15.Click
Click的開發初衷就是使用最少的代碼,以一種可組合的方式創建漂亮的命令行接口。它的目的是使編寫命令行工具的過程快速而有趣,同時防止由于無法實現預期的CLI API而導致的任何問題。主要有三個特點:命令的任意嵌套、自動幫助頁面生成、支持在運行時延遲加載子命令。
原文地址:https://www.toutiao.com/i6906750874563936772/