国产片侵犯亲女视频播放_亚洲精品二区_在线免费国产视频_欧美精品一区二区三区在线_少妇久久久_在线观看av不卡

腳本之家,腳本語言編程技術及教程分享平臺!
分類導航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務器之家 - 腳本之家 - Python - Python通過四大 AutoEDA 工具包快速產出完美數據報告

Python通過四大 AutoEDA 工具包快速產出完美數據報告

2022-02-22 12:55Python學習與數據挖掘 Python

在三年前,我們做數據競賽或者數據建模類的項目時,前期我們會耗費較多的時間去分析數據,但現在非常多擅長數據分析的大師們已經將我們平時常看的數據方式進行了集成,開發了很多AutoEDA的工具包。可以幫助我們節省大量時

AutoEDA工具包對于剛剛學習數據分析的小伙伴可以帶來非常大的幫助。

本篇文章我們介紹目前最流行的四大AutoEDA工具包。

  • D-tale
  • Pandas-Profiling
  • Sweetviz
  • AutoViz

這幾個工具包可以以短短三五行代碼幫新手節省將近一天時間去寫代碼分析,非常建議大家收藏學習,喜歡點贊支持,文末提供技術交流群,盡情暢聊。

介紹

01 D-Tale

Python通過四大 AutoEDA 工具包快速產出完美數據報告

D-Tale是Flask后端和React前端組合的產物,也是一個開源的Python自動可視化庫,可以為我們提供查看和分析Pandas DataFrame的方法,幫助我們獲得非常數據的詳細EDA。

目前D-Tale支持DataFrame、Series、MultiIndex、DatetimeIndex 和 RangeIndex 等 Pandas 對象。

Github 鏈接

https://github.com/man-group/dtale

  1. # pip install dtale 
  2. import dtale 
  3. import pandas as pd 
  4. df = pd.read_csv("./data/titanic.csv"
  5. d = dtale.show(df) 
  6. d.open_browser() 

Python通過四大 AutoEDA 工具包快速產出完美數據報告

02 Pandas-Profiling

Python通過四大 AutoEDA 工具包快速產出完美數據報告

Pandas-Profiling可以對Pandas DataFrame生成report報告。其中:

  • pandas_profiling的df.profile_report()擴展了pandas DataFrame以方便進行快速數據分析。

Pandas-Profiling對于每一列特征,特征的統計信息(如果與列類型相關)會顯示在交互式 HTML的report中:

  • Type:檢測數據列類型;
  • Essentials:類型、unique值、缺失值
  • 分位數統計,如最小值、Q1、中位數、Q3、最大值、范圍、四分位距
  • 描述性統計數據,如均值、眾數、標準差、總和、中值絕對偏差、變異系數、峰態、偏度
  • 出現最多的值
  • 直方圖
  • 高度相關變量、Spearman、Pearson 和 Kendall 矩陣的相關性突出顯示
  • 缺失值矩陣、計數、熱圖和缺失值樹狀圖

Github 鏈接

https://github.com/pandas-profiling/pandas-profiling/

  1. from pandas_profiling import ProfileReport 
  2. profile = ProfileReport(df, title="Pandas Profiling Report"
  3. profile 

2021-10-30 22:50:43,584 - INFO - Pandas backend loaded 1.2.5
2021-10-30 22:50:43,597 - INFO - Numpy backend loaded 1.19.2
2021-10-30 22:50:43,599 - INFO - Pyspark backend NOT loaded
2021-10-30 22:50:43,600 - INFO - Python backend loaded

一個特征的案例

Python通過四大 AutoEDA 工具包快速產出完美數據報告

03 Sweetviz

Python通過四大 AutoEDA 工具包快速產出完美數據報告

Sweetviz也是一個開源Python庫,Sweetviz可以用簡短幾行代碼生成美觀、高密度的可視化文件,只需兩行代碼即可開啟探索性數據分析并輸出一個完全獨立的 HTML 應用程序。Sweetviz主要包含下面的分析:

  • 數據集概述
  • 變量屬性
  • 類別的關聯性
  • 數值關聯性
  • 數值特征最頻繁值、最小、最大值

Github 鏈接

https://github.com/fbdesignpro/sweetviz

  1. # pip install sweetviz 
  2. import sweetviz as sv  
  3. sweetviz_report = sv.analyze(df) 
  4. sweetviz_report.show_html()  

04 AutoViz

Python通過四大 AutoEDA 工具包快速產出完美數據報告

AutoViz可以使用一行自動顯示任何數據集。給出任何輸入文件(CSV、txt或json),AutoViz都可以對其進行可視化。AutoViz的結果會以非常多的圖片都形式存在文件夾下方。

Github 鏈接

https://github.com/AutoViML/AutoViz

  1. # pip install autoviz 
  2. from autoviz.AutoViz_Class import AutoViz_Class 
  3. AV = AutoViz_Class() 
  4.  
  5. sep = ";" 
  6. dft = AV.AutoViz(filename="",sep=sep, depVar="Pclass", dfte=df, header=0, verbose=2,  
  7.                  lowess=False, chart_format="png", max_rows_analyzed=150000, max_cols_analyzed=30) 

諸多文件全都在當前文件夾下方

Python通過四大 AutoEDA 工具包快速產出完美數據報告

我們打開其中一個效果如下:

Python通過四大 AutoEDA 工具包快速產出完美數據報告

適用問題

適用于所有的數據分析問題。

到此這篇關于Python通過四大 AutoEDA 工具包快速產出完美數據報告的文章就介紹到這了,更多相關Python AutoEDA工具包內容請搜索服務器之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持服務器之家!

原文鏈接:https://blog.csdn.net/weixin_38037405/article/details/121059750

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 91久久久久久久久久久久久 | 91精品国产综合久久香蕉最新版 | 国产97色在线 | 亚洲 | 久久九九国产精品 | 91在线网址| 蜜桃色网 | 中文字幕日产乱码六区小草 | 亚洲成人第一网站 | 五月婷婷在线观看 | 亚洲精品乱码久久久久久金桔影视 | 国产视频久久 | 伊人无码高清 | 午夜精品一区二区三区在线播放 | 成人免费视频网 | 夜夜久久| 午夜欧美 | 伊人久久在线 | 中文字幕视频在线 | 一级片在线观看 | 国产一区二区在线免费观看 | 在线欧美亚洲 | 激情亚洲 | 大乳videos巨大吃奶 | 一区二区在线视频 | 九九香蕉视频 | 色在线电影 | 欧美日韩三区 | 成人av一区二区亚洲精 | 精品欧美乱码久久久久久1区2区 | av午夜| 中文成人在线 | 亚洲欧洲久久 | 女男羞羞视频网站免费 | 日韩成人av在线 | 免费黄色在线观看视频 | 一区二区三区四区在线 | 国产精品美女久久久免费 | 精品国产91亚洲一区二区三区www | 日韩在线视频播放 | 成人片在线播放 | 中文字幕一区二区三区不卡 |