好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

主頁 > 知識庫 > pandas統計重復值次數的方法實現

pandas統計重復值次數的方法實現

熱門標簽:千呼ai電話機器人免費 外呼系統前面有錄音播放嗎 高德地圖標注字母 騰訊地圖標注有什么版本 400電話辦理費用收費 鎮江人工外呼系統供應商 深圳網絡外呼系統代理商 柳州正規電銷機器人收費 申請辦個400電話號碼

本文主要介紹了pandas統計重復值次數的方法實現,分享給大家,具體如下:

from pandas import DataFrame

df = DataFrame({'key1':['a','a','b','b','a','a'],
        'key2':['one','two','one','two','one','one'],
        'data1':[1,2,3,2,1,1],
        # 'data2':np.random.randn(5)
        })
# 打印數據框
print(df)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two
# 4   1  a one
# 5   1  a one

# 重復項
print(df[df.duplicated()])
#  data1 key1 key2
# 4   1  a one
# 5   1  a one

# 統計重復值
dup=df[df.duplicated()].count()
print(dup) # 最后兩項重復
# data1  2
# key1   2
# key2   2

# 去除重復項
nodup=df[-df.duplicated()]
print(nodup)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two

pandas 中 dataframe 重復元素個數的獲取

方法有二:

1. 在調用duplicated方法后,非重復的元素會被標記為False,而重復的元素會被標記為True

count = 0
for i in users_info['user_id'].duplicated():
  if i == True:
    count = count + 1
count

【注1】users_info為一個dataframe框,user_id為其中一列

【注2】duplicated( )方法只會把重復的元素標記為True,而不會標記被重復的元素

2.這行代碼的速度更快,drop_duplicates(['user_id'])方法為刪除user_id列中相同的元素

users_info.shape[0] - users_info.drop_duplicates(['user_id']).shape[0]

【注】shape[0] 為獲取行數

到此這篇關于pandas統計重復值次數的方法實現的文章就介紹到這了,更多相關pandas統計重復值次數內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Pandas 數據處理,數據清洗詳解
  • Pandas統計重復的列里面的值方法
  • pandas數據處理基礎之篩選指定行或者指定列的數據
  • Python Pandas數據分析工具用法實例
  • Python教程pandas數據分析去重復值

標簽:郴州 烏蘭察布 海南 合肥 哈爾濱 烏蘭察布 大慶 平頂山

巨人網絡通訊聲明:本文標題《pandas統計重復值次數的方法實現》,本文關鍵詞  pandas,統計,重復,值,次數,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《pandas統計重復值次數的方法實現》相關的同類信息!
  • 本頁收集關于pandas統計重復值次數的方法實現的相關信息資訊供網民參考!
  • 推薦文章