秋霞国产在线,大尺度做爰床戏呻吟免费观看 ,亚洲人成色A片7777

本文詳解如何使用pandas查看dataframe的重復數據，判斷是否重復，以及如何去重

DataFrame.duplicated(subset=None, keep='first')

subset：如果你認為幾個字段重復，則數據重復，就把那幾個字段以列表形式放到subset后面。默認是所有字段重復為重復數據。

keep:

默認為'first' ,也就是如果有重復數據，則第一條出現的定義為False，后面的重復數據為True。
如果為'last'，也就是如果有重復數據，則最后一條出現的定義為False，后面的重復數據為True。
如果為False，則所有重復的為True

下面舉例

df = pd.DataFrame({
    'brand': ['Yum Yum', 'Yum Yum', 'Indomie', 'Indomie', 'Indomie'],
    'style': ['cup', 'cup', 'cup', 'pack', 'pack'],
    'rating': [4, 4, 3.5, 15, 5]
})
df

# 默認為keep="first",第一條重復的為False,后面重復的為True
# 一般不會設置keep，保持keep為默認值。
df.duplicated()

結果
0    False
1     True
2    False
3    False
4    False
dtype: bool

# keep="last",,最后一條重復的為False,后面重復的為True
df.duplicated(keep="last")

結果
0     True
1    False
2    False
3    False
4    False
dtype: bool

# keep=False,,所有重復的為True
df.duplicated(keep=False)

結果
0     True
1     True
2    False
3    False
4    False
dtype: bool

# sub是子，subset是子集
# 標記只要brand重復為重復值。
df.duplicated(subset='brand')

結果

0    False
1     True
2    False
3     True
4     True
dtype: bool


# 只要brand重復brand和style重復的為重復值。
df.duplicated(subset=['brand','style'])

結果

0    False
1     True
2    False
3    False
4     True
dtype: bool


# 顯示重復記錄，通過布爾索引
df[df.duplicated()]

# 查詢重復值的個數。
df.duplicated().sum()

結果
1

到此這篇關于pandas中DataFrame檢測重復值的實現的文章就介紹到這了,更多相關pandas DataFrame檢測重復值內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

Pandas實現Dataframe的重排和旋轉
Pandas實現Dataframe的合并
pandas中DataFrame數據合并連接（merge、join、concat)
教你漂亮打印Pandas DataFrames和Series
使用pandas忽略行列索引,縱向拼接多個dataframe
Pandas.DataFrame轉置的實現
Pandas中DataFrame交換列順序的方法實現
詳解pandas中利用DataFrame對象的.loc[]、.iloc[]方法抽取數據
Pandas中兩個dataframe的交集和差集的示例代碼
Pandas DataFrame求差集的示例代碼
淺談pandas dataframe對除數是零的處理
Pandas中DataFrame數據刪除詳情

標簽：蘭州成都六盤水江蘇山東駐馬店常州宿遷

巨人網絡通訊聲明：本文標題《pandas中DataFrame檢測重復值的實現》，本文關鍵詞 pandas,中,DataFrame,檢測,重復,；如發現本文內容存在版權問題，煩請提供相關信息告之我們，我們將及時溝通與處理。本站內容系統采集于網絡，涉及言論、版權與本站無關。

好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

pandas中DataFrame檢測重復值的實現