好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

主頁 > 知識庫 > pandas數據處理之 標簽列字符轉數字的實現

pandas數據處理之 標簽列字符轉數字的實現

熱門標簽:ai地圖標注 n400電話申請多少錢 如何在地圖標注文字 女王谷地圖標注 廈門crm外呼系統如何 地圖標注推廣單頁 長春人工智能電銷機器人官網 西藏快速地圖標注地點 百應ai電銷機器人鄭州

機器學習中,當我們在進行數據預處理的時候,對于標簽列非字符的數據,我們往往需要將其轉換成字符,因為有的算法可能不支持非數字類型來做特征。

那么怎么快捷地來著這個轉換呢,請看我的示例:

1.構建測試數據

import pandas as pd
array = ['good','bad','well','bad','good','good','well','good']

2.數據轉換下,并獲取標簽列的字典

df = pd.DataFrame(array,columns=['status'])
status_dict = df['status'].unique().tolist()

3.使用函數進行轉換

df['transfromed']=df['status'].apply(lambda x : status_dict.index(x))

這樣,就將標簽列處理好了哈

等用完之后,再轉回來

df['transfromed1']= df['transfromed'].apply(lambda x : status_dict[x])

補充:pandas factorize將字符串特征轉化為數字特征

將原始數據中的字符串特征轉化為模型可以識別的數字特征可是使用pandas自帶的factorzie方法。

原始數據的job特征值如下

都是字符串特征,無法用于訓練,當然可以單獨建立map硬編碼處理,但是pandas已經封裝好了相應的方法。

data = pd.read_csv("data/test_set.csv")
data["job"] = pd.factorize(data["job"])[0].astype(np.uint16)

以上為個人經驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。

您可能感興趣的文章:
  • pandas 對每一列數據進行標準化的方法
  • pandas數據處理進階詳解
  • Pandas 數據處理,數據清洗詳解
  • 使用pandas模塊實現數據的標準化操作

標簽:內江 拉薩 興安盟 廊坊 亳州 綿陽 黔東 渭南

巨人網絡通訊聲明:本文標題《pandas數據處理之 標簽列字符轉數字的實現》,本文關鍵詞  pandas,數據處理,之,標簽,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《pandas數據處理之 標簽列字符轉數字的實現》相關的同類信息!
  • 本頁收集關于pandas數據處理之 標簽列字符轉數字的實現的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 欧美大尺度电影是指哪些电影 | 人獸videossex丰满极品| 女s的女m女女系列| 美女扒开尿口给男人桶动态图| 欧美AV无码成h人动漫奶头| 国产成人精品一区二区三区影院| 儿媳在线| 中文字幕一区二区三区在线不卡| 9久9久女女视频精品6| 邻居(高H,双性,饥渴受)男男小说| 国产同性男男gayxxxx| 国产成人精品午夜福麻豆报告| 男男高黄| 午夜精品国产精品大乳美女| www.日韩av.com| 美女扒开尿口让男人操 | 欧美一级A片BBBBB免费视频| 国产麻豆交换夫妇| 国产2021精品视频免费播放| 男人扒开添女人下部猛添网站| 狠狠躁天天躁小说| 欧美激情视频全部| 日本边添边摸边做边爱边视频| 日产精品二线三线| 日女人逼逼| 恋综NPH一女多男| 坐公交忘穿内裤被挺进老| 在线观看免费步兵区| 夜色撩人网永久地址| 欧美AV无码高潮喷8888| 女人大荫蒂毛茸茸视频| 黑人26厘米大战亚洲女| 翼城县| 77成人影视| 美人r喷奶水了H双性受| 快穿各种被H肉怀孕1V1| 91精品91久久久| 91精品久久久久久久久久| 在线观看无码精品秘?日本| 少妇被大黑捧猛烈进视频| black强行japanesehd|