好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

主頁 > 知識(shí)庫 > Pandas中時(shí)間序列的處理大全

Pandas中時(shí)間序列的處理大全

熱門標(biāo)簽:海外網(wǎng)吧地圖標(biāo)注注冊(cè) 打電話機(jī)器人營(yíng)銷 聊城語音外呼系統(tǒng) ai電銷機(jī)器人的優(yōu)勢(shì) 地圖標(biāo)注自己和別人標(biāo)注區(qū)別 騰訊地圖標(biāo)注沒法顯示 南陽打電話機(jī)器人 孝感營(yíng)銷電話機(jī)器人效果怎么樣 商家地圖標(biāo)注海報(bào)

一、時(shí)間序列數(shù)據(jù)的生成

pd.date_ranges生成時(shí)間序列

  • time格式:年月日分隔符號(hào)可以是"-","/",空格這三種格式(年月日、日月年、月日年都可以);時(shí)分秒只能用":"分隔,順序只能是時(shí)分秒。
  • start:起始時(shí)間(time)
  • end:終止時(shí)間(time)
  • periods:期數(shù)(int),使用時(shí)只能出現(xiàn)start或者end,兩者不能同時(shí)出現(xiàn)
  • freq:頻率(numY,num年;numM,num月;numD,num日),詳細(xì)參數(shù)見下表
頻率別名 描述
B 工作日頻率
C 自定義工作日頻率
D 日歷日頻率
W 每周頻率
M 每月最后一個(gè)日歷日
SM 每半個(gè)月最后一個(gè)日歷日(15日和月末)
BM 每月最后一個(gè)工作日
CBM 自定義每月最后一個(gè)工作日
MS 每月第一個(gè)日歷日
SMS 每半月第一個(gè)日歷日(第1和第15)
BMS 每月第一個(gè)工作日
CBMS 自定義每月第一個(gè)工作日
Q 每季度最后一個(gè)月的最后一個(gè)日歷日
BQ 每季度最后一個(gè)月的最后一個(gè)工作日
QS 每季度最后一個(gè)月的第一個(gè)日歷日
BQS 每季度最后一個(gè)月的第一個(gè)工作日
A, Y 每年的最后一個(gè)日歷日
BA, BY 每年的最后一個(gè)工作日
AS, YS 每年的第一個(gè)日歷日
BAS, BYS 每年的第一個(gè)工作日
BH 工作日按“時(shí)”計(jì)算頻率
H 每小時(shí)頻率
T, min 每分鐘頻率
S 每秒頻率
L, ms 毫秒頻率
U, us 微秒頻率
N 納秒頻率
import pandas as pd
import numpy as np
df = pd.DataFrame( data=np.random.randint(1,20,10),
                  index=pd.date_range(start="20/01/2021",periods=10,freq="M"),) 
print(df)

             0
2021-01-31   1
2021-02-28   6
2021-03-31  12
2021-04-30   5
2021-05-31   7
2021-06-30   4
2021-07-31   9
2021-08-31   7
2021-09-30  18
2021-10-31  10

             0
count  10.00000
mean    7.90000
std     4.72464
min     1.00000
25%     5.25000
50%     7.00000
75%     9.75000
max    18.00000

二、Pandas設(shè)置索引

創(chuàng)建時(shí)添加索引

pd.DataFrame(...,index=[],...)

df.set_index使用現(xiàn)有列設(shè)置索引

  • keys:列名,多個(gè)列用[name1,name2]
  • drop:設(shè)置升序(True)、降序(False)
  • inplace:替換原變量(True),不替換(False)
df.set_index(["X"],inplace=True)
df.set_index(["X","Y"],inplace=True)

df.reset_index可以還原索引

df.reset_index("X")

三、 時(shí)間序列數(shù)據(jù)的截取

df.truncate過濾數(shù)據(jù)

  • before:過濾之前的數(shù)據(jù)(time)
  • after:過濾之后的數(shù)據(jù)(time)
  • axis:列(columns),行(index)
df.truncate(before="2021-5",after="2021-9")

           0
2021-05-31  7
2021-06-30  4
2021-07-31  9
2021-08-31  7

df.loc索引過濾

df.loc["2021-5":]

             0
2021-05-31   7
2021-06-30   4
2021-07-31   9
2021-08-31   7
2021-09-30  18
2021-10-31  10

四、Pandas重復(fù)值處理

4.1 查詢是否有重復(fù)值

duplicated()方法判斷

# 判斷dataframe數(shù)據(jù)整行是否重復(fù)
df.duplicated()
# dataframe數(shù)據(jù)某列是否重復(fù)
df.columns_name.duplicated()
# 判斷dataframe數(shù)據(jù)多列數(shù)據(jù)是否重復(fù)(多列組合查)
df.duplicated(subset = ['n1','n2'])

groupby().count()

df.groupby('columns').count()>1

4.2 去除重復(fù)值

drop_duplicats參數(shù)說明:

  • 參數(shù)subset:用來指定特定的列,默認(rèn)所有列
  • 參數(shù)keep:first和last表示是選擇最前一項(xiàng)還是最后一項(xiàng)保留,默認(rèn)first
  • 參數(shù)inplace:是直接在原來數(shù)據(jù)上修改還是保留一個(gè)副本,默認(rèn)為False
df.drop_duplicats(subset=['name1','name2'],keep='last',inplace=True)

按照index索引去重

df.index.duplicated(keep='last')


五、Pandas缺失值處理

5.1 缺失值查詢

df.info查詢各列的信息

df.info()

# res
class 'pandas.core.frame.DataFrame'>
Int64Index: 10 entries, 19 to 14
Data columns (total 2 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   Y       10 non-null     int32
 1   Z       10 non-null     int32
dtypes: int32(2)
memory usage: 160.0 bytes

df.isnull判斷是否是空值

df.isnull().any() # 篩選出缺失值的列
df.isna().any() # 篩選出缺失值的列

df.empty判斷是否有空值

df.empty

5.2 缺失值填充

ffill 空值取前面的值

df.ffill()

bfill 空值取后面的值

df.bfill()

fillna 指定值填充

df.fillna(1)
df.fillna({'A': 0, 'B': 1, 'C': 2, 'D': 3}) # 指定列填充

interpolate 插值

  • df.interpolate(method=‘linear', axis=0, limit=None, inplace=False, limit_direction=‘forward', limit_area=None, downcast=None, **kwargs)
  • method參數(shù)解釋
    • linear:忽略索引,線性等距插值
    • time:在以天或者更高頻率的數(shù)據(jù)上插入給定的時(shí)間間隔長(zhǎng)度數(shù)據(jù)
    • index, values:使用索引的實(shí)際數(shù)值
    • pad:使用現(xiàn)有值填寫NaN
    • nearest, zero, slinear, quadratic, cubic, spline, barycentric, polynomial:傳遞給scipy.interpolate.interp1d。這些方法使用索引的數(shù)值。polynomial和spline都要求您還指定一個(gè)順序(int),例如 ,df.interpolate(method=‘polynomial', order=5)
    • krogh,piecewise_polynomial,spline,pchip,akima:包括類似名稱的SciPy插值方法。
    • from_derivatives:指 scipy.interpolate.BPoly.from_derivatives,它替換了scipy 0.18中的'piecewise_polynomial'插值方法
  • axis : {0或'index',1或'columns',None},默認(rèn)為None;沿軸進(jìn)行interpolate。
  • limit: int;要填充的連續(xù)NaN的最大數(shù)量。必須大于0
  • inplace : bool,默認(rèn)為False;如果可以,更新現(xiàn)有數(shù)據(jù)
  • limit_direction : {‘forward',‘backward',‘both'},默認(rèn)為'forward';如果指定了限制,則將沿該方向填充連續(xù)的NaN
  • limit_area : {None, ‘inside', ‘outside'}, 默認(rèn)為None;如果指定了限制,則連續(xù)的NaN將填充此限制。
  • None:無填充限制
  • inside:僅填充有效值包圍的NaN
  • outside: 僅在有效值之外填充NaN
dff.interpolate(method='polynomial',order=2)

刪除缺失值

df.dropna(how='any')

六、pandas統(tǒng)計(jì)計(jì)算方法

方法 說明
count 非NaN值的數(shù)理
describe 列計(jì)算統(tǒng)計(jì)匯總
min、max 最小值和最大值
argmin、argmax 最小值和最大值索引(int)
idxmin、idxmax 最小值和最大值索引
quantile 分位數(shù)([0,1],0.25下四分為)
sum 總和
mean 均值
median 0.5分位數(shù),中位數(shù)
mad 根據(jù)均值計(jì)算絕對(duì)離差
var 方差
std 標(biāo)準(zhǔn)差
df.describe()

七、Pandas數(shù)據(jù)重采樣

重采樣就是基于時(shí)間數(shù)據(jù)由一個(gè)頻率轉(zhuǎn)換到另一個(gè)頻率的方法,分為降采樣和升采樣。

降采樣:高頻率===>低頻率,如頻率日變?yōu)樵拢枰付ńy(tǒng)計(jì)函數(shù)如sum

df.resample("M").mean()

升采樣:低頻率===>高頻率,如頻率月變?yōu)槿眨枰M(jìn)行缺失值填充

df.resample("D").asfreq().fillna(1)

總結(jié)

到此這篇關(guān)于Pandas中時(shí)間序列處理的文章就介紹到這了,更多相關(guān)Pandas時(shí)間序列處理內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python+pandas+時(shí)間、日期以及時(shí)間序列處理方法
  • python時(shí)間日期函數(shù)與利用pandas進(jìn)行時(shí)間序列處理詳解
  • pandas基于時(shí)間序列的固定時(shí)間間隔求均值的方法
  • Pandas時(shí)間序列:時(shí)期(period)及其算術(shù)運(yùn)算詳解
  • python Pandas庫基礎(chǔ)分析之時(shí)間序列的處理詳解
  • Pandas時(shí)間序列基礎(chǔ)詳解(轉(zhuǎn)換,索引,切片)
  • python pandas 對(duì)時(shí)間序列文件處理的實(shí)例
  • Pandas時(shí)間序列重采樣(resample)方法中closed、label的作用詳解
  • Pandas時(shí)間序列:重采樣及頻率轉(zhuǎn)換方式

標(biāo)簽:牡丹江 六盤水 撫州 聊城 南寧 迪慶 楊凌 揚(yáng)州

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Pandas中時(shí)間序列的處理大全》,本文關(guān)鍵詞  Pandas,中,時(shí)間序列,的,處理,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Pandas中時(shí)間序列的處理大全》相關(guān)的同類信息!
  • 本頁收集關(guān)于Pandas中時(shí)間序列的處理大全的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    主站蜘蛛池模板: 国产在线欧美日韩精品一区二区| 一级A片在线观看免费下载| 亚洲国产成人久久午夜| 99只有精品视频2019| 日本公妇乱婬XXXX视频| 美女下面被揉出白浆视频| 白丝护士被弄得娇喘不停| 一区二区三区www污污污网站| 嗯不要了h| 爽?好紧?宝贝别夹大巴图片| 我和饥渴岳| 韩国午夜理伦三级理论电影| 热读小说破解版| 亚洲无线乱码高清在线观看一区| yy6080午夜色情理伦片在线| 国产精品美女午夜爽爽爽免费| 啊好爽用力| 老师做爰4韩片无码| 性瘾军官男泄欲猛男h| 日本骚视频| 毛片试看| 巨胸爆乳女搜查官被强制扒开衣服| 久久亚洲精华国产精华精华液| 精品爽爽爽久久久天天躁狠狠躁| 成品人app软件大全下载| 囯产伦精一区二区三区妓| 人妻少妇精品久久久久久天美传媒 | 少妇人妻一级A毛片无码监狱| a级销魂美女视频在线播放| 丰满岳乱妇bd在线观看| 漂亮的保姆三| 北岛玲在线精品一区二区三区| 岳?好舒服?快?免老女人| 午夜性电影| 放荡警察巨r麻麻出轨小说| 十分钟视频免费观看在线www| 99国产精品一区二区女便器调教| 少妇高潮惨叫久久久久久| 国产高清不卡一区二区三区| japanhd69xxxxh| 三上悠亚健身房无码播放|