好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

主頁 > 知識庫 > 利用shell命令統計日志的方法詳解

利用shell命令統計日志的方法詳解

熱門標簽:申請400電話有什么用 宿松高德地圖標注 網絡電話外呼系統撥號軟件 400電話申請找 貴陽400電話到哪里去辦理 4層電梯外呼控制系統設計 天津智能外呼系統排名 汨羅代理外呼系統 電銷機器人加盟多少錢

前言

大家都知道,通過使用 shell 命令可以很方便地對日志進行統計和分析,當服務有異常的時候,需要去排查日志,那么掌握一種統計日志的技巧就是必不可少的了。

假設有一個包含下面內容的日志文件 access.log。我們以統計這個文件的日志為例。

date=2017-09-23 13:32:50 | ip=40.80.31.153 | method=GET | url=/api/foo/bar?params=something | status=200 | time=9.703 | bytes=129 | referrer="-" | user-agent="Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.63 Safari/535.7" | cookie="-"
date=2017-09-23 00:00:00 | ip=100.109.222.3 | method=HEAD | url=/api/foo/healthcheck | status=200 | time=0.337 | bytes=10 | referrer="-" | user-agent="-" | cookie="-"
date=2017-09-23 13:32:50 | ip=40.80.31.153 | method=GET | url=/api/foo/bar?params=anything | status=200 | time=8.829 | bytes=466 | referrer="-" | user-agent="GuzzleHttp/6.2.0 curl/7.19.7 PHP/7.0.15" | cookie="-"
date=2017-09-23 13:32:50 | ip=40.80.31.153 | method=GET | url=/api/foo/bar?params=everything | status=200 | time=9.962 | bytes=129 | referrer="-" | user-agent="Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.63 Safari/535.7" | cookie="-"
date=2017-09-23 13:32:50 | ip=40.80.31.153 | method=GET | url=/api/foo/bar?params=nothing | status=200 | time=11.822 | bytes=121 | referrer="-" | user-agent="Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.63 Safari/535.7" | cookie="-"

不同的服務對應的日志可能不一樣,本文使用示例日志的格式是:

date | ip | method | url | status | time | bytes | referrer | user-agent | cookie

注意:mac 系統和 linux 系統中的命令行為可能不同,以下命令請在 linux 系統中使用

排除特殊日志

統計日志時,我們可能不關心 HEAD 請求,或者只關心 GET 請求,這里首先需要篩選日志,可以使用 grep 命令。-v 的含義是排除匹配的文本行。

grep GET access.log # 只統計 GET 請求
grep -v HEAD access.log # 不統計 HEAD 請求
grep -v 'HEAD\|POST' access.log # 不統計 HEAD 和 POST 請求

查看接口耗時情況

我們可以將每行的 time 匹配出來,然后做一個排序。使用 awk 的 match 方法可以匹配正則:

awk '{ match($0, /time=([0-9]+\.[0-9]+)/, result); print result[1]}' access.log

awk 命令使用方法如下:

awk '{pattern + action}' {filenames}

我們實際上只用到了 action:match($0, /time=([0-9]+\.[0-9]+)/, result); print result[1] 這一段。

match 方法接收三個參數:需要匹配的文本、正則表達式、結果數組。$0 代表 awk 命令處理的每一行,結果數組是可選的,因為我們要拿到匹配結果所以這里傳入了一個 result 數組,用來存儲匹配后的結果。

注意這里的正則我沒有使用 \d 來表示數字,因為 awk 指令默認使用 “EREs",不支持 \d 的表示,具體請看 linux shell 正則表達式(BREs,EREs,PREs)差異比較。

result 數組實際上和 javascript 里的結果數組很像了,所以我們打印出第二個元素,即匹配到的內容。執行完這行命令后結果如下:

9.703
0.337
8.829
9.962
11.822

當然實際上一天的日志可能是成千上萬條,我們需要對日志進行排序,且只展示前 3 條。這里使用到 sort 命令。

sort 命令默認從小到大排序,且當作字符串排序。所以默認情況下使用 sort 命令之后 "11" 會排在 "8" 前面。那么需要使用 -n 指定按數字排序,-r 來按從大到小排序,然后我們查看前 3 條:

awk '{ match($0, /time=([0-9]+\.[0-9]+)/, result); print result[1]}' access.log | sort -rn | head -3

結果:

11.822
9.962
9.703

查看耗時最高的接口

當然我們一般不會只查看接口耗時情況,還需要把具體日志也打印出來,上面的命令就不能滿足要求了。

awk 的打印默認是按空格分隔的,意思是 2017-09-23 GET 這一行如果使用 awk '{print $1}' 會打印出 "2017-09-23",類似地,$2 會打印出 GET。

根據日志特征,我們可以使用 | 來作為分隔符,這樣就能打印出各個我們感興趣的值了。因為我們想找出耗時最高的接口,那么我們把 time、date 和 url 單獨找出來。

awk 的 -F 參數用來自定義分隔符。然后我們可以數一下三個部分按 | 分隔后分別是第幾個:time 是第 6 個、date 是第 1 個、url 是第 4 個。

awk -F '|' '{print $6 $1 $4}' access.log

這樣打出來結果為:

 time=9.703 date=2017-09-23 13:32:50 url=/api/foo/bar?params=something
 time=0.337 date=2017-09-23 00:00:00 url=/api/foo/healthcheck
 time=8.829 date=2017-09-23 13:32:50 url=/api/foo/bar?params=anything
 time=9.962 date=2017-09-23 13:32:50 url=/api/foo/bar?params=everything
 time=11.822 date=2017-09-23 13:32:50 url=/api/foo/bar?params=nothing

因為我們想按 time 來排序,而 sort 可以按列來排序,而列是按空格分隔的,我們目前第一列是 time=xxx,是不能排序的,所以這里要想辦法把 time= 給去掉,因為我們很雞賊地把耗時放在了第一列,那么其實再通過 time= 進行分隔一下就行了。

awk -F '|' '{print $6 $1 $4}' access.log | awk -F 'time=' '{print $2}'

結果:

9.703 date=2017-09-23 13:32:50 url=/api/foo/bar?params=something
0.337 date=2017-09-23 00:00:00 url=/api/foo/healthcheck
8.829 date=2017-09-23 13:32:50 url=/api/foo/bar?params=anything
9.962 date=2017-09-23 13:32:50 url=/api/foo/bar?params=everything
11.822 date=2017-09-23 13:32:50 url=/api/foo/bar?params=nothing

使用 sort 的 -k 參數可以指定要排序的列,這里是第 1 列;再結合上面的排序,就能把耗時最高的日志打印出來了:

awk -F '|' '{print $6 $1 $4}' access.log | awk -F 'time=' '{print $2}' | sort -k1nr | head -3

結果:

11.822 date=2017-09-23 13:32:50 url=/api/foo/bar?params=nothing
9.962 date=2017-09-23 13:32:50 url=/api/foo/bar?params=everything
9.703 date=2017-09-23 13:32:50 url=/api/foo/bar?params=something

統計請求次數最多的接口

如果需要統計哪些接口每天請求量是最多的,只需要新引入 uniq 命令。

我們已經可以通過 grep -v HEAD access.log | awk -F '|' '{print $4}' 來篩選出所有的 url,uniq 命令可以刪除 相鄰 的相同的行,而 -c 可以輸出每行出現的次數。

所以我們先把 url 排序以讓相同的 url 放在一起,然后使用 uniq -c 來統計出現的次數:

grep -v HEAD access.log | awk -F '|' '{print $4}' | sort | uniq -c

因為示例日志數量太少,我們假設日志里有多條,那么結果應該類似下面:

1 url=/api/foo/bar?params=anything
19 url=/api/foo/bar?params=everything
4 url=/api/foo/bar?params=nothing
5 url=/api/foo/bar?params=something

接下來再 sort 即可:

grep -v HEAD access.log | awk -F '|' '{print $4}' | sort | uniq -c | sort -k1nr | head -10

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作能帶來一定的幫助,如果有疑問大家可以留言交流,謝謝大家對腳本之家的支持。

您可能感興趣的文章:
  • shell腳本實現的網站日志分析統計(可以統計9種數據)
  • 使用shell腳本分析網站日志統計PV、404、500等數據

標簽:贛州 烏蘭察布 昌都 撫州 臨沂 海北 廣東 連云港

巨人網絡通訊聲明:本文標題《利用shell命令統計日志的方法詳解》,本文關鍵詞  利用,shell,命令,統計,日志,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《利用shell命令統計日志的方法詳解》相關的同類信息!
  • 本頁收集關于利用shell命令統計日志的方法詳解的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 国产东北妇女野战视频| 日本理伦片公的浮中文字幕| 欧美 亚洲 武侠 另类 动漫| 深夜他撕开我的奶罩| 中文字幕人妻丝袜乱一区二区三区| 主奴口舌vk| 办公室揉着她两个硕大的乳球 | 精品伊人久久大香线蕉| foot交| 看逼逼| 国产无套露脸| 丰满熟女乱婬A片毛片| 亚洲欧美日韩一区成人| chinese国产gay一| 成年人网站免费在线观看| 好吊色视频7777gao·com| 免费区欧美一级毛片私人教师| 日日夜夜嗷嗷叫| 百合全黄h全肉细节文| 性生活在线看| 美女网站黄免费| 国产免费久久精品44| 日本人间尤物石原里美| 成年在线观看免费人视频草莓| 乱h伦亲女欧阳兰| 91在线无码精品秘?国产苹果| 欧美一级婬片A片免费软件| 粉嫩的美女视频在线观看| 好男人影视社区www在线观看| 国产片一级| 美女脱精光隐私扒开无遮挡| 亚洲品质自拍视频| 成人免费**| 久久国产高清| 一边吃奶一边进去好爽感觉| 国产学生无套内精在线观看| 古代宫廷一级毛片免费看| 嗯啊别在秋千高h弄潮| 国产丝袜一区二区三区在线观看| 99在线视频| 亚洲午夜精品久久久久久久久|