好大用力深一点女同,霸道总裁肉文

主頁 > 知識庫 > 利用shell命令統計日志的方法詳解

利用shell命令統計日志的方法詳解

前言

大家都知道，通過使用 shell 命令可以很方便地對日志進行統計和分析，當服務有異常的時候，需要去排查日志，那么掌握一種統計日志的技巧就是必不可少的了。

假設有一個包含下面內容的日志文件 access.log。我們以統計這個文件的日志為例。

date=2017-09-23 13:32:50 | ip=40.80.31.153 | method=GET | url=/api/foo/bar?params=something | status=200 | time=9.703 | bytes=129 | referrer="-" | user-agent="Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.63 Safari/535.7" | cookie="-"
date=2017-09-23 00:00:00 | ip=100.109.222.3 | method=HEAD | url=/api/foo/healthcheck | status=200 | time=0.337 | bytes=10 | referrer="-" | user-agent="-" | cookie="-"
date=2017-09-23 13:32:50 | ip=40.80.31.153 | method=GET | url=/api/foo/bar?params=anything | status=200 | time=8.829 | bytes=466 | referrer="-" | user-agent="GuzzleHttp/6.2.0 curl/7.19.7 PHP/7.0.15" | cookie="-"
date=2017-09-23 13:32:50 | ip=40.80.31.153 | method=GET | url=/api/foo/bar?params=everything | status=200 | time=9.962 | bytes=129 | referrer="-" | user-agent="Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.63 Safari/535.7" | cookie="-"
date=2017-09-23 13:32:50 | ip=40.80.31.153 | method=GET | url=/api/foo/bar?params=nothing | status=200 | time=11.822 | bytes=121 | referrer="-" | user-agent="Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.63 Safari/535.7" | cookie="-"

不同的服務對應的日志可能不一樣，本文使用示例日志的格式是：

date | ip | method | url | status | time | bytes | referrer | user-agent | cookie

注意：mac 系統和 linux 系統中的命令行為可能不同，以下命令請在 linux 系統中使用

排除特殊日志

統計日志時，我們可能不關心 HEAD 請求，或者只關心 GET 請求，這里首先需要篩選日志，可以使用 grep 命令。-v 的含義是排除匹配的文本行。

grep GET access.log # 只統計 GET 請求
grep -v HEAD access.log # 不統計 HEAD 請求
grep -v 'HEAD\|POST' access.log # 不統計 HEAD 和 POST 請求

查看接口耗時情況

我們可以將每行的 time 匹配出來，然后做一個排序。使用 awk 的 match 方法可以匹配正則：

awk '{ match($0, /time=([0-9]+\.[0-9]+)/, result); print result[1]}' access.log

awk 命令使用方法如下：

awk '{pattern + action}' {filenames}

我們實際上只用到了 action：match($0, /time=([0-9]+\.[0-9]+)/, result); print result[1] 這一段。

match 方法接收三個參數：需要匹配的文本、正則表達式、結果數組。$0 代表 awk 命令處理的每一行，結果數組是可選的，因為我們要拿到匹配結果所以這里傳入了一個 result 數組，用來存儲匹配后的結果。

注意這里的正則我沒有使用 \d 來表示數字，因為 awk 指令默認使用 “EREs"，不支持 \d 的表示，具體請看 linux shell 正則表達式(BREs,EREs,PREs)差異比較。

result 數組實際上和 javascript 里的結果數組很像了，所以我們打印出第二個元素，即匹配到的內容。執行完這行命令后結果如下：

當然實際上一天的日志可能是成千上萬條，我們需要對日志進行排序，且只展示前 3 條。這里使用到 sort 命令。

sort 命令默認從小到大排序，且當作字符串排序。所以默認情況下使用 sort 命令之后 "11" 會排在 "8" 前面。那么需要使用 -n 指定按數字排序，-r 來按從大到小排序，然后我們查看前 3 條：

awk '{ match($0, /time=([0-9]+\.[0-9]+)/, result); print result[1]}' access.log | sort -rn | head -3

結果：

11.822
9.962
9.703

查看耗時最高的接口

當然我們一般不會只查看接口耗時情況，還需要把具體日志也打印出來，上面的命令就不能滿足要求了。

awk 的打印默認是按空格分隔的，意思是 2017-09-23 GET 這一行如果使用 awk '{print $1}' 會打印出 "2017-09-23"，類似地，$2 會打印出 GET。

根據日志特征，我們可以使用 | 來作為分隔符，這樣就能打印出各個我們感興趣的值了。因為我們想找出耗時最高的接口，那么我們把 time、date 和 url 單獨找出來。

awk 的 -F 參數用來自定義分隔符。然后我們可以數一下三個部分按 | 分隔后分別是第幾個：time 是第 6 個、date 是第 1 個、url 是第 4 個。

awk -F '|' '{print $6 $1 $4}' access.log

這樣打出來結果為：

 time=9.703 date=2017-09-23 13:32:50 url=/api/foo/bar?params=something
 time=0.337 date=2017-09-23 00:00:00 url=/api/foo/healthcheck
 time=8.829 date=2017-09-23 13:32:50 url=/api/foo/bar?params=anything
 time=9.962 date=2017-09-23 13:32:50 url=/api/foo/bar?params=everything
 time=11.822 date=2017-09-23 13:32:50 url=/api/foo/bar?params=nothing

因為我們想按 time 來排序，而 sort 可以按列來排序，而列是按空格分隔的，我們目前第一列是 time=xxx，是不能排序的，所以這里要想辦法把 time= 給去掉，因為我們很雞賊地把耗時放在了第一列，那么其實再通過 time= 進行分隔一下就行了。

awk -F '|' '{print $6 $1 $4}' access.log | awk -F 'time=' '{print $2}'

結果：

9.703 date=2017-09-23 13:32:50 url=/api/foo/bar?params=something
0.337 date=2017-09-23 00:00:00 url=/api/foo/healthcheck
8.829 date=2017-09-23 13:32:50 url=/api/foo/bar?params=anything
9.962 date=2017-09-23 13:32:50 url=/api/foo/bar?params=everything
11.822 date=2017-09-23 13:32:50 url=/api/foo/bar?params=nothing

使用 sort 的 -k 參數可以指定要排序的列，這里是第 1 列；再結合上面的排序，就能把耗時最高的日志打印出來了：

awk -F '|' '{print $6 $1 $4}' access.log | awk -F 'time=' '{print $2}' | sort -k1nr | head -3

結果：

11.822 date=2017-09-23 13:32:50 url=/api/foo/bar?params=nothing
9.962 date=2017-09-23 13:32:50 url=/api/foo/bar?params=everything
9.703 date=2017-09-23 13:32:50 url=/api/foo/bar?params=something

統計請求次數最多的接口

如果需要統計哪些接口每天請求量是最多的，只需要新引入 uniq 命令。

我們已經可以通過 grep -v HEAD access.log | awk -F '|' '{print $4}' 來篩選出所有的 url，uniq 命令可以刪除相鄰的相同的行，而 -c 可以輸出每行出現的次數。

所以我們先把 url 排序以讓相同的 url 放在一起，然后使用 uniq -c 來統計出現的次數：

grep -v HEAD access.log | awk -F '|' '{print $4}' | sort | uniq -c

因為示例日志數量太少，我們假設日志里有多條，那么結果應該類似下面：

1 url=/api/foo/bar?params=anything
19 url=/api/foo/bar?params=everything
4 url=/api/foo/bar?params=nothing
5 url=/api/foo/bar?params=something

接下來再 sort 即可：

grep -v HEAD access.log | awk -F '|' '{print $4}' | sort | uniq -c | sort -k1nr | head -10

總結

以上就是這篇文章的全部內容了，希望本文的內容對大家的學習或者工作能帶來一定的幫助，如果有疑問大家可以留言交流，謝謝大家對腳本之家的支持。

您可能感興趣的文章:

shell腳本實現的網站日志分析統計（可以統計9種數據）
使用shell腳本分析網站日志統計PV、404、500等數據

標簽：贛州烏蘭察布昌都撫州臨沂海北廣東連云港

巨人網絡通訊聲明：本文標題《利用shell命令統計日志的方法詳解》，本文關鍵詞利用,shell,命令,統計,日志,；如發現本文內容存在版權問題，煩請提供相關信息告之我們，我們將及時溝通與處理。本站內容系統采集于網絡，涉及言論、版權與本站無關。

下面列出與本文章《利用shell命令統計日志的方法詳解》相關的同類信息！

利用shell命令統計日志的方法詳解

前言大家都知道，通過使用 shell 命令可以很方便地對日志進行統計和分析，當服務有異常的時候，需要去排查日志，那么掌握一種統計日志的技巧就是必不可少的了。假設有一個包含...

10-18

附近客電銷機器人哪里買（電銷機器人線路商）

本篇文章給大家談談附近客電銷機器人哪里買，以及電銷機器人線路商對應的知識點，希望對各位有所幫助，不要忘了收藏本...

05-16

電銷辦信用卡效果怎么樣（電話營銷辦信用卡能相信嗎?）

今天給各位分享電銷辦信用卡效果怎么樣的知識，其中也會對電話營銷辦信用卡能相信嗎?進行解釋，如果能碰巧解決你現在...

08-28

抖音代運營在寧德市一個月大概多少錢

自從抖音推出電商功用之后，越來越多商家是入駐到抖音開店。對于新賬號來說，養號是少不了的一個過程;但不少抖音商家...

03-01

長沙呼叫電銷系統代理（電銷呼叫中心系統）

本篇文章給大家談談長沙呼叫電銷系統代理，以及電銷呼叫中心系統對應的知識點，希望對各位有所幫助，不要忘了收藏本站...

08-28

荊州外呼企業管理系統（荊州市外國語學校）

今日給各位共享荊州外呼企業辦理體系的常識，其間也會對荊州市外國語校園進行解說，假如能可巧處理你現在面對的問題，...

05-18

品牌商標擴張的概念

關于商標擴張（Brandstretching）的概念，學術界有不同的定義標準。我們綜合比較國內外各家之言，選擇了較為廣義的商標擴張...

10-23

linux硬盤檢測健康狀態

定期檢查硬盤的健康狀態是每個系統管理員必須要做的事情。說到硬盤的健康狀態，這里就得先說一下S.M.A.R.T.了。 SMART是一...

10-20

江西人工智能外呼管理系統（江西人工智能外呼管理系統官網）

今日給各位共享江西人工智能外呼辦理體系的常識，其間也會對江西人工智能外呼辦理體系官網進行解說，假如能可巧處理你...

11-07

石家莊實惠的電銷卡套餐（石家莊實惠的電銷卡套餐有哪些）

本文目錄一覽：1、電銷卡在哪里辦理多少錢2、做電話營銷,用什么電話卡最便宜啊,請大家支個招!急,急,急!3、電話銷售用什么...

07-10

湖州電信電銷系統辦理價格,群呼線路-請看!

湖州電信電銷系統辦理價格,群呼線路營銷方式：電銷機器人不僅擁有高效客戶的資料整理，外呼系統提高意向客戶轉化率，...

12-17

包含長春語音外呼系統公司的詞條

本篇文章給大家談談長春語音外呼系統公司，以及對應的知識點，希望對各位有所幫助，不要忘了收藏本站喔。本文目錄一...

05-16

直播武漢百度地圖標注實時路況助力市民安全出行

1473 7月6日凌晨武漢再次遭遇了100毫米以上的強暴雨，百度地圖標注針對武漢暴雨緊急上線實時直播，提醒市民注意積水地段...

04-14

白名單電銷卡不封號-電銷卡哪里買

科技有限公司主營電銷卡、不封號電話卡、不封卡電話卡、防封外呼系統、電銷專用卡、電銷軟件、高頻防封電銷座機，國代...

02-04

外呼系統是怎么樣的的簡單介紹

本文目次一覽： 1、外呼零碎是什么必修 2、德律風外呼零碎是什么意思什么是德律風外呼零碎 3、什么是外呼零碎？ 4、外呼...

11-25

山西電銷機器人好用嗎知乎（機器人電銷怎么樣）

本文目次一覽： 1、德律風呆板人作用好欠好？ 2、電銷呆板人有效嗎？ 3、有誰用過電銷呆板人？作用怎樣樣？德律風呆板...

11-25

珠海電銷外呼系統有效果嗎（電話外呼營銷系統合法嗎）

本篇文章給大家談談珠海電銷外呼系統有效果嗎，以及電話外呼營銷系統合法嗎對應的知識點，希望對各位有所幫助，不要忘...

05-16

天津教育電話軟件辦理多少錢,電話線路公司-總算知道

天津教育電話軟件辦理多少錢,電話線路公司電銷系統機器人的使用也不只局限于電銷行業，各行各業都可以使用電話機器人...

12-17

400電話加盟項目好做嗎？

如果你生活中留心的話，會在很多廣告中、企業介紹、廣播電視中了解到400電話，這些電話一般都會用在企業的聯系方式，客...

01-13

外呼系統怎么修改系統電話（電話外呼系統怎么安裝）

本篇文章給大家談談外呼系統怎么修改系統電話，以及電話外呼系統怎么安裝對應的知識點，希望對各位有所幫助，不要忘了...

05-05

智能電話機器人的功能（打電話的智能機器人）

本篇文章給大家談談智能電話機器人的功能，以及打電話的智能機器人對應的知識點，希望對各位有所幫助，不要忘了收藏本...

03-11

工行上海分行“四合一”客戶服務系統

前言 “四合一”客戶服務系統是目前國內較先進的一套綜合企業銀行服務系統，該系統產生于 1996 年 7 月，由中國光大電腦...

10-22

深圳電銷卡不封卡為什么會封號

深圳電銷卡不封卡為什么會封號使用方便，電銷卡不封號使用方便是主要的，辦理電銷卡在我們日常生活中其實很簡單，比...

12-16

聯通加速布局物聯網建設

在如此大規模的市場“蛋糕”上，中國聯通也在加速布局物聯網產業。在近日召開的“中國聯通物聯網生態大會”上，來自物...

10-13

海爾客戶服務系統

今年10月，海爾集團建成了自己的全國廣域網，用于收集海爾在全國各地的電話中心及售后服務中心的客戶信息，特別是建起...

10-22

湛江市好用防封電話卡便宜

2020年中國通信網絡運維服務高級研討會在京召開。本次大會由中國通信企業協會通信網絡運營專業委員會主辦，以“5G智慧物...

04-01

增強Linux和Unix服務器安全性的方法詳解

網絡安全是一個十分主要的課題，而服務器是網絡安全中最主要的環節。Linux被以為是一個比擬安全的Internet服務器，作為一...

10-16

商標固有顯著性與獲得顯著性

承接：商標顯著性案例最高人民法院提出“應從相關公眾的通常認識,從整體上對商標是否具有顯著特征進行判斷”,但未說明...

10-23

亳州市電話機器人培訓中心（亳州市電話機器人培訓中心招聘）

本文目錄一覽：1、想學工業機器人,有沒有靠譜一些的機構啊?2、沒有用的比較好的電話機器人啊?求介紹!現在的招電銷員太難...

06-19

日本強震震撼中國的服務外包產業

CTI論壇(ctiforum)4月18日消息（編譯/劉煜）根據一項最新的國際數據公司（以下簡稱IDC）調查研究顯示，日本的這次災難性事件...

10-19

400業務辦理400電話服務商哪個好

選擇400電話申請是因為有很多具體的增值服務。通常，您還可以看到在理解過程中需要選擇哪些項目，或者在使用過程中需...

01-12

最全50個Mysql數據庫查詢練習題

此數據庫查詢語句是網絡上50個數據庫查詢練習題目，網上有些版本是oracle語句寫的，大多數公司還是用免費的mysql數據庫，...

10-18

包含保定不記名電銷卡的詞條

今天給各位分享保定不記名電銷卡的知識，其中也會對進行解釋，如果能碰巧解決你現在面臨的問題，別忘了關注本站，現在...

08-28

做電話營銷如果碰到障礙怎么辦？

當業務員遇到的客戶是具有一定身份和級別的人時，那么就很有可能遇到一種情況，對方的電話號碼根本無法接通到對方本人...

12-04

巴黎求救電話年呼210萬次 96%屬誤打 --消防隊除報警「污染」12小時過濾假呼

法國消防、緊急救助電話號碼是「18」和「112」。巴黎消防大隊6月25日召開了記者招待會，根據2013年的接線統計記錄，一年里...

10-19

西安的外呼系統（陜西外呼公司）

本篇文章給咱們談談西安的外呼體系，以及陜西外呼公司對應的知識點，期望對各位有所協助，不要忘了保藏本站喔。本文...

11-07

新媒體電銷機器人好用嗎（電銷機器人為什么不受歡迎）

本文目錄一覽： 1、電銷機器人有用嗎？2、電話機器人好用嗎，有什么優勢？3、請問電銷機器人真的好用嗎？用過的來4、電...

11-27

話機世界電銷卡專賣

話機世界電銷卡辦理，找恒升通訊，主頁有恒升通訊聯系方式，話機世界電銷卡白名單電話卡防封電銷卡高頻穩定高頻不...

12-11

400電話續費每年多錢400電話要收多少費

(400電話400電話代理續費每年多錢)(400電話要收多少費)以下內容由巨人小編整理發布。 400電話預存話費：400電話預存費用的是...

01-12

福州財稅外呼系統哪家好,電話營銷系統批發-淺析

福州財稅外呼系統哪家好,電話營銷系統批發我知道有一語培訓公司，前面大概花一千萬做推廣，抓了一批新客戶注冊數據，...

12-16

南京市外呼系統的簡單介紹

今天給各位分享南京市外呼系統的知識，其中也會對進行解釋，如果能碰巧解決你現在面臨的問題，別忘了關注本站，現在開...

05-16

智能語音平臺質檢系統好用嗎?

語音識別、語音合成、聲紋識別技術，可以將一個人的聲音轉化為另一個人的聲音，將其變成另一個人。而智能語音平臺作為...

07-13

常州知識產權電銷軟件費用,呼叫中心軟件辦理多少錢-意味深長

常州知識產權電銷軟件費用,呼叫中心軟件辦理多少錢就可能多成交幾單。人工打電話還是用系統，資源都是一樣的。不過，...

12-16

中國移動撥打400電話收費嗎400電話申請中怎樣選擇號碼？怎樣選擇代理商？

中國移動400電話，包括4001.4007兩個特別是4001段，屬于起步不久的階段，新號源.大量好號碼可選，想辦理400手機的企業抓住機...

01-12

什么是ai電話機器人（ai電話語音機器人）

本篇文章給大家談談什么是ai電話機器人，以及ai電話語音機器人對應的知識點，希望對各位有所幫助，不要忘了收藏本站喔...

11-06

perl數組的多數字下標示例代碼

perl數組中正常的下標運算，想必大家都比較熟悉，這里不作說明。本文想說的是perl數組下標的多數字取值，可以極大的方便...

10-18

金華防封號系統

金華防封號系統 , 辦理金華防封號系統 ,金華防封號系統如何辦理國代卡商：星美樂語北緯分享華翔長城企信藍貓等...

11-15

西安不標記呼叫中心系統案例-服務至上

西安不標記呼叫中心系統案例電話業務人員以及企業能利用撥號的時間設置自己的上班時間，確保在合適的時間段跟目標的客...

01-15

南京金融電銷行業用什么電話銷售卡

南京金融電銷行業用什么電話銷售卡，找華恒通訊，讓您電銷業績翻倍！南京金融電銷防封穩定高頻通話穩定不封卡目前...

11-14

數控機床機器人優勢匯總

山東康道智能資訊：數控機床機器人優勢匯總。山東康道智能12年專注數控車床機器人,數控機床機器人等產品;種類齊全,品質...

10-24

怎么報裝400電話企業安裝400電話的優勢很多

400電話是由10位數字組成的全國統一接入號。在企業宣傳過程中，400電話無形中提升了公司的專業形象和強大的售后體系。...

01-12

利用shell命令統計日志的方法詳解

10-18

本頁收集關于利用shell命令統計日志的方法詳解的相關信息資訊供網民參考！

推薦文章

上一篇：Linux中的特殊符號與正則表達式

下一篇：Linux中的Syslog命令

一起分享吧

好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

利用shell命令統計日志的方法詳解