好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

主頁 > 知識庫 > Shell日志分析常用命令和例子

Shell日志分析常用命令和例子

熱門標簽:杭州機器人外呼系統 佛山高德地圖標注中心 旅游地圖標注大全 百度地圖標注圖標更換 東莞電銷機器人價格一覽表 地圖標注超出范圍怎么辦 陜西電銷卡外呼系統怎么安裝 百度地圖的地圖標注 excel地址地圖標注

學會用shell分析日志只要一上午!!!

很多地方分享了日志分析的shell腳本,但是基本沒說每個命令符的具體含義,學習成本還是很高,在這里總結下,方便大家快速入門。

1、在Windows下的用戶要使用shell命令符的話請先安裝cygwin,安裝方法自行Google(搜技術問題請使用google,百度搜不到活該)

2、下面粗略介紹下SEO日志分析常用的命令符用法,需要詳細了解每個命令符請使用Google。

less 文件名 查看文件內容 按“q” 退出

cat 文件名 打開文件,可以多次打開幾個文件 | cat 1.log 2.log |cat *.cat
grep -參數 文件名
-i 不區分大小寫
-v 顯示不符合條件的所有行
-c 顯示符合條件的所有行數(符合條件的數量)

egrep 屬于grep的升級版,在正則這一塊的支持更完善,使用正則的時候建議使用egrep

head -2 文件名 顯示2行
head -100 文件名 | tail -10 >>a.log 提取文件第91-100行數據

wc -參數 文件名 統計文本大小,字符多少,行數
-c 統計文本字節數
-m 統計文本字符數
-l 統計文本有多少行

sort – 參數 文件名 對文件進行排序
-n 對文件按照數字排序
-r 反向排序

uniq -參數 文件名 對文件去重,去重前需要使用排序

sort
-c 顯示數據重復的次數

split -參數 文件名 對文件進行切割
-100 (每100行切割成一個文件)
-C 25m/b/k (每25兆/字節/K 分割成一個文件)

| 管道,把上一條命令的結果傳輸給下一條命令

“>” 和“>> ” 重定向寫入文件中 “>”相當于“w”清空并寫入 “>>”相當于“a” 追加進文件

 awk -F ‘分割符'  Pattern {action} 文件名 使用指定的字符對每一行數據進行分段,默認是空格(網站日志就是空格分開)
-F后面跟的是分隔符
pattern 就是action執行的條件,這里可以使用正則表達式
$n 即時第幾段數據 $0表示整行數據
NF表示當前記錄的字段數
$NF 表示最后一個字段
BEGIN和END,這兩者都可用于pattern中,提供BEGIN和END的作用是給程序賦予初始狀態和在程序結束之后執行一些掃尾的工作

bash shell.sh 運行shell.sh腳本

dos2unix xxoo.sh 將“\r\n”轉換成“\n” Windows——>linux (由于Windows和Linux下的換行符不同,所以我們在Windows下面下的代碼需要使用dos2unix 轉換成Linux下的換行符,否則運行shell腳本會報錯)

unix2dos xxoo.sh 將“\n”轉換成“\r\n” linux——>Windows
rm xx.txt 刪除xx.txt文件

3、一些簡單的命令符介紹到這里,需要了解shell,建議大家查看相關的書籍.

下面我們開始使用shell分析日志

1、切割百度的抓取數據(將文件切割出來對專門的爬蟲數據進行處理能提高效率)

復制代碼 代碼如下:

cat log.log |grep -i ‘baiduspider' >baidu.log

2、網站狀態碼個數查詢 
復制代碼 代碼如下:

awk ‘{print $9}' baidu.log|sort|uniq -c|sort -nr

3、百度總抓取量
復制代碼 代碼如下:

wc -l baidu.log

4、百度不重復抓取量 
復制代碼 代碼如下:

awk ‘{print $7}' baidu.log|sort|uniq|wc -l

5、百度平均每次抓取的數據大小(結果是KB)
復制代碼 代碼如下:

awk ‘{print $10}' baidu.log|awk ‘BEGIN{a=0}{a+=$1}END{ print a/NR/1024}'

6、首頁抓取量
復制代碼 代碼如下:

awk ‘$7~/\.com\/$/' baidu.log|wc -l

7、某目錄抓取量
復制代碼 代碼如下:

grep ‘/news/' baidu.log|wc -l

8、抓取最多的10個頁面
復制代碼 代碼如下:

awk ‘{print $7}' baidu.log|sort|uniq -c|sort -nr|head -10

9、找出抓取的404錯誤頁面
復制代碼 代碼如下:

awk ‘$9~ /^404$/ {print $7}' baidu.log|sort|uniq|sort -nr

10、找出抓取了多少js文件和文件抓取的次數
復制代碼 代碼如下:

awk ‘$7~ /.js$/ {print $7}' baidu.log|sort|uniq -c |sort -nr

您可能感興趣的文章:
  • hbase shell基礎和常用命令詳解
  • linux shell命令行選項與參數用法詳解
  • Shell腳本中實現切換用戶并執行命令操作
  • linux shell腳本學習xargs命令使用詳解
  • 在Shell命令行處理JSON數據的方法
  • 25個好用的Shell腳本常用命令分享
  • Shell 命令執行順序分析[圖]
  • Shell腳本test命令使用總結和實例
  • 用shell命令讀取與輸出數據的代碼
  • 提高你工作效率的shell命令總結大全

標簽:雅安 青島 西藏 南充 朝陽 通遼 延邊 隨州

巨人網絡通訊聲明:本文標題《Shell日志分析常用命令和例子》,本文關鍵詞  Shell,日志,分析,常用,命令,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Shell日志分析常用命令和例子》相關的同類信息!
  • 本頁收集關于Shell日志分析常用命令和例子的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 免费一级黄色录像影片| av里面女的一直飚奶水| 99re6在线视频| 一级一级一片免费| 在线观看黄网站免费继续| 男人把女人皮曰舒服视频 | 又大又粗性av无码天堂免费| 午夜精品一区二区三区免费视频| 波多野结衣系列073| 黄色片视频在线观看| 美国久久久久精品免费A片喷水| 人善交ⅹzzzzz另类| 看黄网站入口| www男人天堂| 人妻秘书汗接吻中文社长第3季| 免费无码国产精品一区二区| 亚洲欧美在线不卡| 丝袜榨精全肉h老师文| 夜夜躁天天躁时时躁| 日本一级特黄大片a木的应用 | 很黄很肉的军人小说| 姐姐的秘密教学动漫| 久久影片| 国产精品午夜福利视频| 玖玖资源365每日稳定一区| 美国禁忌5| 国产欧美精品专区一区二区| 69人妻偷拍??熟女丝| 成人免费毛片???.金瓶.中国| 欧美性猛交xxxx免费| 习水县| 汤姆地域网名2022入口| 输了就玩对方隐私的游戏| 欧美激情精品久久久久久变态| 男女忍不住爽极了动态| 永久在线观看免费视频| 被黑人巨大进入经历| 巜趁夫不在给给公HD播放| 19videosex性欧美69| 欧美影视一区二区三区 | 无遮挡吸奶头呻吟视频|