linux命令__grep【参数】

  • linux命令__grep【参数】已关闭评论
  • 244 次浏览
  • A+
所属分类:linux技术
摘要

grep命令的功能似乎过滤制定规则的信息。冷知识:grep的名字来源于一个sed格式:g/re/p g:所有行,re:正则规则,p:打印


grep

grep命令的功能似乎过滤制定规则的信息。

冷知识:grep的名字来源于一个sed格式:g/re/p g:所有行,re:正则规则,p:打印

用法:

grep(global search regular express and print out line)打印匹配的行(内容) 类似的命令包括egrep、fgrep、rgrep  grep [OPTION...] PATTERNS [FILE...]  grep [OPTION...] -e PATTERNS ... [FILE...]  grep [OPTION...] -f PATTERN_FILE ... [FILE...]  grep在指定的文件中搜索包含PATTERN匹配的行。如果不指定文件或指定了“-”,则从标准输入中进行搜 索。	默认情况下,grep打印匹配的行。 此外,grep还有很多演变命令,如egrep、fgrep和rgpre,分别对应grep -E、grep -F和grep -r。 这些变种已经弃用,但他们被提供用作向后兼容。  

选项

1. 匹配方式的选择

grep正则表达式(BRE、ERE、PCRE)

-E, --extended-regexp 	将PATTERN作为扩展的正则表达式(ERE) 	 -F,--fixed-strings 	将PATTERN作为为固定字符串的列表,由换行符分隔,匹配其中任意一个	  -G, --basic-regexp	 	将PATTERN作为基本正则表达式(BRE),该选项为默认设置  -P,--perl-regexp 	将PATTERN作为perl兼容正则表达式(PCRE)。 

2. 匹配控制

-e PATTERN, --regexp=PATTERN 	将PATTERN作为匹配项,如果该选项被多次使用或和-f(--file)选项一起使用,匹配所有 	的匹配项。该选项可以用来保护以'-'开头的匹配项。 	 -f FILE,--file=FILE  	将FILE中的每行都作为匹配项,如果此选项被多次使用或与-e(--regexp)选项组合使用,搜索所有给定的匹配项。空文件包含零个匹配项,因此不匹配任何内容   -i,--ignore-case 	忽略匹配项的大小写  -v,--invert-match 	反向匹配,选择没有匹配上的行  -w,--word-regexp 	仅匹配完整单词,匹配的子字符串必须位于行的开头,或者前面有一个非字词字符。类似地,它必须位于行尾或后面跟非字词组成字符(字词组成字符是字母、数字和下划线)。 	 -x,--line-regexp 	 仅选择与整行完全匹配的匹配项。对于正则表达式匹配项,这类似于将匹配项括起来,然后用^和$将其包围。 	    -y   和-i作用相同,但已过时 

3. 通用输出控制

-c,--count 	不打印匹配结果,而是打印匹配的行数  --color[=WHEN],--colour[=WHEN] 	将匹配到的字符串、行、上下文行、文件名、行号、字节偏移量和带转义符的分隔符(用于字段和上下文行组)序列着色,颜色有环境变量GREP_COLORS决定,虽然GREP_COLOR已经过时,但grep依然支持该环境变量,只不过优先权比GREP_COLORS低。WHEN可以为never、always和auto。相关环境变量介绍 	:略。 -L,--files-without-match 	不打印正常匹配结果,而是打印没有匹配上的文件的名称,扫描将在第一次匹配时停止。 -l,--files-with-matches 	不打印正常匹配结果,而是打印匹配上的输入文件的名称,扫描将在第一次匹配时停止  -m NUM --max-count=NUM 	在匹配到NUM行后停止读取文件  -o,--only-matching 	仅打印匹配行中(非空的)匹配部分,每个部分在单独的输出行上  -q,--quiet,--silent 	不向标准输出打印任何内容,匹配到内容立刻退出,即使检测到错误		  -s,--no-messages 	当文件不存在或文件不可读取时,不显示错误信息 

4. 输出行前缀控制

-b,--byte-offset 	在每行输出之前,打印输入文件中基于0的字节偏移量。如果指定了-o(--only-matching),则打印 	匹配项本身的偏移量  -H,--with-filename 	打印每个匹配的文件名,当匹配到多个匹配项时,该选项为默认配置  -h,--no-filename 	在输出中不显示文件名,只匹配到单个结果时,默认不显示文件名  --label=LABEL 	将标准输入显示为来自文件标签的输入(???不理解)  -n,--line-number 	显示行号  -T,--initial-tab 	使匹配结果中每行的第一个字符位于制表位上,以便制表的对齐看起来显得正常。该选项对一些给输出内 	容加前缀的选项很有作用:-H、-n和-b  -u,--unix-byt-offsets 	报告Unix样式的字节偏移量,此开关使grep报告字节偏移量,就像文件是Unix样式的文本文件一样,即 	去掉CR字符。这将产生与在Unix机器上运行grep相同的结果。除非同时使用-b选项,否则此选项无效, 	它对MS-DOS和MS Windows以外的平台没有影响。  -Z,--null 	将文件名后面的符号(冒号或回车)改为零字节(ASCII NUL 字符),例如,grep -lZ在每个文件名 	后输出一个零字节,而不是通常的换行。此选项使输出明确,甚至如果文件名包含不寻常的字符,如新行。 	此选项可与其他命令一起使用,如find -print0、perl-0、sort-z和xargs-0来处理任意文件名, 	甚至包含换行符的文件名。 

5. 上下文控制

-A NUM,--after-context=NUM 	在匹配行之后打印下文的NUM行,连续的匹配组之间用分隔符“--”隔开。和-o或--only-matching选项 	一起使用时,该选项没有任何效果,并且会发出警告  -B NUM,--before-context=NUM 	在匹配行的前面打印上文的NUM行,,连续的匹配组之间用分隔符“--”隔开。和-o或--only-matching 	选项一起使用时,该选项没有任何效果,并且会发出警告  -C NUM,-NUM,--context=NUM 	打印匹配行的上下文各NUM行,连续的匹配组之间用分隔符“--”隔开。和-o或--only-matching选项 	一起使用时,该选项没有任何效果,并且会发出警告 

6. 文件及目录的选择

-a,--text 	像处理文本一样处理二进制文件,相当于--binary-files=text选项  --binary-files=TYPE 	如果文件的前几个字节指示该文件包含二进制数据,则假定文件的类型为TYEP。默认情况下,TYPE为 	binary,grep通常只输出一行表示二进制文件匹配的消息,或者因为没有匹配结果而没有输出;如果 	TYPE为without-match,则grep不对二进制文件进行匹配,相当于-I选项;如果TYPE为text,grep 	将二进制文件当作文本文件处理,这相当于-a选项,处理二进制数据时,grep可以将非文本字节视为行 	终止符,例如,模式“.”(句点)可能不能匹配空字节,因为空字节可能被视为行终止符。警告:grep 	 --binary-files=text可能输出二进制垃圾,如果输出是终端且终端驱动程序将其中一些文本解释为 	 命令则可能会产生严重的副作用。  -D ACTION,--devices=ACTION 	如果输入文件是一个设备、FIFO或则套接字,使用ACTION去处理它,ACTION默认为read,意味着该文 	件将被当作普通文件进行读取。如果ACTION为skip,设备文件被忽略。  -d ACTION,--directories=ACTION 	如果输入文件为一个目录,使用ACTION处理它。ACTION默认为read,即将目录作为普通文件处理。如果 	ACTION为skip,跳过该目录。如果ACTION为recurse,递归读取目录下的所有文件,并且遵循命令行 	符号链接,相当于-r选项  --exclude=GLOB 	跳过名称与GLOB匹配的文件(使用通配符匹配),文件名glob可以使用*、?、和[…]作为通配符,并逐 	字引用通配符或反斜杠字符。  --exclude-from=FILE 	跳过其基名称与从FILE读取的任意文件名通过glob匹配的文件(使用通配符匹配,如--exclude下所述)  --exclude-dir=DIR 	从递归搜索中排除与DIR匹配的目录  -I 	处理二进制文件,就像它不包含匹配的数据一样,这相当于--binary-files=without-match选项。  --include=GLOB 	搜索名称与从GLOB匹配的文件(使用通配符匹配,如--exclude下所述)  -r,--recursive 	递归读取目录下的所有文件,并且遵循命令行符号链接。如果没有给定文件操作数,grep将搜索当前工作 	目录。该命令相当于-d recurse选项  -R,--dereference-recursive 	递归读取目录下所有文件,遵循所有符号链接 

7. 其他选项

--line-buffered 	在输出上使用行缓冲,这可能会导致性能下降  -U,--binary 	将文件视为二进制文件,默认情况下,在MS-DOS和MS-Window中,grep通过读取文件前32KB的内容决 	定这个文件的类型,如果文件为文本文件,grep从原始文件中删除CR字符(使带有‘^'和’$'的正则表达 	式能正常工作),指定-U可以让其对文件进行逐字读取。如果文件为文本文件,每行末尾有CR/LF,这将 	造成一些正则表达式失效。该选项对MS-DOS和MS-Windows以外的平台无影响。  -z,--null-data 	将输入视为一组行,每个行以零字节(ASCII NUL字符)而不是换行符终止,与-Z或--null选项类似, 	此选项可以与sort -z等命令一起使用,以处理任意文件名。 

示例

1. 在文件中搜索字符串

grep -i 字符串 文件名

linux命令__grep【参数】

加上-n参数可以显示匹配出来的行号

linux命令__grep【参数】

显示不匹配的行-v

linux命令__grep【参数】

-v参数显示的就是不包含字符串的所有内容

2. 使用grep过滤命令输出

linux命令__grep【参数】

3. 使用正则

由于在grep中,基本正则表达式和扩展正则表达式在使用时的区别在于:在基本正则表达式中,元字符?、+、{、|、(、和)失去了特殊意义,需要使用反斜杠版本?、+、{、|、(、和)。如果不加任何匹配方式的选项,默认为-G,即基本正则表达式。

linux命令__grep【参数】

匹配某个字符在行首的情况

linux命令__grep【参数】

匹配某个字符在行尾的情况

linux命令__grep【参数】

匹配某个字符前有任意字符的情况

linux命令__grep【参数】

匹配某个字符前面是特定字符的情况

linux命令__grep【参数】

匹配某个字符前面不是特定字符的情况

linux命令__grep【参数】

4. 扩展正则

匹配 bz 或 gz 或 z 开头,后边跟 ip 的行,这里用到了扩展正则中的 小括号 和 或符号"|":

这里就需要用到-E参数,实质上是过滤多个参数的表达式匹配,用小括号扩起来表示一个整体

linux命令__grep【参数】

grep -E的用法等同于egrep

linux命令__grep【参数】

打印ip信息

linux命令__grep【参数】

linux命令__grep【参数】

上述两个命令里面,必须要加上转义符号才能表达符号原本的意思,

5. grep -F

grep -F PATTERN… [FILE…] 将PATTERN作为固定字符串形式的匹配项,不识别正则表达式。等同于fgrep命令

在实践中,我有一个需求,搜索日志关键字,而这一串关键字中包含了特殊字符,这些字符在正则式中有独特的语法,而你又不想用复杂的正则表达式去匹配的时候。那么grep -F 就派上了用场:

linux命令__grep【参数】

现在有这么一堆文件,里面包含了各式各样的文件名,如果我们想要找文件名为‘^abc’的文件

linux命令__grep【参数】

寻找efg$的文件:

linux命令__grep【参数】

与此类推:

linux命令__grep【参数】

6. grep -e

grep -e PATTERN… [FILE…] 和grep -f FILE… [FILE…]-e的作用和不加参数时类似,唯一区别是可以保护以‘-’开头的匹配项

[root@honey-master data] cat test  -test test 

linux命令__grep【参数】

-f的作用是将FILE中的每行都作为匹配项,和-e一样可以多次使用

把模板(pattern)写在一个文件里,然后使用-f参数来读取这些pattern,如果文件中包含0个pattern,那么什么都不匹配;如果有多个pattern,那么必须一行写一个pattern,即:打印后面文件中与前面文件中相同的行,并且,-f参数后面作为标准的文件一定不能有空格

linux命令__grep【参数】

我们可以看到使用test1文件去匹配test文件,所以输出会有全部的test文件内容

linux命令__grep【参数】这里解释了为什么-f参数后面的文件不能有空格。

7. grep -i

忽略大小写

[root@honey-master test] cat test  test1_ivanlee test1_ivanlee1 tesT1_IVANlee2 

linux命令__grep【参数】

8. grep -w

匹配完整的单词,单词前后不能有其他字母或数字,但允许单词前面有非字词符号(包括空格)。

linux命令__grep【参数】

9. grep -x

整行匹配

linux命令__grep【参数】

10. grep -c

打印匹配的行数

linux命令__grep【参数】

11. grep -color[=WHEN] PATTERN… [FILE…]

可以看到centos系统默认使用红色显示匹配项,只不过他只有三个选项,分别是never,auto,always

always和auto的区别就是,always会在任何情况下都给匹配字段加上颜色标记,当通过管道或重定向时就会多出一些控制字符,结果会变成
export [[1;32m[[KGREP[[m[[K_OPTIONS='--color=always'
export [[1;32m[[KGREP[[m[[K_COLOR='1;32'
而auto则只在输出到终端时才加上颜色。

linux命令__grep【参数】

如果想改变匹配颜色,可以修改./bashrc文件

export GREP_COLOR='a;b' #默认是1;31,即高亮的红色

来设置,其中:

a可以选择:【0,1,4,5,7,8】

0 关闭所有属性

1 设置高亮度

4 下划线

linux命令__grep【参数】

5 闪烁

7 反显

8 消隐

其他的效果太难看了~~~~

自己也可以去琢磨颜色,把b值设置为20就是绿色

linux命令__grep【参数】

12 grep -L和l

L不打印匹配的内容,打印FILE中没有匹配上的文件(不能是文件内容了,只能是文件名)。l打印匹配成功的文件名

13. grep -m

grep -m NUM PATTERN… [FILE…] 每个文件最多匹配出NUM行,

linux命令__grep【参数】

14. grep -o

仅打印匹配的内容,而不是匹配的一整行

linux命令__grep【参数】

15. grep -q

不显示匹配结果,匹配结束立刻退出

16. grep -s

不显示文件不存在和读取失败的错误信息

linux命令__grep【参数】

17. grep -b

打印匹配项基于文件开头的偏移量

linux命令__grep【参数】

18 grep -n

显示匹配项在文件中的行号

linux命令__grep【参数】

19 grep -h

不显示文件名,单个文件匹配时,默认不显示文件名

linux命令__grep【参数】

20. grep -T

显示时使用制表符

linux命令__grep【参数】

21. grep -Z

文件名后面的符号改为零字节(ASCII NUL字符)

linux命令__grep【参数】

22. grep -A

linux命令__grep【参数】

23. grep -a PATTERN… [FILE…]

将二进制文件当做文本文件来处理。

28. grep --binary-files=TYPE PATTERN… [FILE…]

TYPE的值可以为:binary(默认)、without-match、text,binary和without-match的区别是前者使用时会提示二进制文件无法匹配,后者不会提示,–binary-files=text相当于-a选项。

29. grep -r??

递归搜索文件

linux命令__grep【参数】