过滤器-选取排序--5.ppt
《过滤器-选取排序--5.ppt》由会员分享,可在线阅读,更多相关《过滤器-选取排序--5.ppt(27页珍藏版)》请在三一文库上搜索。
1、过滤器,薛卫,2,grep,使用正则表达式搜索标准输入或文本, 并把匹配的行打印到标准输出。 语法: Grep -cilLnrsvwx pattern file 例: Grep harley /etc/passwd P402例,3,Grep选项,c:只输出匹配行的计数。 i:不区分大小写(只适用于单字符)。 h:查询多文件时不显示文件名。 l:查询多文件时只输出包含匹配字符的文件名。 p405 n:显示匹配行及行号。 s:不显示不存在或无匹配文本的错误信息。 -w:把表达式做为一个单词搜索。 v:显示不包含匹配文本的所有行,4,look,功能说明:查询单字。 语 法:look -df patt
2、ern file 补充说明:look指令用于已排序英文单字的查询。您仅需给予它欲查询的字首字符串,它会显示所有开头字符串符合该条件的单字。 参 数: -d 只对比英文字母和数字,其余一慨忽略不予比对。 -f 忽略字符大小写差别。 P409例,5,Look与grep区别,1、look要求有序输入 2、只能从文件中读文件,不能从标准输入读数据 3、look只能在行的开头搜索指定模式,6,sort,sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。 语法: Sort -dfnru -t +- -o outfile infile,
3、7,-u选项:作用很简单,就是在输出行中去除重复行 -r选项:sort默认的排序方式是升序,如果想改成降序,需要-r选项。 -o选项:由于sort默认是把结果输出到标准输出,所以需要用重定向才能将结果写入文件,形如sort filename newfile。如果你想把排序结果输出到原文件中,重定向就不行了。-o选项可以把排序后文件放到原始文件。,8,-n选项:排序会遇到10比2小的情况。出现这种情况是由于排序程序将这些数字按字符来排序了,排序程序会先比较1和2,显然1小,所以就将10放在2前面。如果想改变这种现状,就要使用-n选项告诉sort “要以数值来排序”!,9,rocrocketroc
4、rocket programming$ cat number.txt 1 10 19 11 2 5 rocrocketrocrocket programming$ sort number.txt 1 10 11 19 2 5 rocrocketrocrocket programming$ sort -n number.txt 1 2 5 10 11 19,10,-t选项,后面可以设定间隔符。 -k可以指定列数了。 rocrocketpro$ cat facebook.txt banana:30:5.5 apple:10:2.5 pear:90:2.3 orange:20:3.4,11,这个文件
5、有三列,列与列之间用冒号隔开了,第一列表示水果类型,第二列表示水果数量,第三列表示水果价格。 思考:那么以水果数量来排序,也就是以第二列来排序,如何利用sort实现?,12,ror$ sort -n -k 2 -t : facebook.txt apple:10:2.5 orange:20:3.4 banana:30:5.5 pear:90:2.3,$ cat facebook.txt google 110 5000 baidu 100 5000 guge 50 3000 sohu 100 4500 让facebook.txt按照公司人数排序 $ sort n t -k 2 -u facebo
6、ok.txt guge 50 3000 baidu 100 5000 sohu 100 4500 google 110 5000,13,$ sort n t -k 2 -k 3 -u facebook.txt guge 50 3000 sohu 100 4500 baidu 100 5000 google 110 5000,14,让facebook.txt按照员工工资降序排序,如果员工人数相同的,则按照公司人数升序排序,sort -n t -k 3r -k 2 facebook.txt baidu 100 5000 google 110 5000 sohu 100 4500 guge 50 3
7、000,15,16,strings,打印文件中的可打印字符串(print the strings of printable characters in files)。常用来在二进制文件中查找字符串,与grep配合使用。strings命令输出的字符串是至少包含连续4个可打印字符的,这个可以通过参数来修改。 几个选项: -n number 仅输出长度大于number的字符串 -t d/o/x 除了字符串之外,还额外输出字符串的位置(十进制/八进制/十六进制),17,tr,tr用来从标准输入中通过替换或删除操作进行字符转换。tr主要用于删除文件中控制字符或进行字符转换。 Tr abc ABC new
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 过滤器 选取 排序
链接地址:https://www.31doc.com/p-2588173.html