《Linux.Shell编程从入门到精通》读书笔记

时间:2023-03-09 02:49:24
《Linux.Shell编程从入门到精通》读书笔记

第一章 第一个Shell程序

  • 以 #!解析器名称 开头,表示选择哪个解释器解释shell脚本
  • source命令
  • export命令
  • env命令
  • unset命令

    第二章 shell编程基础
  • 函数传递
  • 标准输入输出符号

    第三章 编程的基本元素
  • 获取命令执行返回值
  • $((数值计算)) 获取数值计算结果 如:$((100 - 2*100/400))
  • 替换运算符
  • 模式匹配运算符
  • shift命令可以截取参数列表最左端的一个参数
  • type命令判断被执行命令的来源(别名、关键字、函数、内置命令、外部命令)
  • test命令用于评估表达式,返回零(true)或者非零(false)
  • 逻辑运算符
  • 运算符号
  • 执行反单引号(`)之间的命令,引用结果作为字符串
  • getopt命令用于分析命令标志和参数

    第四章 正则表达式
  • 元字符
  • POSIX字符集
  • 后向引用
  • 交替、分组

    第五章 基本文本处理
  • 排序文本
  • 文本去重
  • 统计文本
  • 打印和格式化输出
  • 提取文本开头和结尾
  • 字段处理
  • 文本替换
  • Linux下的配置文件

    第六章 文件和文件系统
  • 文件
  • 文件系统

    第七章 流编辑器sed
  • 工作地址范围
  • 命令
  • [:特殊字符:]用于匹配特俗字符

    第八章 文本处理利器awk
  • awk代码结构
  • 内建变量
  • 局部变量
  • 字符串函数

    第九章 进程
  • 进程管理命令
  • init进程
  • 调度系统任务
  • 加载proc虚拟文件系统:mount -t proc proc /proc

    第十章 OpenSSH
  • 安装openssh
  • 使用SSH登录远程主机(要求远程主机正在运行sshd)

    第十一章 实用程序(日志处理程序、系统监控程序)
  • 日志清理程序
  • 系统监控程序

第一个Shell程序

以 #!解析器名称 开头,表示选择哪个解释器解释shell脚本

source命令

使用source执行shell脚本时,不会创建子进程,而在父进程中直接执行。

当需要在程序中修改当前shell本身的环境变量时,使用source命令

source命令也可用来读入包含函数的文件

使用方法:source fileName 或者 . fileName

export命令

export命令用于设置或显示环境变量

使用方法:export [-fnp] [变量名称]=[变量设置值]

-f 代表[变量名称]中为函数名称

-n 删除指定的变量。变量实际上并没有删除,只是不会输出到后续指令的执行环境中

-p 列出所有的shell赋予程序

env命令

env命令用于临时改变环境变量值

unset命令

从当前shell删除变量或函数

shell编程基础

函数传递

$0 $1 $2 位置参数

$* 以一个单字符串显示所有向脚本传递的参数

$@ 所有向脚本传递的参数

$# 传入函数的参数个数

$$ 脚本运行的当前进程id号

$! 后台运行的最后一个进程id号

$? 显示最后命令的退出状态

$- 显示shell使用的当前选项

标准输入输出符号

0<:标准输入

1> 或者 >:重定向标准输出

2>:重定向标准错误

&>:标准输出和标准错误

编程的基本元素

获取命令执行返回值

  1. $(命令) 如:$(date +%Y%m%d%H%M%S)
  2. 命令 如:echo 123

$((数值计算)) 获取数值计算结果 如:$((100 - 2*100/400))

替换运算符

  1. ${varname:-word}

    如果varname存在且非null,则返回varname的值;否则,返回word
  2. ${varname:=word}

    如果varname存在且非null,则返回varname的值;否则,将varname的值设置为word,然后返回word
  3. ${varname:?message}

    如果varname存在且非null,则返回varname的值;否则打印message,并退出当前脚本
  4. ${varname:+word}

    如果varname存在且非null,则返回word;否则返回null

模式匹配运算符

  1. ${varname#pattern}

    如果模式匹配变量取值的开头处,则删除匹配的最短部分,并返回剩下部分
  2. ${varname##pattern}

    如果模式匹配变量取值的开头处,则删除匹配的最长部分,并返回剩下部分
  3. ${varname%pattern}

    如果模式匹配变量取值的结尾处,则删除匹配的最短部分,并返回剩下部分
  4. ${varname%%pattern}

    如果模式匹配变量取值的结尾处,则删除匹配的最长部分,并返回剩下部分
  5. ${varname/pattern/string} ${varname//pattern/string}

    将varname中匹配模式的最长部分替换为string

    第一种格式中,只有匹配的第一部分被替换,第二种格式中,varname中所有匹配的部分都被替换

    如果模式以#开头,则必须匹配varname的开头,如果模式以%开头,则必须匹配varname的结尾

shift命令可以截取参数列表最左端的一个参数

type命令判断被执行命令的来源(别名、关键字、函数、内置命令、外部命令)

test命令用于评估表达式,返回零(true)或者非零(false)

逻辑运算符

  1. 关于文件与目录的侦测逻辑卷标!

    -f 常用!侦测『文件』是否存在 eg: if [ -f filename ]

    -d 常用!侦测『目录』是否存在

    -b 侦测是否为一个『 block 文件』

    -c 侦测是否为一个『 character 文件』

    -S 侦测是否为一个『 socket 标签文件』

    -L 侦测是否为一个『 symbolic link 的文件』

    -e 侦测『某个东西』是否存在!
  2. 关于程序的逻辑卷标!

    -G 侦测是否由 GID 所执行的程序所拥有

    -O 侦测是否由 UID 所执行的程序所拥有

    -p 侦测是否为程序间传送信息的 name pipe 或是 FIFO
  3. 关于文件的属性侦测!

    -r 侦测是否为可读的属性

    -w 侦测是否为可以写入的属性

    -x 侦测是否为可执行的属性

    -s 侦测是否为『非空白文件』

    -u 侦测是否具有『 SUID 』的属性

    -g 侦测是否具有『 SGID 』的属性

    -k 侦测是否具有『 sticky bit 』的属性
  4. 两个文件之间的判断与比较 ;例如[ test file1 -nt file2 ]

    -nt 第一个文件比第二个文件新

    -ot 第一个文件比第二个文件旧

    -ef 第一个文件与第二个文件为同一个文件( link 之类的文件)
  5. 逻辑的『和(and)』『或(or)』

    && 逻辑的 AND 的意思

    || 逻辑的 OR 的意思

运算符号

= 等于 应用于:整型或字符串比较 如果在[] 中,只能是字符串

!= 不等于 应用于:整型或字符串比较 如果在[] 中,只能是字符串

< 小于 应用于:整型比较 在[] 中,不能使用 表示字符串

大于 应用于:整型比较 在[] 中,不能使用 表示字符串

-eq 等于 应用于:整型比较

-ne 不等于 应用于:整型比较

-lt 小于 应用于:整型比较

-gt 大于 应用于:整型比较

-le 小于或等于 应用于:整型比较

-ge 大于或等于 应用于:整型比较

-a 双方都成立(and) 逻辑表达式 –a 逻辑表达式

-o 单方成立(or) 逻辑表达式 –o 逻辑表达式

-z 空字符串

-n 非空字符串

执行反单引号(`)之间的命令,引用结果作为字符串

getopt命令用于分析命令标志和参数

正则表达式

元字符

^ 锁定行或字符串的开始

$ 锁定行或字符串的结尾

当^和$结合使用时,意味着模式必须匹配整个串

. 匹配除了换行符以外的任意字符

[...] 方括号表达式,匹配括号内任意一个字符;如果^符号位于方括号的开始,则不匹配方括号中的任意字符

\ 转义字符,用于打开或关闭后续字符的特殊含义

x{m,n} 区间表达式,匹配x字符出现的次数区间

? 匹配前面正则表达式的零个或一个实例

  • 匹配前面正则表达式的一个或多个实例
  • 匹配零个或多个前面字符

    | 匹配前面或后面的正则表达式

    () 匹配括号括起来的正则表达式

    \b 单词锁定符,代表单词的开头和结尾,即单词的分界处

    \B 匹配两个单词组成字符间的空字符串

    < > 分别匹配单词开头和单词结尾

    \n 换行符

    \d 匹配一位数字

    \w 匹配文字和数字字符

    \W 匹配一个或多个非单词字符

POSIX字符集

[:alnum:] 数字字符

[:alpha:] 字母字符

[:blank:] 空格与制表符

[:cntrl:] 控制字符

[:digit:] 数字字符

[:graph:] 非空格

[:lower:] 小写字母

[:print:] 可显示的字符

[:punct:] 标点符号字符

[:space:] 空白(whitespace)字符

[:upper:] 大写字母

[:xdigit:] 十六进制数字

[. .] 排序符号,如[.cn.]表示cn字符序列,而单独的c和n都不行

[= =] 等价字符集

后向引用:匹配之前正则表达式使用(和)括起来选定之后引用的模式,使用\1~\9来引用选定的模式

如:(go).*\1 匹配一行中前后出现两个go

交替、分组

交替|:在不同序列之间用管道符号隔开

分组():让元字符修饰前置字符串

如:(man|woman)+ 匹配一个或多个man或者woman字符串

基本文本处理

排序文本

sort命令用于排序文件,对已排序的文件进行合并,并检查文件以确定它们是否已排序

文本去重

uniq命令用于文本去重(在使用uniq命令前,先使用sort命令,使所有重复行相邻)

统计文本

wc命令用于统计文本行数、字数以及字符数

打印和格式化输出

pr命令用于将文本转换成适合打印的文件

fmt命令用于编排文本文件

fold命令限制文本宽度

提取文本开头和结尾

head命令提取文件开头

tail命令提取文件结尾

字段处理

cut命令用于从一个文本文件或者文本流中提取文本列

join命令用于根据指定栏位,找到两个文件中指定栏位内容相同的行,将它们合并,并根据要求的格式输出内容

文本替换

tr命令用于替换字符

Linux下的配置文件

/etc/group 用户组定义

/etc/passwd 用户信息定义

/etc/inittab init的配置文件,在Linux启动时扮演重要角色

/etc/shadow 用户密码的存放地址

/etc/crontab cron(定期执行命令的程序)的配置文件

/etc/fstab 文件系统信息

文件和文件系统

文件

ls命令用于列出文件

chown命令用于改变文件的所有者

chgrp命令用于改变文件的用户组

umask命令用于指定哪些权限在新文件的默认权限中被删除

chmod命令用于修改文件权限

touch命令更新文件的访问和修改时间

find命令用于寻找文件

xargs命令用于遍历处理文件

comm命令用于比较两个已排序文件之间的差异

diff命令用于比较两个文件之间的差异

文件系统

fdisk命令用于查看/修改系统的分区表

mkfs命令用于创建文件系统

mount命令用于加载文件系统到指定的加载点

umount命令用于卸载已经加载的文件系统

df命令用于显示当前挂载情况

流编辑器(sed)

工作地址范围

  1. 行地址 如:删除第一行 sed -e '1d' filePath
  2. 行范围地址 如:打印1到5行 sed -n -e '1,5p' filePath
  3. 正则表达式地址 如:打印所有以开头的注释行 sed -n -e '/^#/p' filePath
  4. 两个用逗号分开的正则表达式之间的地址 如:打印从包含'BEGIN'的行开始,并且包含'END'的行结束的文本块 sed -n -e '/BEGIN/,/END/p' filePath

命令

  1. d 删除
  2. p 打印
  3. s/// 替换
  4. = 打印行号
  5. i 插入
  6. a 追加

[:特殊字符:]用于匹配特俗字符

文本处理利器(awk)

awk代码结构

  1. 处理输入前的初始化

    BEGIN{

    ....

    }
  2. 处理输入过程

    [ 条件 ] {

    ...

    }
  3. 处理完所有输入后的扫尾工作

    END{

    ...

    }

内建变量

FILENAME 当前输入文件的名称

FS 字段分隔符(支持正则表达式),默认为空格

OFS 输出字段分隔字符,默认为空格

ORS 输出记录分隔字符,默认为\n

RS 输入记录分隔字符

NF 当前记录的字段数

NR 在工作中的记录数

FNR 当前输入文件的记录数

局部变量:列在函数参数列表中并且在字首前置一些额外的空白 如: add(x,y, sum) {}

字符串函数

sub(/reg/, newsubstr, str) 只替换第一个匹配字符串

gsub(/reg/, newsubstr, str) 将字符串str中所有符号/reg/正则的子串替换为字符串newsubstr

index(str, substr) 返回子串substr在串str中的索引

length(str) 返回字符串的长度

match(str, /reg/) 如果在串str中找到正则/reg/匹配的串,则返回出现的位置,未找到则返回0

split(str, array, sep) 使用分隔符sep把字符串分解成数组array

substr(str, position[, length]) 返回str中从position开始的length个字符

toupper(str) 对字符进行大小写转换

sprintf("format", expr) 对expr使用printf格式说明

进程

进程管理命令

fork函数用于创建进程

ps命令用于查看系统正在运行的进程

top命令用于查看系统一段时间进程的动态信息

pstree命令用于打印进程树形结构

Ctrl+C快捷键用于中断前台进程

Ctrl+\快捷键用于杀死前台进程

Ctrl+Z快捷键用于挂起前台进程

bg命令用于将挂起进程转换为后台进程

fg命令用于将后台进程转换为前台进程

jobs命令用于显示当前shell的进程状况

kill命令用于向指定进程发送信号

init命令用于进程初始化工具,可切换运行等级

init进程

  1. /etc/inittab init程序读取的配置文件

    基本格式为 id:runlevels:action:process
    • id为1~2个字符,配置行的唯一标识,在配置文件中不能重复
    • runlevels(运行等级)取值如下
      • 等级0表示:表示关机(千万不能把initdefault 设置为0)
      • 等级1表示:单用户模式
      • 等级2表示:无网络连接的多用户命令行模式
      • 等级3表示:有网络连接的多用户命令行模式
      • 等级4表示:不可用
      • 等级5表示:带图形界面的多用户模式
      • 等级6表示:重新启动(千万不要把initdefault 设置为6)
    • action取值如下
      • respawn 启动并监视第4项指定的process,若process终止则重启它
      • wait 执行第4项指定的process,并等待它执行完毕
      • once 执行第4项指定的process
      • boot 不论在哪个执行等级,系统启动时都会运行第4项指定的process
      • bootwait 不论在哪个执行等级,系统启动时都会运行第4项指定的process,且一直等它执行完备
      • off 关闭任何动作,相当于忽略该配置行
      • ondemand 进入ondemand执行等级时,执行第4项指定的process
      • initdefault 系统启动后进入的执行等级,该行不需要指定process
      • sysinit 不论在哪个执行等级,系统会在执行boot 及bootwait之前执行第4项指定的process
      • powerwait 当系统的供电不足时执行第4项指定的 process,且一直等它执行完毕
      • powerokwait 当系统的供电恢复正常时执行第4项指定的process,且一直等它执行完毕
      • powerfailnow 当系统的供电严重不足时执行第4项指定的process
      • ctrlaltdel 用户按下【Ctrl+Alt+Del】时执行的操作
      • kbrequest 当用户按下特殊的组合键时执行第4项指定的process,此组合键需在keymaps文件定义
    • process为所要执行的shell命令。任何合法的shell语法均适用于该字段。
  2. /etc/rc.d/rcX.d文件(X代表运行等级)含有各个运行等级服务启动和终止配置

    /etc/rc.d/init.d目录下存放着对应运行等级的服务脚本
  3. 修改配置/etc/inittab后马上生效:kill -1 1 或者 init q

调度系统任务

  1. crontab命令用于调度重复性的任务

    控制访问的文件:cron.allow、cron.deny
  2. at命令用于调度只执行一次的任务

    控制访问的文件:at.deny

加载proc虚拟文件系统:mount -t proc proc /proc

SSH

安装openssh

  • 替换阿里云的源

    echo "http://mirrors.aliyun.com/alpine/latest-stable/main/" > /etc/apk/repositories

    echo "http://mirrors.aliyun.com/alpine/latest-stable/community/" >> /etc/apk/repositories

  • 同步时间

    cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime

  • 更新源、安装openssh 并修改配置文件、生成key、启动sshd服务

    apk update &&

    apk add --no-cache openssh-server tzdata &&

    sed -i "s/#PermitRootLogin.*/PermitRootLogin yes/g" /etc/ssh/sshd_config &&

    ssh-keygen -t rsa -P "" -f /etc/ssh/ssh_host_rsa_key &&

    ssh-keygen -t ecdsa -P "" -f /etc/ssh/ssh_host_ecdsa_key &&

    ssh-keygen -t ed25519 -P "" -f /etc/ssh/ssh_host_ed25519_key &&

    /usr/sbin/sshd -D

使用SSH登录远程主机(要求远程主机正在运行sshd)

  • 基于口令的登录方法

    ssh -l 登录账号 远程主机

  • 基于密钥对的登录方法

    • 生成密钥对:ssh-keygen -d
    • 把公钥上传到服务器上(/.ssh/id_dsa.pub、/.ssh/authorized_keys)
    • 测试自动登录:ssh [登录账号@]远程主机 (需要输入第一步输入的passphrase,若想不输入passphrase可以考虑ssh-agent)

实用程序

日志清理程序

把以下代码保存为log_clean.sh文件中即可使用

内含操作:备份重要的日志、限制日志目录大小、清理老旧日志


# maximum log size
alarmrate=500
# the max size file can reach
file_max_size=5
# this is the directory where fresh logs are originally written
working_dir=/mnt/soho_storage/log
# this is the frequency our program runs
SLEEPTIME=5 # append year.month.day and timestamp to log filename
filenameConvert()
{
timestamp=$(date +%Y%m%d%H%M%S)
timestamp=`echo $timestamp`
RETVAL=$1.$timestamp
} # search dir to fetch the oldest log
searchdir()
{
oldestlog=`ls -rt | head -n 1 | awk '{print $1}'`
} # this function clean old logs under working dir if it reaches it's size limitation
clear_old_log_under_working_dir()
{
cd $working_dir
while true
do
logsize=`du -ms $working_dir | awk '{print $1}'`
if [ $logsize -gt $alarmrate ]
then
searchdir
rm -rf $oldestlog
else
break;
fi
done
} # this is the main process of our log backup activity
backuplog_process()
{
cd $log_ram_dir
for i in *
do
file_size=`du -m $i | awk '{print $1}'`
# need to backup log file
case $i in access.log | error.log | apcupsd.events | soho.log)
if [ ! -d $working_dir ]
then
mkdir -p $working_dir
fi
if [ file_size -gt file_max_size ]
then
filenameConvert $i
cp $log_ram_dir/$i $working_dir/$RETVAL
echo "" > $log_ram_dir/$i
clear_old_log_under_working_dir
fi
;;
*)
if [ file_size -gt file_max_size ]
then
echo "" > $log_ram_dir/$i
fi
done
} while true
do
backuplog_process
sleep $SLEEPTIME
done

系统监控程序

把以下代码保存为system_monitor.sh文件中即可使用

内含操作:监控内存、硬盘、CPU、进程,形成状态报告


# maximum ratio of memory usage
mem_quota=80
# hard disk
hd_path=/dev/sda1
# maximum ratio of hard disk usage
hd_quota=80
# maximum ratio of cpu usage
cpu_quota=80
# time gap between two times fetching cpu status
time_gap=60
# generate report every 10 minutes
runtime_gap=60 # fetch the ratio of memory usage
# @return 1: if larger than $mem_quota
0: if less than $mem_quota
watch_memory()
{
mem_total=`cat /proc/meminfo | grep MemTotal | awk '{print $2}'`
mem_free=`cat /proc/meminfo | grep MemFree | awk '{print $2}'`
mem_usage=$((100-mem_free*100/mem_total))
if [ $mem_usage -gt $mem_quota ]
then
mem_message="ALARM!! The memory usage is $mem_usage%!!"
return 1
else
return 0
fi
} # fetch the top 10 most wasting memory process
proc_memory_top10()
{
mem_busiest=`ps aux | sort -nk 4r | head -n 11`
} # fetch the ratio of hard disk usage
# @return 1: if larger than $hd_quota
0: if less than $hd_quota
watch_hd()
{
hd_usage=`df | grep $hd_path | awk '{print $5}' | sed 's/%//g'`
if [ $hd_usage -gt $hd_quota ]
then
hd_message="ALARM!! The hard disk usage is $hd_usage%!!"
return 1
else
return 0
fi
} # fetch cpu status at a time point
# format used unused
get_cpu_info()
{
cat /proc/stat | grep -i "^cpu[0-9]\+" | awk '{used+=$2+$3+$4;unused+=$5+$6+$7+$8} END{print used,unused}'
} # fetch the ratio of cpu usage
# fetch cpu stat two times, with time gap, then calculate the average status
# @return 1: if larger than $cpu_quota
0: if less than $cpu_quota
watch_cpu()
{
time_point_1=`get_cpu_info`
sleep $time_gap
time_point_2=`get_cpu_info`
cpu_usage=`echo $time_point_1 $time_point_2 | awk '{used=$3-$1;total+=$3+$4-$2-$1}';print $used*100/total`
if [ $cpu_usage -gt $cpu_quota ]
then
cpu_message="ALARM!! The cpu usage is over $cpu_usage%!!"
return 1
else
return 0
fi
} # fetch the top 10 busiest processes
proc_cpu_top10()
{
proc_busiest=`ps aux | sort -nk 3r | head -n 11`
} while true
do
# report content
report=""
# memory monitor
if [ `watch_memory` -eq 1 ]
then
report=$report'\n'$mem_message
proc_memory_top10
report=$report'\n'$mem_busiest
fi
# hard disk monitor
if [ `watch_hd` -eq 1 ]
then
report=$report'\n'$hd_message
fi
# cpu monitor
if [ `watch_cpu` -eq 1 ]
then
report=$report'\n'$cpu_message
proc_cpu_top10
report=$report'\n'$proc_busiest
fi
# feedback report
if [ -n $report ]
then
# todo...
fi
# sleep time
sleep $((runtime_gap-time_gap))
done