Skip to content

Latest commit

 

History

History
1776 lines (1376 loc) · 78.4 KB

linux.md

File metadata and controls

1776 lines (1376 loc) · 78.4 KB

目录

unix-history

系统启动

MBR 与 GPT

硬盘分区格式一般有两种,老式的 MBR 与新式的 GPT。

二者区别 MBR GPT
单个分区容量大小 最大支持近 2TB 最大支持近 18EB
主分区 最多只能有 3 个主分区与 1 个扩展分区 无主分区概念,或全部是主分区
引导加载器 在 MBR 头部以及主分区头部 在 ESP 中
分区表健壮性 无校验、 无备份 有校验、有备份

MBR

MBR 小节参考自鸟哥的 Linux 私房菜

MBR结构

MBR 区
 LBA0 中的前 446 字节,用于存放 boot-loader

分区表项
 LBA0 中的后 64 字节,最多存储 4 笔分区记录。其中最后一笔记录为扩展分区,其他为主分区。 扩展分区可以再细化分割出逻辑分区,而分割逻辑分区的分区表项存储再扩展分区头部。 扩展分区并非一个可使用的分区,它存在的目的即是容纳逻辑分区。

GPT

GPT 小节参考自金步国作品集

GPT表结构

注:LBA0 表示 0 号扇区,即第一个 512B 的块

保护 MBR
 保护 MBR 包含一个 DOS 分区表,只包含一个类型值为 0xEE 的分区项, 在小于 2TB 的磁盘上,大小为整个磁盘;在更大的磁盘上,它的大小固定为 2TB。 它的作用是阻止不能识别 GPT 分区的磁盘工具试图对其进行分区或格式化等操作,所以该扇区被称为“保护 MBR”。 实际上,EFI 根本不使用这个分区表。

GPT 头部

相对字节偏移量 字节数 说明 备注
00 ~ 07 8 GPT 头签名 “45 46 49 20 50 41 52 54”(ASCII 码为“EFI PART”)
08 ~ 0B 4 GPT 版本号 目前是 1.0 版,其值是“00 00 01 00”
0C ~ 0F 4 GPT 头的大小 通常为“5C 00 00 00”(0x5C),也就是 92 字节
10 ~ 13 4 GPT 头 CRC 校验和 计算时把这个字段本身看做零值
14 ~ 17 4 保留 必须为“00 00 00 00”
18 ~ 1F 8 EFI 信息区(GPT 头)的起始扇区号 通常为“01 00 00 00 00 00 00 00”,也就是 LBA1
20 ~ 27 8 EFI 信息区(GPT 头)备份位置的扇区号 也就是 EFI 区域结束扇区号。通常是整个磁盘最末一个扇区
28 ~ 2F 8 GPT 分区区域的起始扇区号 通常为“22 00 00 00 00 00 00 00”(0x22),也即是 LBA34
30 ~ 37 8 GPT 分区区域的结束扇区号 通常是倒数第 34 扇区
38 ~ 47 16 磁盘 GUID 全球唯一标识符,与 UUID 是同义词
48 ~ 4F 8 分区表起始扇区号 通常为“02 00 00 00 00 00 00 00”(0x02),也就是 LBA2
50 ~ 53 4 分区表总项数 通常限定为“80 00 00 00”(0x80),也就是 128 个
54 ~ 57 4 每个分区表项占用字节数 通常限定为“80 00 00 00”(0x80),也就是 128 字节
58 ~ 5B 4 分区表 CRC 校验和
5C ~* * 保留 通常是全零填充

分区表项

相对字节偏移量 字节数 说明 备注
00 ~ 0F 16 分区类型 用 GUID 表示,可用 gdisk 查看
10 ~ 1F 16 分区唯一标示符 用 GUID 表示
20 ~ 27 8 分区的起始扇区 用 LBA 值表示
28 ~ 2F 8 分区的结束扇区 用 LBA 值表示,通常是奇数
30 ~ 37 8 分区的属性标志 一般用于 Windows,可用 gdisk 查看
38 ~ 7F 72 UTF-16LE 编码的分区名称 最大 32 个字符

BIOS 与 UEFI

固件规范也基本分为两种,老式的 BIOS 与新式的 UEFI。

BIOS

 BIOS 与一般 MBR 配合,作为老式主板的固件。 在 MBR 格式的硬盘分区中,除了 MBR 头部的引导区,每个分区头部都有一个引导区用于存放 boot-loader。 BIOS 加载 MBR 头部的 boot-loader,而后者便可以选择:

  • 加载操作系统镜像
  • 加载其他 boot-loader

UEFI

UEFI 小节参考自知乎-老狼

 EFI 系统分区(ESP),是一个 FAT16 或 FAT32 格式的物理分区,但是其分区标识是 EF (十六进制) 而非常规的 0E 或 0C; 因此该分区在 Windows 操作系统下一般是不可见的。 ESP 是系统引导分区,供 UEFI 引导系统使用,支持 EFI 模式的电脑需要从 ESP 启动系统,EFI 固件可从 ESP 加载 EFI 启动程序或者应用。

主要规范

  • 读取 GPT 分区表
  • 读取 ESP
  • 能够执行 EFI 可执行文件
  • 添加、删除、修改启动项

    默认启动项位于每个 ESP 的/EFI/BOOT/BOOT{x64,IA32,IA64,ARM,A64}.EFI
    用于那些没有指定硬盘上具体目标,而只是让固件自行搜索的启动项

  • 设置启动项顺序
  • 设置启动项模式(UEFI or BIOS)

安全启动
 UEFI 规范规定固件可以包含一系列签名,并拒绝运行未签名或签名与固件中包含的签名不一致的 EFI 可执行文件。 这种签名机制还用于内核对加载模块的验证。

关于 Microsoft Windows

  • 限制了需要获得预装 Windows 的批量许可(即“微软认证”)的在售 PC:

    • 默认启用安全启动 (Secure Boot)(服务器除外)
    • 在其信任密钥列表中包含微软的密钥
    • 启用安全启动 (Secure Boot) 时,必须禁用 BIOS 兼容模式(如果没记错的话,UEFI 规范也有此要求)
    • 支持签名黑名单
  • 符合微软认证要求的 x86 计算机 还必须满足以下附加条件:

    • 允许 自然人禁用安全启动 (Secure Boot)
    • 允许 自然人启用自定义模式,以及修改固件的信任密钥列表
  • 符合微软认证要求的 ARM 计算机 还必须满足以下附加条件:

    • 不允许 自然人禁用安全启动 (Secure Boot)
    • 不允许 自然人启用自定义模式,以及修改固件的信任密钥列表

grub

grub 启动流程

  1. 加载 bootx64.efi
  2. 定义变量cmdpath prefix root
  3. 加载 normal.mod

    失败则进入救援模式

  4. 执行$prefix/grub.cfg

    无 grub.cfg 则进入命令模式

  5. 进入普通模式(选单界面)
    • e进入编辑模式
    • c进入命令模式
  6. 加载 initramfs
  7. 加载 kernel

grub 配置

  • /etc/default/grub

    该文件中的内容会被 grub-mkconfig 程序转换后加入 grub.conf

  • /etc/grub.d/

    将这些脚本的标准输出重定向到 grub.conf

    • 00_header :基础配置
    • 01_user :自定义环境
    • 10_linux :确定 linux 选单
    • 20_os-prober :确定其他 OS 选单
    • 40_custom :自定义选单
  • 配置完后使用命令工具使配置生效

grub-install --target=x86_64-efi --efi-directory=/boot/efi --bootloader-id=GRUB

grub-mkconfig -o /boot/grub/grub.cfg
  • /boot/grub/grub.conf

    grub 的直接配置文件,不建议直接修改

grub 脚本

  • 模块:默认自动加载 command.lst 与 crypto.lst

  • 文件命令规则

    • 分区 :(hd0,gpt1)
    • 文件 :(hd0,gpt1)/path/to/file
    • 扇区 :(hd0,gpt1)0+1
  • 特殊变量

    • prefix :grub 安装目录
    • root :根设备,未指定设备名的文件的默认设备
    • cmdpath :core.image 所在目录
    • superusers :超级用户,逗号分隔
  • grub 命令

    • ls :列出已知设备/设备中的文件/目录的内容
    • cat :显示文件内容,--dos 选项处理换行符
    • echo :与 bash 用法一样
    • normal :执行命令脚本
    • source :将文件内容插入当前位置
    • configfile :将文件做配置加载,不会保留其设置的环境变量
    • set var=val :设置变量
    • export var :导出至环境变量,使其对 configfile 命令载入的配置文件可见
    • lsmod :列表已加载模块
    • insmod/rmmod :加载/卸载模块
    • loopback dev isofile :建立 loop 设备,-d 删除
    • halt/reboot :关机/重启
    • menuentry :选单制作

grub 安全

  • 设置超级用户:set superusers="root"

    注 :设置后只有超级用户才能修改选单

  • 设置加密密码:password_pbkdf2 root grub.pbkdf2.sha512...

    注 :使用 grub-mkpasswd-pbkdf2 命令产生密码

  • 设置明文密码:password user ...

    注:不建议设置明文密码

  • 设置 menuentry 选项
    • --unrestricted :所有人可执行
    • --users "" :仅超级用户
    • --users "user" :仅 user 与超级用户

kernel

kernel 启动流程

  1. 挂载 initramfs 模拟的/ (根目录设备)

    1. 加载模块
    2. 启动 init 程序(systemd)
    3. 启动 initrd.target
  2. 挂载硬盘中真正/ (根目录设备),并释放 initramfs

  3. 准备启动磁盘上的 default.target

kernel 引导参数

  • 系统救援

    • 修改选单内核参数为rd.break,并chroot

      注 :rd.break 模式下无 SELinux,修改密码会导致其安全上下文失效而导致无法登陆

    • 修改选单内核参数为systemd-unit=rescu.target
  • 禁用 Nvidia 开源驱动:nouveau.modeset=0

systemd

systemd 小节参考自金步国作品集鸟哥的 Linux 私房菜

systemd 启动流程

  1. 寻找并启动 default.target,同时递归检查依赖,一般情况依赖如下

  2. sysinit.target:

    • 特殊文件系统的挂载与启动

      如 LVM 与 RAID 等

    • 启动 plymouthd

      开机动画服务

    • 启动 systemd-journald

      系统日志服务

    • 载入额外的内核模块

      /etc/modules-load.d/*.conf

    • 载入额外的内核参数

      /etc/sysctl.conf 与 /etc/sysctl.d/*.conf

    • 启动乱数产生器
    • 设置终端字体
    • 启动 systemd-udevd

      动态设备管理器

    • 加载本地文件系统与 swap

      读取/etc/fstab

  3. basic.target

    • SELlinux
    • FireWall
    • pathes.target
    • slices.target
    • sysinit.target
    • sockets.target
    • timers.target
    • getty.target
  4. multi-user.target

  5. graphical.target

systemd 管理命令

systemctl [OPTIONS...] COMMAND ...
  • 开机自启
子命令 描述
enable 加入开机启动,指定选项--now同时执行 start
disable 取消开机启动,指定选项--now同时执行 stop
static 只能作为依赖被启动
mask 禁止启动(创建符号连接指向/dev/null)
unmask 解除禁止启动
get-default 查看开机启动的 default-target
set-default 设置开机启动的 default-target
isolate 切换当前启动的 target
// systemd启动流程分析
systemd-analyze blame
systemd-analyze plot > plot.svg
  • 手动控制
子命令 描述
start 立即启动
stop 立即停止
restart 立即重启
reload 立即重载配置(根据服务配置不一定有效)
  • 信息查看
子命令 描述
status 查看单元启动状态
show 查看单元所有配置信息
cat 查看单元文件内容
edit 编辑单元文件内容
选项或子命令 描述
-t 单元类型 列出指定类型的单元
-a 列出所有单元
list-dependencies [--reverse] 列出指定单元的依赖
  • 主机状态
子命令 描述
suspend 休眠(低耗开机状态)
hibernate 冬眠(关机状态)
rescue 救援
emergency 紧急救援
// 注意配置完后让systemd重新读取配置
systemctl daemon-reload

systemd 单元配置

  • unit 配置目录(优先级降序)

    • systemd 无法管理手动执行启动的服务
    • 只有在配置目录的 unit 才在 systemd 视线里
    • 是否开机启动取决于满足上述的 unit 是否在 default.target 的依赖链中
    • /etc/systemd/system/
    • /run/systemd/system/
    • /lib/systemd/system/
  • unit 类型

    • service :封装了一个被 systemd 监视与控制的进程
    • socket :封装了一个用于进程间通信的套接字(socket)或管道(FIFO), 以支持基于套接字的启动
    • path :封装了一组由 systemd 监视的文件系统路径,以支持基于路径的启动
    • timer :封装了一个由 systemd 管理的定时器, 以支持基于定时器的启动
    • mount :封装了一个由 systemd 管理的文件系统挂载点
    • automount :封装了一个由 systemd 管理的 文件系统自动挂载点
    • swap :封装了一个由 systemd 管理的 swap 设备或 swap 文件
    • device :封装了一个位于 sysfs/udev(7) 中的设备
    • slice :封装管理一组进程资源占用的控制组的 slice 单元。 此类单元是通过在 Linux cgroup(Control Group) 树中创建一个节点实现资源控制的
    • scope :仅能以编程的方式通过 systemd D-Bus 接口创建。范围单元用于管理 一组外部创建的进程, 它自身并不派生(fork)任何进程
    • target :一系列 unit 的集合

      一般包括有:graphical,multi-user,rescue,emerge,shutdown 等

  • unit 配置

    • 模板单元:命名[email protected],配置中%i替换为实例[email protected]中的bar%I替换为未转移的bar
    • 单元别名:通过在单元目录下创建符号链接即可形成单元别名
    • 依赖目录:单元目录下名如foo.service.wants/foo.service.required/的目录中的单元文件会加入foo.service中的Wants=Requires=依赖中
    • 额外配置:单元目录下名如foo.service.d/,当解析完主单元文件foo.service后会按字典序读取额外配置目录下的名如*.conf的文件

Unit 小节

[Unit]
Description=            # 描述该服务的名词
Documentation=          # 该服务的详细文档。接受 http://、https://、file:、info:、man: 五种URI。若为空字符串则表示清空之前设置
After=                  # 当与列表中单元同时启动时,在其启动完成之后才启动,同时关闭时在其之前
Before=                 # 当与列表中单元同时启动时,在其启动完成之前就启动,同时关闭时在其之后
Wants=                  # 同时启动依赖单元
Requires=               # 同时启动依赖单元。若同时设置了After=依赖单元且其启动失败,则无法启动本单元。若依赖单元被显式停止,本单元连带被停止
BindsTo=                # 同时启动依赖单元。若依赖单元停止,则本单元连带被停止
Requisite=              # 只检查而不启动依赖,检查失败则fail
PartOf=                 # 跟着依赖同时关闭或重启
Conflicts=              # 与这些单元不能同时存在

Install 小节

[Install]
WantedBy=               # enable时创建到指定的foo.service.wants/目录下的符号链接,disable时删除
RequiredBy=             # enable时创建到指定的foo.service.required/目录下的符号链接,disable时删除
Alias=                  # 更改上述创建的符号链接的文件名(别名)
Also=                   # enable与disable本单元时,也对列表中单元进行相同操作
DefaultInstance=        # 对于模板单元,设置默认实例,即直接启动该模板单元而未指定实例时的默认实例

Service 小节

Type=
# simple    表示当fork()返回时即算启动完成
# exec      表示当exec()执行成功时才算是启动完成
# forking   表示当父进程退出且至少有一个子进程才算完成,应该设置PIDFile=以跟踪主进程
# oneshot   表示当执行完成并退出后才算完成,直接从activating到inactive,应该设置RemainAfterExit
# notify    表示当返回状态信息后才算完成
# dbus      表示当从D-Bus获得名称后算完成,需设置BusName选项
# idle      表示当所有任务完成后才启动,最多延迟5秒

User=
Group=
ExecPre=
ExecStart=
ExecPost=
ExecReload=
ExecStop=
ExecStopPost=
# 只有Type=oneshot才支持启动多个程序
# -绝对路径名,表示失败退出被视为成功,否则停止该单元
# +绝对路径名,表示使用超级权限

Restart=                # 如何重启
RestartSec=             # 重启前暂停时间,需要指定单位
# | 退出原因         | no | always | on-success | on-failure | on-abnormal | on-abort | on-watchdog |
# |------------------|----|--------|------------|------------|-------------|----------|-------------|
# | 正常退出         |    | X      | X          |            |             |          |             |
# | 退出码不为"0"    |    | X      |            | X          |             |          |             |
# | 进程被强制杀死   |    | X      |            | X          | X           | X        |             |
# | systemd 操作超时 |    | X      |            | X          | X           |          |             |
# | 看门狗超时       |    | X      |            | X          | X           |          | X           |

Timer 小节

OnBootSec=              # 相对内核启动
OnStartupSec=           # 相对systemd启动
OnActiveSec=            # 相对该timer.target启动
OnUnitActiveSec=        # 相对匹配service最后一次启动
OnUnitInactiveSec=      # 相对匹配service最后一次关闭
OnCalendar=             # 星期 年-月-日 时:分:秒
# 星期(可选)            Mon、Tue、Wed、Thu、Fri、Sat、Sun
# x,y                   表示指定列表
# x..y                  表示指定范围
# *                     表示指定任一
# x/N                   表示指定N间隔跳跃
# ~日                   表示指定月中倒数第几天
# 秒                    us、ms、s、m、h、d、w、M、y

AccuracySec=            # 设置精度,默认一分钟
Persistent=             # 是否操作OnCalendar不错过
WakeSystem=             # 是否到时唤醒系统
Unit=                   # 指定匹配unit,默认同名.service

getty-login

  1. 启动 getty.target 创建终端,并打印提示/etc/issue
  2. 启动 systemd-logind 并连接到上述终端,然后打印提示/etc/motd
  3. 用户输入用户名与密码,systemd-logind 调用 PAM 进行身份验证与授权。

    相关文件:/etc/pam.d/、/etc/login.defs、/etc/nologin.txt、/etc/nologin

  4. systemd-logind 作为超级用户进程,需要为接下来用户 shell 初始化安全的、基础的进程环境
  5. systemd-logind 调用 exec 加载 shell,将argv[0][0]设置为-表示登录 shell
  6. shell 读取其配置文件

用户管理

用户:用户登录并开启会话后,所有该会话的进程默认都具有该用户的权限。

用户组:而为了方便管理同一群体的用户,于是有了用户组的概念。

附加组:当创建新用户时,一般会同时为该新用户创建一个同名的用户组,并将该用户加入该组。而用户所在的其他组被称为附加组

用户资料文件

  • /etc/passwd

    用户名:密码:UID:GID:描述信息:主目录:默认Shell

  • /etc/shadow

    用户名:加密密码:最后一次修改时间:最小修改时间间隔:密码有效期:密码需要变更前的警告天数:密码过期后的宽限时间:账号失效时间:保留

  • /etc/group

    组名:密码:GID:组附加用户列表

  • /etc/gshadow

    组名:加密密码:组管理员:组附加用户列表

  • /etc/skel

    创建用户家目录时,复制该目录下的所有文件到新建的用户家目录中去

 由上可知,

  • 用户登录信息包括:用户名、UID、密码
  • 一个用户名对应一个用户,一个 UID 对应一个权限
  • 可以有多个用户名对应一个 UID(同一权限)
  • 进程不携带用户名信息,utmp 日志(w 命令输出)将用户名与终端绑定,可通过进程终端判断用户名

相关命令

  • id :打印当前用户的 UID、GID、附属 GID 以及对应的名字
  • useradd

    • -u :指定 UID
    • -g :指定 GID
    • -G :指定附加组
    • -c :指定描述信息
    • -d :指定主目录绝对路径
    • -s :指定默认 shell
    • -m :自动创建主目录
    • -o :允许用户 UID 相同
    • -r :添加系统用户(1-499)
    • -D :查看或修改默认配置/etc/default/useradd
  • userdel

    • -r :删除主目录,邮箱需要手动删除
  • usermod _ -l :用户名 _ -u :UID _ -g :GID _ -G :附加组 _ -c :描述信息 _ -d :主目录绝对路径 * -s :默认 shell

  • passwd

    • -S :查看信息
    • -l :锁定用户
    • -u :解锁用户
    • --stdin :指明从管道读取密码
  • chage _ -l :详情 _ -d :最后一次修改 YYYY-MM-DD,为 0 强制修改 _ -m :最小修改间隔天数 _ -M :最大修改间隔天数(密码过期后强制修改) _ -W :密码到期提前警告天数 _ -I :宽限天数,这段时间用户可以登录,但会强制其修改密码 * -E :失效日期 YYYY-MM-DD,-1 则无

  • groupadd

    • -g :GID
    • -r :系统群组
  • groupdel

  • groupmod

    • -g :GID
    • -n :组名
  • gpasswd _ -A :管理员 _ -r :移除群组密码 _ -R :密码失效 _ -M :将用户加入群组(root) _ -a :将用户加入群组 _ -d :移除用户

日志管理

系统提供了一个套接字与系统的日志服务通讯:/dev/log

代号 日志类型 说明
0 kern(kernel) 内核日志,大都为硬件检测与内核功能加载
1 user 用户层信息(如logger -p user.info MSG)
2 mail 邮件服务有关
3 daemon 系统服务(如 systemd)
4 auth 认证与授权(如 login,ssh,su)
5 syslog rsyslogd 服务
6 lpr 打印
7 news 新闻组
8 uucp 全名"Unix to Unix Copy Protocol",早期用于 unix 系統间的程序资料交换
9 cron 计划任务(如 cron,at)
10 authpriv 与 auth 类似,但记录较多账号私人信息,包括 PAM 模块
11 ftp 与 FTP 协议有关
16~23 local0 ~ local7 本地保留
代号 日志级别 说明
7 debug 除错
6 info 基本信息说明
5 notice 正常通知
4 warning(warn) 警告,可能有问题但还不至与影响到 daemon
3 err (error) 错误,例如配置错误导致无法启动
2 crit 严重错误
1 alert 警报
0 emerg(panic) 疼痛等級,意指系統几乎要死机,通常大概只有硬件出问题导致内核无法运行

系统日志

  • w :系统现在的登录情况

    /var/run/utmp

  • last :系统的启动与用户登陆日志

    /var/log/wtmp

  • lastlog :每个用户最后一次登陆时间

    /var/log/lastlog

  • lastb :上次错误登录记录

    /var/log/btmp

  • journalctl:系统管理日志 > /var/log/journal/* _ -b :开机启动日志 _ -n :最近的几行日志 _ -r :反向,由新到旧 _ -f :监听 _ -t :类型 _ -p :级别 _ -S、-U :since 与 until 某时刻的日志(date 格式时间) _ 指定范围: _ -u :指定 unit _ _PID= _ _UID= _ _COMM=

系统配置

基本系统信息

Linux 系统的全称应该叫基于 GNU/Linux 内核的操作系统发行版

  • lscpu
  • lspci [-s 指定设备] [-vv 显示详情]
  • lsusb [-t 树状展示]
  • uname -a
  • lsb_release -a
  • hostnamectl

日期时间与时区

电脑主板有专门的硬件用于记录日期时间,其由电池供电。 Linux 提供两种系统时间方案:

  • 硬件记录 UTC 时间,然后由系统根据时区转换得到本地时间
  • 硬件记录本地时间,然后由系统根据时区转换得到 UTC 时间

系统启动后一般就读取一次硬件时间,之后系统时间便与硬件时间无关了。 利用 NTP 服务器校对时间后,记得将系统时间写入硬件。

命令:

  • timedatectl

    • set-timezone
    • set-local-rtc
    • set-ntp
  • hwclock -w :将系统时间写入硬件

  • date

    • +timeformat :指定打印格式
    • -d timeformat :指定时间
    • -d @N :指定时间为 epoch 之后 N 秒
    • -d '19700101 Ndays' :指定时间为 epoch 之后 N 天
  • cal [MONTH] [YEAR]

语系与字符集

语系关系到应用程序如何展示如时间、货币、消息等信息的格式以及自然语言的显示内容。
字符集关系到应用程序如何解析或存储系统字符信息(如文件)。

命令:

  • locale [-a]
  • localectl

网络与防火墙

配置文件 说明
/etc/services 服务名与端口对照
/etc/protocols 系统支持的网络协议
/etc/hosts 已知主机名
/etc/resolv.conf DNS 服务器

命令

  • ip [--color] _ link/l _ set IF up/down _ set name NAME _ set promisc _ addr/a _ add IP/MASK broadcast + dev IF _ del IP/MASK dev IF _ route/r _ list table TBL_NAME|TBL_NR _ add IP/MASK via GWIP dev IF src IP metric 600 _ add [throw|unreachable|prohibit|blackhole] IP/MA _ del IP/MASK via GWIP dev IF _ neigh/n _ add/del IP lla MAC dev IF
  • nmcli
    • radio/r
      • wifi on|off
    • connection/c
      • up CON-NAME
      • add type . ifname . ssid . con-name .
      • del SSID
      • reload
    • device/d
      • wifi
      • dis IF
      • wifi c SSID password PASSWD (hidden yes)
  • nmtui
  • ss _ -atp :TCP 端口 _ -atpn :TCP 端口,指定端口号 _ -aup :UDP 端口 _ -axp :UNIX 类型 socket
  • drill
  • ping
  • nmap 图片来自网络

图片来自网络

  • iptables
参数 解释
-t, --table table 对指定的 table 进行操作,table 必须是 raw、nat、filter、mangle 之一,默认为 filter
-p 指定要匹配的数据包协议类型,如 tcp、udp、icmp
--dport num 匹配目标端口号
--sport num 匹配来源端口号
-s, --source [!]address[/mask] 把指定的一个或一组地址作为源地址,按此规则进行过滤。比如 192.168.1.1 与 192.168.1.0/255.255.255.0
-d, --destination [!]address[/mask] 地址格式同上,但这里是指定地址为目的地址,按此进行过滤
-i, --in-interface [!]网络接口 指定数据包的来自来自网络接口,比如最常见的 eth0。注意它只对 INPUT、FORWARD、PREROUTING 这三个链起作用。如果没有指定此选项,说明可以来自任何一个网络接口
-o, --out-interface [!]网络接口 指定数据包出去的网络接口。只对 OUTPUT、FORWARD、POSTROUTING 三个链起作用
-A, --append chain rule-specification 在指定链 chain 的末尾插入指定的规则,也就是说,这条规则会被放到最后,最后才会被执行。规则是由后面的匹配来指定。
-I, --insert chain [rulenum] rule-specification 在链 chain 中的指定位置插入一条或多条规则。默认 rulenum 我 1,表示在链的头部插入
-D, --delete chain rule-specification 或 rulenum 在指定的链 chain 中删除一个或多个指定规则。
-R num 替换/修改第几条规则
-P, --policy chain target 为指定的链 chain 设置策略 target。注意,只有内置的链才允许有策略,用户自定义的是不允许的。
-F, --flush [chain] 清空指定链 chain 上面的所有规则。如果没有指定链,清空该表上所有链的所有规则。
-N, --new-chain chain 用指定的名字创建一个新的链。
-X, --delete-chain [chain] 删除指定的链,这个链必须没有被其它任何规则引用,而且这条上必须没有任何规则。如果没有指定链名,则会删除该表中所有非内置的链。
-E, --rename-chain old-chain new-chain 用指定的新名字去重命名指定的链。这并不会对链内部造成任何影响。
-Z, --zero [chain] 把指定链,或者表中的所有链上的所有计数器清零。
-j, --jump target 即满足某条件时该执行什么样的动作。target 可以是内置的目标,比如 ACCEPT,也可以是用户自定义的链。
-L, --list [chain] 列出链 chain 上面的所有规则,如果没有指定链,列出表上所有链的所有规则
-h 显示帮助信息

选项-j的动作包括:

  • ACCEPT :接收数据包。
  • DROP :丢弃数据包。
  • REDIRECT :重定向、映射、透明代理。
  • SNAT :源地址转换。
  • DNAT :目标地址转换。
  • MASQUERADE :IP 伪装(NAT),用于 ADSL。
  • LOG :日志记录。
iptables -t 表名 <-A/I/D/R> 规则链名 [规则号] <-i/o 网卡名> -p 协议名 <-s 源IP/源子网> --sport 源端口 <-d 目标IP/目标子网> --dport 目标端口 -j 动作

硬盘管理

GPT 分区

  • gdisk DEV [-l]

    • m :普通模式
    • x :专家模式
    • r :恢复模式
    • ? :帮助
  • parted DEV

    • p
    • mktable
    • mkpart LABLE START END
    • resizepart NUM END
    • rm NUM
    • name NUM NAME
    • set NUM FLAG on/off

      FLAG:raid lvm boot hidden diag

    parted-Flag      Type                     Attr
        hidden         -                        0
        boot        EFI System                  -
        diag        Windows RE                  -
        msftres     Micorsoft reserved          -
  • partprobe: 修改分区表后一定要让内核重载硬盘信息
  • lsblk

    • -f :显示文件系统类型
    • -m :权限及所有者
  • sudo blkid [DEV] _ 文件系统标签与类型 _ 文件系统 UUID(fstab 所用) _ 分区标签 _ 分区 UUID

LVM 逻辑卷

  • LVM-PV 阶段
  • pvs
  • pvdisplay PV
  • pvcreate DEV
  • pvremove DEV
  • LVM-VG 阶段
  • vgs
  • vgdisplay VG
  • vgcreate VG PV
  • -s :指定 PE 大小
  • vgextend VG PV
  • vgreduce VG PV
  • vgchange -a y/n
  • vgremove VG
  • LVM-LV 阶段
  • lvs
  • lvdisplay LV
  • lvcreate
  • -L SIZE -n LV :普通 LV
  • -L SIZE -T VG/LVpool :建立 LVpool
  • -V SIZE -T VG/LVpool -n LV :在指定 LVpool 中建立 LV
  • -s -L SIZE -n LVS VG/LV :建立快照
  • lvresize
  • -L +|-SIZE
  • lvchange -a y|n * lvremove LV

XFS 文件系统

  • 结构:

    • 分配组
      • 超级块(只在第一个分配组)
      • 空闲空间索引
      • Inode 索引
    • Inodes
    • Blocks
    • Log
    • Realtime
  • 特性:

    • 分配组的并行性
    • 日志与恢复
    • 延迟分配
    • 扩展属性
    • 文件空洞优化
  • mkfs.xfs DEV

    • -f :强制
    • -L :设置文件系统标签
    • -b size=
    • -i size=
    • -d agcount=
    • -d file
    • -l external,logdev= ,size=
  • xfs_admin

    • -l :查看文件系统标签
    • -L :修改标签
    • -u :查看文件系统 uuid
    • -U :修改 uuid
  • xfs_info

  • xfs_growfs

  • resize2fs

  • xfsdump MP

    注 :挂载点MP末不能带/号

    • -l :备份级别 0 为全量,其他在前一级基础上增量
    • -L :备份文件标签
    • -M :备份设备标签
    • -f :指定备份文件
    • -e :排除属性含 d 的文件
    • -s :指定目录(无增量备份)
  • xfsrestore MP

  • -f :指定使用的备份文件

  • -s :只还原指定的文件或目录

  • -I :查询基础数据库/var/lib/xfsdump/inventory/

  • xfs*repair

  • -f :对 image-file 修复

  • -n :只检测

  • -l :指定 logdev

  • -d :用于单用户模式强制恢复以 ro 挂载的/

归档包

归档包即一种特殊的文件系统格式

  • gzip/bzip2/xz
  • -[1-9] :压缩等级,越大压缩比越高
  • -k :保存原文件不删除 * -l :查看压缩包信息
  • tar
  • -[z|j|J] :gzip | bzip2 | xz
  • -[c|x|t|u] :打包|解包|查询|更新
  • --delete :删除
  • -f :指定压缩文件名
  • -v :详述
  • -p :保留权限等信息
  • --exlcude :排除,pattern
  • -C :解包时指定路径
  • zip ZIPFILE FILES
    • -[1-9] :压缩等级,越大压缩比越高
    • -r :打包目录时指定递归
    • -e 或-P 密码 :加密
  • unzip ZIPFILE [LIST] > LIST指定提取 ZIPFILE 中的哪些文件 * -p :解压文件到 stdout
  • dd
    • if=
    • skip=
    • of=
    • seek=
    • bs=
    • count=
    • conv=
    • lcase :小写
    • ucase :大写
    • notrunc :不截断,覆盖

      例:dd if=manjaro.iso of=_usb-dev bs=8M oflag=sync status=progress

  • losetup /dev/loop0 loopfile

    制作 loop 设备

  • losetup -d /dev/loop0 > 解除 loop 设备

文件系统

文件描述符

fd

  • 文件描述符(进程唯一)
    • 描述符标识
    • 文件表项指针
  • 文件表项(系统共享)
    • 文件打开标识
    • 文件偏移量
    • v 节点表项指针
  • v 节点表项(文件唯一)
    • 文件系统相关 i 节点
    • 文件系统无关 i 节点

文件系统中有一个特别的目录/dev/fd/,在 Linux 中它为一指向/proc/self/fd/的符号链接, 而该目录下又有多个符号链接指向当前进程的文件描述符所指向的文件。

虚拟文件系统

 当进程陷入系统调用读取文件时,内核会先搜索文件缓存/缓冲区,若未找到则调用驱动程序加载文件。
 内核为进程提供了一层称作 虚拟文件系统(VFS) 的抽象,这也是 “UNIX 哲学:一切皆文件” 的由来。 进程可以通过它来一致性地访问不同挂载位置、不同类型的文件:

  • 挂载

    如下所见,不是所有的文件都是硬盘上的持久化文件;有些文件是动态变化的,甚至对于不同的进程所看见的文件也不一样(如/proc/self、/dev/tty、/dev/ptmx 等)

    • 远程网络文件
    • 本地硬盘文件
    • 临时内存文件
    • 内核接口文件
    • 硬件设备文件
  • 类型
    • 目录
    • 符号链接
    • 普通文件
    • IPC 文件(如 pipe、socket)
    • 字符文件(如终端)
    • 块文件(如硬盘)

而其中不同的类型的文件的内核缓冲区是不同的

  • 存储在硬盘上的普通文件缓冲区的特点是:

    • 读写时使用同一 fd 与同一缓冲区
    • 可以任意反复读写内容
  • 还有如 socket 的缓冲区的特点是:

    • 不区分读写 fd,但区分读写缓冲区
    • 读缓冲区内容由另一端写入,写缓冲区的内容由另一端读取
    • 不能反复读取相同内容
  • 最典型的,pipe 文件缓冲区的特点是:

    • 区分读写 fd,但不区分读写缓冲区
    • 缓冲区中内容由读 fd 读取,写 fd 写入
    • 不能反复读取相同内容

根目录结构

文件名 :每个文件的名字存在与其父目录的目录项中(目录项中还包含 i-node)。 ...为特殊文件名,且文件名还不能包含/

路径名 :文件名在不同目录下可具有相同的名字,需要用路径名唯一确定。 以/开头的路径名为绝对路径,否则为相对路径(相对路径与文件名形似)

根文件:一般会将一个硬盘分区中的文件系统挂载到/上,因为硬盘文件是持久化的,可以记录整个目录结构

以下目录结构摘录自菜鸟教程

目录结构

目录 说明
/boot 存放的是启动 Linux 时使用的一些核心文件,如 initramfs 与内核镜像
/boot/efi UEFI 固件系统中,用于挂载 EFI 分区
/etc etc 是 Etcetera(等等)的缩写,这个目录用来存放所有的系统管理所需要的配置文件和子目录
/opt opt 是 optional(可选) 的缩写,这是给主机额外安装软件所摆放的目录
/usr usr 是 unix shared resources(unix 共享资源)的缩写,用户的很多应用程序和文件都放在这个目录下,类似于 windows 下的 program files 目录
/usr/bin 系统用户使用的应用程序
/usr/sbin 超级用户使用的比较高级的管理程序和系统守护程序
/bin bin 是 Binaries(二进制文件)的缩写,这个目录存放着最经常使用的命令
/sbin sbin,是 Superuser Binaries(超级用户的二进制文件)的缩写,这里存放的是系统管理员使用的系统管理程序
/lib lib 是 Library(库)的缩写,这个目录里存放着系统最基本的动态连接共享库,其作用类似于 Windows 里的 DLL 文件
/root 该目录为系统管理员,也称作超级权限者的用户主目录
/home 用户的主目录,在 Linux 中,一般每个用户都有一个自己与用户名相同的目录
/selinux 这个目录是 Redhat/CentOS 所特有的目录,Selinux 是一个安全机制,类似于 windows 的防火墙,这个目录就是存放 selinux 相关的文件的
/lost+found 这个目录一般情况下是空的,当系统非法关机后,这里就存放了一些文件
/media linux 系统会自动识别一些设备,例如 U 盘、光驱等等,当识别后,Linux 会把识别的设备挂载到这个目录下
/mnt 系统提供该目录是为了让用户临时挂载别的文件系统的,我们可以将光驱挂载在/mnt/上,然后进入该目录就可以查看光驱里的内容了
/srv 该目录存放一些服务启动之后需要提取的数据
/var var 是 variable(变量)的缩写,这个目录中存放着在不断扩充着的东西,我们习惯将那些经常被修改的目录放在这个目录下,如包括各种日志文件
/tmp tmp 是 temporary(临时)的缩写这个目录是用来存放一些临时文件的
/proc proc 是 Processes(进程)的缩写,/proc 是一种伪文件系统,它是系统内存的映射,我们可以通过直接访问这个目录来获取系统信息
/run 是一个临时文件系统,存储系统启动以来的信息。当系统重启时,这个目录下的文件应该被删掉或清除。如果你的系统上有/var/run 目录,应该让它指向/run
/sys 该文件系统是内核设备树的一个直观反映。当一个内核对象被创建的时候,对应的文件和目录也在内核对象子系统中被创建
/dev dev 是 Device(设备)的缩写,该目录下存放的是 Linux 的外部设备,在 Linux 中访问设备的方式和访问文件的方式是相同的

附注:对于 ArchLinux 系列的发行版来说,/bin、/sbin、/usr/sbin 都是指向/usr/bin 的符号链接

挂载命令

  • df _ -T :显示文件系统类型 _ -h :人性化 size * -i :显示 inode 使用情况
  • mount DEV MP
    • -a :忽略其他参数,按/etc/fstab 挂载
    • --bind :转移挂载点
    • --rbind :递归转移挂载点
    • -t :指定文件系统类型(sysfs,proc,devtmpfs,tmpfs)
    • -o
      • remount :重新挂载
      • default :默认属性
      • loop :挂载 loop 设备
      • logdev= :挂载 xfs 时指定 logdev
      • nouuid :用于挂载 LVM 快照
      • iocharset= :字符集
      • ro/rw
      • sync/async
      • atime/noatime
      • suid/nosuid
      • exec/noexec
      • userquota/grpquota/quota/noquota
  • umount

文件信息

典型的文件信息,由stat命令打印

  File: /dev/tty
  Size: 0               Blocks: 0          IO Block: 4096   character special file
Device: 6h/6d   Inode: 14344       Links: 1     Device type: 5,0
Access: (0666/crw-rw-rw-)  Uid: (    0/    root)   Gid: (    5/     tty)
Access: 2020-11-07 14:24:02.060000000 +0800
Modify: 2020-11-07 13:53:39.060000000 +0800
Change: 2020-11-07 13:53:39.060000000 +0800
信息 描述
文件名 存在于文件父目录的目录项中,文件的 inode 并不存储文件名
文件长度 只对普通文件、目录、符号链接有意义
占用块数* 该文件占用的硬盘块数,每块大小一般为 512B。因 Block 指针、文件空洞、文件对齐的原因,文件长度并不等于块数乘以块大小
最优 I/O 块大小* 提示系统以这么大小的块进行 I/O 性能最优
设备号* 标识文件所处的文件系统位置
特殊文件设备号* 标识设备类型,只有块设备与字符设备才有
Inode* 文件主 Block 的索引号,不能跨越文件系统
硬链接 即指向该文件的目录项的个数,目录项中除了存储文件名,还存储文件名对应的 Inode。
文件类型 有普通文件、目录、符号链接、套接字、pipe 或 FIFO、块设备、字符设备
文件访问权限 限制用户进程对该文件的访问
Uid 文件的拥有者。大多数更改文件元信息的操作需要进程 EUID 为文件的 Uid
Gid 文件的所有组
访问时间 上次读取该文件块内容的日期时间
修改时间 上次修改该文件块内容的日期时间
更改时间 上次更改该文件元信息的日期时间

关于硬链接

当一文件的硬链接数为 0,则说明所有目录都没有记录其 inode 位置,则该文件无法被找到,判定为已删除,这也是rm命令的原理。

若此时有进程正打开它,则该文件的 inode 还存在与内核 vnode 中,该进程仍然可以访问文件。当进程关闭 fd,内核清零 entry 和 vnode 后则 indoe 完全丢失。

自主访问控制

权限的意义

  • 对于普通文件
    • 读 :可以读取其 block 中的内容
    • 写 :可以更改其 block 中的内容
    • 执 :可以使用 exec 函数加载并执行该(程序)文件
    • SUID :执行该文件时将进程 EUID 设置为该文件的 UID
    • SGID :执行该文件时将进程 EGID 设置为该文件的 GID
  • 对于目录
    • 读 :可以读取其目录项(文件名与 i-node)
    • 写 :可以添加、删除或修改其目录项
    • 执 :可以通过该目录作为路径名中的一员访问其目录项所指向的文件
    • SGID :创建在该目录下的文件的 GID 默认为该目录的 GID
    • SBIT :创建在该目录下的文件,只有超级用户、该目录拥有者或文件的拥有者才能删除该文件

权限的判断

  1. EUID==0则直接授权读写(不包括执行)
  2. EUID==OWNER则进行适当权限判断,然后结束
  3. EGID==GROUP则进行适当权限判断,然后结束
  4. 若存在EUID的附属GID==GROUP则进行适当权限判断,然后结束
  5. 若存在 ACL 权限则进行适当权限判断
  6. 否则使用 OTHER 权限进行适当权限判断,然后结束

权限的设置

  • 对于符号链接,一般权限为777且无法更改
  • 每个进程有个 umask 标识,表示创建文件时的默认权限掩码
  • 当非 root 进程写一个普通文件时,自动清除其 SUID 与 SGID

文件的所有者

  • 默认创建
    • ONWER 为进程 EUID
    • GROUP 为进程 EGID。但若父目录设置 SGID,则 GROUP 为父目录的 GROUP
  • 主动修改
    • 普通用户只能修改文件 UID 为进程 EUID,且 EUID 必须等于 UID,超级用户随意修改
    • 普通用户只能修改文件 GID 为进程 EGID 或附属 GID 之一,超级用户随意修改

命令

  • ACL 权限 - setfacl > 设置 ACL 权限,优先级在 owner 和 group 之后 - getfacl
  • 额外属性
    • chattr

      设置文件额外属性

      • -R: 递归目录
      • 以下选项的前缀,-设置,+取消
      • a : 只能追加
      • i : 无法变更
      • A : 不更新 atime
      • S : 同步存储文件
      • d : 不被 dump
    • lsattr
  • sudo CMD

    • -u :使用目标用户权限(仅 root 可用)
    • -l :列出本用户 sudo 信息
    • -b :后台执行
  • visudo

    /etc/sudoers 与/etc/sudoers.d
    user host=(root) cmd,!cmd
    %grp host=(%root) NOPASSWD:ALL

  • su _ - :转为 root _ - user :转为 user * -c :用对应目标用户执行一条命令

  • umask
  • chmod [+- ] PERM PATH
    • -R :递归目录
  • chown OWNER:GROUP PATH * -R :递归目录

强制访问控制

自主访问控制是通过进程的用户标识来限制其对系统资源的访问; 而强制访问控制是通过进程的“强制访问特殊标识”(如 SELinux 标识)来限制进程对系统资源的访问。
 如此一来,对各个程序进程限制,可以有效防止滥用、误用超级权限。

进程管理

进程关系

会话

会话是进程组的集合

新建会话的作用:

  • 新建切断 与终端的关联,从而与原来的作业控制机制隔离

    关联后该终端成为该会话中所有进程的控制终端(/dev/tty)。

会话首进程的特点:

  • 进程组组长不能调用setsid()
  • 会话首进程未以O_NOCTTY作 oflag 调用open()打开第一个尚未关联会话的终端会将本会话与该终端关联
  • 终端挂断时终端驱动会发射信号SIGHUP给与该终端关联的会话的会话首进程
  • 会话首进程退出会发射信号SIGHUP给该会话前台进程

 那些不与终端联系,不属于用户会话的进程,即被称为 Daemon(守护进程)。 以下是编写 Daemon 时的一般流程:

  • 调用fork()后,子进程调用setsid()创建新会话并成为会话首进程

    因为调用setsid()的进程不能时进程组组长,所以要先调用fork()以保证其子进程必定非进程组组长。

  • 接下来新的会话首进程有 4 种选择:
    • 不退出父进程,则新会话仍可通过父进程与旧会话进行某种关联
    • 退出父进程,彻底成为一支 Daemon
    • 选择连接新的控制终端
    • 调用fork()后退出会话首进程进程,以保证该会话无法连接新的控制终端
  • 关闭从父进程继承而来的文件描述符
  • 更改 cwd 到根目录,防止占用而不能卸载文件系统
  • 调用 syslog 报告日志
  • 对于单例进程,利用文件锁机制确认系统中是否已存在进程副本

进程组

进程组是进程的集合

进程组的作用:

  • 方便使用信号来管理整个进程组中的进程,尤其是作业控制机制中的前台进程组与后台进程组

以下常见操作形成的进程的进程组相同:

  • fork 出的子进程与其父进程同组
  • login-shell 中的pipeline同属 shell 的一个子进程组
  • nologin-shell 中执行的所有命令与 shell 同属一个进程组

进程

进程即是程序的运行实例

父进程:

  • 可为子进程调用setpgid()
  • 可调用wait函数获取子进程状态
  • 退出可形成孤儿进程:某进程的父进程终止后,该进程成为孤儿进程,由 init 进程收养
  • 退出可形成孤儿进程组:某进程组中的所有进程的父进程没有一个是同会话中其他进程组的进程,当孤儿进程组中有停止的进程时,内核向孤儿进程组发送信号SIGHUPSIGCONT

进程环境

标注为(线程 n)表示同一进程中每个线程的有独立的该类信息, n 为 0 表示线程启动时清除该信息;n 为 1 表示继承启动该线程的线程的该信息

进程信息 说明 fork 子进程继承信息 exec 保留信息
UID, GID 进程的实际用户、用户组 1 1
EUID, EGID 进程的有效用户、有效用户组 1 0 (依赖执行文件 SUID, SGID)
SUID, SGID 进程的保留用户、保留用户组 1 0 (依赖 EUID, EGID)
附属 GID 进程有效用户加入的附属组 1 1
PID 进程 ID(内核态 PID 为线程 ID) 0 (产生新进程) 1
PPID 父进程 ID 0 (产生新进程) 1
PGID 进程组 ID 1 1
SID 会话 ID 1 1
CWD 进程当前所在目录 1 1
RTD 进程所见的“根目录” 1 1
UMASK 进程的文件权限掩码 1 1
LIMITS ulimit 资源限制 1 1
NICE(线程继承) 调度优先级,越低越优先 1 1
FD 打开的文件描述符 1 0 (依赖文件描述符 FD_CLOEXEC)
ENV 进程的环境表(环境变量) 1 0 (依赖 exec 参数)
VMEM 虚拟内存 1 0 (exec 重新加载执行程序)
SIGNAL_HANDLE 信号处理(默认、忽略、捕获) 1 0 (设置了处理函数的信号恢复默认,其余设置不变)
SIGNAL_MASK(线程继承) 信号阻塞集 1 1
SIGNAL_SET 信号接收集 0 (产生新进程) 1
ALARM alarm 定时闹钟 0 (产生新进程) 1
TIME(线程清除) 进程的 cpu_time 与 sys_time 0 (产生新进程) 1
LOCK 文件锁 0 (产生新进程) 1

信号机制

CPU 异常类型

  • 中断 :来自外设的 I/O 信号,返回下条指令

    如键盘的输入、网络数据包的到达、硬盘的读取、时钟滴答等等

  • 陷入 :程序指令的有意结果,返回下条指令

    最重要的用途便是进行系统调用

  • 故障 :若能修正则返回当前指令,否则终止程序

    如算数除零、段错误等

  • 终止 :不可回复的致命错误,直接终止程序

    一般由一般硬件错误引发

进程状态

  • 运行(R) :该进程在调度队列中
  • 可中断睡眠(S) :该进程在相应事件等待队列中
  • 不可中断睡眠(D) :该进程不响应异步信号,以保护控制流不被打断
  • 停止或跟踪(T) :停止就是进程被暂停,跟踪还不能响应 SIGCONT
  • 退出(X) :进程马上将要销毁
  • 僵尸(Z) :进程已经终止但还未被父进程回收

信号机制  CPU 的异常控制流由操作系统内核进行处理,表现到用户层时分为两种形式:系统调用与信号

 信号中断对于用户态进程是可见的(不同于 CPU 中断), 若捕获了某信号,则对该信号的处理会占用当前进程中的一个线程控制流。 若该信号与硬件故障有关,则定向占用引起该事件的线程;否则随机占用一个线程。

 由于信号是异步产生的,所以信号处理函数也会异步调用,由此产生异步安全问题。 与线程的异步安全问题不同,线程加锁阻塞后,总会有一个线程解锁并启动阻塞的线程; 而信号是占用的线程的控制流,若使用互斥锁机制,则可能锁可能一直将信号处理程序锁住, 而无法返回到上锁的那个线程,形成死锁。

 信号的处理流程:

  • 信号发射

    对于普通用户,信号只能发射给同一用户的进程,即发射进程的 UID 或 EUID 要与接收进程的 UID 或 EUID 相同。 特殊地,SIGCONT 可以发射给同一会话中的任一进程

  • 未决信号(SIGNAL_SET)

    进程已经接收到信号但还未处理,可能只是没“反应”过来,也可能信号被阻塞了

  • 信号处理

    3 中处理方式:默认(终止、暂停、继续、忽略)、主动忽略、主动处理。

编号 名称 描述 默认行为
1 SIGHUP 会话挂断,终端连接断开时发射给会话首进程 T
2 SIGINT 终端中断,一般由按键Ctrl+C发射给前台进程组,若进程阻塞或忽略该信号则不发送 T
3 SIGQUIT 终端退出,一般由按键Ctrl+\发射给前台进程组,若进程阻塞或忽略该信号则不发送 A
4 SIGILL 非法指令,执行非执行页中指令或堆栈溢出 A
5 SIGTRAP 跟踪陷入,一般用来将控制转移至调试程序 A
6 SIGABRT 异常终止,一般由程序自己引发 A
7 SIGBUS 非法地址,地址对齐问题 A
8 SIGFPE 算术异常,如整数除零 A
9 SIGKILL 强制终止进程,不可捕获 T
10 SIGUSR1 用户自定义信号 1 T
11 SIGSEGV 段错误,无效内存引用即访问未分配的地址 A
12 SIGUSR2 用户自定义信号 2 T
13 SIGPIPE 写至无读进程的管道,若进程阻塞或忽略该信号则不发送,write 函数仍调用成功 T
14 SIGALRM 定时器超时,一般由程序调用 alarm 函数来作异步计时器 T
15 SIGTERM 终止进程 T
16 SIGSTKFLT 协处理器栈故障 T
17 SIGCHLD 子进程暂停或终止,与 wait 函数相互独立,若忽略该信号则不产生僵尸进程 I
18 SIGCONT 使暂停进程继续,可发送给同一会话的任一进程而无视 UID 与 EUID 的匹配 C
19 SIGSTOP 强制停止进程,不可捕获 S
20 SIGTSTP 终端停止,一般由Ctrl+Z发射给前台进程组,若进程阻塞或忽略该信号则不发送 S
21 SIGTTIN 后台读取,后台进程试图读取终端输入,若进程阻塞或忽略该信号则不发送,但 read 函数调用失败 S
22 SIGTTOU 后台写入,后台进程试图进行终端输出,若进程阻塞或忽略该信号则不发送,write 函数仍调用成功 S
23 SIGURG 紧急 IO 数据,out-of-band 数据到达 socket 时产生 I
24 SIGXCPU 突破对 cpu 时间的限制 A
25 SIGXFSZ 突破对文件大小的限制 A
26 SIGVTALRM 虚拟定时器超时(setitimer) T
27 SIGPROF 性能分析定时器超时(弃用) T
28 SIGWINCH 终端窗口尺寸发生变化 I
29 SIGIO 异步 I/O,文件描述符准备就绪 T
30 SIGPWR 电量行将耗尽 T
31 SIGSYS 错误的系统调用 A
34~64 SIGRTMIN~SIGRTMAX 实时信号 T
默认行为 描述
T 终止
A 终止并产生 coredump
S 暂停
C 继续
I 忽略

发送信号命令

  • kill -SIG PID

    PID 为负,表示其绝对值为进程组号

  • killall -SIG Pname
    • -I :忽略大小写
  • pkill -SIG
  • -ce :显示匹配进程的数量并显示每个进程信息
  • -u :EUID
  • -U :UID
  • -G :GID
  • -P :PPID
  • -s :PSID * -t :TTY

资源限制

进程使用资源主要有两类:CPU 与 MEM CPU 使用时间

  • real:运行期间流逝的时间
  • sy :内核进程
  • us :用户进程(un-niced)
  • ni :用户进程(niced)
  • id :空闲资源
  • wa :等待 I/O
  • hi :硬中断请求服务
  • si :软中断请求服务
  • st :虚拟机偷取的时间,即虚拟 CPU 等待实际 CPU

调度优先级

  • PRI(Priority)与 NI(Nice)
    • PRI (最终值) = PRI (原始值) + NI
    • PRI 值是由内核动态调整的,用户不能直接修改,只能通过修改 NI 值来影响 PRI 值,间接地调整进程优先级
  • NI 值越小,进程的 PRI 就会降低,该进程就越优先被 CPU 处理
  • NI 范围是 -20~19。
  • 普通用户调整 NI 值的范围是 0~19,只能调整自己的进程,只能调高 NI 值,而不能降低
  • 只有 root 用户才能设定进程 NI 值为负值,而且可以调整任何用户的进程

CGroup 机制

  • 基础组件:
    • hierarchy :/sys/fs/cgroup/*
    • cgroup :/sys/fs/cgroup//**/
  • 接口文件:
    • cgroup.clone_children :是否继承父 cgroup(默认 0)
    • cgroup.procs :加入该 cgroup 的 PID

      子进程继承父进程 CGroups(跨 fork()与 execv())

系统创建 hierarchy 后,所有进程都会加入该 hierarchy 的根 cgroup;
同一进程可同时加入多个不同 hierarchy 中的 cgroup;
新建的 cgroup 可以继承父 cgroup 的配置;

ulimit 机制

  • ulimit -a -HS > /etc/security/ulimits.d/ _ -v :进程虚拟内存最大长度 _ -l :进程调用 mlock()能锁住的最大内存 _ -l :进程最大驻留内存长度 _ -d :进程数据段最大长度 _ -s :进程栈的最大值 _ -f :进程写入文件的最大长度 _ -c :进程 core 文件最大长度 _ -q :进程 POSIX 消息队列最大长度 _ -i :进程可排队信号的最大数量 _ -n :进程同时打开文件最大数量 _ -t :进程 CPU 时间最大秒数 _ -u :实际用户可拥有的最大进程数

终端

终端在文件系统中表现为一个字符文件

终端结构

  • 终端驱动程序:

    • 利用键盘驱动程序,将键盘发送的扫描码转换成字符流,并发送给行规程处理
    • 接收行规程回传的字符流,根据 ANSI 规范将字符流渲染成图形画面(字体、颜色等),再送给屏幕打印。
  • 行规程(line discipline):

    • 接收、处理输入字符流后,并将其加入输入缓冲队列(I)供前台进程读取;
      当输入流中有特殊字符则进行特殊处理(如发射信号);
      若设置了终端回显,则会将输入字符处理后送给终端驱动程序打印。

    • 接收并处理存放进程的输出的缓冲队列(O),处理后送给终端驱动程序打印。

ANSI escape

  • 8/16/24 colors

    ${ID}:见下表

    • \033[${ID}m (普通)
    • \033[${ID};1m (粗体,高亮)
    • \033[${ID};2m (低暗)
color foreground background
black 30 40
red 31 41
green 32 32
yellow 33 33
blue 34 34
purple 35 35
cyan 36 36
white 37 37
  • 256 color

    ${fg_bg}:前景为38,背景为48
    ${ID}:0~255 见https://jonasjacek.github.io/colors/

    • \033[${fg_bg};5;${ID}m
  • true color > ${fg_bg}:前景为38,背景为48

    ${red|green|blue}:见系统调色板 * \033[${fg_bg};2;${red};${green};${blue}m

  • ansi escape
escape meaning
\e[0m 复原
\e[1m 加粗
\e[2m 低暗
\e[3m 斜体
\e[4m 下划线
\e[4:3m 下划波浪线
\e[5m 闪烁
\e[7m 反显
\e[8m 消隐
\e[9m 删除线
\e[?25l 隐藏光标

作业控制

在作业控制概念中,将连接到终端的用户会话中的进程组分为两部分,前台进程组与后台进程组。 前台进程组能输出到终端从而打印字符到屏幕,也能从终端读取用户输入。 而后台进程一般不能输出到终端也不能从终端读取输入。

信号名 说明
SIGINT 一般按键^C,发射给前台进程组,若进程阻塞或忽略该信号则不发送
SIGQUIT 一般按键为^\,发射给前台进程组,若进程阻塞或忽略该信号则不发送
SIGTSTP 一般按键为^Z,发射给前台进程组,若进程阻塞或忽略该信号则不发送
SIGTTIN 后台进程组中进程试图读取终端,发射该信号给该后台进程组,若进程阻塞或忽略该信号则不发送,但会使本次 read 调用失败。SIGPIPE 有类似机制
SIGTTOU 后台进程组中进程试图输出到终端,发射该信号给该后台进程组,若进程阻塞或忽略该信号则不发送,且 write 调用仍可成功
SIGWINCH 终端窗口尺寸发生变化,发射给前台进程组
SIGHUP 连接断开时发射给会话首进程、会话首进程终止时发射给前台进程组
SIGCONT 当对进程产生停止信号(SIGTSTP、SIGSTOP、SIGTTIN、SIGTTOU)时,清除该进程未决的 SIGCONT;反之亦然。捕获该信号并不会取消其“继续运行”的功能

作业控制命令:

  • jobs

    • -l :显示 PID
    • -r :显示 running jobs
    • -s :显示 suspended jobs
  • fg/bg %JID

伪终端

 伪终端的的结构与物理终端类似,不过终端驱动程序拆分为了主设备与从设备。 写到主设备的数据可从从设备读出,反之亦然,就像套接字一样。
 当进程打开文件/dev/ptmx时,内核产生与之配对的从设备/dev/pts/N(N 为数字)。 于是当两个进程打开配对的终端主设备与终端从设备时,就可以进行通讯了,故伪终端技术也可当作一种 IPC 技术。  但与 pipe、socket 之类的正统 IPC 不同,使用伪终端的目的主要是使用其终端行规程

伪终端用途:

  • 进程间通讯,对等进程的输入与输出针对终端会有特殊处理
  • 进程间通讯,强制对等进程程使用的标准流进程行缓冲(相对管道为全缓冲而可能导致死锁)
  • 终端模拟器
  • 远程终端
  • stty _ -a :查看标准输入连接的终端的所有设置,可通过重定向更改查看的终端 _ -flag :关闭终端标识 flag * flag :开启终端标识 flag

更多终端信息见Linux 系统接口