实例讲解Linux内核信号SIGIO的使用

一口Linux

    一、信号
    1. 基本概念
    信号是在软件层次上对中断机制的一种模拟,在原理上,一个进程收到一个信号与处理器收到一个中断请求可以说是一样的。信号是异步的,一个进程不必通过任何操作来等待信号的到达,事实上,进程也不知道信号到底什么时候到达。
    例如键盘输入中断按键(^C),它的发生在程序执行过程中是不可预测的。
    信号是进程间通信机制中唯一的异步通信机制,可以看作是异步通知,通知接收信号的进程有哪些事情发生了。
    硬件异常也能产生信号,例如被零除、无效内存引用(test里产生的就是这种错误)等。这些条件通常先由内核硬件检测到,然后通知内核。内核将决定产生什么样的信号。
    同一个信号的额外发生通常不会被排队。如果信号在被阻塞时发生了5次,当我们反阻塞这个信号时,这个信号的信号处理函数通常只被调用一次。
    同一时刻只能处理一个信号,在信号处理函数发信号给自己时,该信号会被pending。
    信号的数值越小,则优先级越高。当进程收到多个待处理信号时,总是先处理优先级别高的信号。
    信号处理函数的栈可以使用被中断的也可以使用独立的,具体可以通过系统调用设置。
    信号机制经过POSIX实时扩展后,功能更加强大,除了基本通知功能外,还可以传递附加信息。
    2. 处理方式
    忽略:接收到信号后不做任何反应。捕获:用自定义的信号处理函数来执行特定的动作。默认:接收到信号后按系统默认的行为处理该信号。这是多数应用采取的处理方式。
    二、Linux下的信号类型
    使用kill -l就会显示出linux支持的信号列表。
    
    其中列表中,编号为1 ~ 31的信号为传统UNIX支持的信号,是不可靠信号(非实时的),编号为32 ~ 63的信号是后来扩充的,称做可靠信号(实时信号)。不可靠信号和可靠信号的区别在于前者不支持排队,可能会造成信号丢失,而后者不会。
    下面我们对编号小于SIGRTMIN的信号进行讨论(下面的编号 依次对应信号 的数值为1 - 31)。
    1) SIGHUP
    本信号在用户终端连接(正常或非正常)结束时发出, 通常是在终端的控制进程结束时, 通知同一session内的各个作业, 这时它们与控制终端不再关联。
    登录Linux时,系统会分配给登录用户一个终端(Session)。在这个终端运行的所有程序,包括前台进程组和后台进程组,一般都 属于这个 Session。当用户退出Linux登录时,前台进程组和后台有对终端输出的进程将会收到SIGHUP信号。这个信号的默认操作为终止进程,因此前台进 程组和后台有终端输出的进程就会中止。不过可以捕获这个信号,比如wget能捕获SIGHUP信号,并忽略它,这样就算退出了Linux登录,wget也 能继续下载。
    此外,对于与终端脱离关系的守护进程,这个信号用于通知它重新读取配置文件。
    2) SIGINT
    程序终止(interrupt)信号, 在用户键入INTR字符(通常是Ctrl-C)时发出,用于通知前台进程组终止进程。
    3) SIGQUIT
    和SIGINT类似, 但由QUIT字符(通常是Ctrl-)来控制. 进程在因收到SIGQUIT退出时会产生core文件, 在这个意义上类似于一个程序错误信号。
    4) SIGILL
    执行了非法指令. 通常是因为可执行文件本身出现错误, 或者试图执行数据段. 堆栈溢出时也有可能产生这个信号。
    5) SIGTRAP
    由断点指令或其它trap指令产生. 由debugger使用。
    6) SIGABRT
    调用abort函数生成的信号。
    7) SIGBUS
    非法地址, 包括内存地址对齐(alignment)出错。比如访问一个四个字长的整数, 但其地址不是4的倍数。它与SIGSEGV的区别在于后者是由于对合法存储地址的非法访问触发的(如访问不属于自己存储空间或只读存储空间)。
    8) SIGFPE
    在发生致命的算术运算错误时发出. 不仅包括浮点运算错误, 还包括溢出及除数为0等其它所有的算术的错误。
    9) SIGKILL
    用来立即结束程序的运行. 本信号不能被阻塞、处理和忽略。如果管理员发现某个进程终止不了,可尝试发送这个信号。
    10) SIGUSR1
    留给用户使用
    11) SIGSEGV
    试图访问未分配给自己的内存, 或试图往没有写权限的内存地址写数据.
    信号 11,即表示程序中可能存在特定条件下的非法内存访问。
    12) SIGUSR2
    留给用户使用
    13) SIGPIPE
    管道破裂。这个信号通常在进程间通信产生,比如采用FIFO(管道)通信的两个进程,读管道没打开或者意外终止就往管道写,写进程会收到SIGPIPE信号。此外用Socket通信的两个进程,写进程在写Socket的时候,读进程已经终止。
    14) SIGALRM
    时钟定时信号, 计算的是实际的时间或时钟时间. alarm函数使用该信号.
    15) SIGTERM
    程序结束(terminate)信号, 与SIGKILL不同的是该信号可以被阻塞和处理。通常用来要求程序自己正常退出,shell命令kill缺省产生这个信号。如果进程终止不了,我们才会尝试SIGKILL。
    17) SIGCHLD
    子进程结束时, 父进程会收到这个信号。
    如果父进程没有处理这个信号,也没有等待(wait)子进程,子进程虽然终止,但是还会在内核进程表中占有表项,这时的子进程称为僵尸 进程。这种情 况我们应该避免(父进程或者忽略SIGCHILD信号,或者捕捉它,或者wait它派生的子进程,或者父进程先终止,这时子进程的终止自动由init进程 来接管)。
    18) SIGCONT
    让一个停止(stopped)的进程继续执行. 本信号不能被阻塞. 可以用一个handler来让程序在由stopped状态变为继续执行时完成特定的工作. 例如, 重新显示提示符
    19) SIGSTOP
    停止(stopped)进程的执行. 注意它和terminate以及interrupt的区别:该进程还未结束, 只是暂停执行. 本信号不能被阻塞, 处理或忽略.
    20) SIGTSTP
    停止进程的运行, 但该信号可以被处理和忽略. 用户键入SUSP字符时(通常是Ctrl-Z)发出这个信号
    21) SIGTTIN
    当后台作业要从用户终端读数据时, 该作业中的所有进程会收到SIGTTIN信号. 缺省时这些进程会停止执行.
    22) SIGTTOU
    类似于SIGTTIN, 但在写终端(或修改终端模式)时收到.
    23) SIGURG
    有"紧急"数据或out-of-band数据到达socket时产生.
    24) SIGXCPU
    超过CPU时间资源限制. 这个限制可以由getrlimit/setrlimit来读取/改变。
    25) SIGXFSZ
    当进程企图扩大文件以至于超过文件大小资源限制。
    26) SIGVTALRM
    虚拟时钟信号. 类似于SIGALRM, 但是计算的是该进程占用的CPU时间.
    27) SIGPROF
    类似于SIGALRM/SIGVTALRM, 但包括该进程用的CPU时间以及系统调用的时间.
    28) SIGWINCH
    窗口大小改变时发出.
    29) SIGIO
    文件描述符准备就绪, 可以开始进行输入/输出操作.
    30) SIGPWR
    Power failure
    31) SIGSYS
    非法的系统调用。
    三、 信号行为说明
    不通的信号在不同的标准下,功能有所差别,下面列出主要的信号的默认行为和说明:
    名称数字标准默认行为说明SIGILL4ANSI终止+coredump执行了非法指令. 通常是因为可执行文件本身出现错误, 或者试图执行数据段. 堆栈溢出时也有可能产生这个信号SIGABRT6ANSI终止+coredump调用abort函数生成的信号SIGBUS74.2 BSD终止+coredump非法地址, 包括内存地址对齐(alignment)出错。比如访问一个四个字长的整数, 但其地址不是4的倍数。它与SIGSEGV的区别在于后者是由于对合法存储地址的非法访问触发的(如访问不属于自己存储空间或只读存储空间)SIGFPE8ANSI终止+coredump在发生致命的算术运算错误时发出. 不仅包括浮点运算错误, 还包括溢出及除数为0等其它所有的算术的错误SIGSEGV11ANSI终止+coredump试图访问未分配给自己的内存, 或试图往没有写权限的内存地址写数据。访问空指针,野指针基本都产生这个信号,也是最常见的信号SIGSTKFLT16N/A终止堆栈错误SIGPIPE13POSIX终止管道破裂。这个信号通常在进程间通信产生,比如采用FIFO(管道)通信的两个进程,读管道没打开或者意外终止就往管道写,写进程会收到SIGPIPE信号。
    此外用Socket通信的两个进程,写进程在写Socket的时候,读进程已经终止SIGTRAP5POSIX终止+coredump由断点指令或其它trap指令产生. 由debugger使用SIGHUP1POSIX终止用户终端连接(正常或非正常)结束时发出, 通常是在终端的控制进程结束时, 通知同一session内的各个作业, 这时它们与控制终端不再关联SIGINT2ANSI终止程序终止(interrupt)信号, 在用户键入INTR字符(通常是Ctrl-C)时发出,用于通知前台进程组终止进程SIGQUIT3POSIX终止+coredump和SIGINT类似, 但由QUIT字符(通常是Ctrl-)来控制. 进程在因收到SIGQUIT退出时会产生core文件, 在这个意义上类似于一个程序错误信号SIGKILL9POSIX终止用来立即结束程序的运行. 本信号不能被阻塞、捕获和忽略。如果管理员发现某个进程终止不了,可尝试发送这个信号SIGCHLD17POSIX忽略子进程结束时, 父进程会收到这个信号。如果父进程没有处理这个信号,也没有等待(wait)子进程,子进程虽然终止,但是还会在内核进程表中占有表项,这时的子进程称为僵尸进程。
    这种情 况我们应该避免(父进程或者忽略SIGCHILD信号,或者捕捉它,或者wait它派生的子进程,或者父进程先终止,这时子进程的终止自动由init进程来接管)SIGCONT18POSIX继续/忽略让一个停止(stopped)的进程继续执行. 本信号不能被阻塞 . 可以用一个handler来让程序在由stopped状态变为继续执行时完成特定的工作. 例如, 重新显示提示符..在进程挂起时是继续,否则是忽略SIGSTOP19POSIX暂停暂停进程的执行. 注意它和terminate以及interrupt的区别:该进程还未结束, 只是暂停执行. 本信号不能被阻塞、捕获或忽略SIGALRM14POSIX终止时钟定时信号, 计算的是实际的时间或时钟时间. alarm函数使用该信号四、信号分类
    在以上列出的信号中,程序不可捕获、阻塞或忽略的信号有:
    SIGKILL,SIGSTOP
    不能恢复至默认动作的信号有:
    SIGILL,SIGTRAP
    默认会导致进程流产的信,有:
    SIGABRT,SIGBUS,SIGFPE,SIGILL,SIGIOT,SIGQUIT,SIGSEGV,SIGTRAP,SIGXCPU,SIGXFSZ
    默认会导致进程退出的信号有:
    SIGALRM,SIGHUP,SIGINT,SIGKILL,SIGPIPE,SIGPOLL,SIGPROF,SIGSYS,SIGTERM,SIGUSR1,SIGUSR2,SIGVTALRM
    默认会导致进程停止的信号有:
    SIGSTOP,SIGTSTP,SIGTTIN,SIGTTOU
    默认进程忽略的信号有:
    SIGCHLD,SIGPWR,SIGURG,SIGWINCH
    此外,SIGIO在SVR4是退出,在4.3BSD中是忽略;
    SIGCONT在进程挂起时是继续,否则是忽略,不能被阻塞
    终止程序的时候在不得已的情况下不能用SIGKILL,因为SIGKILL不会对子进程进行处理,只是把对自己进行处理。
    五、信号驱动IO-SIGIO-29
    下面我们主要讲SIGIO-29的使用。
    
    参考上图:
    时刻1 通过sigaction系统调用建立信号SIGIO的信号处理函数,该函数壶立即返回,注意,对应的驱动必须支持方法.fastnc时刻2 数据此时没有准备好,应进程会继续执行,而内核会继续等待数据,也就是说等待数据阶段应用进程是非阻塞的。时刻3 内核准备好了数据,要向应用进程复制数据,通过函数kill_fasync()向应用程序递交SIGIO信号,二应用程序的信号处理程序会被调用到,在该函数中我们可以通过read等系统调用从内核赋值程序到进程时刻4 在赋值数据期间,进程阻塞时刻5 数据复制完成,会返回成功的指示,应用程序可以继续处理数据
    信号驱动 I/O 的 CPU 利用率很高,因为在图中,等待数据的那段时间2,应用程序可以继续执行其他操作。
    六、程序实现
    1. 信号注册函数signal()#include
    功能:
    给信号signum注册处理函数,函数原型是void (*sighandler_t)(int)
    当收到信号signum后,就会调用注册的函数
    参数:
    int signum  信号值
    sighandler_t handler  信号处理函数
    2.内核函数void kill_fasync(struct fasync_struct **fp, int sig, int band)
    功能:
    发送信号sig给进程,通知进程是可读还是可写,由band给出
    POLLIN    :可读
    POLLOUT:可写
    通用字符设备的.fasync方法,一般都是固定的写法,我们暂时可以不用关心他的原理,会用即可,具体写法如下:
    static ssize_t hello_write (struct file *filep, const char __user *buf, size_t size, loff_t *pos)
    {
     int error;
    …………
     kill_fasync(&hello_fasync,SIGIO,POLLIN);
     return size;
    }
    static struct file_operations hello_ops =
    {
    …………
     .fasync = hello_fasync_func,
    };
    2. 源程序
    驱动程序:hello.c
     
     *公众号:一口Linux
     *2021.6.21
     *version: 1.0.0
    #include
    write.c
     
     *一口Linux
     *2021.6.21
     *version: 1.0.0
    #include
    test.c
     
     *公众号:一口Linux
     *2021.6.21
     *version: 1.0.0
    #include
    编译
    make
    gcc test.c -o run
    gcc write.c -o run
    执行:
    insmod hello.ko
    先开启一个终端 ,执行
    ./run
    再开启一个终端 ,执行
    ./w
    执行结果如下:
    
    可以看到,写入数据后,信号处理程序被调用到,并且打印出信号的值29,同时从驱动力读取出数据。
    本例以字符设备为基础来实现,详细原理,请参考博主其他文章。