误碰键盘导致代码错误怎么办?结构体中指针类型了解一下

道哥分享

    一、前言
    昨天在编译代码的时候,之前一直OK的一个地方,却突然出现了好几个 Warning!
    本着强迫症要消灭一切警告的做法,最终定位到:是结构体内部, 指向结构体类型的指针成员变量导致的问题。
    这个问题,也许永远不会碰到,之所以被我赶上了,应该是因为某个时候手贱, 误碰了键盘导致。
    下面一一道来。
    PS: 我的测试环境是 Ubuntu16.04-64,编译器使用系统自带的 gcc-5.4.0。
    二、问题描述
     1. 正常的代码
    比较简单:结构体 struct _Data2_ 的第 2 个成员变量是一个指针,指向的数据类型是结构体 struct _Data1_。
    typedef struct _Data1_
    {
        int a;
    }Data1;
    typedef struct _Data2_
    {
        int b;
        struct _Data1_ *next;
    }Data2;
    int main()
    {
        Data1 d1 = {1};
        Data2 d2 = {2, &d1};
        printf("d1 = %p ", &d1);
        printf("d2 = %p ", &d2);
    }
    编译、执行,都没有问题:
    $ gcc main.c -m32  -o main
    $ ./main
    d1 = 0xffdc72f0
    d2 = 0xffdc72f4
    2. 错误的代码
    现在我们来模拟误碰键盘操作,把 struct _Data2_ 中 next 成员指向的数据类型,改为一个 不存在的结构体:
    typedef struct _Data2_
    {
        int b;
        struct _Data3_ *next;
    }Data2;
    在测试代码中,struct _Data3_  肯定是不存在的。
    好了,现在执行编译指令 gcc main.c -m32  -o main,将会得到什么结果?
    可以停下来稍微 思考一下。
    我之前的预期是:gcc 会 报错,找不到 struct _Data3_ 这个类型。
    实际情况是:
    $ gcc main.c -m32  -o main -I./
    main.c: In function ‘main’:
    main.c:18:20: warning: initialization from incompatible pointer type [-Wincompatible-pointer-types]
         Data2 d2 = {2, &d1};
                        ^
    main.c:18:20: note: (near initialization for ‘d2.next’)
    $ ./main
    d1 = 0xffd8ee70
    d2 = 0xffd8ee74
    好神奇吧, gcc 居然不报错!那么我们就按照 gcc 的方式来理解一下。
    我们知道,编译器在遇到一个结构体类型的时候,最重要的就是需要知道结构体类型 所占据的内存空间的大小。
    gcc 在遇到 struct _Data2_ 这个字符串时,判断出它是一个用户自定义的数据类型:结构体 _Data2。
    gcc 继续读取结构体内部的每一个字符,在读取到 *next 时,知道它是一个 指针。
    此时它并并没确认该指针所指向的数据类型是否存在,它只是为 next 保留了  4 个字节的内存空间(32位系统)。
    然后 gcc 在解析 Data2 d2 = {2, &d1}; 这一行时,就发现 类型不匹配了:data2 的 next 需要的是 struct _Data3_ 类型的指针,但是赋值的 d1 是 struct _Data1_ 类型,于是给出警告信息。
    我们用其他的编译器试一下:
    (1) clang
    $ clang main.c -m32  -o main -I./
    main.c:18:20: warning: incompatible pointer types initializing 'struct _Data3_ *' with an expression of type 'Data1 *'
          (aka 'struct _Data1_ *') [-Wincompatible-pointer-types]
        Data2 d2 = {2, &d1};
                       ^~~
    1 warning generated.
    $ ./main
    d1 = 0xffb1b3a0
    d2 = 0xffb1b398
    (2) g++
    $ g++ main.c -m32  -o main -I./
    main.c: In function ‘int main()’:
    main.c:18:23: error: cannot convert ‘Data1* {aka _Data1_*}’ to ‘_Data3_*’ in initialization
         Data2 d2 = {2, &d1};
    看起来,只有 g++ 进一步确认了 _Data3_ 这个结构体类型不存在!
    三、把类型改为 void 指针类型
    把 struct _Data2_ 中的 next 成员,改为 指向 void 型的指针,然后在 main 函数中操作它。
    typedef struct _Data1_
    {
        int a;
    }Data1;
    typedef struct _Data2_
    {
        int b;
        void *next;
    }Data2;
    int main()
    {
        Data1 d1 = {1};    
        Data2 d2 = {2, &d1};
        Data1 *dn = d2.next;
        printf("dn->a = %d ", dn->a);
    }
    编译、执行:
    $ gcc main.c -m32  -o main -I./
    $ ./main
    dn->a = 1
    可以看到:Data1 *dn = d2.next; 这一行把指向 void 型的 d2.next 赋值给指向Data1型的指针变量 dn,然后在 printf 语句中可以正确地打印出dn中的成员变量a。
    这又回到了指针的本质: 指针就是一个地址,至于如何来解释这个地址中的内容,这是由定义这个指针时所指定的数据类型来决定的
    结合代码来看:虽然d2.next是一个 void 型指针,但是它的确存储了一个 地址(变量 d1 的地址)。然后把这个地址赋值给dn 指针,那么通过dn指针来操作该地址内的成员时,就取决于在定义dn时所指定的数据类型(Data1),因此 dn->a 就可以正确的从这个地址中取出前 4 个字节,然后作为一个int型的数据打印出来。
    以上代码,如果使用clang来编译,结果也是正确的。
    用g++编译,继续报错:
    $ g++ main.c -m32  -o main -I./
    main.c: In function ‘int main()’:
    main.c:23:20: error: invalid conversion from ‘void*’ to ‘Data1* {aka _Data1_*}’ [-fpermissive]
         Data1 *dn = d2.next;
    如果想让这个错误消除掉,在指针赋值时, 强制转换一下即可(把void型指针强转成Data1型指针,然后再赋值):
    Data1 *dn = (Data1 *)d2.next;
    四、总结
    这里描述的错误,几乎很少遇到,除非是像我一样误碰了键盘。
    不过,从中我们也看到了一个现象:gcc编译器在面对结构体时,主要关心的是结构体在内存空间中所占用的空间大小,对其内部指向结构体类型的指针,并没有严格的检查是否存在,g++ 在这一点就做的严谨一些了。