C语言易错点汇总

无特殊说明情况下,下面所有题s目都是linux下的32位C程序。


1、计算以下sizeof的值。

char str1[] = {'a', 'b', 'c', 'd', 'e'};
char str2[] = "abcde";
char *ptr = "abcde";
char book[][80]={"计算机应用基础","C语言","C++程序设计","数据结构"};

sizeof(str1)=?   
sizeof(str2)=? 
sizeof(ptr)=?
sizeof(book)=?
sizeof(book[0])=?

分析:

sizeof(str1)=5,就是5 * sizeof(char)=5;

sizeof(str2)=6,字符串都是以'\0'结尾,所以所占字节数为6;

sizeof(ptr)=4,ptr是一个指针,在32位平台上大小为4字节;

sizeof(book)=320,book是一个二维数组,4 * 80 * 1

sizeof(book[0])=80,book[0]是第一维数组,因为此80 * 1

根据sizeof求数组元素的个数也很简单,拿第一个来说,就是sizeof(str1)/sizeof(char)。

2、上面是求计算他们所占字节数,下面来看看怎么求字符串或数组的实际长度。计算下面strlen值。

char  arryA[] = {'a','b','c','\0','d','e'};
char  arryB[] = {'a','b','c','d','e'};
char  arryC[6] = {'a','b','c','d','e'};
char *str = "abcde";

分析:

strlen(arryA) = 3,strlen遇到'\0'就会返回,无论后面有多少个字符;

strlen(arryB)长度无法确定,没有人为写入‘\0’,strlen会继续计算直到找到结束符,结果未知;

strlen(arryC)=5,指定了数组大小,编译器会自动在空余地方添加'\0',这其实跟char arryC[6] = {'a','b','c','d','e','\0'};等价。

strlen(str) = 5,不包括结尾的'\0'。

由以上两个我们来看看strlen和sizeof的区别:

(1)、sizeof是C语言中的一个单目运算操作符,类似++、--等;

  用于数据类型,sizeof(type),比如sizeof(int)
  用于变量,sizeof(var_name)
注意:sizeof不能用于函数类型、不完全类型或位字段。不完全类型是指具有未知存储大小的数据类型,比如未知存储大小的数组类型、未知内容的结构体或联合类型,void类型等。例如: sizeof(max),若此时变量max定义为int max(); sizeof(char_v),此时char_v定义为char char_v[MAX]且MAX未知。

(2)、strlen是个函数,其原型为unsigned int strlen(char *s);

   streln的计算必须依赖字符序列中的'\0',通过该字符来判断字符序列是否结束。对于int arryB[] = {'a','b','c','d','e'};无法使用strlen函数,因为该函数只接受char型。

3、忽悠人的char str[]和char *str

(1)下面的操作合法么?出错的话,会是在那个阶段?编译时期还是运行时期?

char str[] = "hello";
str[0] = 's';     //合法么

char *str = "hello";
p[0] = 's';      //合法么

分析:

这两个都可以成功编译,只是第二个会在运行时期出现段错误。下面来分析一下:

首先"hello"是一个字符串常量,存储在静态数据区域(data段),这是在编译时期就确定的。第一个是将字符串常量赋值给了一个变量(全局变量在数据段,局部变量在栈区),实际上是将字符串常量拷贝到了变量内存中,因此修改的只是str[]这个变量的值。

第二个是将字符串常量的首地址赋值给p,对p操作就是对字符串常量进行修改!因此出现了段错误。

(2)理解了上面的知识,判断一下下面的true or false?

char str1[] = "abc";
char str2[] = "abc";

const char str3[] = "abc";
const char str4[] = "abc";

const char *str5 = "abc";
const char *str6 = "abc";

char *str7 = "abc";
char *str8 = "abc";

cout << ( str1 == str2 ) << endl;
cout << ( str3 == str4 ) << endl;
cout << ( str5 == str6 ) << endl;
cout << ( str7 == str8 ) << endl;

分析:

结果是: 0 0 1 1

先理解str1,str2,str3,str4,他们是什么?他们是数组名,也就是数组首元素的地址!”str1 == str2“本质就是比较两个数组的地址是不是相同。上面我们说过,编译器给他们分配了新的存储空间来对字符串"abc"进行拷贝,这些变量在内存里是相互独立的,因此他们的地址肯定不同!

再理解str5,str6,str7,str8,他们是什么?他们是指针,他们的值就是字符串常量的地址!它们都指向“abc"所在的静态数据区,所以他们都相等。

(3)更深一步:下面程序有问题么?有的话问题出在哪里?如何修改?

#include <stdio.h>

char *returnStr()
{
   char p[]="hello world!";
   return p;
}
int main()
{
   char *str = NULL;
   str = returnStr();
   printf("%s\n", str);
   return 0;
}

分析:

p是个局部变量,只是把字符串"hello word!"进行了拷贝,该局部变量是存放在栈中的,当函数退出时,栈被清空,p会被释放,因此返回的是一个已经被释放的内存地址,这样做是错误的。

可以进行如下修改:

#include <stdio.h>

char *returnStr()
{
   char *p = "hello world!";
   return p;
}

int main()
{
   char *str = NULL;
   str = returnStr();
   printf("%s\n", str);
   return 0;
}

这么写就不会有问题了,因为"hello world!"存放在静态数据区,将该区的首地址赋值给指针p并返回,即使returnStr函数退出,也不会对字符串常量所在的内存进行回收,因此可以访问该字符串常量。

当然了,也可以这么修改:

#include <stdio.h>

char *returnStr()
{
   static char p[] = "hello world!";
   return p;
}

int main()
{
   char *str = NULL;
   str = returnStr();
   printf("%s\n", str);
   return 0;
}

使用关键字static,static修饰的局部变量也会放在data段,即使returnStr函数退出,也不会收回该内存空间。
static修饰局部变量可以延长该变量的生存周期(存放在data段)。

4、数组作为函数参数传递

我们往往会把数组当做函数的入参,看看下面的函数有啥问题:

int func(int a[])
{  
    int n = sizeof(a)/sizeof(int);  
    for(int i=0;i<n;i++)
 {  
        printf("%d ",a[i]);  
        a[i]++;  
    }  
}  

结果却发现n的值总是1!为什么会这样呢?这是因为在C中,将数组传递给一个函数时,无法按值传递,而是会自动退化为指针。下面的三种写法其实是等价的:

"int func(int a[20]);" 等价于 "int func(int a[]);" 等价于 "int func(int *a);"。

5、两数交换的那些坑

下面代码想实现两数交换,有什么问题么?

void swap(int* a, int* b)  
{  
    int *p;  
    p = a;  
    a = b;  
    b = p;  
} 

分析:

程序在运行到调用函数时,会将参数压栈,并为之分配新的空间,此时传递进来的其实是一个副本,如下图所示:

a的值跟b的值都是地址,交换a和b的值,只是把两个地址交换了而已,也就说只是改变了副本的地址而已,地址所指向的对象并没有改变!。

正确的方法应该是这样的:

void swap(int* a, int* b)  
{  
    int tmp;  
    tmp = *a;  
    *a = *b;  
    *b = tmp;  
} 

a和b虽然也是副本,但是在函数内部通过该地址直接修改了对象的值,对应的实参就跟着发生了变化。

其实,指针传递和值传递的本质都是值传递,值传递是传递了要传递变量的一个副本。复制完后,实参的地址和形参的地址没有任何联系,对形参地址的修改不会影响到实参,但是对形参地址所指向对象的修改却能直接反映在实参中,这是因为形参所指向的对象就是实参的对象。正因如此,我们在传递指针作为参数时,要用const进行修饰,就是为了防止形参地址被意外修改。

6、函数参数为指针应小心

下面的代码有什么问题?运行结果会怎么样?

void GetMem(char *p)
{
    p = (char*)malloc(100);   
}

void main()
{
    char *str = NULL;
    GetMem(str);
    strcpy(str, "hello word!");
    printf(str);
}

分析:
程序崩溃。在上面已经分析过了,传递给GetMem函数形参的只是一个副本,修改形参p的地址对实参str丝毫没有影响。所以str还是那个str,仍为NULL,这时将字符串常量拷贝到一个空地址,必然引发程序崩溃。下面的方法可以解决这个问题:

void GetMem(char **p)
{
    *p = (char*)malloc(100);   
}

void main()
{
    char *str = NULL;
    GetMem(&str);
    strcpy(str, "hello word!");
    printf(str);
    free(str);   //不free会引起内存泄漏
}

看似有点晦涩,其实很好理解。本质上是让指针变量str指向新malloc内存的首地址,也就是把该首地址赋值给指针变量str。前面我们说过,指针传递本质上也是值传递,要想在子函数修改str的值,必须要传递指向str的指针,因此子函数要传递的是str的地址,这样通过指针方式修改str的值,将malloc的内存首地址赋值给str。

7、数组指针的疑惑
(1)说出下面表达式的含义?

int *p1[10];
int (*p2)[10];

第一个是指针数组,首先他是一个数组,数组的元素都是指针。
第二个是数组指针,首先他是一个指针,它指向一个数组。
如下图所示:

(2)写出下面程序运行的结果

int a[5] = { 1, 2, 3, 4, 5 };  
int *ptr = (int *)(&a + 1);  
printf("%d,%d", *(a + 1), *(ptr - 1)); 

分析:

答案是2,5。本题的关键是理解指针运算,”+1“就是偏移量的问题:一个类型为T的指针移动,是以sizeof(T)为单位移动的。

a+1:在数组首元素地址的基础上,偏移一个sizeof(a[0])单位。因此a+1就代表数组第1个元素,为2;

&a+1:在数组首元素的基础上,偏移一个sizeof(a)单位,&a其实就是一个数组指针,类型为int(*)[5]。因此&a+1实际上是偏移了5个元素的长度,也就是a+5;再看ptr是int*类型,因此"ptr-1"就是减去sizeof(int*),即为a[4]=5;

a是数组首地址,也就是a[0]的地址,a+1是数组下一个元素的地址,即a[1]; &a是对象的首地址,&a+1是下一个对象的地址,即a[5]。

8、二级指针疑问
给定声明 const char * const *pp;下列操作或说明正确的是?
(A)pp++  (B)(*pp)++  (C)(**pp)=\c\;  (D)以上都不对

分析:

答案是A。

先从一级指针说起吧:
(1)const char p : 限定变量p为只读。这样如p=2这样的赋值操作就是错误的。
(2)const char *p: p为一个指向char类型的指针,const只限定p指向的对象为只读。这样,p=&ap++等操作都是合法的,但如*p=4这样的操作就错了, 因为企图改写这个已经被限定为只读属性的对象。
(3)char *const p: 限定此指针为只读,这样p=&ap++等操作都是不合法的。而*p=3这样的操作合法,因为并没有限定其最终对象为只读。
(4)const char *const p:两者皆限定为只读,不能改写。

再来看二级指针问题:
(1)const char **p : p为一个指向指针的指针,const限定其最终对象为只读,显然这最终对象也是为char类型的变量。故像**p=3这样的赋值是错误的, 而像*p=? p++这样的操作合法。
(2)const char * const *p :限定最终对象和 p指向的指针为只读。这样 *p=?的操作也是错的,但是p++这种是合法的。
(3)const char * const * const p:全部限定为只读,都不可以改写

9、关于*p++、 (*p)++、 *++p、 ++*p的区别
假如有下面的代码:

    int a[5]={1, 2, 3, 4, 5};
    int *p = a;

分析下面的区别:
1) *p++

        cout << *p++;   // 结果为 1
        cout <<(*p++);  // 1,先取指针p指向的值(数组第一个元素1),再将指针p自增1;

2)(*p)++

        cout << (*p)++;  // 1
        cout <<((*p)++)  // 2,先取指针p指向的值(数组第一个元素1),再将该值自增1(数组第一个元素变为2

3)*++p

        cout << *++p;  // 2
        cout <<(*++p)  // 2,先将指针p自增1(此时指向数组第二个元素),* 操作再取出该值

4)++*p

       cout <<++*p;     // 2    
       cout <<(++*p)  // 2,先取指针p指向的值(数组第一个元素1),再将该值自增1(数组第一个元素变为2)

10.多线程修饰的变量为什么要用volatile修饰?
volatile的作用是告知编译器,它修饰的变量随时都可能被改变,因此,编译后的程序每次在使用该变量的值时,都会从变量的地址中读取数据,而不是从寄存器中获取。
在多线程环境下,每个线程都有一个独立的寄存器,用于保存当前执行的指令。假设我们定义了一个全局变量,每个线程都会访问这个全局变量,这时候线程的寄存器可能会存储全量变量的当前值用于后续的访问。当某个线程修改了全局变量的值时,系统会立即更新该线程寄存器中对应的值,其他线程并不知道这个全局变量已经修改,可能还是从寄存器中获取这个变量的值,这个时候就会存在不一致的情况。


参考博客:
1、C语言中sizeof 与strlen 区别
2、常量字符串为什么位于静态存储区?
3、值传递、指针传递、引用传递的区别
4、牛客网mlc答案