1、什么是sizeof
sizeof不是一個函數,sizeof是一元操作符,sizeof更像一個特殊的宏,它是在編譯階段求值的。
舉個例子:
cout<<sizeof(int)<<endl; // 32位機上int長度為4
cout<<sizeof(1==2)<<endl; // == 操作符返回bool類型,相當于 cout<<sizeof(bool)<<endl;
在編譯階段已經被翻譯為:
cout<<4<<endl;
cout<<1<<endl;
這里有個陷阱,看下面的程序:
int a = 0;
cout<<sizeof(a=3)<<endl;
cout<<a<<endl;
輸出為什么是4,0而不是期望中的4,3???就在于sizeof在編譯階段處理的特性。由于sizeof不能被編譯成機器碼,所以sizeof
作用范圍內,也就是()里面的內容也不能被編譯,而是被替換成類型。=操作符返回左操作數的類型,所以a=3相當于int,而代碼也
被替換為:
int a = 0;
cout<<4<<endl;
cout<<a<<endl;
所以,sizeof是不可能支持鏈式表達式的,這也是和一元操作符不一樣的地方。
結論:不要把sizeof當成函數,也不要看作一元操作符,把他當成一個特殊的編譯預處理。
2、sizeof的用法
sizeof有兩種用法:
(1)sizeof(object)
也就是對對象使用sizeof,也可以寫成sizeof object 的形式
(2)sizeof(typename)
也就是對類型使用sizeof,注意這種情況下寫成sizeof typename是非法的。下面舉幾個例子說明一下:
int i = 2;
cout<<sizeof(i)<<endl; // sizeof(object)的用法,合理
cout<<sizeof i<<endl; // sizeof object的用法,合理
cout<<sizeof 2<<endl; // 2被解析成int類型的object, sizeof object的用法,合理
cout<<sizeof(2)<<endl; // 2被解析成int類型的object, sizeof(object)的用法,合理
cout<<sizeof(int)<<endl;// sizeof(typename)的用法,合理
cout<<sizeof int<<endl; // 錯誤!對于操作符,一定要加()
可以看出,加()是永遠正確的選擇。
結論:不論sizeof要對誰取值,最好都加上()。
3、數據類型的sizeof
(1)C++固有數據類型
32位C++中的基本數據類型,也就char,short int(short),int,long int(long),float,double, long double
大小分別是:1,2,4,4,4,8, 10。
考慮下面的代碼:
cout<<sizeof(unsigned int) == sizeof(int)<<endl; // 相等,輸出 1
unsigned影響的只是最高位bit的意義,數據長度不會被改變的。
結論:unsigned不能影響sizeof的取值。
(2)自定義數據類型
typedef可以用來定義C++自定義類型?紤]下面的問題:
typedef short WORD;
typedef long DWORD;
cout<<(sizeof(short) == sizeof(WORD))<<endl; // 相等,輸出1
cout<<(sizeof(long) == sizeof(DWORD))<<endl; // 相等,輸出1
結論:自定義類型的sizeof取值等同于它的類型原形。
(3)函數類型
考慮下面的問題:
int f1(){return 0;};
double f2(){return 0.0;}
void f3(){}
cout<<sizeof(f1())<<endl; // f1()返回值為int,因此被認為是int
cout<<sizeof(f2())<<endl; // f2()返回值為double,因此被認為是double
cout<<sizeof(f3())<<endl; // 錯誤!無法對void類型使用sizeof
cout<<sizeof(f1)<<endl; // 錯誤!無法對函數指針使用sizeof
cout<<sizeof*f2<<endl; // *f2,和f2()等價,因為可以看作object,所以括號不是必要的。被認為是double
結論:對函數使用sizeof,在編譯階段會被函數返回值的類型取代。
4、指針問題
考慮下面問題:
cout<<sizeof(string*)<<endl; // 4
cout<<sizeof(int*)<<endl; // 4
cout<<sizof(char****)<<endl; // 4
可以看到,不管是什么類型的指針,大小都是4的,因為指針就是32位的物理地址。
結論:只要是指針,大小就是4。(64位機上要變成8也不一定)。
順便唧唧歪歪幾句,C++中的指針表示實際內存的地址。和C不一樣的是,C++中取消了模式之分,也就是不再有
small,middle,big,取而代之的是統一的flat。flat模式采用32位實地址尋址,而不再是c中的 segment:offset模式。舉個例子,假如有
一個指向地址 f000:8888的指針,如果是C類型則是8888(16位, 只存儲位移,省略段),far類型的C指針是f0008888(32位,高位保留
段地址,地位保留位移),C++類型的指針是f8888(32位,相當于段地址*16 + 位移,但尋址范圍要更大)。
經典問題:
double* (*a)[3][6];
cout<<sizeof(a)<<endl; // 4 a為指針
cout<<sizeof(*a)<<endl; // 72 *a為一個有3*6個指針元素的數組
cout<<sizeof(**a)<<endl; // 24 **a為數組一維的6個指針
cout<<sizeof(***a)<<endl; // 4 ***a為一維的第一個指針
cout<<sizeof(****a)<<endl; // 8 ****a為一個double變量
問題解析:a是一個很奇怪的定義,他表示一個指向double*[3][6]類型數組的指針。既然是指針,所以sizeof(a)就是4。
既然a是執行double*[3][6]類型的指針,*a就表示一個double*[3][6]的多維數組類型,因此sizeof(*a)=3*6*sizeof(double*)=72
。同樣的,**a表示一個double*[6]類型的數組,所以sizeof(**a)=6*sizeof (double*)=24。***a就表示其中的一個元素,也就是
double*了,所以sizeof(***a)=4。至于****a,就是一個double了,所以sizeof(****a)=sizeof(double)=8。
union 與struct的空間計算
總體上遵循兩個原則:
(1)整體空間是 占用空間最大的成員(的類型)所占字節數的整倍數
(2)數據對齊原則----內存按結構成員的先后順序排列,當排到該成員變量時,其前面已擺放的空間大小必須是該成員類型大小的整
倍數,如果不夠則補齊,以此向后類推。。。。。
注意:數組按照單個變量一個一個的擺放,而不是看成整體。如果成員中有自定義的類、結構體,也要注意數組問題。
例:[引用其他帖子的內容]
因為對齊問題使結構體的sizeof變得比較復雜,看下面的例子:(默認對齊方式下)
struct s1
{
char a;
double b;
int c;
char d;
};
struct s2
{
char a;
char b;
int c;
double d;
};
cout<<sizeof(s1)<<endl; // 24
cout<<sizeof(s2)<<endl; // 16
同樣是兩個char類型,一個int類型,一個double類型,但是因為對齊問題,導致他們的大小不同。計算結構體大小可以采用元素擺
放法,我舉例子說明一下:首先,CPU判斷結構體的對界,根據上一節的結論,s1和s2的對界都取最大的元素類型,也就是double類
型的對界8。然后開始擺放每個元素。
對于s1,首先把a放到8的對界,假定是0,此時下一個空閑的地址是1,但是下一個元素d是double類型,要放到8的對界上,離1最
接近的地址是8了,所以d被放在了8,此時下一個空閑地址變成了16,下一個元素c的對界是4,16可以滿足,所以c放在了16,此時
下一個空閑地址變成了20,下一個元素d需要對界1,也正好落在對界上,所以d放在了20,結構體在地址21處結束。由于s1的大小需
要是8的倍數,所以21-23的空間被保留,s1的大小變成了24。
對于s2,首先把a放到8的對界,假定是0,此時下一個空閑地址是1,下一個元素的對界也是1,所以b擺放在1,下一個空閑地址變
成了2;下一個元素c的對界是4,所以取離2最近的地址4擺放c,下一個空閑地址變成了8,下一個元素d的對界是8,所以d擺放在8,
所有元素擺放完畢,結構體在15處結束,占用總空間為16,正好是8的倍數。
這里有個陷阱,對于結構體中的結構體成員,不要認為它的對齊方式就是他的大小,看下面的例子:
struct s1
{
char a[8];
};
struct s2
{
double d;
};
struct s3
{
s1 s;
char a;
};
struct s4
{
s2 s;
char a;
};
cout<<sizeof(s1)<<endl; // 8
cout<<sizeof(s2)<<endl; // 8
cout<<sizeof(s3)<<endl; // 9
cout<<sizeof(s4)<<endl; // 16;
s1和s2大小雖然都是8,但是s1的對齊方式是1,s2是8(double),所以在s3和s4中才有這樣的差異。
所以,在自己定義結構體的時候,如果空間緊張的話,最好考慮對齊因素來排列結構體里的元素。
補充:不要讓double干擾你的位域
在結構體和類中,可以使用位域來規定某個成員所能占用的空間,所以使用位域能在一定程度上節省結構體占用的空間。不過考
慮下面的代碼:
struct s1
{
int i: 8;
int j: 4;
double b;
int a:3;
};
struct s2
{
int i;
int j;
double b;
int a;
};
struct s3
{
int i;
int j;
int a;
double b;
};
struct s4
{
int i: 8;
int j: 4;
int a:3;
double b;
};
cout<<sizeof(s1)<<endl; // 24
cout<<sizeof(s2)<<endl; // 24
cout<<sizeof(s3)<<endl; // 24
cout<<sizeof(s4)<<endl; // 16
可以看到,有double存在會干涉到位域(sizeof的算法參考上一節),所以使用位域的的時候,最好把float類型和double類型
放在程序的開始或者最后。
相關常數:
sizeof int:4
sizeof short:2
sizeof long:4
sizeof float:4
sizeof double:8
sizeof char:1
sizeof p:4
sizeof WORD:2
sizeof DWORD:4
|