久久久久久久999_99精品久久精品一区二区爱城_成人欧美一区二区三区在线播放_国产精品日本一区二区不卡视频_国产午夜视频_欧美精品在线观看免费

 找回密碼
 立即注冊(cè)

QQ登錄

只需一步,快速開(kāi)始

搜索
查看: 2731|回復(fù): 0
打印 上一主題 下一主題
收起左側(cè)

防止 整型 溢出-C語(yǔ)言

[復(fù)制鏈接]
跳轉(zhuǎn)到指定樓層
樓主
ID:90014 發(fā)表于 2015-9-15 15:05 | 只看該作者 回帖獎(jiǎng)勵(lì) |倒序?yàn)g覽 |閱讀模式


C語(yǔ)言的整型溢出問(wèn)題

整型溢出有點(diǎn)老生常談了,bla, bla, bla… 但似乎沒(méi)有引起多少人的重視。整型溢出會(huì)有可能導(dǎo)致緩沖區(qū)溢出,緩沖區(qū)溢出會(huì)導(dǎo)致各種黑客攻擊,比如最近OpenSSL的heartbleed事件,就是 一個(gè)buffer overread的事件。在這里寫下這篇文章,希望大家都了解一下整型溢出,編譯器的行為,以及如何防范,以寫出更安全的代碼。
什么是整型溢出

C語(yǔ)言的整型問(wèn)題相信大家并不陌生了。對(duì)于整型溢出,分為無(wú)符號(hào)整型溢出和有符號(hào)整型溢出。

對(duì)于unsigned整型溢出,C的規(guī)范是有定義的——“溢出后的數(shù)會(huì)以2^(8*sizeof(type))作模運(yùn)算”,也就是說(shuō),如果一個(gè)unsigned char(1字符,8bits)溢出了,會(huì)把溢出的值與256求模。例如:
unsigned char x = 0xff;printf("%d\n", ++x);

上面的代碼會(huì)輸出:0 (因?yàn)?xff + 1是256,與2^8求模后就是0)

對(duì)于signed整型的溢出,C的規(guī)范定義是“undefined behavior”,也就是說(shuō),編譯器愛(ài)怎么實(shí)現(xiàn)就怎么實(shí)現(xiàn)。對(duì)于大多數(shù)編譯器來(lái)說(shuō),算得啥就是啥。比如:
signed char x =0x7f; //注:0xff就是-1了,因?yàn)樽罡呶皇?也就是負(fù)數(shù)了printf("%d\n", ++x);

上面的代碼會(huì)輸出:-128,因?yàn)?x7f + 0×01得到0×80,也就是二進(jìn)制的1000 0000,符號(hào)位為1,負(fù)數(shù),后面為全0,就是負(fù)的最小數(shù),即-128。

另外,千萬(wàn)別以為signed整型溢出就是負(fù)數(shù),這個(gè)是不定的。比如:
signed char x = 0x7f;signed char y = 0x05;signed char r = x * y;printf("%d\n", r);

上面的代碼會(huì)輸出:123

相信對(duì)于這些大家不會(huì)陌生了。
整型溢出的危害

下面說(shuō)一下,整型溢出的危害。

示例一:整形溢出導(dǎo)致死循環(huán)
... ...... ...short len = 0;... ...while(len< MAX_LEN) { len += readFromInput(fd, buf); buf += len;}

上面這段代碼可能是很多程序員都喜歡寫的代碼(我在很多代碼里看到過(guò)多次),其中的MAX_LEN 可能會(huì)是個(gè)比較大的整型,比如32767,我們知道short是16bits,取值范圍是-32768 到 32767 之間。但是,上面的while循環(huán)代碼有可能會(huì)造成整型溢出,而len又是個(gè)有符號(hào)的整型,所以可能會(huì)成負(fù)數(shù),導(dǎo)致不斷地死循環(huán)。

示例二:整形轉(zhuǎn)型時(shí)的溢出
int copy_something(char *buf, int len){ #define MAX_LEN 256 char mybuf[MAX_LEN];</pre><pre> ... ... ... ... if(len > MAX_LEN){ // <---- [1] return -1; } return memcpy(mybuf, buf, len);}

上面這個(gè)例子中,還是[1]處的if語(yǔ)句,看上去沒(méi)有會(huì)問(wèn)題,但是len是個(gè)signed int,而memcpy則需一個(gè)size_t的len,也就是一個(gè)unsigned 類型。于是,len會(huì)被提升為unsigned,此時(shí),如果我們給len傳一個(gè)負(fù)數(shù),會(huì)通過(guò)了if的檢查,但在memcpy里會(huì)被提升為一個(gè)正數(shù),于是我 們的mybuf就是overflow了。這個(gè)會(huì)導(dǎo)致mybuf緩沖區(qū)后面的數(shù)據(jù)被重寫。

示例三:分配內(nèi)存

關(guān)于整數(shù)溢出導(dǎo)致堆溢出的很典型的例子是,OpenSSH Challenge-Response SKEY/BSD_AUTH 遠(yuǎn)程緩沖區(qū)溢出漏洞。下面這段有問(wèn)題的代碼摘自O(shè)penSSH的代碼中的auth2-chall.c中的 input_userauth_info_response() 函數(shù):
nresp = packet_get_int();if (nresp > 0) { response = xmalloc(nresp*sizeof(char*)); for (i = 0; i < nresp; i++) response[ i] = packet_get_string(NULL);}

上面這個(gè)代碼中,nresp是size_t類型(size_t一般就是unsigned int/long int),這個(gè)示例是一個(gè)解數(shù)據(jù)包的示例,一般來(lái)說(shuō),數(shù)據(jù)包中都會(huì)有一個(gè)len,然后后面是data。如果我們精心準(zhǔn)備一個(gè)len,比 如:1073741825(在32位系統(tǒng)上,指針占4個(gè)字節(jié),unsigned int的最大值是0xffffffff,我們只要提供0xffffffff/4 的值——0×40000000,這里我們?cè)O(shè)置了0×4000000 + 1), nresp就會(huì)讀到這個(gè)值,然后nresp*sizeof(char*)就成了 1073741825 * 4,于是溢出,結(jié)果成為了 0×100000004,然后求模,得到4。于是,malloc(4),于是后面的for循環(huán)1073741825 次,就可以干環(huán)事了(經(jīng)過(guò)0×40000001的循環(huán),用戶的數(shù)據(jù)早已覆蓋了xmalloc原先分配的4字節(jié)的空間以及后面的數(shù)據(jù),包括程序代碼,函數(shù)指 針,于是就可以改寫程序邏輯。關(guān)于更多的東西,你可以看一下這篇文章《 Survey of Protections from Buffer-Overflow Attacks 》)。

示例四:緩沖區(qū)溢出導(dǎo)致安全問(wèn)題
int func(char *buf1, unsigned int len1, char *buf2, unsigned int len2 ){ char mybuf[256]; if((len1 + len2) > 256){ //<--- [1] return -1; } memcpy(mybuf, buf1, len1); memcpy(mybuf + len1, buf2, len2); do_some_stuff(mybuf); return 0;}

上面這個(gè)例子本來(lái)是想把buf1和buf2的內(nèi)容copy到mybuf里,其中怕len1 + len2超過(guò)256 還做了判斷,但是,如果len1+len2溢出了,根據(jù)unsigned的特性,其會(huì)與2^32求模,所以,基本上來(lái)說(shuō),上面代碼中的[1]處有可能為假 的。(注:通常來(lái)說(shuō),在這種情況下,如果你開(kāi)啟-O代碼優(yōu)化選項(xiàng),那個(gè)if語(yǔ)句塊就全部被和諧掉了——被編譯器給刪除了)比如,你可以測(cè)試一下 len1=0×104, len2 = 0xfffffffc 的情況。

這樣的例子有很多很多,這些整型溢出的問(wèn)題如果在關(guān)鍵的地方,尤其是在搭配有用戶輸入的地方,如果被黑客利用了,就會(huì)導(dǎo)致很嚴(yán)重的安全問(wèn)題。
關(guān)于編譯器的行為

在談一下如何正確的檢查整型溢出之前,我們還要來(lái)學(xué)習(xí)一下編譯器的一些東西。請(qǐng)別怪我羅嗦。

編譯器優(yōu)化

如何檢查整型溢出或是整型變量是否合法有時(shí)候是一件很麻煩的事情,就像上面的第四個(gè)例子一樣,編譯的優(yōu)化參數(shù)-O/-O2/-O3基本上會(huì)假設(shè)你的程序不會(huì)有整形溢出。會(huì)把你的代碼中檢查溢出的代碼給優(yōu)化掉。

關(guān)于編譯器的優(yōu)化,在這里再舉個(gè)例子,假設(shè)我們有下面的代碼(又是一個(gè)相當(dāng)相當(dāng)常見(jiàn)的代碼):
int len;char* data; if (data + len < data){ printf("invalid len\n"); exit(-1);}

上面這段代碼中,len 和 data 配套使用,我們害怕len的值是非法的,或是len溢出了,于是我們寫下了if語(yǔ)句來(lái)檢查。這段代碼在-O的參數(shù)下正常。但是在-O2的編譯選項(xiàng)下,整個(gè)if語(yǔ)句塊被優(yōu)化掉了。

你可以寫個(gè)小程序,在gcc下編譯(我的版本是4.4.7,記得加上-O2和-g參數(shù)),然后用gdb調(diào)試時(shí),用disass /m命信輸出匯編,你會(huì)看到下面的結(jié)果(你可以看到整個(gè)if語(yǔ)句塊沒(méi)有任何的匯編代碼——直接被編譯器和諧掉了):
7 int len = 10;8 char* data = (char *)malloc(len); 0x00000000004004d4 <+4>: mov $0xa,%edi 0x00000000004004d9 <+9>: callq 0x4003b8 <malloc@plt>910 if (data + len < data){11 printf("invalid len\n");12 exit(-1);13 }1415 } 0x00000000004004de <+14>: add $0x8,%rsp 0x00000000004004e2 <+18>: retq

對(duì)此,你需要把上面 char* 轉(zhuǎn)型成 uintptr_t 或是 size_t,說(shuō)白了也就是把char*轉(zhuǎn)成unsigned的數(shù)據(jù)結(jié)構(gòu),if語(yǔ)句塊就無(wú)法被優(yōu)化了。如下所示:
if ((uintptr_t)data + len < (uintptr_t)data){ ... ...}

關(guān)于這個(gè)事,你可以看一下C99的規(guī)范說(shuō)明《 ISO/IEC 9899:1999 C specification 》第 §6.5.6 頁(yè),第8點(diǎn),我截個(gè)圖如下:(這段話的意思是定義了指針+/-一個(gè)整型的行為,如果越界了,則行為是undefined)

注意上面標(biāo)紅線的地方,說(shuō)如果指針指在數(shù)組范圍內(nèi)沒(méi)事,如果越界了就是undefined,也就是說(shuō)這事交給編譯器實(shí)現(xiàn)了,編譯器想咋干咋干,那怕你想把其優(yōu)化掉也可以。在這里要重點(diǎn)說(shuō)一下, C語(yǔ)言中的一個(gè)大惡魔—— Undefined! 這里都是“野獸出沒(méi)”的地方,你一定要小心小心再小心 。

花絮:編譯器的彩蛋

上面說(shuō)了所謂的undefined行為就全權(quán)交給編譯器實(shí)現(xiàn),gcc在1.17版本下對(duì)于undefined的行為還玩了個(gè)彩蛋( 參看Wikipedia )。

下面gcc 1.17版本下的遭遇undefined行為時(shí),gcc在unix發(fā)行版下玩的彩蛋的源代碼。我們可以看到,它會(huì)去嘗試去執(zhí)行一些游戲 NetHack , Rogue 或是Emacs的 Towers of Hanoi ,如果找不到,就輸出一條NB的報(bào)錯(cuò)。
execl("/usr/games/hack", "#pragma", 0); // try to run the game NetHackexecl("/usr/games/rogue", "#pragma", 0); // try to run the game Rogue// try to run the Tower's of Hanoi simulation in Emacs.execl("/usr/new/emacs", "-f","hanoi","9","-kill",0);execl("/usr/local/emacs","-f","hanoi","9","-kill",0); // same as abovefatal("You are in a maze of twisty compiler features, all different");
正確檢測(cè)整型溢出

在看過(guò)編譯器的這些行為后,你應(yīng)該會(huì)明白——“ 在整型溢出之前,一定要做檢查,不然,就太晚了 ”。

我們來(lái)看一段代碼:
void foo(int m, int n){ size_t s = m + n; .......}

上面這段代碼有兩個(gè)風(fēng)險(xiǎn): 1)有符號(hào)轉(zhuǎn)無(wú)符號(hào) , 2)整型溢出 。這兩個(gè)情況在前面的那些示例中你都應(yīng)該看到了。所以,你千萬(wàn)不要把任何檢查的代碼寫在 s = m + n 這條語(yǔ)名后面,不然就太晚了 。undefined行為就會(huì)出現(xiàn)了——用句純正的英文表達(dá)就是——“Dragon is here”——你什么也控制不住了。(注意:有些初學(xué)者也許會(huì)以為size_t是無(wú)符號(hào)的,而根據(jù)優(yōu)先級(jí) m 和 n 會(huì)被提升到unsigned int。其實(shí)不是這樣的,m 和 n 還是signed int,m + n 的結(jié)果也是signed int,然后再把這個(gè)結(jié)果轉(zhuǎn)成unsigned int 賦值給s)

比如,下面的代碼是錯(cuò)的:
void foo(int m, int n){ size_t s = m + n; if ( m>0 && n>0 && (SIZE_MAX - m < n) ){ //error handling... }}

上面的代碼中,大家要注意 (SIZE_MAX - m < n) 這個(gè)判斷,為什么不用m + n > SIZE_MAX呢?因?yàn)椋绻?m + n 溢出后,就被截?cái)嗔耍员磉_(dá)式恒真,也就檢測(cè)不出來(lái)了。另外,這個(gè)表達(dá)式中,m和n分別會(huì)被提升為unsigned。

但是上面的代碼是錯(cuò)的,因?yàn)椋?/strong>

1)檢查的太晚了,if之前編譯器的undefined行為就已經(jīng)出來(lái)了(你不知道什么會(huì)發(fā)生)。

2)就像前面說(shuō)的一樣,(SIZE_MAX - m < n) 可能會(huì)被編譯器優(yōu)化掉。

3)另外,SIZE_MAX是size_t的最大值,size_t在64位系統(tǒng)下是64位的,嚴(yán)謹(jǐn)點(diǎn)應(yīng)該用INT_MAX或是UINT_MAX

所以,正確的代碼應(yīng)該是下面這樣:
void foo(int m, int n){ size_t s = 0; if ( m>0 && n>0 && ( UINT_MAX - m < n ) ){ //error handling... return; } s = (size_t)m + (size_t)n;}

在《 蘋果安全編碼規(guī)范 》(PDF)中,第28頁(yè)的代碼中:

如果n和m都是signed int,那么這段代碼是錯(cuò)的。正確的應(yīng)該像上面的那個(gè)例子一樣,至少要在n*m時(shí)要把 n 和 m 給 cast 成 size_t。因?yàn)椋琻*m可能已經(jīng)溢出了,已經(jīng)undefined了,undefined的代碼轉(zhuǎn)成size_t已經(jīng)沒(méi)什么意義了。(如果m和n是 unsigned int,也會(huì)溢出),上面的代碼僅在m和n是size_t的時(shí)候才有效。

不管怎么說(shuō),《 蘋果安全編碼規(guī)范 》絕對(duì)值得你去讀一讀。

上溢出和下溢出的檢查

前面的代碼只判斷了正數(shù)的上溢出overflow,沒(méi)有判斷負(fù)數(shù)的下溢出underflow。讓們來(lái)看看怎么判斷:

對(duì)于加法,還好。
#include <limits.h>void f(signed int si_a, signed int si_b) { signed int sum; if (((si_b > 0) && (si_a > (INT_MAX - si_b))) || ((si_b < 0) && (si_a < (INT_MIN - si_b)))) { /* Handle error */ return; } sum = si_a + si_b;}

對(duì)于乘法,就會(huì)很復(fù)雜(下面的代碼太夸張了):
void func(signed int si_a, signed int si_b){ signed int result; if (si_a > 0) { /* si_a is positive */ if (si_b > 0) { /* si_a and si_b are positive */ if (si_a > (INT_MAX / si_b)) { /* Handle error */ } } else { /* si_a positive, si_b nonpositive */ if (si_b < (INT_MIN / si_a)) { /* Handle error */ } } /* si_a positive, si_b nonpositive */ } else { /* si_a is nonpositive */ if (si_b > 0) { /* si_a is nonpositive, si_b is positive */ if (si_a < (INT_MIN / si_b)) { /* Handle error */ } } else { /* si_a and si_b are nonpositive */ if ( (si_a != 0) && (si_b < (INT_MAX / si_a))) { /* Handle error */ } } /* End if si_a and si_b are nonpositive */ } /* End if si_a is nonpositive */ result = si_a * si_b;}

更多的防止在操作中整型溢出的安全代碼可以參看《 INT32-C. Ensure that operations on signed integers do not result in overflow 》
其它

對(duì)于C++來(lái)說(shuō),你應(yīng)該使用STL中的numeric_limits::max() 來(lái)檢查溢出。

另外,微軟的SafeInt類是一個(gè)可以幫你遠(yuǎn)理上面這些很tricky的類,下載地址: http://safeint.codeplex.com/

對(duì)于Java 來(lái)說(shuō),一種是用JDK 1.7中Math庫(kù)下的safe打頭的函數(shù),如safeAdd()和safeMultiply(),另一種用更大尺寸的數(shù)據(jù)類型,最大可以到BigInteger。

可見(jiàn),寫一個(gè)安全的代碼并不容易,尤其對(duì)于C/C++來(lái)說(shuō)。對(duì)于黑客來(lái)說(shuō),他們只需要搜一下開(kāi)源軟件中代碼有memcpy/strcpy之類的地方,然后看一看其周邊的代碼,是否可以通過(guò)用戶的輸入來(lái)影響,如果有的話,你就慘了。


分享到:  QQ好友和群QQ好友和群 QQ空間QQ空間 騰訊微博騰訊微博 騰訊朋友騰訊朋友
收藏收藏 分享淘帖 頂 踩
回復(fù)

使用道具 舉報(bào)

本版積分規(guī)則

手機(jī)版|小黑屋|51黑電子論壇 |51黑電子論壇6群 QQ 管理員QQ:125739409;技術(shù)交流QQ群281945664

Powered by 單片機(jī)教程網(wǎng)

快速回復(fù) 返回頂部 返回列表
主站蜘蛛池模板: 在线观看黄色电影 | 操操日| 欧美国产日韩在线观看 | 久久久国产精品 | 国产乱码精品一区二区三区中文 | 久久久www成人免费精品 | 91偷拍精品一区二区三区 | 欧洲色综合 | 99国内精品久久久久久久 | 夜夜草 | 国产亚洲欧美在线 | 免费观看黄网站 | 国产一级免费视频 | 成人国内精品久久久久一区 | 免费网站国产 | 日韩高清www | 老司机深夜福利网站 | 成人国产午夜在线观看 | 久久久久国产一级毛片高清网站 | 亚洲精品中文字幕中文字幕 | 日韩欧美一区二区三区 | 午夜精品久久久久久久 | 亚洲一区二区中文字幕在线观看 | 久久久久久久久久久久久久av | 毛色毛片免费看 | 久久乐国产精品 | 久久精品国产一区二区电影 | 久久夜色精品国产 | 久久免费香蕉视频 | 日韩和的一区二在线 | 欧州一区二区三区 | 亚洲欧洲精品成人久久奇米网 | 亚洲精品一区二区另类图片 | 日韩欧美国产不卡 | 中文字幕精品视频 | 亚洲美女视频 | 九九综合九九 | 91精品麻豆日日躁夜夜躁 | 国产精品成人国产乱一区 | 欧美成人精品一区二区男人看 | 久久免费观看一级毛片 |