最近要在Cortex-M3上寫一個簡單的操作系統,打算使用IAR,為了寫好啟動代碼,花了一些時間了解了IAR在main()以前做了些什么事。
首先系統復位時,Cortex-M3從代碼區偏移0x0000'0000處獲取棧頂地址,用來初始化MSP寄存器的值。
接下來從代碼區偏移0x0000'0004獲取第一個指令的跳轉地址。這些地址,是CM3要求放置中斷向量表的地方。
這里是一個程序的啟動區的反匯編:
__vector_table:
這個程序是由IAP程序來啟動的,IAP程序獲取0x0800'4000處的MSP值(0x20002600),并設置為MSP的值,即主堆棧最大范圍是0x2000'0000~0x2000'25FF。接下來IAP程序獲取0x0800'4004處的Reset_Handler的地址(0x0800'7E1D),并跳轉到Reset_Handler()執行。
IAP在這里完全是模仿了Cortex-M3的復位序列,也就是說,在沒有IAP的系統上,CM3只能從0x0800'0000獲取MSP,從0x0800'0004獲取第一條指令所處地址。而IAP就存在在0x0800'0000這個地址上,IAP的啟動,已經消耗掉了這個復位序列,所以IAP要啟動UserApp程序的時候,也是完全模仿Cortex-M3的復位序列的。
接下來我們看看復位后第一句指令——Reset_Handler()函數里有什么。
若我們使用的是ST公司標準外設庫,那么已經有了現成的Reset_Handler,不過他是弱定義——PUBWEAK,可以被我們重寫的同名函數覆蓋。一般來說,我們使用的都是ST提供的Reset_Handler,在V3.4版本的庫中,可以在startup_stm32f10x_xx.s中找到這個函數:
Reset_Handler
看來ST沒有做太多的事,他只調用了自家庫提供的SystemInit函數進行系統時鐘、Flash讀取的初始化,并把大權交給了__iar_program_start這個IAR提供的“內部函數”了,我們就跟緊這個__iar_program_start跳轉,看看IAR做了什么,上面一段代碼的反匯編如下:
__iar_section$$root:
細心的觀眾會發現地址是0x0800'7E1C,比我們查到的0x0800'7E1D差了1,這是ARM家族的遺留問題,因為ARM處理器的指令至少是半字對齊的(16位THUMB指令集 or 32位ARM指令集),所以PC指針的LSB是常為0的,為了充分利用寄存器,ARM公司給PC的LSB了一個重要的使命,那就是在執行分支跳轉時,PC的LSB=1,表示使用THUMB模式,LSB=0,表示使用ARM模式,但在最新的Cortex-M3內核上,只使用了THUMB-2指令集挑大梁,所以這一位要常保持1,所以我們查到的地址是0x0800'7E1D(C=1100,D=1101),放心,我們的CM3內核會忽略掉LSB(除非為0,那么會引起一個fault),從而正確跳轉到0x0800'7E1C。
從0x0800'7E20處的加載指令,我們可以算出__iar_program_start所處的位置,就是當前PC指針(0x0800'7E24),再加上4,即0x0800'7E28處的所指向的地址——0x0800'7D8D(0x0800'7D8C),我們跟緊著跳轉,__iar_program_start果然在這里:
__iar_program_start:
我們看到IAR提供了__low_level_init這個函數進行了“底層”的初始化,進一步跟蹤,我們可以查到__low_level_init這個函數做了些什么,不是不是我們想象中的不可告人。
__low_level_init:
__low_level_init出乎想象的簡單,只是往R0寄存器寫入了1,就立即執行"BX LR"回到調用處了,接下來,__iar_program_start檢查了R0是否為0,為0,則執行__iar_init$$done,若不是0,就執行__iar_data_init2。__iar_init$$done這個函數很簡單,只有2句話,第一句是把R0清零,第二句就直接"BL main",跳轉到main()函數了。不過既然__low_level_init已經往R0寫入了1,那么我們還是得走下遠路——看看__iar_data_init2做了些什么,雖然距離main只有一步之遙,不過這中間隱藏了編譯器的思想,我們得耐心看下去。
__iar_data_init2:
看來IAR遲遲不執行main()函數,就是為了執行__iar_data_init2,我們來分析分析IAR都干了些什么壞事~
首先壓R4,LR入棧,然后加載0x0800'7C78至R0,0x0800'7C9C至R4,馬上跳轉到0x0800'7D62執行R0,R4的比較,結果若是相等,則彈出R4,PC,然后立即進入main()。不過IAR請君入甕是自不會那么快放我們出來的——結果不相等,跳轉到0x0800'7D5C執行,在這里,把R0指向的地址——0x0800'7C78中的值——0x0800'7D71加載到R1,并且R0中的值自加4,更新為0x0800'7C7C,并跳轉到R1指向的地址處執行,這里是另一個IAR函數:__iar_zero_init2:
__iar_zero_init2:
__iar_data_init2還沒執行完畢,就跳轉到了這個__iar_zero_inti2,且看我們慢慢分析這個幫兇——__iar_zero_inti2做了什么。
__iar_zero_inti2將R3寄存器清零,立即跳轉到0x0800'7D80執行'LDR
1、將R0指向的地址——0x0800'7C80中的值——0x2000'27D4加載到R1寄存器,然后R0中的值自加4,更新為0x0800'7C84。
2、將R1指向的地址——0x2000'27D4中的值——改寫為R3寄存器的值——0,然后R1中的值自加4,更新為0x2000'27D8。
3、R2自減4
4、檢查R2是否為0,不為0,跳轉到第二條執行。不為,則執行下一條。
這簡直就是一個循環!——C語言的循環for(r2=0x2F4;r2-=4;r!=0){...},我們看看循環中做了什么。
第一條指令把一個地址加載到了R1——0x2000'27D4
清零完畢后,接下來的指令"LDR
讀到這里,我們應該可以猜到IAR的意圖了:__iar_data_init2一開始加載了0x0800'7C78至R0,0x0800'7C9C至R4,[R0,R4]就是一段啟動代碼區,在這個區域內保存了要“處理”的所有地址與信息——執行的函數地址或者參數,實際上,這片區域也有一個名字,叫做:Region$$Table$$。在這個區域內,程序以R0為索引,R4為上限,當R0=R4,__iar_data_init2執行完畢,跳轉至main()函數。
好了,保持我們這個猜想,繼續跟蹤我們的PC指針——我們回到了__iar_data_init2函數中,第一件事就是比較R0,R4的值,可惜的是,仍然不相等,我們又被帶到了0x0800'7D5C,至此,我們應該能看出這是一個__iar_data_init2的“主循環”,這也驗證了我們對IAR意圖的猜想~
我們可以等價寫為:for(r0=0x0800'7C78,r4=0x0800'7C9C;r0!=r4;r0+=4){...}
此時,我們的R0為0x0800'7C88,經過“指令1”,R0變為0x0800'7C8C,R1為0x0800'7C55。我們來看看,7C55處,IAR又要執行何種操作。
__iar_copy_init2:
這是一個名為__iar_copy_init2的函數,他執行了什么"copy"操作呢?
首先壓R3,R4入棧,然后跳轉到0x0800'7C6C,從R0——Region$$Table$$Base中取出參數0x238放入R3,接下來的指令大家應該都熟悉了,0x238不為0,所以我們被帶至7C58處,再次從Region$$Table$$Base中取出參數0x0800'7F14放入R1,從Region$$Table$$Base取出參數0x2000'2AC8放入R2處。細心的觀眾應該能察覺這和__iar_zero_init2中取參數的幾乎一樣:先取出大小,隨后取出了地址——只不過這里多出了1個地址,沒錯這就是"copy",隨后的指令
則是另一個“4指令”,指令1將R1指向地址的數據讀到R4,指令2將R2指向地址的數據改寫為R4的數據,指令3、4是完成一個循環。
說到這里大家都應該明白了——這就是一個"copy"的操作,從Flash地址0x0800'7F14起,將長度0x238的數據拷貝到RAM地址0x2000'2AC8中。
通過Jlink,我們可以看到這片區域是我們定義的并且已初始化的全局變量。也就是說,每次復位后,IAR在此處進行全局變量的初始化。
在這“4指令”執行完畢后,再次從Region$$Table$$Base中取出參數,為0,比較之后條件符合,函數返回__iar_data_init2。
此時的R0已經為0x0800'7C9C與R4相等,__iar_data_init2終于完成它的使命。
將R0清零以后,IAR放棄主動權,把PC指針交給了用戶程序的入口——main()。
但請注意,這里使用的是BL指令進行main跳轉,也就是說,main函數只是IAR手中的一個子程序,若是main函數執行到了結尾,接下來則會執行exit等IAR提供的“退出”函數。這些函數,等待下回分解~
總之,IAR在啟動main()函數以前,執行了Reset_Handler,調用SystemInit()(ST庫提供)進行時鐘,Flash讀取初始化,并轉入__iar_program_start中執行__low_level_init與__iar_data_init2,并在__iar_data_init2中,先后調用__iar_zero_init2與__iar_copy_init2對全局變量、全局已初始化變量進行相應的初始化操作。最后,調用main()函數執行。
這就是IAR在啟動main()函數之前做的事情,它并沒有那么神秘,只要花些時間,就可以跟跟蹤分析出這個過程。