高效的C編程之: 函數(shù)調(diào)用
14.9.6內(nèi)嵌函數(shù)
ARM編譯器支持函數(shù)內(nèi)嵌功能。使用關(guān)鍵字“_inline”聲明函數(shù),可以使函數(shù)內(nèi)嵌。下面的例子顯示了如何使用函數(shù)內(nèi)嵌功能。
程序源文件如下。
__inlineintsquare(intx)
{
returnx*x;
}
#includemath.h>
doublelength(intx,inty)
{
returnsqrt(square(x)+square(y));
}
編譯結(jié)果如下所示。
length
STMDBsp!,{lr}
MULa3,a1,a1
MLAa1,a2,a2,a3
BL_dflt
LDMIAsp!,{lr}
Bsqrt
使用函數(shù)內(nèi)嵌有以下好處:
·減少了函數(shù)調(diào)用開銷(如寄存器的壓棧保護);
·減少了參數(shù)傳遞開銷;
·進一步提高了編譯器對代碼優(yōu)化的可能性(如編譯器可將ADD和MUL指令合并為一條MLA指令)。
但使用函數(shù)內(nèi)嵌將增加代碼尺寸。也正是處于這種原因,armcc和tcc都沒有提供函數(shù)自動內(nèi)嵌的編譯選項。
一般來說,只有對性能影響較大的重要函數(shù)才使用關(guān)鍵字_inline進行內(nèi)嵌。
14.9.7函數(shù)定義
使用函數(shù)時要先定義后調(diào)用是ARM編程的基本規(guī)則之一。在函數(shù)調(diào)用之前定義函數(shù),編譯器可以檢查被調(diào)用函數(shù)的寄存器使用情況,從而對其進行進一步的優(yōu)化。
首先來看下面的例子。
intsquare(intx);
intsumsquares1(intx,inty)
{
returnsquare(x)+square(y);
}
/*square函數(shù)可以在本文件中定義,也可以在其他源文件中定義*/
intsquare(intx)
{
returnx*x;
}
intsumsquares2(intx,inty)
{
returnsquare(x)+square(y);
}
編譯的結(jié)果如下所示。
sumsquares1
STMDBsp!,{v1,v2,lr}
MOVv1,a2
BLsquare
MOVv2,a1
MOVa1,v1
BLsquare
ADDa1,v2,a1
LDMIAsp!,{v1,v2,pc}
square
MOVa2,a1
MULa1,a2,a2
MOVpc,lr
sumsquares2
STMDBsp!,{lr}
MOVa3,a2
BLsquare
MOVa4,a1
MOVa1,a3
BLsquare
ADDa1,a4,a1
LDMIAsp!,{pc}
從編譯的結(jié)果可以看出,將square函數(shù)定義放在sumsquares函數(shù)前,編譯器可以判斷寄存器a3和a4并未使用,所有在調(diào)用函數(shù)入口處并未將其壓棧。這樣,減少了內(nèi)存訪問,提高了代碼執(zhí)行效率。
評論