目录
1、概述
本文档参考林锐博士《高质量C++ C编程指南》及自己的心得编写,如有侵权,立刻删除!
2 、编程指南
2.1文章结构
每个C++/C程序通常分为两个文件。一个文件用于保存程序的声明,我们称之为头文件。另一个文件用于保存程序的实现,我们称之为定义文件。
C++/C程序的头文件以“.h”为后缀,C程序的定义文件以“.c”为后缀,C++程序的定义文件通常以“.cpp”为后缀(也有一些系统以“.cc”或“.cxx”为后缀)。
2.1.1版权和版本的声明
版权和版本的声明位于头文件和定义文件的开头,主要内容有:
- 版本信息
- 文件名称,标识符,摘要
- 当前版本号,作者/修改着,完成日期
- 版本历史信息
/*
*Copyright(c) 2024
*All rights reserved.
*
*文件名称:filename.h
*文件标识:见配置管理计划
*摘 要:简要描述文本内容
*
*当前版本:1.1
*作 者:输入作者(或修改者)名字
*完成日期:xxxx年xx月xx日
*
*取代版本:1.0
*原作者 :输入原作者(或修改者)名字
*完成日期:xxxx年xx月xx日
*/
2.1.2头文件的结构
头文件由三部分组成:
(1)头文件开头处的版权和版本声明(见2.1.1);
(2)预处理块;
(3)函数和类结构声明等。
假设头文件的名称为header.h,头文件的结构参见如下:
- 规则1:为了防止头文件被重复引用,应当用ifndef/define/endif结构产生预处理块。
- 规则2:用#include <header.h>格式来引用标准库的头文件(编译器将从标准库目录开始搜索)。
- 规则3:用#include "header.h" 格式来引用非标准库的头文件(编译器将从用户的工作目录开始搜索)。
建议1:头文件中只存放“声明”而不存放“定义”
在C++语法中,类的成员函数可以在声明的同时被定义,并且自动成为内联函数。这虽然会带来书写上的方便,却造成了风格不一致,弊大于利。建议将成员函数的定义与声明分开,不论函数体有多小。
建议2:不提倡使用全局变量,尽量不要在头文件中出现像extern int value这类声明
//版权和版本声明见2.1.1,此处省略
#ifndef HEADER_H //防止header.h被重复引用
#define HEADER_H
#include <math.h> //引用标准库的头文件
...
#include "myheader.h" //引用非标准库的头文件
...
void Funtion(...); //全局函数声明
...
class Box //类结构声明
{
...
};
#endif
2.1.3定义文件的结构
定义文件有三部分内容:
(1)定义文件开头处的版权和版本声明;
(2)对一些头文件的使用;
(3)程序的实现体(包括数据和代码)
假设定义文件的名称为header.cpp,定义文件的结构参见如下:
//版权和版本说明见2.1.1,此处省略
#include "header.h" //引用头文件
...
//全局函数的实现体
void Funtion(...)
{
...
}
//类成员函数的实现体
void Box::Draw(...)
{
...
}
2.1.4头文件的作用
早期的编程语言如Basic、Fortran没有头文件的概念,C++/C语言的初学者虽然会使用头文件,但常常不明其理。这里对头文件的作用略作解释:
(1)通过头文件来调用库功能。在很多场合,源代码不便(不准)向用户公布,只要向用户提供头文件和二进制的库即可。用户只需要按照文件中的接口声明来调用库功能,而不必关心接口怎么实现的。编译器会从库中提取相应的代码。
(2)头文件能加强类型安全检查。如果某个接口被实现或被使用时,其方式与头文件的声明不一致,编译器就会指出错误,这一简单的规则能大大减轻程序员调试、改错的负担。
2.1.5目录结构
如果一个软件的头文件数目比较多(如果超过10个),通常应将头文件和定义文件分别保存于不同的目录,以便于维护。
例如可将头文件保存在include目录,将定义文件保存于source目录(可以是多级目录)。
如果某些头文件时是私有的,它不会被用户的程序直接引用,则没有必要公开其“声明”。为了加强信息隐藏,这些私有的头文件可以和定义文件文件存放于同一目录。
2.2程序的板式
板式虽然不会影响程序的功能,但会影响程序的可读性。程序的板式追求清晰、美观,是程序风格的重要构成因素。
可以把程序的板式比喻为“书法”。好的“书法”可以让人对程序一目了然,看得兴致勃勃。差的程序“书法”如螃蟹爬行,让人看的索然无味,更令维护者烦恼有加。请程序员们学习程序的“书法”,弥补大学计算机教育的漏洞,实在很有必要。
2.2.1空行
空行起着分隔程序段落的作用。空行得体(不过多也不过少)将使程序的布局更加清晰。空行不会浪费内存,虽然打印含有空行的程序是会多消耗一些纸张,但是值得,所以不要舍不得用空行。
- 规则1:在每个类声明之后、每个函数体定义结束之后都要加上空行
- 规则2:在一个函数体内,逻辑上密切相关的语句之间不加空行,其他地方应加上空行分隔
//函数之间的空行
//空行
void Funtion1(...)
{
...
}
//空行
void Funtion2(...)
{
...
}
//空行
void Funtion(...)
{
...
}
//函数内部的空行
while(1)
{
statement1;
//空行
if(1)
{
statement2;
}
else
{
statement3;
}
//空行
statement4;
}
2.2.2代码行
- 规则1:一行代码只做一件事,如只定义一个变量,或只写一条语句。这样代码容易阅读,并且方便于写注释。
- 规则2:if、for、while、do等语句自占一行,执行语句不得紧跟其后。不论执行语句有多少都要加{},这样可以防止书写失误。
先看看风格不良的代码行:
int nWidth, nHeight, nDepth; //宽度高度深度
x = a + b; y = c + d; z = e + f;
if(nWIdth < nHeight) dosomething();
for(initialization; condition; updata)
dosomething();
other();
在看看良好的代码行:
int nWidth; //宽度
int nHeight; //高度
int nDepth; //深度
X = a + b;
y = c + d;
z = e + f;
if(nWidth < nHeight)
{
dosomething();
}
for(initialization; condition; updata)
{
dosomething();
}
建议:尽可能在定义变量的同时初始化该变量(就近原则)
如果变量的引用处和其定义处相隔比较远,变量的初始化很容易被忘记。如果引用了未被初始化的变量,可能会导致程序错误,此条建议可减少隐患,例如:
int nWidth = 10; //定义并初始化nWidth
int nHeight = 10; //定义并初始化nHeight
int nDepth = 10; //定义并初始化nDepth
2.2.3代码行内的空格
- 规则1:关键字后要留有空格。像const、virtual、inline、case等关键字之后至少要留有一个空格,否则无法辨析关键字。像if、for、while等关键字之后应留有一个空格再跟左括号‘(’,以突出关键字。
- 规则2:函数名之后不要留有空格,紧跟左括号‘(’,以与关键字区别。
- 规则3:‘(’向后紧跟‘)’、‘,’、‘;’向前紧跟,紧跟处不留空格。
- 规则4:‘,’之后要留空格,如Funtion(x, y, z)。如果‘;’不是一行的结束符号,其后要留空格,如for(initialization; condition; updata)。
- 规则5:赋值操作符、比较操作符、算术操作符、逻辑操作符、位域操作符,如“=”、“+=”、“>=”、“<=”、“+”、“*”、“%”、“&&”、“||”、“<<”、“^”等二元操作符的前后应当加空格。
- 规则6:一元操作符“!”、“~”、“++”、“--”、“&”(地址运算符)等前后不加空格。
- 规则7:像“[ ]”、“.”、“->”这类操作符前后不加空格。
建议: 对于表达式比较长的for语句和if语句,为了紧凑起见可以适当地去掉一些空格,如or(i=0; i<10; i++)和for((a<=b) && (c<=d))。
void Func1(int x, int y, int z); //良好的风格
void Func1(int x,int y,int z); //不良的风格
if(year >= 2000) //良好的风格
if(year>=2000) //不良的风格
if((a>=b) && (c<=d)) //良好的风格
if(a>=b&&c<=d) //不良的风格
for(i=0; i<10; i++) //良好的风格
{
...
}
for(i=0;i<10;i++) //不良的风格
{
...
}
for(i = 0; i < 10; i++) //过多的空格
{
...
}
x = a < b ? a : b; //良好的风格
x=a<b?a:b; //不良的风格
int *p = &y; //良好的风格
int * p = & y; //不良的风格
array[5] = 0; //不要写成array [ 5 ] = 0;
a.Funtion(); //不要写成a . Funtion();
b->Funtion(); //不要写成b -> Funtion();
2.2.4对齐
- 规则1:程序的分界符‘{‘ 和 ’}’应独占一行并且位于同一列,同时与引用他们的语句左对齐。
- 规则2:{}之内的代码块在‘{’右边数格处左对齐,缩进为空格数4。
//不良的代码行
void Funtion(int x){
...//program code
}
if(condition){
...//program code
}
else{
...//program code
}
for(initialization; condition; updata){
...//program code
}
while(condition){
...//program code
}
//良好的代码行
void Funtion(int x)
{
...//program code
}
if(condition)
{
...//program code
}
else
{
...//program code
}
for(initialization; condition; update)
{
...//program code
}
while(condition)
{
...//program code
}
//如果出现嵌套的{},则使用缩进对齐,如:
{
...
{
...
}
...
}
2.2.5长行拆分
- 规则1:代码行最大长度控制在70至80个字符以内。代码行不要过长,否则眼睛看不过来,也不便于打印。
- 规则2:长表达式要在低优先级操作符处拆分成新行,操作符放在新行之首(以便突出操作符)。拆分出新行要进行适当的缩进,使排版整齐,语句可读。
if((very_longer_variable1 >= very_longer_variable2)
&&(very_longer_variable3 >= very_longer_variable4)
&&(very_longer_variable5 >= very_longer_variable6))
{
donsomething();
}
virtual CMatrix CMultiplyMatrix(CMatrix leftMatrix,
CMatrix rightMatrix);
for(very_longer_initialization;
very_longer_condition;
very_longer_update)
{
dosomething();
}
2.2.6修饰符的位置
修饰符 * 和 & 应该靠近数据类型还是该靠近变量名,是个有争议的话题。
若将修饰符 * 靠近数据类型,例如:int* x;从语义上讲此写法比较直观,及x是int类型的指针。
上述写法的弊端是容易引起误解,例如:int* x,y;此处y容易被误解为指针变量。虽然x和y分行定义可以避免误解,但并不是人人都愿意这样做。
- 规则1:应当将修饰符 * 和 & 靠近变量名
例如:char *pName;
int *x,y; //此处y不会被误解为指针
2.2.7注释
C语言的注释为“/*...*/”。C++语言中,程序块的注释常采用“/*...*/”,行注释一般采用“//...”。注释通常用于:
(1)版本、版权说明;
(2)函数接口说明;
(3)重要的代码行或段落提示。
虽然注释有助于理解代码,但注意不可过多的使用注释。
- 规则1:注释是对代码的“提示”,而不是文档。程序中的注释不可喧宾夺主,注释太多了会让人眼花缭乱。注释的花样要少。
- 规则2:如果代码本来就是清楚的,则不必加注释。否则多此一举,令人烦厌。
例如:i++;//i加1,多余的注释
- 规则3:编写代码边注释,修改代码同时修改相应注释,以保证注释与代码的一致性。不再有用的注释要删除。
- 规则4:注释应当准确、易懂,防止注释有二义性。错误的注释不但无益反而有害。
- 规则5:尽量避免在注释中使用缩写,特别是不常用缩写。
- 规则6:注释的位置应与被描述的代码相领,可以放在代码的上方或右方,不可放在下方。
- 规则7:当代码比较长,特别是有多重嵌套时,应当在一些段落的结束处加注释,便于阅读。
/*
*函数介绍:
*输入参数:
*输出参数:
*返回值:
*/
void Function(float x, float y, float z)
{
...
}
if(...)
{
...
while(...)
{
...
}//end of while
...
}//end of if
2.2.8类的板式
类可以将数据和函数封装在一起,其中函数表示了类的行为(或称服务)。类提供关键字public、protect和private,分别用于声明哪些数据和函数是公开的、受保护的和私有的。这样可以达到信息隐藏的目的,既让类仅仅公开必须要让外界知道的内容,而隐藏其他的一切内容。我们不可以滥用类的封装功能,不能把它当成火锅,什么东西都往里面扔。
类的板式主要有两种方式:
(1)将private类型的数据写在最前面,而将public类型的函数写在最后面,采用这种板式的程序员主张类的设计以“以数据位核心”,重点关注类的内部结构。
(2)将public类型的函数写在最前面,而将private类型的数据写在后面,采用这种板式的程序员主张类的设计“以行为为中心”,重点关注的是类应该提供什么样的接口(或服务)。
我建议读者采用“以行为为中心”的书写方式,即首先考虑类应该提供什么样的函数。这也是很多人的经验--“这样做不仅让自己在设计类时思路清晰,而且方便别人阅读。因为用户最关心的是接口,谁愿意先看到一堆私有的数据成员”。
//以数据为中心的板式
class A
{
private:
int i, j;
float x, y;
...
public:
void Function1(void);
void Function2(void);
...
}
//以行为为中心的板式
class A
{
public:
void Function1(void);
void Function2(void);
...
private:
int i, j;
float x, y;
...
}
2.3命名规则
2.3.1 缩写
缩写的几种技术:
(1)去掉所有的不再词头的元音字母。如screen写成scrn, primtive写成prmv;
(2)使用单词的头一个或几个字母。如Channel Activation写成ChanActiv, Release Indication写成RelInd;
(3)使用变量名中每个有典型意义的单词。如Count of Failure写成Failcnt;
(4)去掉无用的单词后缀ing, ed等。如Paging Request写成PaReq;
(5)使用标准的或惯用的缩写方式(包括协议文件中出现的缩写方式)。如BSIC(Base Station Identification Code)、MAP(Mobile Application Part)。
缩写的准测:
(1)缩写应保持一致性。如Channel不要有时缩写成Chan,有时缩写成Ch。
(2)在源代码头部加入注释来说明协议相关的、非通用缩写。
(3)表示符的长度不超过32个字符。
2.3.2变量命名约定
参照匈牙利命名法,即
【作用范围域前缀】 + 【前缀】 + 基本类型 + 变量名
其中:
(1)前缀是可选项,以小写字母表示;
(2)基本类型是必选项,以小写字母表示;
(3)变量名是必选项,可多个单词(或缩写)合在一起,每个单词首字母大写。
序号 | 基本类型 | 意义 | 举例 |
1 | h | Handle句柄 | hWnd |
2 | p | Pointer指针 | pTheWord |
3 | lp | Long Point长指针 | lpCmd |
4 | b或bl | Boolean布尔 | bIsOk, blOk |
5 | by | Byte字节 | byNum |
6 | c | Char字符 | cMyChar |
7 | i或n | interget/int 整数 | nTestNumber |
8 | u或un | unsigned interger无符号整形 | uCount |
9 | ul | unsigned long 无符号长整形 | ulTime |
10 | w | Word字 | wPara |
11 | dw | double word 双字 | dwPara |
12 | l | long 长整型 | lPara |
13 | f | float浮点数 | fTotal |
14 | s或str | string 字符串 | strTemp |
15 | fn或fun | Funtion函数 | fnAdd或funAdd |
2.3.3宏与常量命名
宏与常量的命名规则:单词的字母全部大写,个单词之间用下划线隔开。命名举例:
#define MAX_SLOT_NUM 8
#define EI_ENCR_INFO 0x07
const int MAX_ARRAY = 100;
2.3.4结构和结构成员命名
要求结构体名称后加_ST或者_st,表示是结构体,如:
typedef struct _IC_VG_CONFIG_ST_
{
XBUS_WORD iPortStart;
XBUS_BYTE reserved;
XBUS_BYTE ContinueNum;
}IcVgRange_st, *pIcVgRange_st;
结构成员的命名同变量的命名规则。
2.3.4函数的命名
单词首字母为大写,其余均为小写,单词之间不用下划线。函数名应以一个动词开头,即函数名应类似“动宾结构”。命名举例:
extern int __stdcall BackMemToMemPool(pMenPoolMng_st pPool, pMemPoolIndex pIndexNide);
extern void __stdcall UninitMemPool(pMemPoolMng_st pPool);
2.4表达式和基本语句
读者可能怀疑:连if、for、while、goto、swicth这样简单的东西也要探讨编程风格,是不是有点小题大做了?
我真的发觉很多程序员用隐含错误的方式写表达式和基本语句,我自己也犯过类似的错误。表达式和语句都属于C++/C的短于机构语法。他们看似简单,但使用是隐患比较多。本节归纳了正确使用表达式和语句的一些规则与建议。
2.4.1运算符的优先级
C++/C语言的运算符有数十个,运算符的优先级与结合律如下表所示。注意一元运算符 +、-、*的优先级高于对应的二元运算符。
优先级 | 运算符 | 结合律 |
从高到低排列 | () [ ] -> . | 从左至右 |
! ~ ++ (类型) sizeof + - * & | 从右至左 | |
* / % | 从左至右 | |
+ - | 从左至右 | |
<< >> | 从左至右 | |
< <= > >= | 从左至右 | |
== != | 从左至右 | |
& | 从左至右 | |
^ | 从左至右 | |
| | 从左至右 | |
&& | 从左至右 | |
|| | 从右至左 | |
?: | 从右至左 | |
= += -= *= /= %= &= ^= |= <<= >>= | 从左至右 |
- 规则1:如果代码行中的运算符比较多,用括号确定表达式的操作顺序,避免使用默认的操作顺序。
由于将上表熟记比较困难,为了防止产生歧义并提高可读性,应当用括号确定表达式的操作顺序。
例如:
word = (high << 8) | low
if((a | b) && (a & c))
2.4.2复合表达式
如a = b = c这样的表达式称为复合表达式。允许复合表达式存在的理由是:(1)书写简洁;(2)可以提高编译效率。但要防止滥用复合表达式。
- 规则1:不要编写太复杂的复合表达式。
例如:i = a >= b && c < d && c + f <= g + h;//复合表达式过于复杂
- 规则2:不要有多用途的复合表达式。
例如:d = (a = b + c) + r;
该表达式即求a值又求d值。应拆分为两个独立的语句:
a = b + c;
d = a + r;
- 规则3:不要把程序中的复合表达式与“真正的数学表达式”混淆。
例如:if(a < b < c) //a < b < c是数学表达式而不是程序表达式
并不表示
if((a < b) && (b < c))
而是成了令人费解的
if((a < b) < c)
2.4.3if语句
if语句是C++/C语言中最简单、最常用的语句,然而很多程序员用隐含错误的方式写if语句。本小节以“与零值比较”为例,展开讨论。
2.4.3.1布尔值与零值比较
- 规则1:不可将布尔变量直接与TRUE、FALSE或1、0进行比较。
根据布尔类型的语义,零值为“假”(记为FALSE),任何非零值都是“真”(记为TRUE)。TRUE的值究竟是什么并没有同一的标准。例如Visual C++将TRUE定义为1,而Visual Basic则将TRUE定义为-1。
假设布尔变量名字为flag,它与零值比较的标准if语句如下:
if(flag) //表示flag为真
if(!flag) //表示flag为假
其他用法都属于不良风格,例如:
if(flag == TRUE)
if(flag == 1)
if(flag == FALSE)
if(flag == 0)
2.4.3.2整形变量与零值的比较
- 规则2:应当将整形变量用“==”或“!=”直接与0进行比较。
假设整形变量的名字为Value,它与零值比较的标准if语句如下:
if(0 == value)
if(0 != value)
不可模仿布尔变量的风格而写成
if(value) //会让人误解Value是布变量
if(!value)
2.4.3.3浮点变量与零值比较
- 规则3:不可将浮点变量用“==”或“!=”与任何数字比较
千万要留意,无论是float还是double类型的变量,都有进度限制。所以一定要避免将浮点数变量用“==”或“!=”与数字比较,应设法转化成“>=”或“<=”形式。
假设浮点变量的名字为x,应当将
if(x == 0.0) //隐含错误的比较
转化为
if((x >= -EPSINON) && (x <= EPSINON))
其中EPSINON是允许的误差(即精度)。
2.4.3.4指针变量与零值的比较
- 规则4:应当将指针变量用“==”或“!=”与NULL比较。
指针变量的零值是“空”(记为NULL)。尽管NULL的值与0相同,但两者的意义不同。假设指针变量的名字为p,它与零值的比较的表准if语句如下:
if(NULL == p) //p与NULL现实比较,强调p是指针变量
if(p != NULL)
不要写成
if(p == 0) //容易让人误解p是整形变量
if(p != 0)
或者
if(p) //容易让人误解p是布尔变量
if(!p)
2.4.3.5对if语句的补充说明
有时候我们可能会看到if(NULL == p)这样古怪的形式,我上面就是这样写的。不是程序写错了,是程序员为了防止将if(p == NULL) 误写成if(p = NULL),而有意把p和NULL颠倒。编译器认为if(p = NULL)是合法的,但是会指出if(NULL = p)是错误的,因为NULL不能被赋值。
程序中有时会遇到if/else/return的组合,应当将如下不良风格的程序
//不良的代码行
if(condition)
return x;
return y;
//良好的代码风格
if(condition)
{
return x;
}
else
{
return y;
}
//另外一种简单的风格
return (condition ? x : y);
2.4.4循环语句的效率
C++/C循环语句中,for语句使用频率最高,while语句其次,do语句很少用。本小节重点论述循环体的效率。提高循环体的效率的基本办法是降低循环体的复杂性。
建议1:在多重循环中,如果有可能,应当将最长的循环放在最内层,最短的循环放在最层,以减少CPU跨切循环层的次数。
//低效率的循环体
for(row=0; row<100; row++)
{
for(col=0; col<5; col++)
{
sum = sum + a[row][col];
}
}
//高效率的循环体
for(col=0; col<5; col++)
{
for(row=0; row<100; row++)
{
sum = sum + a[row][col];
}
}
建议2:如果循环体内存在逻辑判断,并且循环次数很大,宜将逻辑判断移到循环体的外面。
如下所示,如果N非常小,两者效率差别并不明显,采用简洁的书写比较方便。
//效率低但程序简洁
for(i=0; i<N; i++)
{
if(condition)
{
Dosomething();
}
else
{
DoOtherthing();
}
}
//效率高但程序不简洁
if(condition)
{
for(i=0; i<N; i++)
{
DoSomething();
}
}
else
{
for(i=0; i<N; i++)
{
DoOtherthing();
}
}
2.4.5for语句的循环控制变量
- 规则1:不可再for循环体内修改循环变量,防止for循环失去控制。
建议1:建议for语句的循环控制变量的取值采用“半开半闭区间”写法。
示例1中的x值属于半开半闭区间“0 =< x < N”,起点到终点的间隔为N,循环次数为N。
示例2中的x值属于闭区间“0 =< x <= N-1”,起点到终点的间隔为N-1,循环次数为N。
相比之下,示例1的写法更加直观,尽管两者的功能是相同的。
//示例1
for(int x=0; x<N; x++)
{
...
}
//示例2
for(int x=0; x <= N - 1; x++)
{
...
}
2.4.6switch语句
有了if语句为什么还要Switch语句?
switch是多分支选择语句,而if语句只有两个分支可供选择。虽然可以用嵌套的if语句来实现多分支选择,但那样的程序冗长难读。这是switch语句存在的理由。
switch语句的基本格式是:
switch(variable)
{
case value1:
...
break;
case value2:
...
break;
...
default:
...
break;
}
- 规则1:每个case语句的结尾不要忘记加break,否则将导致多个分支重叠(除非有意使多个分支重叠)。
- 规则2:不要忘记最后那个default分支。即使程序真的不需要default处理,也应该保留语句default:break;这样做并非多此一举,而是为了防止别人误以为你忘了default处理。
2.4.7goto语句
自从提倡结构化设计以来,goto就成了有争议的语句。首先,由于goto语句可以灵活跳转,如果不加限制,它的确会破坏结构化设计的风格。其次,goto语句经常带来错误或隐患。它可能跳过了某些对象的构造、变量的初始化、重要的计算语句等,例如:
goto state;
String s1, s2; //被goto跳过
int num = 0; //被goto跳过
...
state:
...
如果编译器不能发觉此类错误,每用一次goto语句都可能留下隐患。
很多人建议废除C++/C的goto语句,以绝后患。但实事求是的说,错误是程序员自己造成的,不是goto的过错。goto语句至少有一处可显神通,它能从多重循环体咻地一下子跳到外面,用不着写很多次的break语句,例如:
{
...
{
...
{
goto error;
}
}
}
error:
...
就像楼房着火了,来不及从楼梯一级一级往下走,可从窗口跳出火坑。所以我们主张少用 、慎用goto语句,而不是禁用。
2.5常量
常量是一种标识符,它的值在运行期间恒定不变。C语言用#define来定义常量(称为宏常量)。C++语言除了用#define外还可以用const来定义常量(称为const常量)。
2.5.1为什么需要常量
如果不使用常量,直接在程序中填写数字或字符串,将会有什么麻烦?
(1)程序的可读性(可理解性)变差。程序员自己会忘记哪些数字或字符串是什么意思,用户则更加不知道它们从何来、表示什么。
(2)在程序的很多地方输入同样的数字或字符串,难保不发生书写错误。
(3)如果要修改数字或者字符串,则会在很多地方改动,即麻烦又容易出错。
- 规则1:尽量使用含义 比较直观的常量来表示那些将在程序中多次出现的数字或字符串。
例如:
#define MAX 100 //C语言的宏常量
const int MAX = 100; //C++语言的const常量
const float PI = 3.14159 //C++语言的const常量
2.5.2const与#define比较
C++语言可以用const来定义常量,也可以用#define来定义常量。但是前者比后者有更多的优点:
(1)const常量有数据类型,而宏常量没有数据类型。编译器可以对前者进行类型安全检查。而对后者只进行字符替换,没有类型安全检查,并且在字符替换可能会产生意料不到的错误(边际效应)。
(2)有些集成化的调试工具可以对const常量进行调试,但是不能对宏常量进行调试。
- 规则1:在C++程序中只使用const常量而不使用宏常量,即const常量完全取代宏常量。
2.5.3常量定义规则
- 规则1:需要对外部公开的常量放在头文件中,不需要对外公开的常量放在定义文件头部。为便于管理,可以把不同模块的常量集中存放在一个公共的头文件中。
- 规则2:如果某一些常量与其他常量密切相关,应在定义中包含这种关系,而不应该给出一些孤立的值。
例如:
const float RADIUS = 100;
const float DIAMETER = RADIUS * 2;
2.5.4类中的常量
有时我们希望某些常量只存放在类中有效。由于#define定义的宏常量是全局的,不能达到目的,于是想当然地觉得应该用const修饰数据成员来实现。const数据成员的确是存在的,但其含义却不是我们所期待的。const数据成员只在某个对象的生存期内是常量,而对于整个类而言是可变的,因为类可以创建多个对象,不同的对象其const数据成员的值可以不同。
不能再类声明中初始化const数据成员。以下用法是错误的,因为类的对象未被创建时,编译器不知道SIZE的值是什么。
class A
{
...
const int SIZE = 100;//错误,企图在类声明中初始化const数据成员
int array[SIZE]; //错误,未知的SIZE
};
const数据成员的初始化只能在类的构造函数的初始化列表中进行,例如:
class A
{
...
A(int size); //构造函数
const int SIZE;
};
A::A(int size) : SIZE(size)//构造函数的初始化表
{
...
}
A a(100); //对象a的SIZE值为100
A b(200); //对象b的SIZE值为200
怎样才能建立在整个类中都恒定的常量呢?别指望const数据成员了,应该用类中的枚举常量来实现。例如:
class A
{
enum{SIZE1 = 100,SIZE2 = 200 };//枚举常量
int array[SIZE1];
int array[SIZE2];
} ;
枚举常量不会占用对象的存储空间,它们在编译时被全部求值。枚举常量的缺点是:它的隐含数据类型是整数,其最大值有限,且不能表示浮点数(如PI = 3.14159)。
2.6函数设计
函数是C++/C程序的基本功能单元,其重要性不言而喻。函数设计的细微缺点很容易导致该函数被错用,所以光使函数的功能正确是不够的。本小节重点论述函数的接口设计和内部实现的一些规则。
函数接口的两个要素是参数和返回值。C语言中,函数的参数和返回值的传递方式有两种:值传递和指针传递。C++语言中多了引用传递。由于引用传递的性质像指针传递,而使用方式却像值传递,初学者常常迷惑不解,容易引起混乱,请先阅读2.6.6节“引用和指针的比较”。
2.6.1参数的规则
- 规则1:参数的书写要完善,不要贪图省事只写参数的类型而省略参数的名字。如果函数没有参数 ,则用void填充。例如:
//良好的风格代码
void SetValue(int nWidth, int nHeight);
//不良的风格代码
void SetValue(int , int);
//良好的风格代码
float GetValue(void);
//不良的风格代码
float GetValue();
- 规则2:参数命名要恰当,顺序要合理。
例如编写字符串拷贝函数StringCopy,它有两个参数。如果把参数名字起为str1和str2,例如:
void StringCopy(char *str1, tinationchar *str2);
那么我们很难搞清楚究竟是把str1拷贝到str2中,还是刚好倒过来。
可以把参数名字起的更有意义,如叫strSource和strDestination。这样从名字上就可以看出应该把strSource拷贝到strDestination。
还有一个问题,这两个参数哪一个该在前哪一个该在后?参数的顺序要遵循程序员的习惯。一般地,应将目的参数放在前面,源参数放在后面。
如果将函数声明为:
void StringCopy(char *strSource, char *strDestination);
别人在使用时可能会不假思索地写成如下形式:
char str[20];
StringCopy(str, "hello World"); //参数顺序颠倒
- 规则3:如果参数是指针,且仅作输入作用,则应在类型前加const,以防止指针在函数体内被任意修改。
例如:
void StringCopy(char *strDestination, const char *strSource);
- 规则4:如果输入参数以值传递的方式传递对象,则宜改为“const &”方式来传递,这样可以省略去临时对象的构造和析构过程,从而提高效率。
建议1:避免函数有太多的参数,参数的个数尽量控制在5个以内。如果参数太多,在使用时容易将参数类型或顺序搞错。
建议2:尽量不要使用类型和数目不确定的参数。
C标准库函数printf是采用不确定参数的典型代表,其原型为:
int printf(const char *format[, argument]...);
这种风格的函数在编译时丧失了严格的类型安全检查。
2.6.2返回值规则
- 规则1:不要省略返回值的类型。
在C语言中,凡不加类型说明的函数,一律自动按整形处理。这样不会有什么好处,却容易被误解为void类型。
C++语言有严格的类型安全检查,不允许上述情况发生。由于C++程序可以调用C函数,为了避免混乱,规定任何C++/C函数都必须有类型。如果函数没有返回值,那么应该声明为void类型。
- 规则2:函数名字与返回值类型在语义上不可冲突。
违反这条规定的典型代表是C标准库函数getchar。
例如:char c;
c = getchar();
if(c == EOF)
...
按照getchar名字的意思,将变量c声明为char类型是很自然的事情。但不幸的是getchar的确不是char类型,而是int类型,其原型如下:
int getchar(void);
由于c是char类型,取值范围是[-128, 127],如果宏EOF的值在char的取值范围之外,那么。if语句将总是失败,这种“危险”人们一般哪里能料得到!导致本例错误的责任并不在用户,是函数getchar误导了使用者。
- 规则 3:不要将正常值和错误标志混在一起返回。正常值用输出参数获取,而错误标志用return语句返回。
回顾上例,C标准库函数的设计者为什么要将getchar声明为令人迷糊的int类型呢?他会那么傻吗?
在正常情况下,getchar的确返回单个字符。但如果getchar碰到文件结束标志或发生读错误,它必须返回一个标志EOF。为了区别于正常的字符,只好将EOF定义为负数(通常为-1)。因此函数getchar就成了int类型。
我们在实际工作中,经常会碰到上述令人为难得问题。为了避免出现误解,我们应该将正常值和错误标志分开。即:正常值用输出参数获得,而错误标志用return语句返回。
函数getchar可以改写成 BOOL GetChar(char *c);
虽然getchar比GetChar灵活,例如putchar(getchar());但是如果getchar用错了,它的灵活性又有什么用呢?
建议1:有时候函数原本不需要返回值,但为了增加灵活性如支持链式表达式,可以附加返回值。
例如字符串拷贝函数strcpy的原型:
char *strcpy(char *strDest, char *strSrc);
strcpy函数将strSrc拷贝至输出参数strDest中,同时函数的返回值又是strDest。这样做并非多此一举,可以获得如下灵活性:
char str[20];
int lenth = strlen(strcpy(str, "hello world"));
建议2:如果函数的返回值是一个对象,有些场合用“引用传递”替换“值传递”可以提高效率。而有些场合只能用“值传递”而不能用“引用传递”,否则会出错。
例如:
class String
{
...
//赋值函数
String & operate=(const String &other);
//相加函数,如果没有fried修饰则只允许有一个右侧参数
fried String operate+(const String &s1, const String &s2);
private:
char *m_pData;
}
String的赋值函数operate=的实现如下:
String & String::operate=(const String &other)
{
if(this == &other)
{
return *this;
}
delete m_pData;
m_pData = new char[strlen(other.data) + 1];
strcpy(m_pData, other.data);
return *this; //返回的是*this的引用,无需拷贝过程
}
对于赋值函数,应当用“引用传递”的方式返回String对象。如果用“值传递”的方式,虽然功能任然正确,但由于return语句要把*this拷贝到保存返回值的外部存储单元之中,增加了不必要的开销,降低了函数赋值的效率。例如:
String a, b, c;
...
a = b; //如果用“值传递”,将产生一次*this拷贝
a = b = c; //如果用“值传递”,将产生两次*this拷贝
String的相加函数operate+的实现如下:
String operate+(const String &s1, const String &s2)
{
String strTemp;
delete strTemp.data;//strTemp.data是仅包含‘\0’的字符串
strTemp.data = new char[strlen(s1.data) + strlen(s2.data) + 1];
strcpy(strTemp.data, s1.data);
strcat(strTemp.data, s2.data);
return strTemp;
}
对于相加函数,应当用“值传递”的方式返回String对象。如果改用“引用传递”,那么函数返回值是一个指向局部对象strTemp的“引用”。由于strTemp在函数结构体时被自动销毁,将导致返回的“引用”无效。例如:
c = a + b;
此时a+b并不是返回期待值,c什么也得不到,留下了隐患。
2.6.3函数内部实现的规则
不同功能的函数其内部实现各不相同,看起来似乎无法就“内部实现”达成一致的观点。但根据经验,我们可以在函数体的“入口处”和“出口处”从严把关,从而提高函数的质量 。
- 规则1:在函数体的“入口处”,对参数的有效性进行检查。
很多程序错误是由非法参数引起的,我们应该充分理解并正确使用“断言”(assert)来防止此类错误。详见2.6.5节“使用断言”。
- 规则2:在函数体的“出口处”,对return语句的正确性和效率进行检查。
如果函数有返回值,那么函数的“出口处”是return语句。我们不要轻视return语句,如果return语句写的不好,函数要么出错,要么效率低下。
注意事项如下:
(1)return语句不可返回指向“栈内存”的“指针”或者“引用”,因为该内存在函数体结束时被自动销毁。例如:
char * Func(void)
{
char str[] = "hello world"; //str的内存位于栈上
...
return str; //将导致错误
}
(2)要搞清楚返回的究竟是“值”、“指针”还是“引用”。
(3)如果函数返回值是一个对象,要考虑return语句的效率。例如:
return String(str1 + str2);
这是临时对象的语法,表示“创建一个临时对象并返回它”。不要以为它与“先创建一个局部对象Temp并返回它的结果”是等价的,如
String temp(s1 + s2);
return temp;
实质不然,上述代码将发生三件事。首先,temp对象被创建,同时完成初始化;然后拷贝构造函数把temp拷贝到保存返回值的外部存储单元中;最后,temp在函数结束时被销毁(调用析构函数)。然而“创建一个临时对象并返回它”的过程是不同的,编译器直接把临时对象创建并初始化在外部存储单元,省去了拷贝和析构的花费,提高了效率。
类似地,我们不要将
return int(x + y); //创建一个临时变量并返回它
写成
int temp = x + y;
return temp;
由于内部数据类型如int,float, double的变量不存在构造函数和析构函数,虽然该“临时变量的语法”不会提高多少效率,但是程序更加简易读。
2.6.4其它建议
建议1:函数的功能要单一,不要设计度用途的函数;
建议2:函数体的规模要小,尽量控制在150行代码以内;
建议3:尽量避免函数带有“记忆”功能。相同的输入应当产生相同的输出;
带有“记忆”功能的函数,其行为是不可预测的,因为它的行为可能取决于某种“记忆状态”。这样的函数即不易理解又不利于测试和维护。在C/C++语言中,函数的static局部变量是函数的“记忆存储器”。建议尽量少用static局部变量,除非必须。
建议4:不仅要检查输入参数的有效性,还要检查通过其它途径进入函数体内的变量的有效性,例如全局变量、文件句柄等。
建议5:用于出错处理的返回值一定要清楚,然使用者不容易忽视或误解错误情况。
2.6.5使用断言
程序一般分为Debug版本和Release版本,Debug版本用于内部调试,Release版本发行给用户使用。
断言assert是仅在Debug版本起作用的宏,它用于检查“不应该”发生的情况。如下例所示是一个内存赋值函数。在运行过程中,如果assert的参数为假,那么程序就会终止(一般地还会出现提示对话框,说明在什么地方引发了assert)。
void *memcpy(void *pvTo, const void *pvFrom, size_t size)
{
assert((pvTo != NULL) && (pvFrom != NULL)); //使用断言
byte *pbTo = (byte *)pvTo; //防止改变pvTo的地址
byte *pbFrom = (byte *)pvFrom //防止改变pvFrom的地址
while(size-- > 0)
{
*pbTo++ == *pbFrom++;
}
return pvTo;
}
assert不是一个仓促拼凑起来的宏。为了不再程序的Debug版本和Release版本引起差别,assert不应该产生任何副作用。所以assert不是函数,而是宏。程序员可以把assert看成在任何系统状态下都可以安全使用的无害测试手段。如果程序在assert处终止了,并不是说明含有该assert的函数有错误而是调用者出了差错,assert可以帮助我们找到发生错误的原因。
- 规则1:使用断言捕捉不应该发生的非法情况。不要混淆非法情况与错误情况之间的区别,后者是必然 存在的并且是一定要做出处理的。
- 规则2:在函数的入口处,使用断言检查参数的有效性(合法性)。
建议1:在编写函数时,要进行反复的考查,并且自问:“我打算做哪些假定?”一旦确定了的假定,就要使用断言对假定进行检查。
建议2:一般教科书都鼓励程序员们进行放错设计,但要记住这种编程风格可能会隐瞒错误。当进行放错设计时,如果“不可能发生”的事情的确发生了,则要使用断言进行报警。
2.6.6应用与指针的比较
引用是C++中的概念,初学者容易把引用和指针混淆一起。下面程序中,n是m的一个引用,m是被引用物。
int m;
int &n = m;
n相当于m的别名(绰号),对n的任何操作就是对m的操作。例如有人名叫王小毛,他的绰号是“三毛”。说“三毛”怎么怎么的,其实就是对王小毛说三到四。所以n即不是m的拷贝,也不是指向m的指针,其实n就是m她自己。
引用的一些规则如下:
(1)引用被创建的同时必须被初始化(指针则可以再任何时候被初始化);
(2)不能有NULL引用,引用必须与合法的存储单元关联 (指针则可以是NULL);
(3)一旦引被初始化,就不能改变引用的关系(指针可以随时改变所指向的对象) 。
以下示例程序中,k被初始化为i的引用。语句k = j并不能将k修改成为j的引用,只是把k的值改变成为6。由于k是i的引用,所以i的值也变成了6。
int i = 5;
int j = 6;
int &k = i;
k = j; //k和i的值都变成了6
上面程序看起来像在玩文字游戏,没有体现出引用的价值。引用的主要功能是传递函数的参数和返回值。C++语言中,函数的参数和返回值的传递方式有三种:值传递、指针传递和引用传递。
以下是“值传递”的示例程序。由于Func1函数体的x是外部变量n的一份拷贝,改变x的值不会影响n,所以n的值仍然是0。
void Func1(int x)
{
x = x + 10
}
...
int n = 0;
Func1(n);
cout << "n= " << n << endl;//n = 0
以下是“指针传递”的示例程序。由于Func2函数体的x是指向外部变量n的指针,改变该指针的内容将导致n的值改变,所以n的值成了10。
void Func(int *x)
{
(*x) = (*x) + 10;
}
...
int n = 0;
Func2(&n);
cout << "n= " << n << endl;//n = 10
以下是“引用传递”的示例程序。由于Func3函数体的x是外部变量n的引用,x和n是同一个东西,改变x等于改变n,所以n的值成为了10。
void Func3(int &x)
{
x = x + 10;
}
...
int n = 0;
Func3(n);
cout << "n= " << n << endl;//n = 10;
对比上述三个示例程序,会发现“引用传递”的性质像“指针传递”,而书写方式像“值传递”。实际上“引用”可以做的任何事情“指针”也能够做,为什么还要“引用”这东西?
答案是“用适当的工具做恰如其分的工作”。
指针能够毫无约束的操作内存中的任何东西,尽管指针功能强大,但是非常危险。就像一把刀,它可以用来砍树、裁纸、修指甲、理发等,谁敢这样用?
如果的确只需要借用一下某个对象的“别名”,那么就用“引用”,而不是要用“指针”,以免发生意外。比如说,某人需要一份证明,本来在文件上 盖上公章的印子就行了,如果把取公章的钥匙交给他,那么他就获得了不该有的权利。
2.7内存管理
欢迎进入内存这片雷区。程序员们经常编写内存管理程序,往往提心吊胆。如果不想触雷,唯一的解决办法就是发现所有潜伏的地雷并且排除它们,躲是躲不了的。本小节的内容比一般教科书要深入的多,读者需细心阅读,做到真正地通晓内存管理。
2.7.1内存分配方式
内存分配方式有三种:
(1)从静态存储区域分配。内存在程序编译的时候就已经分配好了,这块内存在程序的整个运行期间都 存在。例如全局变量、static变量;
(2)在栈上创建。在执行函数时,函数内局部变量的存储单元都可以在栈上创建,函数执行结束时这些存储单元自动释放。栈内存分配运算内置于处理器的指令集中,效率很高,但是分配的内存容量有限;
(3)从堆上分配,亦称动态内存分配。程序在运行的时候用malloc或new申请任意多少的内存,程序员自己负责在何时用free或delete释放内存。动态内存的生存期由我们决定,使用非常灵活 ,但问题也最多。
2.7.2常见的内存错误及其对策
发生内存错误是件非常麻烦的事。编译器不能自动发现这些错误,通常是在程序运行时才能捕捉到。而这些错误大多没有明显的症状,时隐时现,增加了改错的难度。有时候用户怒气冲冲地把你找来,程序却没有发生任何问题,你一走,错误又发作了。
常见的内存错误及其对策如下:
- 内存分配未成功,却使用了它。
编程新手常犯这种错误,因为他们 没有意识到内存分配会不成功。常用解决办法是,在使用内存之前检查指针是否为NULL。如果指针p是函数的参数,那么在函数的入口处用assert(p != NULL)进行检查。如果是用malloc或new来申请内存,应该用if(p == NULL)或if(p != NULL)来进行防错处理。
- 内存分配虽然成功,但是尚未初始化就引用它。
犯这种错误的主要有两个原因:一是没有初始化的观念;二是误以为内存的缺省初值全为零,导致引用初值错误(例如数组)。
内存的缺省初值究竟是什么并没有统一的标准,尽管有些时候为零值,我们宁可信其无不可信其有。所有不论用何种方式创建数组,别忘了赋初值,即便是赋灵芝也不可省略, 不要嫌麻烦。
- 内存分配成功并且已经初始化,但是操作越过了内存边界。
例如在使用数组时经常发生下标“多1”或者“少1”的操作。特别是在for循环语句中,循环次数很容易搞错,导致数组操作越界。
- 忘记了释放内存,造成内存泄漏
含有这种错误的函数每被调一次就丢失一块内存。刚开始系统的内存充足,你看不到错误。终有一次程序突然死掉,系统出现提示:内存耗尽。
动态内存的申请与释放必须配队,程序中malloc与free的使用次数一定要相同,否则肯定有错误(new/delete同理)。
- 释放了内存却继续使用它
有三种情况:
(1)程序中的调用关系过于复杂,是在难以搞清楚某个对象是否已经被释放了内存,此时应该宠幸设计数据结构,从根本上解决对象管理的混乱局面。
(2)函数的return语句写错了,注意不要返回指向“栈内存”的“指针”或者“引用”,因为该内存在函数体结束时被自动销毁。
(3)使用free或delete释放了内存后,没有将指针设置为NULL。导致产生“野指针”。
- 规则1:用malloc或new申请内存之后,应该立即检查指针值是否为NULL。防止使用指针值为NULL的内存。
- 规则2:不要忘记为数组和动态内存赋初值。防止将未被初始化的内存作为右值使用。
- 规则3:避免数组或指针的下标越界,特别要当心发生“多1”或者“少1”操作。
- 规则4:动态内存的申请与释放必须配对,防止内存泄漏。
- 规则5:用free或delete释放内存之后,立即将指针设置为NULL,防止产生“野指针”。
2.7.3指针与数组的对比
C++/C程序中,指针和数组在不少地方可以相互替换着使用,让人产生一种错觉,以为两者是等价的。
数组要么在静态存储区被创建(如全局数组),要么在栈上被创建。数组名对应着(而不是指向)一块内存,其地址与容量在生命周期内保持不变,只有数组的内容可以改变。
指针可以随意指向任意类型的内存块,它的特征是“可变”,所以我们常用指针来操作动态内存 。指针远比数组灵活,但也更危险。
下面以字符串为例比较指针与数组的特性。
2.7.3.1修改内容
示例1中,字符数组a的容量是6个字符,其内容为hello\0。a的内容可以改变,如a[0] = 'X'。指针p指向常量字符串“world”(位于静态存储区,内容为world\0),常量字符串的内容是不可以被修改的。从语法上看,编译器并不觉得语句p[0] = 'X'有什么不妥,但是该语句企图修改常量字符串的内容导致运行错误。
//示例1
char a[] = "hello";
a[0] = 'X';
cout << a << endl;
char *p = "world"; //注意p指向的是常量字符串
p[0] = 'X'; //编译器不能发现该错误
cout << p << endl;
2.7.3.2内容赋值与对比
不能对数组名进行直接复制与比较。示例2中,若想把数组a的内容赋值给数组b,不能用语句 b = a,否则将产生编译错误。应该用标准库函数strcpy进行复制。同理,比较b和a的内容是否相同,不能用if(b == a)来判断,应该用标准库函数strcmp进行比较。
语句p = a并不能把a的内容复制指针p,而是把a的地址赋给了p。想要复制a的内容,可以先用库函数malloc为p申请一块容量为strlen(a) + 1 个字符的内存,在用strcpy进行字符串复制。同理,语句if(p == a)比较的不是内存而是地址,应该用库函数strcmp来比较。
//数组...
char a[] = "hello";
char b[10];
strcpy(b, a); //不能使用b = a;
if(strcmp(b, a) == 0) //不能用if(b == a)
{
...
}
//指针...
int len = strlen(a);
char *p = (char *)malloc(sizeof(char) * (len + 1));
strcpy(p, a); //不要用 p = a;
if(strcmp(p, a) == 0) //不要用if(p == a)
{
...
}
2.7.3.3计算内存容量
用运算符sizeof可以计算数组的容量(字节数)。示例3a中,sizeof(a)的值是12(注意别忘了‘\0’)。指针p指向a,但是sizeof(p)的值却是4。这是因为sizeof(p)得到的是一个指针变量的字节数,相当于sizeof(char *),而不是p所指的内存容量。C++/C语言没有办法知道指针所指的内存容量,除非在申请内存时记住它。
注意当数组作为函数的参数进行传递时,该数组自动退化为同类型的指针。示例3b中,不论数组a的容量是多少,sizeo(a)始终等于sizeof(char *)。
//示例3a
//计算数组和指针的内存容量
char a[] = "hello world";
char *p = a;
cout << sizeof(a) << endl; //12字节
cout << sizeof(p) << endl; //4字节
//示例3b
//数组退化为指针
void Func(char a[100])
{
cout << sizeof(a) << endl; //4字节而不是100字节
}
2.7.4指针参数是如何传递内存的?
如果函数的参数是一个指针,不要指望用该指针去申请动态内存。示例4中,Test函数的语句GetMemory(str, 200)并没有使str获得期望的内存,str依旧是NULL,为什么?
void GetMemory(char *p, int num)
{
p = (char *)malloc(sizeof(char) * num);
}
void Test(void)
{
char *str = NULL;
GetMemory(str, 100); //str仍然为NULL
strcpy(str, "hello"); //运行错误
}
毛病出在函数GetMemory中。编译器总是要为函数的每个参数制作临时副本,指针参数p的副本是_p,编译器使_p = p。如果函数体内的程序修改了_p的内容 ,就导致参数p的内容做相应的修改。这就是指针可以用作输出参数的原因。在本例中,_p申请了新的内存,只是把_p所指的内存地址改变了,但是p丝毫未变。所以函数GetMemory并不能输出任何东西。事实上,每执行一次GetMemory就会泄漏一块内存,因为没有用free释放内存。
如果非得要用指针参数去申请内存,那么应该改用“指向指针的指针”,见下例。
void GetMemory2(char **p, int num)
{
*p = (char *)malloc(sizeof(char) *num);
}
void Test2(void)
{
char *str = NULL;
GetMemory2(&str, 100); //注意参数是&str, 而不是str
strcpy(str, "hello");
cout << str << endl;
free(str);
}
由于“指向指针的指针”这个概念不容易理解,我们可以用函数的返回值来传递动态内存。这种方法更加简单,见下例。
void *GetMemory3(int num)
{
char *p = (char *)malloc(sizeof(char) *num);
return p;
}
void Test3(void)
{
char *str = NULL;
str = GetMemory3(100);
strcpy(str, "hello");
cout << str << endl;
free(str);
}
用函数返回值来传递内存这种方法虽然好用,但是常常有人把return语句用错了。这里强调不要用return语句返回指向“栈内存”的指针,因为该内存存在函数结束时自动消亡。见下例。
char *GetString(void)
{
char p[] = "hello world";
return p; //编译器将提出警告
}
void Test4(void)
{
char *str = NULL;
str = GetMemory(); //str的内容是垃圾
cout << str << endl;
}
用调试器逐步跟踪Test4,发现执行str = GetString语句后str不再是NULL指针,但是str的内容不是“hello world”而是垃圾。
如果把示例4写成示例5,会怎么样?
char *GetString2(void)
{
char *p = "hello world";
return p;
}
void Test5(void)
{
char *str = NULL;
str = GetString2();
cout << str << endl;
}
函数Test5运行虽然不会出错,但是函数GetMemory2的设计概念却是错误的。因为GetString2内的“hello world” 是常量字符串,位于静态存储区,它在程序生命期内恒定不变。无论什么时候调用GetString2,它返回的始终是一个“只读”的内存块。
2.7.5free和delete把指针怎么啦?
别看free和delete的名字恶狠狠的(尤其是delete),他们只是把指针所指向的内存给释放掉了,但并没有把指针本身干掉。
用调试器跟踪示例5,发现指针p被free以后其地址仍然不变(非NULL),只是改地址对应的内存是垃圾,p成了“野指针”。如果此时不把p设置为NULL,会让人误会以为p是个合法指针。
如果程序比较长,我们有时记不住p所指的内存是否已经被释放了,再继续使用p之前,通常会用语句if(p != NULL)进行放错处理。很遗憾,此时if语句起不到防错作用,因为即使p不是NULL指针,它也不指向合法的内存块。
char *p = (char *)malloc(100);
strcpy(p, "hello");
free(p); //p所指的内存块被释放,但是p所指的地址仍然不变
...
if(p != NULL)
{
strcpy(p, "world"); //出错
}
2.7.6动态内存会被自动释放吗?
函数体内的局部变量在函数结束时自动消亡。哼很多人误以为上述示例是正确的。理由是p是局部的指针变量,它消亡的时候会让它所指的动态内存一起完蛋。这是错觉!
void Func(void)
{
char *p = (char *)malloc(100); //动态内存会自动释放吗?
}
我们发现指针有一些“似是而非”的特征:
(1)指针消亡了,并表示它所指向的内存会被自动释放。
(2)内存被释放了,并不表示指针会消亡或者成了NULL指针。
这表明释放内存并不是一件可以草率对待的事。也许有人不服气,一定要找出可以草率行事的理由:
如果程序终止了运行,一切指针都会消亡,动态内存会被操作系统回收。既然如此,在程临终前,就可以不必释放内存、不必将指针设置为NULL了。终于可以偷懒不会发生错误了吧?
想得美。如果别人把那段程序取出来用到其他地方怎么办?
2.7.7杜绝“野指针”
“野指针”不是NULL指针,是指向“垃圾”内存的指针。人们一般不会错用NULL指针,因为用if语句很容易判断。但是“野指针”是很危险的,if语句对它不起作用。
“野指针”的成因主要有两种:
(1)指针变量没有被初始化。任何指针变量刚被创建时不会自动成为NULL指针,它的缺省值是随机的,它会乱指一气。所以,指针变量在创建的同时应当被初始化,要么将指针设置为NULL,要么让它指向合法的内存。例如:
char *p = NULL;
char *str = (char *)malloc(100);
(2)指针p被free或者delete之后,没有设置NULL,让人误以为p是个合法的指针。 参见2.7.5。
(3)指针操作超越了变量的作用范围。这种情况让人防不胜防,示例程序如下:
class A
{
public:
void Func(void)
{
cout << "Func of class A" << endl;
}
};
void Test(void)
{
A *p;
{
A a;
p = &a;//注意a的生命周期
}
p->Func();//p是野指针
}
函数Test在执行语句p->Func()时,对象a已经消失,而p是指向a的,所以p就成了“野指针”。但奇怪的是我运行这个程序时居然没有出错,这可能与编译器有关。
2.7.8有了malloc/free为什么还要new/delete?
malloc与free是C++/C语言的标准库函数,new/delete是C++运算符。它们都可以用于申请动态内存和释放内存。
对于非内部数据类型的对象而言,光用malloc/free无法满足动态对象的要求。对象在创建的同时要自动执行构造函数,对象在消亡之前要自动执行析构函数。由于malloc/free是库函数而不是运算符,不再编译器控制权限之内,不能够把执行构造函数和析构函数的任务强加于malloc/free。
因此C++语言需要一个能完成动态内存分配和初始化工作的运算符new,以及一个能完成清理于释放工作的运算符delete。注意new/delete不是库函数。
我们先看一看malloc/free和new/delete如何实现对象的动态内存管理,见下例:
class Obj
{
public:
Obj(void){ cout << "Initialization" << endl; }
~Obj(void){ coud << "Destroy" << endl; }
void Initialize(void){ cout << "Initialization" << endl; }
void Destroy(void){ cout << "Destroy" << endl; }
};
void Usemallocfree(void)
{
Obj *a = (Obj *)malloc(sizeof(Obj)); //申请动态内存
a->Initialize(); //初始化
...
a->Destroy(); //清除工作
free(a); //释放内存
}
void UseNewDelete(void)
{
Obj *a = new Obj;//申请动态内存并初始化
//...
delete a; //清除并且释放内存
}
类Obj的函数Initialize模拟了构造函数的功能,函数Destroy模拟了析构函数的功能。函数Usemallocfree中,由于malloc/free不能执行构造函数与析构函数,必须调用成员函数Initialize和Destroy来完成初始化与清除工作。函数UseNewDelete则简单得多。
所以我们不要企图用malloc/free来完成动态对象的内存管理,应该用new/delete。由于内部数据类型的“对象”没有构造与析构的过程,对它们而言malloc/free和new/delete是等价的。
既然new/delete的功能完全覆盖了malloc/free,为什么C++不把malloc/free淘汰出局呢?这是因为C++程序经常要调用C函数,而C程序只能用malloc/free管理动态内存。
如果用free释放“new创建的动态对象”,那么该对象因无法执行析构函数而可能导致程序出错。如果用delete释放“malloc申请的动态内存”,理论上讲程序不会出错,但是该程序的可读性很差。所以new/delete必须配对使用,malloc/free也一样。
2.7.9内存耗尽怎么办?
如果在申请动态内存时找不到足够大的内存块,malloc和new将返回NULL指针,宣告内存申请失败。通常有三种方式处理“内存耗尽”问题。
(1)判断指针是否为NULL,如果时则马上用return语句终止本函数。例如:
void Func(void)
{
A *a = new A;
if(NULL == a)
{
return;
}
...
}
(2)判断指针是否为NULL,如果是则马上用exit(1)终止整个程序的运行。例如:
void Func(void)
{
A *a = new A;
if(NULL == a)
{
cout << "Memory Exhausted" << endl;
exit(1);
}
...
}
(3) 为new和malloc设置异常处理函数。例如Visual C++可以用_set_new_hander函数为new设置用户自己定义的异常处理函数,也可以让malloc享用与new相同的异常处理函数。详细内容请参考C++使用手册。
上述(1)(2)方式使用最普遍。如果一个函数内有多处需要申请动态内存,那么方式(1)就显得力不从心(释放内存很麻烦),应该用方式(2)来处理。
很多人不忍心用exit(1),问:“不编写出错处理程序,让操作系统自己解决行不行?”
答案是不行,如果发生“内存耗尽”这样的事情,一般来说应用程序已经无可救药。如果不用exit(1)把坏程序杀死,它可能会害死操作系统。道理如同:如果不把歹徒击毙,歹徒在老死之前会犯下更多的罪。
有一个很重要的现象要告诉大家。对于32位以上的应用程序而言,无论怎样使用malloc与new,几乎不可能导致“内存耗尽”。我在Windows 98下用VisualC++编写了测试程序,见下例。这个程序会无休止地运行下去,根本不会停止。因为32位操作系统支持“虚存”,内存用完了,自动用硬盘空间顶替。我只听到硬盘嘎吱嘎吱的响,Windows 98已经累的对键盘、鼠标毫无反应。
我可以得出一个结论:对于32位以上的应用程序,“内存耗尽”错误错误处理程序毫无作用。这下把Unix和Windows程序员们乐坏了:反正错误处理程序不起作用,我就不写了,省了很多麻烦。
我不想误导读者,必须强调:不加错误处理将导致程序的质量很差,千万不可因小失大。
void main(void)
{
float *p = NULL;
while(TRUE)
{
p = new float[1000000];
cout << "eat memory" << endl;
if(NULL == p)
{
exit(1);
}
}
}
2.7.10malloc/free的使用要点
函数malloc的原型如下:
void *malloc(size_t size);
用malloc申请一块长度为length的整数类型的内存,程序如下:
int *p = (int *)malloc(sizeof(int ) * length);
我们应当把注意力集中在两个要素上:“类型转换”和“sizeof”。
- malloc返回值的类型是void *,所以在调用malloc时要显示地进行类型转换,将void *转换成所需要的指针类型。
- malloc函数本身并不识别要申请的内存是什么类型,它只关心内存的总字节数。我们通常记不住int、float等数据类型的变量的确切字节数。例如int变量在16位系统下是2个字节,在32位下是4个字节;而float变量在16位系统下是4个字节,在32位下也是4个字节。最好用sizeof()运算符做一下测试。
- 函数free的原型如下:
void free(void * memblock);
为什么free函数不像malloc函数那样复杂呢?这是因为指针p的类型以及它所指的内存的容量事先都是知道的,语句fre(p)能正确的释放内存。如果指针p是NULL指针,那么free对p无论操作多少次都不会出问题。如果p不是NULL指针,那么free对p连续操作两次就会导致程序运行错误。
2.7.11new/delete的使用要点
运算符new使用起来要比函数malloc简单的多,例如:
int *p1 = (int *)malloc(sizeof(int) * length);
int *p2 = new int[length];
这是因为new内置了sizeof、类型转换和类型安全检查功能。对于非内部数据类型的对象而言,new在创建动态内存对象的同时完成了初始化工作。如果对象有多个构造函数,那么new的语句也可以有多种形式。例如:
class Obj
{
public:
Obj(void); //无参数的构造函数
Obj(int x); //带一个参数的构造函数
...
};
void Test(void)
{
Obj *a = new Obj;
Obj *b = new Obj(1);//初始值为1
...
delete a;
delete b;
}
如果同new创建对象数组,那么只能使用对象的无参数构造函数。例如:
Obj *objects = new Obj[100];//创建100个动态对象
而不能写成:
Obj *objects = new Obj[100](1);//创建100个动态对象的同时赋初值为1
在用delete释放对象数组时,留意不要丢了符号‘[ ]’。例如:
delete []objects;//正确的写法
delete objects;//错误的写法
后者相当于delete objects[0],漏掉了林外99个对象。
2.7.12一些心得体会
我认识不少技术不错的C++/C程序员,很少有人能拍拍胸脯说通晓指针与内存管理(包括我自己)。我最初学习C语言是特别怕指针,导致我写代码的时候没有使用一个指针,全用数组来顶替指针,是在蠢笨得过分。躲避指针不是办法,后来我改写了这个软件,代码量缩小到原先的一半。
我的经验教训是:
(1)越是怕指针,就越要使用指针。不会正确使用指针,肯定算不上是合格的程序员。
(2)必须养成“使用调试器逐步跟踪程序”的习惯,只有这样才能发现问题的本质。
2.8C++函数的高级特性
对比于C语言的函数,C++增加了重载、内联、const和virtual四种机制。其中重载和内联机制既可以用于全局函数也可以用于类的成员函数,const与virtual机制仅用于类的成员函数。
重载和内联肯定有其好处才会被C++语言采纳,但是不可以当成免费的午餐而滥用。本小节将探究重载和内联的优点与局限性,说明什么情况下应该采用、不该采用以及要警惕使用。
2.8.1函数重载的概念
2.8.1.1重载的起源
自然语言中,一个词可以有许多不同的定义,即改词被重载了。人们可以通过上下文来判断该词到底是那种含义。“词的重载”可以使语言更加简练。例如“吃饭”的含义十分广泛,人们没有必要每次非得说清楚具体吃什么不可。别迂腐的像孔乙己,说茴香豆的茴字有四种写法。
在C++程序中,可以将语义、功能相似的几个函数用同一个名字表示,即函数重载。这样便于记忆,提高了函数的易用性,这是C++语言采用重载机制的一个理由。例如下面的例子中,函数EatBeef、Eatfish、EatChicken可以用同一个函数名Eat表示,用不同类型的参数加以区别。
void EatBeef(...); //可改为void Eat(Beef...);
void EatFish(...); //可改为void Eat(Fish...);
void EatChicken(...); //可改为void Eat(Chicken...);
C++语言采用重载机制的另一个理由:类的构造函数需要重载机制。因为C++规定类的构造函数于类同名(请参见2.9),构造函数只能有一个名字。如果想用几种不同的方法创建对象该怎么办?别无选择,只能用重载机制来实现。所以类可以有多个同名的构造函数。
2.8.1.2重载是如何实现的?
几个同名的重载函数仍然时不同的函数,它们是如何区分的呢?我们自然想到函数接口的两个要素:参数与返回值。
如果同名函数的参数不同(包括类型、顺序不同),那么容易区别出它们是不同的函数。
如果同名函数仅仅是返回值的类型不同,有时可以区分,有时却不能。例如:
void Function(void);
int Function(void);
上述两个函数,第一个没有返回值,第二个返回值是int类型。如果这样调用函数:
int x = Function();
则可以判断出Function是第二个函数。问题是在C++/C程序中,我们可以忽略函数的返回值。在这种情况下,编译器和程序员都不知道那个Function函数被调用。
所以只能靠参数而不能靠返回值类型的不同来区分重载函数。编译器根据参数为每个重载函数产生不同的内部标识符。例如编译器为2.8.1.1中的示例的三个Eat函数产生像_eat_beff、_eat_fish、_eat_chicken之类的内部标识符(不同的编译器可能产生不同风格的内部标识符)。
如果C++程序要调用已被编译后的C函数,该怎么办?
假设某个C函数的声明如下:
int foo(int x, int y);
该函数被C编译器编译之后再库中的名字为_foo,而C++编译器则会产生像_foo_int_int之类的名字用来支持函数重载和类型安全连接。由于编译后的名字不同,C++程序不能直接调用C函数。C++提供了一个C函数连接交换指定符号extern “C”来解决这个问题。例如:
extern "C"
{
void foo(int x, int y);
...//其它函数
}
或者写成
extern "C"
{
#include "myheader.h"
...//其它C头文件
}
这就告诉C++编译器,函数foo是个C连接,应该到库中找名字_foo而不是找_foo_int_int。C++编译器开发商已经对C标准库的头文件作了extern "C"处理,所以我们可以用#include直接引用这些头文件。
注意并不是两个函数的名字相同就能构成重载。全局函数和类的成员函数同名不算重载,因为函数的作用域不同。例如:
void Print(...); //全局函数
class A
{void Print(...); //成员函数
}
不论两个Print函数的参数是否相同,如果类的某个成员函数要调用全局函数Print,为了与成员函数Print区别,全局函数被调用时应加“::”标志。如
::Print(...); //表示Print是全局函数而非成员函数
2.8.1.3当心隐式类型转换导致重载函数产生二义性
下面示例中,第一个output函数的函数时int类型,第二个output函数的参数是float类型。由于数字本身没有类型,将数字当做参数时将自动进行类型转换(称为隐式类型转换)。语句output(0.5)将产生编译错误,因为编译器不知道将0.5转换成int还是float类型的参数。隐式类型转换在很多地方可以简化程序的书写,但也有可能留下隐患。
#include <iostream.h>
void output(int x); //函数声明
void output(float x); //函数声明
void output(int x)
{
cout << "output int" << x << endl;
}
void output(float x)
{
cout << "output float" << x << endl;
}
void main()
{
int x = 1;
float y = 1.0;
output(x); //output int 1
output(y); //output float 1
output(1); //output int 1
// output(0.5); //error! 因为自动类型转换
output(int(0.5));//output int 0
output(float(0.5));//output float 0.5
}
2.8.2成员函数的重载、覆盖与隐藏
成员函数的重载、覆盖与隐藏很容易混淆,C++程序员必须要搞清楚概念,否则错误将防不胜防。
2.8.2.1重载与覆盖
成员函数被重载的特征:
(1)相同的范围(在同一个类中);
(2)函数名字 相同;
(3)参数不同;
(4)virtual关键字可有可无。
覆盖是指派生类函数覆盖其基类函数,特征是:
(1)不同的范围(分别位于派生类与基类);
(2)函数名字相同;
(3)参数相同;
(4)基类函数必须有virtual关键字。
下面示例中,函数Base::f(int)与Base::f(float)相互重载,而Base::g(void)被Derived::g(void)覆盖。
#include <iostream.h>
class Base
{
public:
void f(int x)
{
cout << "Base::f(int)" << x << endl;
}
void f(float x)
{
cout << "Base::f(float)" << x << endl;
}
virtual void g(void)
{
cout << "Base::g(void)" << endl;
}
};
class Derived: public Base
{
public:
virtual void g(void)
{
cout << "Derived::g(void)" << endl;
}
};
void main()
{
Derived d;
Base *pb = &d;
pb->f(42); //Base::f(int) 42
pb->f(3.14f); //Base::f(float) 3.14
pb->g(); //Derived::g(void)
}
2.8.2.2令人迷惑的隐藏规则
本来仅仅区分重载与覆盖并不算困难,但是C++的隐藏规则使问题复杂性徒然增加。这里“隐藏”是指派生类的函数屏蔽了与其同名的基类函数,规则如下:
(1)如果派生类的函数与基类的函数同名,但是参数不同。此时,不论有无virtual关键字,基类的函数将被隐藏(注意别与重载混淆);
(2)如果派生类的函数与基类的函数同名 ,并且参数也相同,但是基类函数没有virtual关键字。此时,基类的函数被隐藏(注意别与覆盖混淆)。
下面示例a中:
(1)函数Derived::f(float)覆盖了Base::f(float);
(2)函数Derived::g(int)隐藏了Base::g(float),而不是重载;
(3)函数Derived::h(float)隐藏了Base::h(float),而不是覆盖。
#include <iostream.h>
class Base
{
public:
virtual void f(float x)
{
cout << "Base::f(float)" << x << endl;
}
void g(float x)
{
cout << "Base::g(float)" << x << endl;
}
void h(float x)
{
cout << "Base::h(float)" << x << endl;
}
};
class Derived : public Base
{
public:
virtual void f(float x)
{
cout << "Derived::f(float)" << x << endl;
}
void g(int x)
{
cout << "Derived::g(int)" << x << endl;
}
void h(float x)
{
cout << "Derived::h(float)" << x << endl;
}
};
根据考察,很多C++程序员没有意识到有“隐藏”这回事。由于认识不够深刻,“隐藏”的发生可谓神出鬼没,常常产生令人迷惑的结果。
示例b中,bp和dp指向同一地址,按理说运行结果应该是相同的,可事实并非这样。
void main()
{
Derived d;
Base *bp = &d;
Derived *dp = &d;
//Good : behavior depends solely on type of the object
bp->f(3.14); //Derived::f(float) 3.14
dp->f(3.14); //Derived::f(flaot) 3.14
//Bad : behavior depends on type of the pointer
bp->g(3.14f); //Base::g(float) 3.14
dp->g(3.14f); //Derived::g(int) 3 (surprise!)
//Bad : behavior depends on type of the pointer
bp->h(3.14f); //Base::h(float) 3.14 (surprise!)
dp->h(3.14f); //Derived::h(float) 3.14
}
2.8.2.3摆脱隐藏
隐藏规则引起了不少麻烦。下面示例中pd->f(10)的本意是想调用函数Base::f(int),但是Base::f(int)不幸被Derived::f(char *)隐藏了。由于数字10不能被隐式地转化为字符串,所以在编译时会出错。
class Base
{
public:
void f(int x);
};
class Derived : public Base
{
public:
void f(char *);
};
void Test(void)
{
Derived *pd = new Derived;
pd->f(10); //error
}
从上述示例看来,隐藏的规则似乎很愚蠢。但是隐藏规则至少有两个纯在的理由:
- 写语句pd->f(10)的人可能真的想调用Derived::f(char *)函数,只是他误将参数写错了。有了隐藏规则,编译器就可以明确指出错误,这未必不是见好事。否则,编译器回静悄悄 地将错就错,程序员将很难发现这个错误,留下祸根。
- 假如类Derived有很多个基类(多重继承),有时候搞不清哪些基类定义了函数f。如果没有隐藏规则,那么pd->f(10)可能会调用一个出乎意料的基类函数f。尽管隐藏规则看起来不怎么有道理,但它的确能消灭这些意外。
上述示例中,如果语句pd->f(10)一定要调用函数Base::f(int),那么将类Derived修改为如下即可。
class Derived : public Base
{
public:
void f(char *);
void f(int x)
{
Base::f(x);
}
};
2.8.3参数的缺省
有一些参数的值在每次函数调用时都相同,书写这样的语句会使人厌烦。C++语言采用参数的缺省值使书写变得简洁(在编译时,缺省值由编译器自动插入)。
参数缺省值使用规则:
- 规则1:参数的缺省值只能出现在函数的声明中,而不能出现在定义体中。
例如:
void Foo(int x = 0, int y = 0); //正确,缺省值出现在函数的声明中
void Foo(int x = 0, int y = 0) //错误,缺省值出现在函数的定义体中
{
...
}
为什么会这样?我想是有两个原因:一是函数的实现(定义) 本来就与参数是否有缺省值无关,所以没有必要让缺省值出现在函数的定义体中。二是参数的缺省值可能会改动,显然修改函数的声明比修改函数的定义要方便。
- 规则2:如果函数有多个参数,参数只能从后向前爱个缺省,否则将导致 函数调用语句怪模怪样。
正确的示例如下:
void Foo(int x, int y = 0, int z = 0);
错误的示例如下:
void Foo(int x = 0, int y, int z = 0);
要注意,使用参数的缺省值并没有赋予函数新的功能,仅仅是使书写变得简洁一些。它可能会提高函数的易用性,但是也可能会降低函数的可理解性。所以我们自能适当地使用参数的缺省值,要防止使用不当产生负面效果。下面示例中,不合理的使用参数的缺省值将导致重载函数output产生二义性。
#include <iostream.h>
void output(int x);
void output(int x, float y = 0);
void output(int x)
{
cout << "output int " << x << endl;
}
void output(int x, float y)
{
cout << "output int " << x << "and float" << y << endl;
}
void main()
{
int x = 1;
float y = 0.5;
//output(x); //error!ambiguous call
output(x, y); //output int 1 and float 0.5
}
2.8.4运算符的重载
2.8.4.1概念
在C++语言中,可以用关键字operator加上运算符来表示函数,叫做运算符重载 。例如两个复数相加函数:
Complex Add(const Complex &a, const Complex &b);
可以用运算符重载来表示:
Complex operator+(const Complex &a, const Complex &b);
运算符与普通函数在调用时的不同之处是:对于普通对象,参数出现在圆括号内;而对于运算符,参数出现在其左、右侧。例如:
Complex a, b, c;
...
c = add(a, b); //用普通函数
c = a + b; //用运算符 +
如果运算符被重载为全局函数,那么只有一个参数的运算符叫做一元运算符,有两个参数的运算符叫做二元运算符。
如果运算符被重载为类的成员函数,那么一元运算符没有参数,二元运算符只有一个右侧参数,因为对象自己成了左侧参数。
从语法上将,运算符即可以定义为全局函数,也可以定义为成员函数,其总结了如下表的规则:
运算符 | 规则 |
所有的一元运算符 | 建议重载为成员函数 |
= () [ ] -> | 只能重载为成员函数 |
+= -= /= *= &= |= ~= %= >>= <<= | 建议重载为成员函数 |
所有其它的运算符 | 建议重载为全局函数 |
由于C++语言支持函数的重载,才能将运算符当成函数来用,C语言就不行。我们要以平常心来对待运算符的重载:
(1)不要过分担心自己不会用,它的本质仍然是程序员们熟悉的函数。
(2)不要过分热心地使用,如果它不能使代码变得更加易读写,那就别用,否则会自找麻烦。
2.8.4.2不能被重载的运算符
在C++运算符集合中,有一些运算符是不允许被重载的。这种限制是出于安全方面的考虑,可防止错误与混乱。
(1)不能改变C++内部数据类型(如int 、float等)的运算符。
(2)不能重载‘.’,因为‘.’在类中对任何成员都有意义,已经成为标准用法。
(3)不能重载目前C++运算符集合中没有的符号,如#,@,¥等。原因有两点,一是难以理解,二是难以确定优先级。
(4)对已存在的运算符进行重载时,不能改变优先级规则,否则将引起混乱。
2.8.5函数内联
2.8.5.1用内联函数取代宏代码
C++语言支持函数内联,其目的是为了提高函数的执行效率(速度)。
在C程序中,可以用宏代码提高执行效率。宏代码本身不是函数,但使用起来像函数。预处理器用复制宏代码的方式代替函数调用,省去了参数压栈、生成汇编语言的CALL调用、返回参数、执行return等过程,从而提高了速度。使用宏代码最大的缺点是容易出错,预处理器在复制宏代码时常常产生意想不到的边际效应。例如:
#define MAX(a, b) (a) > (b) ? (a) : (b)
语句result = MAX(i, j) + 2;
将被预处理器解释为
result = (i) > (j) ? (i) : (j) + 2;
由于运算符“+”比运算符“:”的优先级高,所以上述语句并不等价于期望
result = ( (i) > (j) ? (i) : (j) ) + 2;
如果把宏代码改写为
#define MAX(a, b) ((a) > (b) ? (a) : (b))
则可以解决优先级引起的错误。但是即使使用修改后的宏代码也不是万无一失的,例如语句
result = MAX(i++, j);
将被预处理器解释为
result = (i++) > (j) ? (i++) : (j);
对于C++而言,使用宏代码还有另一种缺点:无法操作类的私有数据成员。
让我们看看C++的内联函数是怎么工作的。对于任何内联函数,编译器在符号表里放入函数的声明(包括名字、参数类型、返回值类型)。如果编译器没有发现内联函数存在错误,那么该函数的代码也被放入符号表里。在调用一个内联函数时,编译器首先检查调用是否正确(进行类型安全检查,作者进行自动类型转换,当然对所有的函数都一样)。如果正确,内联函数的代码就会直接替换函数调用,于是省去了函数调用的开销。这个过程与预处理有显著的不同,因为预处理器不能进行类型安全检查,或者进行自动类型转换。假如内联函数是成员函数,对象的地址(this)会被放在合适的地方,这也是预处理办不到的。
C++语言的函数内联机制即具备宏代码的效率,又增加了安全性,而且可以只有操作类的数据成员。所以在C++程序中,应该用内联函数取代所有宏代码,“断言assert”恐怕是唯一的例外。assert是仅在Debug版本起作用的宏,它用于检查“不应该”发生的情况。为了不在程序的Debug版本和Release版本引起差别,assert不应该产生任何副作用。如果assert是函数,由于函数调用会引起内存、代码的变动,那么将导致Debug版本与Release版本存在差异。所以assert不是函数,而是宏。(详见2.6.5使用断言)
2.8.5.2内联函数的编程风格
关键字inline必须与函数定义体放在一起才能使函数成为内联函数,仅将inline放在函数声明前面不起任何作用。如下风格的函数Foo不能成为内联函数:
inline void Foo(int x, int y); //inline仅与函数声明放在一起
void Foo(int x, int y)
{
...
}
如下面风格的函数Foo则成为内联函数:
void Foo(int x, int y);
inline void Foo(int x, int y)//inline与函数定义体放在一起
{
...
}
所以说,inline 是一种“用于实现的关键字”,而不是一种“用于声明的关键字”。一般地,用户可阅读函数的声明,但是看不到函数的定义。尽管在大多数教科书内联函数的声明、定义体前面都加inline关键字,但我认为inline不应该出现在函数的声明中。这个细节虽然不会影响函数的功能,但是体现了高质量C++/C程序的设计风格的一个基原则:声明与定义不可混为一谈,用户没有必要、也不应该知道函数是否需要内联。
定义在类声明之中的成员函数将自动成为内联函数,例如
class A
{
public:
void Foo(int x, int y)
{
...
}
};
将成员函数的定义体放在类声明之中虽然能带来书写上的方便,但不是一种良好的编程风格,上例应该改为:
//头文件
class A
{
public:
void Foo(int x, int y);
};
//定义文件
inline void A::Foo(int x, int y)
{
...
}
2.8.5.3慎用内联
内联能提高函数的执行效率,为什么不把所有的函数都定义成内联函数?
如果所有的函数都是内联函数,还用得着“内联”这个关键字吗?
内联是以代码膨胀(赋值)为代价,仅仅省去了函数调用的开销,从而提高函数的执行效率。如果执行函数体内代码的时间,相比于函数的调用开销较大,那么效率的收获会很少。另一方面,每一处内联函数的调用都要赋值代码,将使程序的总代码量增大,消耗更多的内存空间。以下情况不宜使用内联:
(1)如果函数体内的代码比较长,使用内联将导致内存消耗代价较高。
(2)如果函数体内出现循环,那么执行函数体内代码的时间要比函数调用的开销大。
类的构造函数和析构函数容易让人误解成使用内联更有效,要当心构造函数和析构函数可能会隐藏一些行为,如“偷偷地”执行了基类或成员对象的构造函数和析构函数。所以不要随便地将构造函数和析构函数的定义体放在类声明中。
一个好的编译器将会根据函数的定义体,自动地取消不值得的内联(这进一步说明了inline不应该出现在函数的声明中)。
2.8.6一些心得体验
C++语言中的重载、内联、缺省参数、隐式转换等机制展现了很多优点,但是这些优点的背后都隐藏着一些隐患。正如人们的饮食,少食和暴食都不可取,应当恰到好处。我们要辩证地看待C++的新机制,应该恰如其分地使用它们。虽然这会使我们编程时多费一些心思,少了一些痛快,但这才是编程的艺术。
2.9类的构造函数、析构函数与赋值函数
构造函数、析构函数与赋值函数是每个类最基本的函数。它们太普通以致让人容易麻痹大意,其实这些貌似简单的函数就像没有顶盖的下水道那样危险。
每个类只有一个析构函数和一个赋值函数,但可以有多个构造函数(包含一个拷贝构造函数,其它的称为普通构造函数)。对于任意一个类A,如果不想编写上述函数,C++编译器将自动为A产生四个缺省的函数,如
A(void); //缺省的无参数构造函数
A(const A&a);//缺省的拷贝构造函数
~A(void); //缺省的析构函数
A &operate =(const A&a);//缺省的赋值函数
这不禁让人疑惑,既然能自动生成函数,为什么还要程序员编写?
原因如下:
(1)如果使用“缺省的无参构造函数”和“缺省的析构函数”,等于放弃了自主“初始化”和“清除”的机会,C++发明人Stroustrup的好心好意白费了。
(2)“缺省的拷贝构造函数”和“缺省的赋值函数”均采用“位拷贝”而非“值拷贝”的方式来实现,倘若类中含有指针变量,这两个函数注定将出错。
对于那些没有吃够苦头的C++程序员,如果他说编写构造函数、析构函数与赋值函数很容易,可以不动脑筋,表明他的认识还比较肤浅,水平有待提高。
本小节以类String的设计与实现为例,深入阐释被很多教科书忽视了的道理。String的结构如下:
class String
{
public:
String(const char *str = NULL); //普通构造函数
String(const String &other); //拷贝构造函数
~String(void); //析构函数
String & operate =(const String &other);//赋值函数
private:
char *m_data; //用于保存字符串
};
2.9.1构造函数和析构函数的起源
作为比C更先进的语言,C++提供了更好的机制来增强程序的安全性。C++编译器具有严格的类型安全检查功能,它几乎能找出程序中所有的语法问题,这的确帮了程序员的大忙。但是程序通过了编译检查并不表示错误已经不存在了,在“错误”的大家庭里,“语法错误”的地位只能算是小弟弟。级别高的错误通常隐藏的很深,就像狡猾的罪犯,想逮住他可不容易。
根据经验,不少难以察觉的程序错误是由于变量没有正确初始化或清除造成的,而初始化和清除工作很容易被人遗忘。Stroustrup在设计C++语言是充分考虑了这个问题并很好地予以解决:把对象初始化工作放在构造函数中,把清楚工作放在析构函数中。当对象被创建时,构造函数被自动执行。当对象消亡时,析构函数被自动执行。这下就不用担心忘了对象的初始化和清除工作。
构造函数与析构函数的名字不能随便起,必须让编译器认得出才可以被自动执行。Stroustrup的命名方式即简单又合理:让构造函数、析构函数与类同名,由于析构函数的目的与构造函数相反,就加前缀‘~’以示区别。
除了名字外,构造函数和析构函数的另一个特别之处是没有返回值类型,这与返回值类型为void的函数不同。构造函数与析构函数的使命非常明确,就像出生与死亡,光溜溜的来也光溜溜得去。如果没有返回值类型,那么编译器将不知所措。为了防止节外生枝,干脆规定没有返回值类型。
2.9.2构造函数的初始化表
构造函数有个特殊的初始化方式叫“初始化表达式表”(简称初始化表)。初始化表位于函数参数表之后,却在函数体{}之前。这说明该表里的初始化工作发生在函数体内的任何代码被执行之前。
构造函数初始化表的使用规则:
- 如果类存在继承关系,派生类必须在其初始化表里调用基类的构造函数。
例如:
class A
{
...
A(int x); //A的构造函数
};
class B : public A
{
...
B(int x, int y);//B的构造函数
};
B::B(int x, int y)
:A(x) //在初始化表里调用A的构造函数
{
...
}
- 类的const常量只能在初始化表里备初始化,因为它不能再函数体内用赋值的方式来初始化(详见2.5.4节)。
- 类的数据成员的初始化可以采用初始化表或函数体内赋值的两种方式,这两种方式的效率不完全相同。
非内部数据类型的成员对象应当采用第一种方式初始化,以获取更高的效率。例如:
class A
{
...
A(void); //无参的构造函数
A(const A &other);//拷贝构造函数
A & operate =(const A & other);//赋值函数
};
class B
{
public:
B(const A &a); //B的构造函数
private:
A m_a; //成员对象
};
示例a中,类B的构造函数在其初始化表里调用了类A的拷贝构造函数,从而将成员对象m_a初始化。
示例b中,类B的构造函数在函数体内用赋值的方式将成员对象m_a初始化。我们看到的只是一条赋值语句,但实际上B的构造函数干了两件事:先暗地里创建m_a对象(调用了A的无参数构造函数),再调用类A的赋值函数,将参数a赋给m_a。
//示例a
B::B(const A&a)
:m_a(a)
{
...
}
示例b
B::B(const A&a)
{
m_a = a;
...
}
对于内部数据类型的数据成员而言,两种初始化方式的效率几乎没有区别,但后者的板式似乎更加清晰些。若类F的声明如下:
class F
{
public:
F(int x, int y); //构造函数
private:
int m_x, m_y;
int m_i, m_j;
};
示例c中F的构造函数采用了第一种初始化方式,示例d中F的构造函数采用了第二种初始化方式。
//示例c
F::F(int x, int y)
:m_x(x), m_y(y)
{
m_i = 0;
m_j = 0;
}
//示例d
F::F(int x, int y)
{
m_x = x;
m_y = y;
m_i = 0;
m_j = 0;
}
2.9.3构造和析构的次序
构造从类层次的最根处开始,在每一层中,首先调用基类的构造函数,然后调用成员对象的构造函数。析构则严格按照与构造相反的次序,该次序是唯一的,否则编译器将无法自动执行析构过程。
一个有趣的现象是,成员对象初始化的次序完全不受它们在初始化表中次序的影响,只由成员对象在类中声明的次序决定。这是因为类的声明是唯一的,而类的构造函数可以有多个,因此会有多个不同次序的初始化表。如果成员对象按照初始化表的次序进行构造,这将导致析构函数无法得到唯一的逆序。
2.9.4示例:类String的构造函数和析构函数
//String的普通构造函数
String::String(const char *str)
{
if(str == NULL)
{
m_data = new char[1];
*m_data = '\0';
}
else
{
int lenth = strlen(str);
m_data = new char[lenth + 1];
strcpy(m_data, str);
}
}
//String的析构函数
String::~String(void)
{
delete [] m_data;
//由于m_data是内部数据类型,也可以写成delete m_data;
}
2.9.5不要轻视拷贝构造函数与赋值函数
由于并非所有的对象都会使用拷贝构造函数和赋值函数,程序员可能对这两个函数有些轻视。请先记住以下警告,在阅读正文时就会多心:
- 本节开头讲过,如果不主动编写拷贝构造函数和赋值函数,编译器将以“位拷贝”的方式自动生成缺省的函数。倘若类中含有指针变量,那么这两个缺省的函数就隐含了错误。以类String的两个对象a,b为例,假设a.m_data的内容为“hello”,b.m_data的内容为“world”。
现将a赋给b,缺省赋值函数的“位拷贝”意味着执行b.m_data = a.m_data。这将造成三个错误:一是b.m_data原有的内存没有释放,造成内存泄漏;二是b.m_data和a.m_data指向同一块内存,a或b任何一方变动都会影响另一方;三是在对象被析构是,m_data被释放了两次。
- 拷贝构造函数和赋值函数非常容易混淆,常导致错写、错用。拷贝构造函数是在对象被创建时调用的,而赋值函数只能被已经存在了的对象调用。在以下程序中,第三个语句和第四个语句很相似,你分的清那个调用了拷贝构造函数,那个调用了赋值函数吗?
String a("hello");
String b("world");
String c = a; //调用了拷贝构造函数,最好写成c(a);
c = b; //调用了赋值函数
本例中第三个语句的风格较差,宜直接写成String c(a)以区别于第四个语句。
2.9.6示例:类String的拷贝构造函数与赋值函数
//拷贝构造函数
String::String(const String &other)
{
//允许操作other的私有成员m_data
int length = strlen(other.m_data);
m_data = new char[length + 1];
strcpy(m_data, other.m_data);
}
//赋值函数
String & String::operate =(const String &other)
{
//(1)检查自赋值
if(this == &other)
{
return *this;
}
//(2)释放原有的内存资源
delete [] m_data;
//(3)分配新的内存资源,并复制内容
int length = strlen(other.m_data);
m_data = new char[length + 1];
strcpy(m_data, other.m_data);
//(4)返回本对象的引用
return *this;
}
类String拷贝构造函数与普通构造函数(详见2.9.4)的区别是:在函数入口处无需与NULL进行比较,这是因为“引用”不可能是NULL,而“指针”可以为NULL。
类String的赋值函数比构造函数复杂得多,分四步实现:
(1)第一步,检查自赋值。你可能会认为多此一举,难道有人会愚蠢的写出a = a这样的自赋值语句!的确不会。但是间接的自赋值仍有可能出现,例如:
//内容自赋值
b = a;
...
c = b;
...
a = c
//地址自赋值
b = &a;
...
a = *b;
也许有人会说:“即使出现自赋值,我也可以不理睬,发不了花点时间让对象赋值自己而已,反正不会出错!”
它真的说错了。看看第二部的delete,自杀后还能复制自己吗?所以,如果发现自赋值,应该马上终止函数。注意不要将检查自赋值的if语句
if(this == &other)错写成 if(*this == other)
(2)第二步,用delete释放原有的内存资源。如果现在不释放,以后就没有机会了,将造成内存泄露。
(3)第三步,分配新的内存资源 ,并复制字符串。注意函数strlen返回的是有效字符串长度,不包括'\0'。函数strcpy则连'\0'一起复制。
(4)第四步,返回本对象的引用,目的是为了实现像a = b = c 这样的链式表达式。注意不要将return *this错写成return this。那么能否写成return other呢?效果不是一样吗?
不可以!因为我们不知道参数other的生命周期。有可能other是个临时对象,在赋值结束后它马上消失,那么return other返回的将是垃圾。
2.9.7偷懒的办法处理拷贝构造函数与赋值函数
如果我们实在不想编写拷贝构造函数和赋值函数,又不允许别人使用编译器生成缺省函数,怎么办?
偷懒的办法是:只需将拷贝构造函数和赋值函数声明为私有函数,不用编写代码。例如:
class A
{
private:
A(const A&a); //私有的拷贝构造函数
A & operate =(const A&a);//私有的赋值函数
};
如果有人试图编写如下程序:
A b(a); //调用了私有的拷贝构造函数
b = a; //调用了私有的赋值函数
编译器将指出错误,因为外界不可以操作A的私有函数。
2.9.8如何在派生类中实现类的基本函数
基类的构造函数、析构函数、赋值函数都不能被派生类继承。如果类之间存在继承关系,在编写上述基本函数时应该注意以下事项:
- 派生类的构造函数应在其初始化表里调用基类的构造函数。
- 基类与派生类的析构函数应该为虚函数(即加上virtual关键字)。例如:
#include <iostream.h>
class Base
{
public:
virtual ~Base()
{
cout << "~Base" << endl;
}
};
class Derived : public Base
{
public:
virtual ~Derived()
{
cout << "~Derived" << endl;
}
};
void main()
{
Base * pB = new Derived; //upcast;
delete pB;
}
输出结果为:
~Derived
~Base
如果析构函数不为虚,那么输出结果为
~Base
- 在编写派生类的赋值函数时,注意不要忘记对基类的数据成员重新赋值。例如:
class Base
{
public:
...
Base & operate =(const Base &other); //类Base的赋值函数
private:
int m_i, m_j, m_k;
};
class Derived : public Base
{
public:
...
Derived & operate =(const Derived &other); //类Derived的赋值函数
private:
int m_x, m_y, m_z;
};
Derived & Derived::operate=(const Derived &other)
{
//(1)检查自赋值
if(this == &other)
{
return *this;
}
//(2)对基类的数据成员重新赋值
Base::operate =(other); //因为不能直接操作私有数据成员
//(3)对派生类的成员赋值
m_x = other.m_x;
m_y = other.m_y;
m_z = other.m_z;
//(4)返回本对象的引用
return *this;
}
2.10类的继承与组合
对象是类的一个实例。如果将对象比作房子,那么类就是房子的设计图纸。所以面向对象设计的重点是类的设计,而不是对象的设计。
对于C++程序而言,设计孤立的类是比较容易得,难的是正确设计基类即派生类。本小节仅仅论述“继承”和“组合”的概念。
2.10.1继承
如果A是基类,B是A的派生类,那么B将继承A的数据和函数。例如:
class A
{
public:
void Func1(void);
void Func2(void);
};
class B : public A
{
public:
void Func3(void);
void Func4(void);
};
void main()
{
B b;
b.Func1(); //B从A继承了函数Func1
b.Func2(); //B从A继承了函数Func2
b.Func3();
b.Func4();
}
这个简单的示例程序说明了一个事实:C++的“继承”特性可以提高程序的可福永性。正因为“继承”太有用 、太容易用,才要防止乱用“继承”。我们应当给“继承”立一些使用规矩。
- 规则1:如果类A和类B毫不相关,不可以为了使B的功能更多些而让B继承A的功能和属性。不要觉得“白吃白不吃”,让一个好端端的健壮青年无缘无故地吃人参补身体。
- 规则2:若在逻辑上B是A的一种,则允许B继承A的功能和属性。例如男人是人的一种,男孩是男人的一种。那么类Man可以从类Human派生,类Boy可以从类Man派生。
class Human
{
...
};
class Man : public Human
{
...
};
class Boy : public Man
{
...
};
注意事项:
规则2看起来很简单,但是实际应用时可能会有意外,继承的概念在程序世界与现实世界并不完全相同。
例如从生物学角度讲,鸵鸟是鸟的一种,按理说类Ostrich应该可以从类Bird派生。但是鸵鸟不会飞,那么ostrich::Fly是什么东西?
class Bird
{
public:
virtual void Fly(void);
...
};
class Ostrich : public Bird
{
...
};
例如从数学角度讲,圆是一种特殊的椭圆,按理说类Circle应该可以从类Ellipse派生。但是椭圆有长轴和短轴,如果圆继承了椭圆的长轴和短轴,岂非画蛇添足?
所以更加严格的继承规则应当是:若在逻辑上B是A的“一种”,并且A的所有功能和属性对B而言都有意义,则允许B继承A的功能和属性。
2.10.2组合
- 规则1:若在逻辑上A是B的一部分,则不允许B从A派生,而是要用A和其它东西组合出B。
例如眼、鼻、口、耳是头的一部分,所以类Head应该由类Eye、Nose、Mouth、Ear组合而成,不是派生而成。如下例所示:
class Eye
{
public:
void Look(void);
};
class Nose
{
public:
void Smell(void);
};
class Mouth
{
public:
void Eat(void);
};
class Ear
{
public:
void Listen(void);
};
//正确的设计,虽然代码冗长
class Head
{
public:
void Look(void){ m_eye.Look();}
void Smell(void){ m_nose.Smell();}
void Eat(void){ m_mouth.Eat();}
void Listen(void){ m_ear.Listen();}
private:
Eye m_eye;
Nose m_nose;
Mouth m_mouth;
Ear m_ear;
};
如果允许Head从Eye、Nose、Mouth、Ear派生而成,那么Head将自动具有Look、Smell、Eat、Listen这些功能。下面示例十分简短并且运行正确,但是这种设计方法却是不对的。
//功能正确并且代码简洁,但是设计方法不对。
class Head : public Eye, public Nose, public Mouth, public Ear
{
};
一只公鸡使劲地追打一只刚下蛋的母鸡,你知道为什么吗?
因为母鸡下了鸭蛋。
很多程序员经不起“继承”的诱惑而犯下设计错误。“运行正确”的程序不见得是高质量的程序,此处就是一个例证。
2.11其它编程经验
2.11.1使用const提高函数的健壮性
看到const关键,C++程序员首先想到的可能是const常量。这可不是良好的天剑反射。如果只知道用const定义常量,那么相当于把火药仅用作于制作鞭炮。const更大的魅力是它可以修饰函数的参数、返回值,甚至函数的定义体。
const是constant的缩写,“恒定不变”的意思。被const修饰的东西都受到强制保护,可预防意外的变动,能提高程序的健壮性。所以很多C++程序设计书籍建议:“Use const whenever you need”。
2.11.1.1用const修饰函数的参数
如果参数作输出用,不论它是什么数据类型,也不论它采用“指针传递”还是“引用传递”,都不能加const修饰,否则该参数将失去输出功能。
const只能修饰输入参数:
- 如果输入参数采用“指针传递”,那么加const修饰可以防止意外地改动该指针,起到保护作用。例如StringCopy函数:
void StringCopy(char *strDestination, const char * strSource);
其中strSource是输入参数,strDestination是输出参数。给strSource加上const修饰后,如果函数体内的语句试图改动strSource的内容,编译器将指出错误。
- 如果输入参数采用“值传递”,由于函数将自动产生临时变量用于复制该参数,该输入参数本来就无需保护,所以不要加const修饰。
例如不要将函数void Func1(int x)写成void Func1(const int x)。同理不要将函数void Func2(A a)写成void Func2(const A a)。其中A为用户自定义的数据类型。
- 对于非内部数据类型的参数而言,像void Func(A a)这样声明的函数注定效率比较低。因为函数体内将产生A类型的临时对象用于复制参数a,而临时对象的构造、复制、析构过程都将消耗时间。
为了提高效率,可以将函数声明改为 void Func(A &a),因为“引用传递”仅借用一下参数的别名而已,不需要产生临时对象。但是函数void Func(A &a)存在一个缺点:“引用传递”有可能改变参数a,这是我们不期望的。解决这个问题很容易,加上const修饰即可,因此函数最终成为void Func(const A & a)。
以此类推,是否应将void Func(int x)改写为void Func(const int &x),以便提高效率?完全没有必要,因为内部数据类型的参数不存在构造、析构的过程,而复制也非常快,“值传递”和“引用传递”的效率几乎相当。
问题是如此的缠绵,我只好将“const &”修饰输入参数的用法总结一下,如下表所示:
对于非内部数据类型的输入参数,应该将“值传递”的方式改为“const 引用传递”,目的是提高效率。例如将void Func(A a)改为void Func(const A &a)。 |
对于内部数据类型的输入 参数,不要将“值传递”的方式改为“const 引用传递”。否则即达不到提高效率的目的,又降低了函数的可理解性。例如void Func(int x)不应该改为void Func(const int &x)。 |
2.11.1.2用const修饰函数的返回值
- 如果给以“指针传递”的方式的函数返回值加const修饰,那么函数返回值(即指针)的内容不能被修改,该返回值只能被赋给加const修饰的同类型指针。
例如函数:const char * GetString(void);
如下语句将出现编译错误:char *str = GetString();
正确的用法是:const char *str = GetString();
- 如果函数返回值采用“值传递方式”,由于函数会把 返回值赋值到外部临时的存储单元中,加const修饰没有任何价值。
例如不要把函数int GetInt(void)写成const int GetInt(void)。
同理不要把函数A GetA(void)写成const AGetA(void),其中A为用户自定义的数据类型。
如果返回值不是内部数据类型,将函数A GetA(void)改写为const A &GetA(void)的确能提高效率。但此时千万千万要小心,一定要搞清楚函数究竟是想返回一个对象的“拷贝”还是仅返回“别名”就可以了,否则程序会出错,详见2.6.2节“返回值的规则”。
- 函数返回值采用“引用传递”的场合并不多,这种方式一般只出现在类的赋值函数中,目的是为了实现链式表达式。
例如:
class A
{
A & operate = (const A &other); //赋值函数
};
A a, b, c; //a,b,c为A的对象
...
a = b = c; //正常的链式表达式
(a = b) = c; //不正常的链式表达式,但合法
如果将赋值函数的返回值加const修饰,那么该返回值的内容不允许被改动。上例中,语句a = b = c;仍然正确,但是语句(a = b) = c;则是非法的。
2.11.1.3const成员函数
任何不会修该数据成员的函数都应该声明为const类型。如果在编写const成员函数时,不慎修改了数据成员,或者调用了其它非const成员函数,编译器将指出错误,这无疑会提高程序的健壮性。以下程序中,类stack的成员函数GetCount仅用于计数,从逻辑上讲GetCount应当为const函数。编译器将指出GetCount函数中的错误。
class Stack
{
public:
void Push(int elem);
int Pop(void);
int GetCount(void) const; //const成员函数
ptivate:
int m_num;
int m_data[100];
};
int Stack::GetCount(void) const
{
++m_num; //编译错误,企图修改数据成员m_num
Pop(); //编译错误,企图调用非const函数
return m_num;
}
const成员函数的声明看起来怪怪的:const关键字只能放在函数声明的尾部,大概是因为其它地方都已经被占用了。
2.11.2提高程序效率
程序的时间效率是指运行速度,空间效率是指程序占用内存或者外存的状况。
全局效率是指站在整个系统的角度上考虑的效率,局部效率是指站在模块或函数角度上考虑的效率。
- 规则1:不要一味地追求程序的效率,应当满足正确性、可靠性、健壮性、可读性等质量因素的前提下,设法提高程序的效率。
- 规则2:以提高程序的全局效率为主,提高局部效率为辅。
- 规则3:在优化程序的效率时,应当先找出限制效率的“瓶颈”,不要在无关紧要之处优化。
- 规则4:先优化数据结构和算法,在优化执行代码。
- 规则5:有时候时间效率和空间效率可能对立,此时应当要分析那个更重要,作出适当的折中。例如富哦花费一些内存来提高性能。
- 规则6:不要追求紧凑的代码,因为紧凑的代码并不能产生高效的机器码。
2.11.3一些有益的建议
建议1:当心哪些视觉上不易分辨的操作符发生书写错误。
我们经常会把“==”误写成“=”,像“||”、“&&”、“<=”、“>=”这类符号也很容易出现丢“1”失误。然而编译器却不一定能自动指出这类错误。
建议2:变量(指针、数组)被创建之后应当及时把它们初始化,以防止把未被初始化的变量当成右值使用。
建议3:当心变量的初值、缺省值错误,或者精度不够。
建议4:当心数据类型转换发生错误。尽量使用显式的数据类型转换(让人们知道发生了什么事),避免让编译器轻悄悄地进行隐式的数据类型转换。
建议5:当心变量发生上溢或下溢,数组的下标越界。
建议6:当心忘记编写错误处理程序,当心错误处理程序本身有误。
建议7:当心文件I/O有错误。
建议8:避免编写技巧性很高的代码。
建议9:不要设计面面俱到、非常灵活的数据结构。
建议10:如果原有的代码质量比较好,尽量复用它。但是不要修补很差劲的代码,应当重新编写。
建议11:尽量使用标准库函数,不要“发明”已经存在的库函数。
建议12:尽量不要使用与具体硬件或软件环境关系密切的变量。
建议13:把编译器的选择项设置为最严格状态。文章来源:https://www.toymoban.com/news/detail-842802.html
建议14:如果可能的话,使用PC-Lint、LogiScope等工具进行代码审查。 文章来源地址https://www.toymoban.com/news/detail-842802.html
到了这里,关于高质量C/C++编程指南的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!