【C++】学习C++STL中的数组——vector

这篇具有很好参考价值的文章主要介绍了【C++】学习C++STL中的数组——vector。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

❤️前言

好久不见大家！今天的这篇博客是关于我对于STL(C++标准模板库)中的容器vector的学习和理解，希望大家能够喜欢。

正文

vector是STL中的一种序列容器，对应着数据结构中的顺序表，也可以说是数组。在我们正式学习了解vector之前，我们先看看C++官网对其的文档介绍。

vector的文档介绍

这是纯英文的官网链接：cplusplus.com/reference/vector/vector/https://cplusplus.com/reference/vector/vector/ 这是大概的中文翻译：

vector是表示可变大小数组的序列容器。

就像原生数组一样，vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问，和数组一样高效。但是又不像数组，它的大小是可以动态改变的，而且它的大小会被容器自动处理。

本质讲，vector使用动态分配数组来存储它的元素。当新元素插入时候，这个数组需要被重新分配大小为了增加存储空间。其做法是，分配一个新的数组，然后将全部元素移到这个数组。就时间而言，这是一个相对代价高的任务，因为每当一个新的元素加入到容器的时候，vector并不会每次都重新分配大小。

vector分配空间策略：vector会分配一些额外的空间以适应可能的增长，因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何，重新分配都应该是对数增长的间隔大小，以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。

因此，vector占用了更多的存储空间，这是为了获得管理存储空间的能力，并且以一种有效的方式动态增长。

与其它动态序列容器相比（deque, list and forward_list），vector在访问元素的时候更加高效，在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作，效率更低。

看不懂也没什么问题，这本来就只是给我们一个大致的vector的印象，接下来我们继续更加细致的了解和学习这个容器。

vector的简单使用

首先我们知道STL是C++的标准模板库，而vector是其中的一种容器(数据结构)，它是一种类模板，通过模板的显式实例化可以产生各种各样不同的类，初始化时vector需要我们给出其中存储的数据类型。

要使用vector，我们首先要知道如何初始化一个vector对象。这时候我们就需要关注vector对应的构造函数。

vector的构造函数

如下是C++98中给出的vector构造函数：【C++】学习C++STL中的数组——vector,【C++】21年精通C++,c++,学习,开发语言

第一个构造函数可以看作无参数的默认构造函数，那个唯一的参数叫做空间配置器，在使用vector时我们基本上可以无视，它的作用就是提高堆区内存资源的存取效率，而且它那里给了缺省参数，一般我们在使用的时候是不怎么需要考虑的。

// 使用这个构造函数初始化vector对象的大致方式：
vector<数据类型> v();
// 存储int类型的数据：
vector<int> v();
// 存储vector<int>类型的数据模拟二维数组：
vector<vector<int>> vv();

第二个构造函数的效果是初始化出n个值，初始化的值默认调用vector中数据的默认构造函数。

// 使用这个构造函数初始化vector对象的大致方式：
vector<数据类型> v(初始化数据的个数,数据初始值);
// 存储int类型的数据10个10：
vector<int> v(10, 10);
// 存储vector<int>类型的数据模拟n*n的二维数组：
vector<vector<int>> vv(n, vector<int>(n));

第三个构造函数通过迭代器区间进行构造，我们只需要给出起止的范围即可(迭代器我们在使用string类时就已经接触过了，它是对应着指针的一类对象)。

// 使用这个构造函数初始化vector对象的大致方式：
vector<数据类型> v(起始迭代器，终止迭代器);

// 存储int类型的数据：
int arr[] = { 0,1,2,3,4 };
int* p1 = arr; int* p2 = arr + 5;
vector<int> v(p1,p2);

第四个构造函数就是拷贝构造函数，使用方式想必不需要过多探讨。

vector的迭代器使用

下面是关于迭代器(iterator)的简单介绍：

在STL中，我们要访问顺序容器和关联容器中的元素，需要通过“迭代器（iterator）”进行。迭代器是一个变量，相当于容器和操纵容器的算法之间的中介。迭代器可以指向容器中的某个元素，通过迭代器就可以读写它指向的元素。从这一点上看，迭代器和指针类似。

简单认识了迭代器之后，让我们看看迭代器在vector中的使用。在vector中，我们一般使用迭代器来对应指针在数组中的操作。通过迭代器，我们可以访问vector中的任意元素。那我们该如何使用迭代器呢？下面举例vector迭代器的使用方式：

vector<int> v(10, 10);

// 创建vector迭代器对象指向v的开头
vector<int>::iterator it = v.begin();
while (it != v.end())
{
	cout << *it << ' ';
	++it;
}

在上述代码中，我调用v的成员函数begin()为it赋初值，我们大概能看出这里的begin()和end()会返回迭代器的值。顾名思义，begin()给出了v的初始位置对应迭代器的值，end()给出末尾元素后的一个位置的值，也就是对应着一个左闭右开的区间。

除此之外，还有一种迭代器被称为反向迭代器(reverse_iterator)，这种迭代器从最后一个元素为起始点，第一个元素的前一个位置为终止点，是与普通迭代器相反的迭代器，可以对容器里的元素进行反向遍历，对应在成员函数中就是rbegin()和rend()。使用方式：

vector<int> v(10, 10);

// 创建vector反向迭代器对象指向v的末尾
vector<int>::reverse_iterator rit = v.rbegin();
while (rit != v.rend())
{
	cout << *rit << ' ';
	++rit;
}

我们可以看到，当我们声明一个迭代器时，它的类型名经常会有些复杂，这时候我们就可以想到之前学习过的一种关键字：auto ，它可以自行推导对象的类型(当然，这需要我们对变量赋初值)，这使我们在使用长类型名对象时更加的方便。例如上面的反向迭代器声明就可以变为：

auto rit = v.rbegin();

vector的空间使用

在使用vector时，我们也需要控制内存和数据，类似于我们在学习数据结构时控制顺序表的内存和数据。

相应的函数有size() capacity() empty() reserve() resize()等。

其中reserve() 可以改变vector的capacity resize()可以改变vector的size也就是有效数据个数。

这些接口的使用大家可以参考C++的文档：

vector - C++ Reference (cplusplus.com)https://legacy.cplusplus.com/reference/vector/vector/

vector的增删查改

对于vector的增删查改，我们比较常用的接口有末端插入push_back()、末端删除pop_back()、重载方括号operator[ ]。

这些函数也可以参考文档进行学习。

迭代器失效问题

迭代器的主要作用就是让算法能够不用关心底层数据结构，其底层实际就是一个指针，或者是对指针进行了封装，比如：vector的迭代器就是原生指针T* 。因此迭代器失效，实际就是迭代器底层对应指针所指向的空间被销毁了，而使用一块已经被释放的空间，造成的后果是程序崩溃(即如果继续使用已经失效的迭代器，程序可能会崩溃)。由此可见，迭代器失效也就类似于我们曾经在C指针阶段非常苦恼的野指针问题。

可能会引起迭代器失效的操作有：

1.可能会引起底层空间发生改变的各种操作，都可能会引发迭代器失效。例如：resize、reserve、insert、assign、push_back等。示例代码如下：

vector<int> v{ 1,2,3,4,5,6 };
auto it = v.begin();

// 将有效元素个数增加到100个，多出的位置使用8填充，操作期间底层会扩容
// v.resize(100, 8);

// reserve的作用就是改变扩容大小但不改变有效元素个数，操作期间可能会引起底层容量改变
// v.reserve(100);

// 插入元素期间，可能会引起扩容，而导致原空间被释放
// v.insert(v.begin(), 0);
// v.push_back(8);

// 给vector重新赋值，可能会引起底层容量改变
v.assign(100, 8);

/*
出错原因：以上操作，都有可能会导致vector扩容，也就是说vector底层原理旧空间被释放掉，
而在打印时，it还使用的是释放之间的旧空间，在对it迭代器操作时，实际操作的是一块已经被释放的
空间，而引起代码运行时崩溃。
解决方式：在以上操作完成之后，如果想要继续通过迭代器操作vector中的元素，只需给it重新
赋值即可。
*/

it = v.begin();

while (it != v.end())
{
	cout << *it << " ";
	++it;
}
cout << endl;

2.指定位置元素的删除操作--erase，当我们通过erase删除了一个元素之后，那么指向这个元素的迭代器就会失效，因为目前这个迭代器的指向是未知的(它会指向原来的下一个位置)。示例代码如下：

vector<int> v{ 1,2,3,4,5,6 };

auto it = v.begin();
while (it != v.end())
{
	if (*it % 2 == 0)
		it = v.erase(it);
	else
		++it;
}

it = v.begin();
while (it != v.end())
{
	std::cout << *it << " ";
	++it;
}
std::cout << endl;

总的来说，迭代器失效就类似于野指针问题，我们解决迭代器失效的方式就是为迭代器重新赋值。

vector的模拟实现

大致了解了vector的使用之后，让我们一起学着模拟实现vector，以此加深我们对与vector的理解，让我们更好的使用它。

namespace MO_lion
{
	template<typename T>
	class vector
	{
	public:
		// 迭代器
		typedef T* iterator;
		typedef const T* const_iterator;

		iterator begin()
		{
			return _start;
		}

		iterator end()
		{
			return _finish;
		}

		const_iterator begin() const
		{
			return _start;
		}

		const_iterator end() const
		{
			return _finish;
		}

		// 构造函数
		vector()
			: _start(nullptr)
			, _finish(nullptr)
			, _end_of_storage(nullptr)
		{}

		// 拷贝构造
		vector(const vector<T>& v)
			: _start(nullptr)
			, _finish(nullptr)
			, _end_of_storage(nullptr)
		{
			reserve(v.capacity());
			for (int i = 0; i < v.size(); ++i)
			{
				_start[i] = v[i];
			}
			_finish += v.size();
		}

		vector(int n, const T& x = T())
		{
			resize(n, x);
		}

		// 扩容
		void reserve(size_t n)
		{
			if (n <= capacity()) return;
			size_t oldsize = size();
			iterator tmp = new T[n];
			if (_start)
			{
				for (int i = 0; i < size(); ++i)
				{
					tmp[i] = _start[i];
				}
				delete[] _start;
			}
			_start = tmp;
			_finish = _start + oldsize;
			_end_of_storage = _start + n;
		}

		void resize(size_t n, const T& x = T())
		{
			if (n > capacity()) reserve(n);
			for (int i = size(); i < n; ++i)
			{
				_start[i] = x;
			}
			_finish = _start + n;
		}

		// 尾插
		void push_back(const T& x)
		{
			//if (_finish == _end_of_storage)
			//{
			//	reserve(capacity() == 0 ? 5 : capacity() * 2);
			//}
			//*_finish = x;
			//_finish++;

			insert(end(), x);
		}

		// 随机位置插入
		iterator insert(iterator pos, const T& x)
		{
			assert(pos <= _finish && pos >= _start);
			if (_finish == _end_of_storage)
			{
				size_t len = pos - _start;
				reserve(capacity() == 0 ? 5 : capacity() * 2);
				pos = _start + len;
			}

			for (int i = size(); i > pos - _start; --i)
			{
				_start[i] = _start[i - 1];
			}

			*pos = x;
			_finish++;

			return pos;
		}

		// 指定位置删除
		iterator erase(iterator pos)
		{
			assert(pos < _finish && pos >= _start);
			for (int i = pos - _start; i < size() - 1; ++i)
			{
				_start[i] = _start[i + 1];
			}
			_finish--;

			return pos;
		}

		// 重载方括号
		T& operator[](size_t n)
		{
			return _start[n];
		}

		const T& operator[](size_t n) const
		{
			return _start[n];
		}

		// 交换两个vector
		void swap(vector<T>& v)
		{
			std::swap(_start, v._start);
			std::swap(_finish, v._finish);
			std::swap(_end_of_storage, v._end_of_storage);
		}

		// 重载等号
		vector<T>& operator=(vector<T> v)
		{
			swap(v);
			return *this;
		}

		// 返回有效数据个数
		size_t size() const
		{
			return _finish - _start;
		}

		// 返回可用空间大小
		size_t capacity() const
		{
			return _end_of_storage - _start;
		}
        
        // 析构函数
		~vector()
		{
			if (_start == nullptr) return;
			delete[] _start;
			_start = nullptr;
			_finish = nullptr;
			_end_of_storage = nullptr;
		}

	private:
        // 将三个指向不同位置的迭代器作为私有成员；
        // 起始位置
		iterator _start;
        // 终止位置
		iterator _finish;
        // 容量的极限位置
		iterator _end_of_storage;
	};

}

在vector的模拟实现中，有以下问题比较值得注意：

深浅拷贝问题

由于vector可以存储各种各样不同的数据类型，我们在模拟实现reverse()和拷贝构造函数复制有效数据的过程中使用赋值运算符 "=" 进行操作。

如果我们像实现string时一样使用memcpy()进行数据拷贝，那么当这样的vector用于存储需要进行资源管理的对象的时候(例如vector<vector<int>>)，就会发生错误，因为memcpy()是浅拷贝。而使用 "=" 这里就比较妙了，它可以适配所有的对象，因为大家都有赋值运算符，正常情况下，赋值运算符会适配对应对象的资源管理方式。

重载等号的现代写法

上面我们可以看到重载等号的写法十分的简洁，实际上是创建了一个临时的vector对象，然后将成员交换给当前对象，相当于复用了拷贝构造的代码，这里有一个比较妙的点就是传参得来的参数是原对象的临时拷贝。

// 交换两个vector
void swap(vector<T>& v)
{
	std::swap(_start, v._start);
	std::swap(_finish, v._finish);
	std::swap(_end_of_storage, v._end_of_storage);
}

// 重载等号
vector<T>& operator=(vector<T> v)
{
	swap(v);
	return *this;
}