【C++入门】STL容器--vector底层数据结构剖析

这篇具有很好参考价值的文章主要介绍了【C++入门】STL容器--vector底层数据结构剖析。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

 

目录

 前言

 1. vector的使用

      vector的构造

 vector迭代器

 vector空间相关的接口

 vector 功能型接口

 find

 swap

 insert

 erase

2. vector内部数据结构剖析

reserve

 push_back和pop_back

size、capacity、empty、operator[ ];

 insert和erase

resize

swap

 拷贝构造和赋值重载

构造函数补充

 迭代器区间构造

指定数值个数构造

总结


前言

         vector在C++中非常重要的容器,在刷题中也经常使用,它是一个动态的数组,提供了快速的随机访问和在尾部的插入和删除操作。vector的底层实现也是非常优秀的数据结构,值得我们去学习鉴赏,使用STL我们需要做到三个境界:能用,明理,能扩展;所以了解它的基本底层原理也是非常有必要的。

【C++入门】STL容器--vector底层数据结构剖析,c++,数据结构,开发语言

 1. vector的使用

      vector的构造

【C++入门】STL容器--vector底层数据结构剖析,c++,数据结构,开发语言

 常见的构造方式:

vector<int> v1;
vector<int> v2(10,1); // 使用10个1进行初始化
vector<int> v3(v2);

 迭代器区间构造:

vector<int> v = { 1,2,3,4,5 };
vector<int> vv(v.begin(),v.end());

 除此之外我们还可以传变量:

vector<int> v(n + m, 0);//开一个数组大小为n+m初始化为0

 这样写也是可以的,在一些刷题常见可能会遇到。

 vector迭代器

 【C++入门】STL容器--vector底层数据结构剖析,c++,数据结构,开发语言

 vector和string迭代器的使用方法相同

【C++入门】STL容器--vector底层数据结构剖析,c++,数据结构,开发语言

vector<int> v{1,2,3,4,5,6};
vector<int>::iterator it = v.begin();
while(it!=vv.end())
{
	cout<<*it;
	it++;
}

 vector空间相关的接口

【C++入门】STL容器--vector底层数据结构剖析,c++,数据结构,开发语言

 这些接口的功能与使用和string的很相似,不做过多的介绍。

  • reserve只负责开辟空间,如果确定知道需要用多少空间,reserve可以缓解vector增容的代价缺陷问题。
  • resize在开空间的同时还会进行初始化,影响size

 vector 功能型接口

【C++入门】STL容器--vector底层数据结构剖析,c++,数据结构,开发语言

 这里着重介绍一下find和swap

 find

【C++入门】STL容器--vector底层数据结构剖析,c++,数据结构,开发语言

 find属于算法库里的内容在头文件 algorithm 中

 函数返回时返回的也是迭代器类型

template<class InputIterator, class T>
  InputIterator find (InputIterator first, InputIterator last, const T& val)
{
  while (first!=last) {
    if (*first==val) return first;
    ++first;
  }
  return last;
}

 使用样例:

vector<int> v{1,2,3,4,5,6,7,8,9};
auto pos = find(v.begin(),v.end(),5);
cout<<*pos;
 swap

 细心的朋友可能会发现,vector、string中都有一个swap接口,它和算法库里的swap还有些不一样:

vector:

【C++入门】STL容器--vector底层数据结构剖析,c++,数据结构,开发语言

 算法库:

【C++入门】STL容器--vector底层数据结构剖析,c++,数据结构,开发语言

算法库里的swap要传两个参数,vector里只用传一个参数;并且它们的交换方式也有所不同;

 算法库中的交换就是简单的数值交换

template <class T> 
void swap ( T& a, T& b )
{
  T c(a); a=b; b=c;
}

 vector和string中的swap通过交换指针指向来实现交换的;

在调用vector的swap时,其实还存在一个this指针作为参数,交换指针指向的内容。

vector<int> v1 = {1, 2, 3};
vector<int> v2 = {4, 5, 6};

v1.swap(v2);
 insert
vector<int> v{1,2,3,4,5,6,7,8,9};
auto pos = find(v.begin(),v.end(),5);
v.insert(pos,10); // 在5前边插入10
 erase
vector<int> v{1,2,3,4,5,6,7,8,9,10};
auto pos = find(v.begin(),v.end(),10);
vv.erase(pos);
//删除一个区间
v.erase(v.begin()+2,v.end()-2);

2. vector内部数据结构剖析

vector的底层本质就是一个动态顺序表,然而它的设计方式又与我们之前的顺序表又有所不同:

template<class T>
class vector
{
public:
	typedef T* iterator;
    typedef const T* const_iterator;

private:
    // 给缺省值,避免每个构造函数都要写初始化列表
	iterator _start = nullptr;
    iterator _finish = nullptr;
    iterator _endofstorage = nullptr;
}

 它的底层是通过三个指针来控制的

【C++入门】STL容器--vector底层数据结构剖析,c++,数据结构,开发语言

 这样的设计也是为了迭代器的适配,有了这样的适配,在STL容器中,迭代器的使用都基本相同,也是为了去除不同容器在使用迭代器时的差异。

 模拟封装一个vector的类,首先我们要先实现它的构造函数和析构函数:

vector() // 注意:这里虽然什么都没有但是不能删,因为我们写的有构造函数
         // 编译器不会生产默认构造,如果删除无参构造时就会报错
{}

~vector()
{
	if (_start)
	{
		delete[] _start;
		//析构时要将所有的指针变量置为NULL
		_start = _finish = _endofstorage = nullptr;
	}
}

 构造函数用于初始化

reserve

 刚开始就要遇到一个大难题,迭代器失效的问题;

        reserve的主要功能就是开空间,而开空间时就可能会遇到空间转移的情况(开辟一块新的空间,将原空间的内容拷贝过去);空间一旦转移,就会导致原先的指针失效——迭代器失效。所以我们要先记录一下原空间的一些数据。

第二个问题,浅拷贝的问题:

        将数据拷贝到新的空间看似很简单,但是它存在浅拷贝的问题,在只用内置类型时不会出问题,一旦遇到涉及动态内存管理的自定义类型就直接会挂;

【C++入门】STL容器--vector底层数据结构剖析,c++,数据结构,开发语言

 memcpy将所有的数据都拷贝过去,这会导致更深一层的浅拷贝问题,两个_str指向同一块空间,原空间交换后就会被销毁,字符串也会被销毁,new的新空间中的_str就会是一个野指针。

所以看似简单的拷贝使用memcpy直接拷贝不行;

        可以使用一个更为直接的方式,就是直接赋值(利用自定义类型的operator=).

void reserve(size_t n)
{
	if (n > capacity())
	{
		//考虑到交换后地址空间转移,需要提前记录旧空间的数据大小
		size_t old = size();
		T* tmp = new T[n];
		if (_start)
		{
			// 自定义类型会造成迭代器失效的问题例如:string
			// memcpy(tmp, _start, n * sizeof(T)); // 这个属于浅拷贝
			for (int i = 0; i < old; i++)
			{
				tmp[i] = _start[i];
			}
			delete[] _start;
		}
		
		_start = tmp;
		_finish = _start + old;
		_endofstorage = _start + n;
	}
}

 push_back和pop_back

 有了reserve,尾插和尾删就简单多了:

void push_back(const T& x)
{
	if (_finish == _endofstorage)
	{
		size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
		reserve(newcapacity);
	}
	*_finish = x;
	_finish++;
}

void pop_back()
{
	assert(size() > 0);
	--_finish;
}

size、capacity、empty、operator[ ];

size_t size() const
{
	return _finish - _start;
}

size_t capacity() const
{
	return _endofstorage - _start;
}

bool empty() const
{
	return (size()==0);
}

T& operator[] (size_t pos)
{
	assert(size() > pos);
	return _start[pos];
}

const T& operator[](size_t pos) const
{
	assert(pos < size());

	return _start[pos];
}

 insert和erase

         插入和删除操作,依然存在着迭代器失效的问题,删除和插入操作可能面临缩容和扩容问题,这都会导致操作后的pos与原先的pos数据不同导致迭代器失效(有些编译器会进行检查,认为erase之后的迭代器失效);insert 和 erase 之后形参pos都可能会失效,insert和erase之后的迭代器不要使用

iterator insert(iterator pos, const T& x)
{
	assert(pos >= _start && pos <= _finish);
	if (_finish == _endofstorage)
	{
		size_t len = pos - _start;
		reserve(capacity() == 0 ? 4 : capacity() * 2);
		pos = _start + len;
	}

	//memmove(pos + 1, pos, sizeof(T) * (_finish - pos));
	iterator end = _finish - 1;
	while (end >= pos)
	{
		*(end + 1) = *end;
		--end;
	}

	*pos = x;
	++_finish;
	return pos;
}

iterator erase(iterator pos)
{
	assert(pos >= _start);
	assert(pos < _finish);
	iterator it = pos + 1;
	while (it < _finish)
	{
		*(it - 1) = *it;
		it++;
	}
	_finish--;

	return pos;
}

为了避免操作后的pos数据丢失,所以返回类型最好是迭代器类型(也就是指针,连续存储的空间可以被视为是一个天然的迭代器);

resize

resize的主要作用是改变容器中元素的数量(size为有效元素个数,capacity为容量)

 三种情况:

  • n > size ,n<capacity   

resize的参数值大于当前容器中size的大小,小于capacity,会在容器末尾插入新的元素,不进行扩容(插入的元素可指定,也可以默认使用默认构造)

  • n > capacity 

 resize的参数值大于当前容器的capacity大小,进行扩容,并插入新的元素

  • n < size

resize的参数值小于当前容器的size大小,那么会删除多余的元素

 它又可以分为两种情况,有删除操作和无删除操作;

// T()为匿名构造
void resize(size_t n, T val = T())
{
	if (n > size())
	{
        // 扩容时会判断传值是否大于它的容量
		reserve(n);
        // 插入新的数据
		while (_finish < _start + n)
		{
			*_finish = val;
			_finish++;
		}
	}
	else
	{
		_finish = _start + n;
	}
}

不管自定义类型还是内置类型匿名构造会调用它的默认构造函数(在C++中认为内置类型也有默认构造函数)

int i; // 默认初始化为0
double d; // 默认初始化为0.0
char c; // 默认初始化为'\0'
bool b; // 默认初始化为false
int* ptr; // 默认初始化为nullptr

swap

swap可以直接使用std里的swap进行封装:

void swap(vector<T>& v)
{
	std::swap(_start, v._start);
	std::swap(_finish, v._finish);
	std::swap(_endofstorage, v._endofstorage);
}

 拷贝构造和赋值重载

 在学习时,我们使用的都是传统的写法,每次都是开空间然后将数据拷贝过去,这样其实很烦,于是小编上网查阅了一些资料,看到别人的代码,偷学来了一种新的写法,简单便捷;

在这里分享给大家:

 我们可以利用我们实现的一些接口来帮我们做,简单便捷;

vector(const vector<T>& v)
{
	reserve(v.capacity());
	for (const auto& e : v)
	{
		push_back(e);
	}
}

vector<T>& operator=(vector<T> v)
{
	swap(v);
	return *this;
}

 最为精妙的莫过于operator=;之前我们写赋值运算符重载要写一大堆,这里只需要两行就可以完成;

什么原理?

【C++入门】STL容器--vector底层数据结构剖析,c++,数据结构,开发语言

 如上图,v1有数据,v2没有数据,现在将v1的值赋值给v2,调用赋值运算符重载(operator=);

注意这里是传值调用,传值调用会调用拷贝构造,创建一个临时变量(也就是图上的v);

调用swap函数,交换两个指针指向的内容;

函数执行结束,临时对象v就会连同v的内容一同被销毁;

这样的设计堪称精妙,值得我们学习和鉴赏;

构造函数补充

构造函数我们只实现了一个,构造函数还有迭代器区间构造,指定数值个数构造

 迭代器区间构造

在此之前我们要先来把我们实现的vector迭代器接口实现,方便遍历:

iterator begin()
{
	return _start;
}

iterator end()
{
	return _finish;
}
const_iterator begin() const
{
	return _start;
}

const_iterator end() const
{
	return _finish;
}

         这里我们可以使用模板,传进来的迭代器的类型我们未知,可能是int类型、string类型、double类型...

template <class InputIterator>
vector(InputIterator first, InputIterator last)
{
	while (first != last)
	{
		push_back(*first);
		first++;
	}
}

 利用push_back接口进行数据插入;

指定数值个数构造
vector(size_t n, const T& val = T())
{
	resize(n, val);
}

 我们直接调用resize来帮我做;但是这样存在缺陷,我们用10个0进行初始化就会报错;为什么?

        模板调用时,一定是选择最合适的,两个参数都是int类型,他会调用迭代器的那个函数模板(模板的两个参数类型相同),不会走vector(size_t n, const T& value = T())这个构造方法,到了*first,就会报错,一个int类型如何解引用?

 解决办法也很简单在实现一个构造函数给int类型:

vector(int n, const T& val = T())
{
	reserve(n);
	for (int i = 0; i < n; i++)
	{
		push_back(val);
	}
}

 


总结

        在本文中,我们深入探讨了STL容器中的vector,以及它的底层数据结构。vector的底层设计也是比较好的,值得每位初学者借鉴学习;以上便是本文全部内容,希望对你有所帮助,最后感谢阅读!文章来源地址https://www.toymoban.com/news/detail-822794.html

到了这里,关于【C++入门】STL容器--vector底层数据结构剖析的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【C++ STL容器】:vector存放数据以及存放自定义的数据类型

    时不可以苟遇,道不可以虚行。 STL 中最常用的容器为: vector ,暂且把它理解为我们之前学过的数组 Array 。 添加头文件: #include vector 利用内置函数: push_back() 先声明两个迭代器, 一个指向容器中的第一元素 , 一个指向容器中的最后一个元素的下一个位置 然后利用一层

    2024年02月15日
    浏览(54)
  • C++提高编程——STL:string容器、vector容器

    本专栏记录C++学习过程包括C++基础以及数据结构和算法,其中第一部分计划时间一个月,主要跟着黑马视频教程,学习路线如下, 不定时更新,欢迎关注 。 当前章节处于: ---------第1阶段-C++基础入门 ---------第2阶段实战-通讯录管理系统, ---------第3阶段-C++核心编程, -----

    2024年01月23日
    浏览(49)
  • C++ —— STL容器【vector】模拟实现

    本章代码gitee仓库:vector模拟实现、vector源码 看源码发现 vector 是类模板定义的,成员是采用迭代器进行管理 当涉及到容器类时,通常有一些关键函数,如构造函数、析构函数和拷贝构造函数,它们负责初始化容器对象、销毁对象和进行对象的拷贝等 这里注意拷贝构造要实现

    2024年02月16日
    浏览(45)
  • C++数据结构之vector

    vector数组是一个能存放任意数据类型(类,结构体,普通变量类型等)的动态数组,在数据结构中就相当于顺序储存的线性表,寻找元素非常快,但是插入元素的时间却很大(list是一个双向链表,在同一个位置插入大量的数据时速度很快,但是查找的速度就会慢很多) 和普

    2024年02月04日
    浏览(49)
  • 【C++】:C++中的STL序列式容器vector源码剖析

    vector定于与stl_vector.h头文件中 例如: vector的数据结构非常简单:一个线性连续空间 下面介绍vector的3个数据结构: start:表示目前使用空间的头 finish:表示目前使用空间的尾 end_of_storage:表示目前可用空间的尾 说明:为了降低空间配置时的速度成本,vector实际配置的大小可

    2024年01月22日
    浏览(52)
  • STL标准模板库 vector容器与迭代器入门

    vector 就是一个连续的数据 C++11 std::vector a ={1,4,2,6,7}; 可以使用花括号来定义 容器的功能就是存储数据 迭代器的功能就是指向数据,并且可以实现前后移动(指针)算法和容器的接口的存在 vector功能是长度可变的数组, 身在栈上 里面的数据存储在堆上 因为栈不可动态扩容

    2023年04月23日
    浏览(47)
  • C++ stl容器list的底层模拟实现

    目录 前言: 1.创建节点 2.普通迭代器的封装 3.反向迭代器的封装 为什么要对正向迭代器进行封装? 4.const迭代器 5.构造函数 6.拷贝构造 7.赋值重载 8.insert 9.erase 10.析构 11.头插头删,尾插尾删 12.完整代码+简单测试 总结: 1.创建节点 注意给缺省值,这样全缺省就会被当做默认

    2024年04月23日
    浏览(44)
  • C++ stl容器string的底层模拟实现

    目录 前言: 1.成员变量 2.构造函数与拷贝构造函数 3.析构函数 4.赋值重载 5.[]重载 6.比较关系重载 7.reserve 8.resize 9.push_back,append和重载+= 10.insert 11.erase 12.find 14.迭代器 15.流插入,流提取重载 16.swap 17.c_str 18.完整代码+测试 总结: 1.成员变量 首先注意的就是_str,不能是const类型

    2024年04月23日
    浏览(43)
  • 【C++入门到精通】C++入门 —— vector (STL)

    前面我们讲了C语言的基础知识,也了解了一些数据结构,并且讲了有关C++的命名空间的一些知识点以及关于C++的缺省参数、函数重载,引用 和 内联函数也认识了什么是类和对象以及怎么去new一个 ‘对象’ ,也相信大家都掌握的不错,接下来博主将会带领大家继续学习有关

    2024年02月13日
    浏览(48)
  • 【C++庖丁解牛】STL之vector容器的介绍及使用 | vector迭代器的使用 | vector空间增长问题

    🍁你好,我是 RO-BERRY 📗 致力于C、C++、数据结构、TCP/IP、数据库等等一系列知识 🎄感谢你的陪伴与支持 ,故事既有了开头,就要画上一个完美的句号,让我们一起加油 vector的文档介绍 vector是表示可变大小数组的序列容器。 就像数组一样,vector也采用的连续存储空间来存

    2024年03月14日
    浏览(79)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包