温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

C++ vector的底层实现分析

发布时间:2021-11-18 16:41:48 来源:亿速云 阅读:258 作者:iii 栏目:开发技术

这篇文章主要介绍“C++ vector的底层实现分析”,在日常操作中,相信很多人在C++ vector的底层实现分析问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”C++ vector的底层实现分析”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

    定义初始结构

    在标准C++中,vector同样是一个模板,并且其底层实现用的是三个指针,然后利用这三个指针相互加减,达到存储效果.

    而vector和string类似,本质是都是一个顺序表.

    template <class T>
    class vector
    {
    public:
        ~vector()
        {
            delete _start;
            _start = _finish = _end_of_storage = nullptr;
        }
    private:
        T* _start;         //顺序表的头
        T* _finish;        //顺序表有效长度位置
        T* _end_of_storage; //顺序表末尾
    };

    声明构造函数

    上一章节已经讲解,构造函数比较多,这里只是为了简单实现,所以博主就实现一个最简单的构造函数,即无参构造.

    vector():_start(nullptr),_finish(nullptr),_end_of_storage(nullptr) {}

    容量有关操作

    获取有效数据大小size()

    想要获取size,该怎么实现呢?我们在定义初始结构的时候,已经知道其底层是利用的三个指针,所以size等于_finish - _start.

    size_t size() const    //加const是保证const对象也可以用
    {
        return _finish - _start;
    }

    获取数据容量capacity()

    同样的道理,capacity就应是_end_of_storage - _start;

    size_t capacity() //加const是保证const对象也可以用
    {
        return _end_of_storage - _start;
    }

    增加容量reserve()

    我们在后面会实现一个接口,叫做push_back(),它的作用是把数据放进vector,但如果空间不足了呢?这就需要我们的增容函数reserve了.

    其参数是无符号整型n,代表要开n个空间

    void reserve(size_t n)
    {
        if (n > capacity())
        {
            T* tmp = new T[n];               //先开辟一块空间
            size_t sz = size();              //保留原来的有效数据大小,且一定要先保存
            if (_start)        //一定要判断这个,因为最开始_start为空,那么就只需要开空间
            {
                memcpy(tmp, _start, sizeof(T) * n);  //把原来的数据拷贝进新空间
                delete _start;  //释放原来的空间
            }
            _start = tmp;                    //移交空间
            _finish = _start + sz;           //更新_finish
            _end_of_storage = _start + n;    //更新_end_of_storage
        }
    }

    重置大小resize()

    这个想必大家现在已经比较习惯了吧?他有两个参数,会分情况讨论是否大于size()而进行参数赋值.

    void resize(size_t n,const T& val = T())
    {
        if(n>capacity()) reserve(n);
        for(size_t i = size();i<n;i++)
        {
            _start[i] = val;
        }
        _finish = _start + n;    
    }

    迭代器

    前面讲解string的时候说过,现阶段我们就把迭代器当做一个指针,**虽然指针一定是迭代器,但是迭代器不一定是指针.**但是目前阶段我们用到的迭代器就是一个指针,因此这里便直接定义迭代器了

    typedef T* iterator;              //普通迭代器
    typedef const T* const_iterator;  //const迭代器
    //因此返回首尾迭代器的接口,博主便一并写下来
    iterator begin() {return _start;}
    iterator end() {return _finish;}        //普通接口
    const_iterator begin() const {return _start;}
    const_iterator end() const {return _finish;}  //const接口

    数据操作

    尾插push_back()

    该接口的实现操作一般是先检查容量是否充足,然后把数据放进去,最后size大小加一.

    void push_back(const T& val)
    {
        if(size() == capacity())
        {
            size_t newcapacity = size()==0?4:capacity()*2;  //需要考虑到size是否有可能为0的情况
            reserve(newcapacity);
        }
        *_finish = val;
        _finish++;
    }

    尾删pop_back()

    实现该接口的操作一般是先检查是否还存在数据,然后size大小减一

    void pop_back()
    {
        assert(size()>0);
        _finish--;
    }

    某一位置插入 insert()

    同样的道理,一般先检查容量是否充足,如果不够,需要警惕迭代器失效问题,然后移动该位置及以后的所有数据,最后插入数据.

    官方文档定义其返回值为新插入数据的位置

    iterator insert(iterator pos,const T& val)
    {
        assert(pos>=_start && pos <= _finish);
        if(_finish == _end_of_storage)
        {
            int n = pos - _start;
            size_t newcapacity = 0 ? 4 :capacity()*2;
            pos = _start + n;      //防止pos迭代器失效
        }
        iterator cur = end();
        while(cur > pos)
        {
            *cur = *(cur-1);
            cur--;
        }
        *pos = val;
        _finish++;
        return pos;
    }

    某一位置删除 erase()

    该接口的操作一般是从pos后位置开始,所有数据前挪一单位.但是在挪之前,需要检查是否还存在数据

    官方文档定义其返回值为删除数据的下一位置

    iterator erase(iterator pos)
    {
        assert(pos >= _start && pos < _finish);
        iterator it = pos + 1;
        while (it != _finish)
        {
            *(it-1) = *it;
            ++it;
        }
        --_finish;
        return pos;
    }

    拷贝构造

    vector(const vector<T>& v):_start(nullptr), _finish(nullptr), _end_of_storage(nullptr)
    {
        reserve(v.capacity());
        for (const auto& e : v)
        {
            push_back(e);
        }
    }

    []访问操作

    上面我们实现了迭代器,但是vector还支持[]索引取值,博主这里便实现两个[]重载吧

    T& operator[](size_t i)
    {
        assert(i < size());
        return _start[i];
    }
    const T& operator[](size_t i) const
    {
        assert(i < size());
        return _start[i];
    }

    =赋值操作

    vector<T>& operator=(vector<T> v)    //注意哦~,我这里故意写的传值参数,而不是引用,是为了下面进行交换
    {
        swap(*this,v);
        return *this;
    }

    特别注意!!!

    在实现了上面的一系列操作以后,有没有觉得我们已经大功告成了?其实这里还隐藏着一个小小bug!.为什么呢?看下面'

    int main()
    {
        //我们假设最开始创建的vector的容量是4
    	vector<string> vc;
    	vc.push_back("123");    //创建vc,并给其赋值
        vc.push_back("234");
        vc.push_back("345");
        vc.push_back("456");
        vc.push_back("567");
        return 0;
    }

    初一看,好像并没有什么错误哎?但是一运行就会发现,当插入第5个元素的时候,就报错了.这是什么原因呢?

    调试发现,问题出在了reserve上面,因为push_back之前,会检查容量,那么我们现在重新瞅瞅 reserve存在什么问题呢?

    void reserve(size_t n)
    {
        if (n > capacity())
        {
            T* tmp = new T[n];               //先开辟一块空间
            size_t sz = size();              //保留原来的有效数据大小,且一定要先保存
            if (_start)        //一定要判断这个,因为最开始_start为空,那么就只需要开空间
            {
                memcpy(tmp, _start, sizeof(T) * n);  //把原来的数据拷贝进新空间
                delete _start; //释放原来的空间
            }
            _start = tmp;                    //移交空间
            _finish = _start + sz;           //更新_finish
            _end_of_storage = _start + n;    //更新_end_of_storage
        }
    }

    大家有发现什么问题了吗?

    没错,问题出现在memcpy上面,当容量不足,reserve就会增加容量,然后把原来空间的内容值拷贝到新空间.

    但是原来空间的内容也就只有三个指针呀,拷贝过去后,新空间和源空间都指向了同一块空间,而我们又会释放原空间.

    所以,当继续尾插第5个元素时候,就报错了,因为空间已经不存在了!!!,被释放了.

    那怎么解决呢?这里便只能用循环,把string值赋给新空间了.

    void reserve(size_t n)
    {
        if (n > capacity())
        {
            size_t sz = size();
            T* tmp = new T[n];
            if (_start)
            {
                for (size_t i = 0; i < sz; ++i)
                {	
                    tmp[i] = _start[i];
                }
                delete[] _start;
            }
            _start = tmp;
            _finish = _start + sz;
            _endofstorage = _start + n;
        }

    到此,关于“C++ vector的底层实现分析”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注亿速云网站,小编会继续努力为大家带来更多实用的文章!

    向AI问一下细节

    免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

    AI