首页 > 其他分享> 文章详细

数据结构学习总结（用于考研复试）

2022-03-28 22:32:00 阅读：183 来源： 互联网

标签：存储排序复杂度个数复试关键字数据结构节点考研

自己整理的哈，有错误还请各位大哥指正！

1.什么是O

O表示算法复杂度，他需要通过时间复杂度和空间复杂度来描述。

①时间复杂度:一个语句的频度即该语句被执行的次数，程序中所有语句的频度之和记为T(n)，时间复杂度就是T(n)的数量级函数，其中n表示问题的规模。

如常见的冒泡排序最坏时间复杂度为O(n^2)，即初始数据为逆序排序。

②空间复杂度:算法所耗费的存储空间，也是问题规模n的函数。

若算法所需辅助空间为常量，则空间复杂度是O(1)，即原地工作。

2.数据结构三要素

①逻辑结构：指数据之间的逻辑关系，与存储关系无关。主要有集合；线性（一对一）；树形（一对多）；图（多对多）四类。

②存储结构：指数据在计算机中的表示。只要有顺序存储；链式存储；索引存储；散列存储。

③数据的运算：施加在数据上的运算。

3.循环与递归

递归优点：代码简洁清晰

　　缺点：每递归一层,就会在内存生成一个栈保存递归的信息，如果递归深度过深,有栈溢出的问题。循环则不会有这样的问题。

循环优点：结构简单易实现

　　缺点：没有递归简介明了（我认为所有递归都可以写成循环，但比较麻烦）

4.贪心，dp及分治的区别

贪心：只考虑当前最优解，而非全局最优。

dp：考虑到全局最优，求解子问题过程中保留可能的局部最优解，从下往上，一步步对比出全局最优解。

分治：顾名思义分而治之，将问题分为若干规模小且与原问题相似的子问题，递归解决再合并结果。如归并排序。

5.顺序表和链表：

空间上：顺序表需要连续存储空间

内存上：链表有指针额外占用空间

随机存取上：顺序表支持

插入删除上：链表只需修改指针，而顺序表需大量移动元素

6.头指针和头节点：

头指针：不管有没有头节点，永远指向链表第一个节点。作用：具有标识作用。

头节点：带头节点链表中的第一个节点，通常不存储信息。作用：使得第一个节点和其他节点的操作统一；使得空表和非空表操作统一。

7.栈和队列：

栈：先进后出，只能在一端进行插入删除。

队列：先进先出，只能在一端插入另一端删除。

相同点：都可链式顺序存储，都是操作受限的线性表。

8.共享栈：

两个顺序栈共享一个一维数组空间，栈底分别设在两端，插入数据时向中间延申，所以只有空间被占满时才上溢。

9.判断循环队列的空满：

一般牺牲一个单元格：当(队尾+1）%maxnum=队头时则为队满；当队头=队尾时则为队空。

也可以增设一个数据成员表示队内元素个数来判断：个数=0队空，个数=maxnum为队满。

10.kmp算法中next数组的计算：

当第j个字符匹配失败时，记1~j-1的字符串为S；则next【j】=S的模式串最长相等前后缀长度+1，特别地next【1】=0。

改进后的nextvel数组：记next【j】的值为x，当模式串下标为x的字符=当前模式串所指字符，说明就算移动也会匹配失败，所以直接nextvel【j】=nextvel【x】（即参考前面的相同字符的nextval值。

11.线索二叉树：

作用：使得不用遍历的情况下直接找到某结点的前驱或后继。

先序线索化不能直接找前驱，后序线索化不能直接找后继

12.二叉排序树

空树或：左子树结点的值小于他，右子树结点的值大于他，且左右都是二叉排序树。

13.平衡二叉树

空树或：左右子树高度差绝对值不超过1且左右都是平衡二叉树。

14.哈夫曼树

带权路径最小的树，也称为最优二叉树

14.树的存储结构

顺序存储和链式存储（一般二叉树才有可能用顺序存储）

三种方法：双亲表示法（存该结点的父亲），孩子表示法（链式存储该节点的所有孩子），孩子兄弟表示法（左边存孩子右边存兄弟）

15.B树(多路平衡查找树)m阶B树的结点最多m个子树

要求根的子树个数为【2，m】，关键字数=【1，m-1】；非根的子树为【m/2，m】；关键字数=【(m/2)-1，m-1】

查找：同二叉排序树(大了往右，小了往左)，只不过不是两路分支而是多路分支

插入：同二叉排序树一样找到位置插入，然后不满足B树条件时进行不断分裂(中间位置的关键字去父节点中，左边的关键字不动，右边的关键字新生成一个结点)

删除：①直接删：删除后仍满足B树条件。

　　　②兄弟够借：父子互换法，兄弟顶替被删的关键字且父子互换。

　　 ③兄弟不够借：父亲下坠法，父亲下来与兄弟合并。

16.B树和B+树区别：

B+树是应数据库所需而出现的一种B树的变形。

B+树结点的子树个数=关键字个数。而B树子树个数-1=关键字个数。

B+树仅在叶子节点存储索引对应信息（而B树则每个节点中都存放了索引对应信息），所以一个磁盘可以存下更多的索引元素，大大减少磁盘访问操作。这也是为什么大多数数据库选择B+树的主要原因。

B+树叶子节点间有双向的指针，支持顺序查找、范围查找。

17.数据库为什么用B+树不用B树：因为查询操作需要读磁盘，而磁盘是慢速设备，所以当然是读的次数越少越好，也就是树的高度越小越好。而B+树相对B树而言，它的非叶子节点不存储关键字对应信息，只存储关键字，所以规定的磁盘空间就能存放更多关键字，树也越矮，查找速度更快。且叶子节点有双向的指针，支持顺序查找、范围查找。

18.排序

d是关键字数，r时队列数，n是待排序数。

19.快排复杂度怎么来的：

最好为O（nlogn）。每次需要将数组分成两半进行比较交换，最好情况下每次都分为等长两个部分，则需要logn次划分。最差情况下分为n-1个元素和0个元素，则需n次划分。

不管最好还是最差划分每趟排序都需要对元素进行n次比较，所以最好为nlogn，最差为n^2。

改进：每次随机选择基准元素可以使得最坏情况几乎不会发生。

20.基数排序：

将所有待比较数统一为同样的长度，不足的前面补零。然后对每个数的第i位数进行比较，插入相应的队列，最后将队列用指针链接。如此循环直到最高位比较完毕。

时间复杂度为d（n+r），其中d为关键字个数。r为队列数，n为排序数。

标签：存储,排序,复杂度,个数,复试,关键字,数据结构,节点,考研
来源： https://www.cnblogs.com/ydw--/p/15955675.html

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

数据结构学习总结（用于考研复试）