学习python中的数据结构

创始人

2024-02-24 12:06:07

0次

数据结构

链表和数组

数组

Python的list是由数组来实现的

有序的元素序列, 在内存中表现为一块连续的内存区域;
链表

通过指针将无序的列表链接起来, 每个节点都存储着当前节点的值和下一个节点的内存地址
链表和数组有什么区别?
- 实现有序的方式是不一样的, 数组是连续的内存. 链表通过持有下一个节点的内存地址来达到有序的目的;
- 基于上述的特性, 数组在进行增删改查的时候钥耗费大量的系统资源来移动元素, 而链表只需要修改保存的地址即可.

栈

栈的特点是后入先出LIFO last in first out

可以将栈想象为一个有底的玻璃瓶, 那我们存取东西都必须遵守后入先出.

队列

队列的特点是先入先出FIFO first in first out

可以将队列想象为一个没有封口的玻璃管, 但是该玻璃管只有一个口可以添加元素, 一个口吐出元素. 那么队列获取元素必然遵守先入后出.

散列表

python中的dict本质就是散列表

散列表也叫hashmap. 通过将key值映射到数组中的一个位置来访问. 这个映射函数就叫做散列函数, 存放记录的数组也叫散列表

树和堆

树是一种特殊的链表结构, 每个节点下有若干个子节点

树的分类
二叉树

每个节点下最多只有两个节点
- 平衡二叉树
  
  二叉树节点下可以只有一个子节点, 如果二叉树中节点1-> 2 -> 3 -> 4 -> 5, 那么当前的树结构退化成了链表, 为了解决这么一个情况, 就有了平衡二叉树.
  
  平衡二叉树的任意节点的左子树的高度与右子树的高度差不可以超过1.
  - 红黑树
    
    因为平衡二叉树要严格保证左右子树的高度不超过1, 在实际场景中, 平衡二叉树需要频繁地进行调整.
二叉堆

二叉堆是一个完全二叉树, 满足当前任意节点要<=或者>=左右子节点, 一般使用数组来实现.
- 最大堆
  
  当前任意节点要>=左右子节点
- 最小堆
  
  略
B树
- B树解决了什么问题?
  
  B树的目的是在搜索树的基础上优化了磁盘获取的效率
  
  大部分数据查询的瓶颈在磁盘IO上, 从磁盘中读取1kb数据和1b数据消耗的时间基本是一样的, 在平衡二叉树的基础上, 每个节点尽可能多地存储数据
B+树解决了什么问题?
为了优化B树的查找速度, B树的每一个节点都是数据, 而B+树非子节点存储的是数据的地址(索引值), 子节点存储的是数据, 而且子节点会指向相邻的子节点, 都成一个有序链表.

B树适合作文件系统. B+树适合作遍历和查找.

链表

通过指针将无序的列表链接起来. 每个节点都存储着当前节点的值和下一个节点的地址

链表的缺点

链表的查找是从头节点逐个节点遍历, 查找效率低.
链表的应用
- 系统的文件系统
  
  我们存放在磁盘上的文件并不是连续的, 我们通过链表来对文件进行目录归类.
- git的提交节点
- 其他数据结构的基础, 比如树结构

链表的种类

单链表
双链表
环形链表

单链表的实现

声明Node类(自定义一个数据结构Node)

class Node:def __init__(self, data):self.data = dataself.next = Nonedef __str__(self):return f""

实现LinkedList数据结构

class LinkedList:def __init__(self):self.head = Noneself.end = self.headdef append(self, node):"""向链表尾部添加一个节点1. 尾部添加: end.next -> node, end -> node2. 当前头部没有节点: head -> node:param node::return:"""if not self.head:self.head = nodeelse:self.end.next = nodeself.end = nodedef insert(self, index, node):"""向index值插入一个节点1. 插入的是中间节点: 找到index值的节点, cur.next -> node   node->next2. 遍历的过程当中, 结果index值超过了当前链表的长度, 我们抛出异常3. 在头部插入节点: head -> node, node.next = head4. 在尾部插入节点: 跟中间节点是一样的, 但是end -> node:param index::param node::return:"""# 在原index值元素的左边插入 -> 在原index-1值对应元素的右边插入cur = self.headif index == 0:node.next = self.headself.head = nodereturnfor i in range(index-1):cur = cur.nextif cur is None:raise IndexError("LinkedList insert node exceed max length")node.next, cur.next = cur.next, nodeif node.next is None:self.end = nodedef remove(self, node):"""通过遍历删除给定的节点1. 移除的是中间节点: cur.next -> None, prev.next -> cur.next2. 移除的是头节点: head -> cur.next, cur.next -> None3. 移除的是尾节点: cur.next本身指向的就是None，和1一致， end -> prev:param node::return:"""cur = self.headprev = Nonewhile cur:if cur.data == node.data:if prev is None:self.head = cur.nextelse:prev.next = cur.nextcur.next = Noneif prev and prev.next is None:self.end = prevreturnprev = curcur = cur.nextdef reverse(self):"""翻转当前链表1. 中间节点： cur.next -> prev2. 头节点： cur.next -> prev3. 尾节点： cur.next -> prev4. 处理原本的head和end:return:"""# 能被翻转说明链表长度 > 1if self.head and self.head.next:cur = self.head.nextprev = self.head# 原本头节点的next需要断开self.head.next = None# 原本头节点就变成了尾节点self.end = prevwhile cur:# 这里设计到next，cur， prev三个节点， 所以引入中间变量nextnext = cur.nextcur.next = prevprev = curcur = next# 翻转后，头节点指向了原本的尾节点self.head = prevelse:returndef __str__(self):"""通过遍历的方式打印当前链表初始节点为Head, 如果当前指针指向的是NULL, 说明我们到达了结尾:return:"""cur = self.headresult = ""while cur:result += str(cur) + "\t"cur = cur.nextreturn resultif __name__ == "__main__":node_1 = Node(1)node_2 = Node(2)node_3 = Node(3)node_4 = Node(4)linked_list = LinkedList()linked_list.append(node_1)linked_list.append(node_2)linked_list.append(node_3)# linked_list.insert(3, Node(1.5))linked_list.append(node_4)# linked_list.remove(Node(1.5))linked_list.reverse()print(linked_list)