【数据结构】堆(二)——堆排序、TOP-K问题
创始人
2024-04-25 18:23:35
0

作者:一个喜欢猫咪的的程序员 

专栏:《数据结构》

喜欢的话:世间因为少年的挺身而出,而更加瑰丽。                                  ——《人民日报》


目录

堆排序:(以小堆为例)

 Heapsort函数(堆排序):

向下调整具体的时间复杂度:

向上调整具体的时间复杂度:

如何实现堆排序

TOP-K问题:


堆排序:(以小堆为例)

堆的分类:

  • 升序or降序
  • 大堆or小堆
void test2()
{//堆排序int array[] = { 27,15,19,18,28,34,65,49,25,37 };Heapsort(array, sizeof(array) / sizeof(array[0]));for (int i = 0; i < sizeof(array) / sizeof(array[0]); i++){printf("%d ", array[i]);}printf("\n");}

 Heapsort函数(堆排序):

int array[] = { 27,15,19,18,28,34,65,49,25,37 };

需将这个数组进行大堆排列,分为两种调整形式:向上调整和向下调整

向上调整和向下调整的思想可以参考我的例外一篇博客:http://t.csdn.cn/YFSpd

void Ajustup(HPDataType*a, int child)
{//N*logNassert(a);//int child = n - 1;while (child > 0){int parent = (child - 1) / 2;if (a[child] > a[parent]){Swap(&a[child], &a[parent]);child = parent;}else{break;}}
}
void Ajustdown(HPDataType* a, int n,int parent)
{//O(N)assert(a);int child = 2 * parent+1;while (child a[parent])//>大堆,<为小堆{Swap(&a[child], &a[parent]);parent = child;child = child * 2 + 1;}else{break;}}
}

 向上调整和向下调整具体的时间复杂度是多少呢?

向下调整具体的时间复杂度:

假设树高为h

第h层,有2^(h-1)个节点,需要向下调整0次(直接不算,从第h-1层开始算)。

第h-1层,有2^(h-2)个节点,需要向下调整1层。

第h-2层,有2^(h-3)个节点,需要向下调整2层。

......

第4层,有2^3个节点,需要向下调整h-4层。

第3层,有2^2个节点,需要向下调整h-3层。

第2层,有2^1个节点,需要向下调整h-2层。

第1层,有2^0个节点,需要向下调整h-1层。

当h高的次数,最多调整层数为:

F(h)=2^0*(h-1)+2^1*(h-2)+2^2*(h-3)+...+2^(h-3)*2+2^(h-2)*1+2^(h-1)*0       ——①

2*F(h)=2^1*(h-1)+2^2*(h-2)+2^3*(h-3)+...+2^(h-2)*2+2^(h-1)*1+2^(h)*0       ——②

有错位相减②-①可得:

F(h)=-2^0*(h-1)+2^1+2^2+....+2^(h-2)+2^(h-1)

F(h)=2^h-1-h                                                                                                           ——③

 当树高为h时,节点总个数N为:

N=2^0+2^1+...+2^(h-2)+2^(h-1)

N=2^h-1                                                                                                                        ——④

有④可得:h=log(N+1)                                                                                            ——⑤

综合③④⑤可得:

F(N)=N-log(N+1)

  •  因此时间复杂度为O(N)

向上调整具体的时间复杂度:

在一层,需要向上调整0次

第二层,向上调整1次

第三层,向上调整2次

...

第h-1层,向上调整h-2次

第h层,向上调整h-1次

F(h)=2^1*1+2^2*2+....+2^(h-1)*(h-1)。

由错位相减可得:

F(N)=2N(1-log(N+1))。

  • 时间复杂度为O(N*logN)

如何实现堆排序

显然向下调整优于向上调整。

 先利用Ajustdown排序好数组,然后再用交换Ajustdown实现小堆。

void Heapsort(int*a,int n)//堆排序
{//向上调整for (int i = 1; i = 0; i--){Ajustdown(a, n, i);}int end = n - 1;while (end>0){Swap(&a[0], &a[end]);Ajustdown(a, end, 0);end--;}//N*logN
}
void test2()
{//堆排序int array[] = { 27,15,19,18,28,34,65,49,25,37 };Heapsort(array, sizeof(array) / sizeof(array[0]));for (int i = 0; i < sizeof(array) / sizeof(array[0]); i++){printf("%d ", array[i]);}printf("\n");}

TOP-K问题:

TOP-K问题:即求数据结合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。
比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。

当数据量特别大时,我们造一个数组来存储他们依次存储时,就不大现实。

可以先开一个K个空间的数组,将这个数据量的前K个放进去,将他们小堆排列,并将这个数据量每个数与堆顶的元素相比较,比它大就替代它进入数组,在向下排列,以此循环。

void test3()
{int minHeap[5];FILE* fout = fopen("data.txt", "r");if (fout == NULL){perror("fopen fail");exit(-1);}int k = sizeof(minHeap) / sizeof(minHeap[0]);for (int i = 0; i < k; i++){fscanf(fout,"%d",&minHeap[i]);}for (int i = 0; i < sizeof(minHeap) / sizeof(minHeap[0]); i++){//检查是否录入数据printf("%d ", minHeap[i]);}printf("\n");for (int i = (k - 1 - 1) / 2; i >= 0; i--){Ajustdown(minHeap, k, i);}for (int i = 0; i < sizeof(minHeap) / sizeof(minHeap[0]); i++){//检查是否为大小堆printf("%d ", minHeap[i]);}printf("\n");int data = 0;while (fscanf(fout, "%d", &data) != EOF){if (data > minHeap[0]){minHeap[0] = data;Ajustdown(minHeap, k, 0);}}int end = k - 1;while (end > 0){Swap(&minHeap[0], &minHeap[end]);Ajustdown(minHeap, end, 0);end--;}//完成升序或者降序for (int i = 0; i < sizeof(minHeap) / sizeof(minHeap[0]); i++){//检查是否为大小堆printf("%d ", minHeap[i]);}printf("\n");fclose(fout);
}
void test4()
{int n, k;scanf("%d %d", &n, &k);FILE* fint = fopen("data1.txt", "w");if (fint == NULL){perror("fopen fail");exit(-1);}srand(time(0));int randK = k;for (size_t i = 0; i < n; ++i){int data = rand() % 100000;fprintf(fint, "%d\n", data);}fclose(fint);int* minHeap = (int*)malloc(sizeof(int) * k);FILE* fout = fopen("data1.txt", "r");if (fout == NULL){perror("fopen fail");exit(-1);}for (int i = 0; i < k; i++){fscanf(fout, "%d", &minHeap[i]);}for (int i = 0; i < k; i++){//检查是否录入数据printf("%d ", minHeap[i]);}printf("\n");for (int i = (k - 1 - 1) / 2; i >= 0; i--){Ajustdown(minHeap, k, i);}for (int i = 0; i < k; i++){//检查是否为大小堆printf("%d ", minHeap[i]);}printf("\n");int data = 0;while (fscanf(fout, "%d", &data) != EOF){if (data > minHeap[0]){minHeap[0] = data;Ajustdown(minHeap, k, 0);}}int end = k - 1;while (end > 0){Swap(&minHeap[0], &minHeap[end]);Ajustdown(minHeap, end, 0);end--;}//完成升序或者降序for (int i = 0; i < k; i++){//检查是否为大小堆,升序或者降序printf("%d ", minHeap[i]);}printf("\n");fclose(fout);
}
int main()
{//test1();test2();//test3();//test4();return 0;
}

相关内容

热门资讯

监控摄像头接入GB28181平... 流程简介将监控摄像头的视频在网站和APP中直播,要解决的几个问题是:1&...
Windows10添加群晖磁盘... 在使用群晖NAS时,我们需要通过本地映射的方式把NAS映射成本地的一块磁盘使用。 通过...
protocol buffer... 目录 目录 什么是protocol buffer 1.protobuf 1.1安装  1.2使用...
在Word、WPS中插入AxM... 引言 我最近需要写一些文章,在排版时发现AxMath插入的公式竟然会导致行间距异常&#...
【PdgCntEditor】解... 一、问题背景 大部分的图书对应的PDF,目录中的页码并非PDF中直接索引的页码...
Fluent中创建监测点 1 概述某些仿真问题,需要创建监测点,用于获取空间定点的数据࿰...
educoder数据结构与算法...                                                   ...
MySQL下载和安装(Wind... 前言:刚换了一台电脑,里面所有东西都需要重新配置,习惯了所...
MFC文件操作  MFC提供了一个文件操作的基类CFile,这个类提供了一个没有缓存的二进制格式的磁盘...
有效的括号 一、题目 给定一个只包括 '(',')','{','}'...