大根堆與小根堆的理解，如何手寫一個堆，以及什麼時候用自己手寫的堆，什麼時候用語言提供堆的api，（二者的區別）

語言: CN / TW / HK

時間 2021-01-18 12:02:50 osc_rjwgyutp

主題: python java

大根堆與小根堆的理解，如何手寫一個堆，以及什麼時候用自己手寫的堆，什麼時候用語言提供堆的api，（二者的區別）

定義

Heap是一種資料結構具有以下的特點：
1）完全二叉樹；
2）heap中儲存的值是偏序；

Min-heap: 父節點的值小於或等於子節點的值；
Max-heap: 父節點的值大於或等於子節點的值；
用通俗語言來說，大根堆就是每個最大的數字在每個子樹的最上方，及大根堆pop值為最大值，小根堆反之
在這裡插入圖片描述

堆的儲存

堆的儲存一般由陣列表示，由於堆的實質就是完全二叉樹，所以對於每個i來說（從0開始）,左右孩子分別為2i+1,2i+2，父節點為（i-1）/2，
在這裡插入圖片描述

堆的核心操作（手寫與系統均有）

heapinsert與heapify
1.heapinsert:加入一個節點，通過上升的方式，依次進行比較，（上升操作），時間複雜度為o（logN）因為樹的深度為logN
在這裡插入圖片描述
swap為交換操作

private void heapInsert(int[] arr, int index) {
   
   
			while (arr[index] > arr[(index - 1) / 2]) {
   
   
				swap(arr, index, (index - 1) / 2);
				index = (index - 1) / 2;
			}
		}

2.heapify：彈出根結點之後的，將剩餘變成堆的操作（下沉操作），因為彈出根結點後，會將陣列最後面的數字頂替為根結點，所以只需將該結點進行下沉操作即可，時間複雜度為o（logN）樹的深度為logN
在這裡插入圖片描述
swap為交換操作

/**
		 * 
		 * @param arr 陣列
		 * @param index 索引
		 * @param heapSize 堆大小
		 */
		private void heapify(int[] arr, int index, int heapSize) {
   
   
			int left = index * 2 + 1;
			while (left < heapSize) {
   
   
				int largest = left + 1 < heapSize && arr[left + 1] > arr[left] ? left + 1 : left;
				largest = arr[largest] > arr[index] ? largest : index;
				if (largest == index) {
   
   
					break;
				}
				swap(arr, largest, index);
				index = largest;
				left = index * 2 + 1;
			}
		}

堆排序

首先堆排序分為2部分
1.將一個無序陣列變成堆
2.將堆進行排序核心操作（heapfiy，因為如果是大根堆的話，最大值在上方一直，heapfiy即可＋swap（交換）即可）

首先分析第一個部分
通常有2中方法
1.最常用的一種是將陣列依次遍歷，最後一次加入堆中，便可將陣列變成堆，但是此種方法的因為將陣列中所以數進行遍歷（N），將每個數進行heapinsert（logN），所以時間複雜度為O（N*logN）

// O(N*logN)
		for (int i = 0; i < arr.length; i++) {
   
    // O(N)
			heapInsert(arr, i); // O(logN)
		}

2.對此有一種優化方法，從陣列尾部開始遍歷，然後進行下沉，由於是從尾部，那邊可以得到下沉數字一定為有限常數

可以嘗試這麼理解，剛開始從尾部遍歷，那麼底部只有一層嘛，這時候heapify就為下沉0，倒數第二層時候，heapify為下沉1層，倒數第三層，heapify為下沉2層，有限個數時間複雜度為o(1)
那麼總體便為o(N*1)=O(N)

for (int i = arr.length - 1; i >= 0; i--) {
   
   
			heapify(arr, i, arr.length);
		}

然後分析第二個部分
變成堆之後，例如大根堆，最大是數字是根結點，那麼將最大的數字為尾部交換，然後將–heapsize,然後迴圈依次swap，heapify就ok了
這個方法的時間複雜度為o（n*logN）從頂部開始下沉，heapify是logN哈

詳細程式碼如下

// 堆排序額外空間複雜度O(1)
	public static void heapSort(int[] arr) {
   
   
		if (arr == null || arr.length < 2) {
   
   
			return;
		}
		// O(N*logN)
//		for (int i = 0; i < arr.length; i++) { // O(N)
//			heapInsert(arr, i); // O(logN)
//		}
		//O(N)
		for (int i = arr.length - 1; i >= 0; i--) {
   
   
			heapify(arr, i, arr.length);
		}
		int heapSize = arr.length;
		swap(arr, 0, --heapSize);
		// O(N*logN)
		while (heapSize > 0) {
   
    // O(N)
			heapify(arr, 0, heapSize); // O(logN)
			swap(arr, 0, --heapSize); // O(1)
		}
	}

什麼時候使用語言自帶api，什麼時候使用自己的手寫api

首先我們需要明確一點，我們需要重寫編寫一個類代替原有api，肯定當前api無法滿足我們的情況，我們來重寫api達到我們的效果

我們現在來看一種效果，我們現在不是int型別，是一個引用型別例如Teacher（假設包含id，name），我們通過比較器（後續部落格會有一篇詳細結束比較器的，會更新的，嘿嘿）
對其進行id比較，變成堆之後，（切記是以及變成堆之後）我們對其中某一個Teacher進行操作，將他的id變化，那麼這個時候整個堆會發生巨大變化（變成不是堆結構），而這不是使用者本意，使用者只是想修改某一個teacher的資訊，然後依然希望這個list是堆，換句話說，修改之後依然希望類自己進行維護，修改之後的結構自己進行復原變成堆

所以這個時候，語言自帶的api無法完成這個操作（java，python沒有，就算某些語言有，也是進行整體heapinsert，時間複雜度太高不適應）這個時候我們便需要自己首先一個api，來完成此操作

手寫解決上述問題優化的堆

核心思想便是使用HashMap<T, Integer> indexMap;對修改位置的索引進行記錄，在push的時候將指標（地址）與索引進行記錄在pop的時候進行刪除，

核心在於regsion
通過值可以得到索引，然後對索引依次進行heapify與heapinsert巧妙在於因為堆的特性要麼上升要麼下沉,時間複雜度與o（logN）

public static class MyHeap<T> {
   
   
		private ArrayList<T> heap;
		private HashMap<T, Integer> indexMap;
		private int heapSize;
		private Comparator<? super T> comparator;

		public MyHeap(Comparator<? super T> com) {
   
   
			heap = new ArrayList<>();
			indexMap = new HashMap<>();
			heapSize = 0;
			comparator = com;
		}
		public boolean isEmpty() {
   
   
			return heapSize == 0;
		}
		public int size() {
   
   
			return heapSize;
		}
		public boolean contains(T key) {
   
   
			return indexMap.containsKey(key);
		}

		public void push(T value) {
   
   
			heap.add(value);
			indexMap.put(value, heapSize);
			heapInsert(heapSize++);
		}

		public T pop() {
   
   
			T ans = heap.get(0);
			int end = heapSize - 1;
			swap(0, end);
			heap.remove(end);
			indexMap.remove(ans);
			heapify(0, --heapSize);
			return ans;
		}
		public void resign(T value) {
   
   
			int valueIndex = indexMap.get(value);
			heapInsert(valueIndex);
			heapify(valueIndex, heapSize);
		}
		private void heapInsert(int index) {
   
   
			while (comparator.compare(heap.get(index), heap.get((index - 1) / 2)) < 0) {
   
   
				swap(index, (index - 1) / 2);
				index = (index - 1) / 2;
			}
		}
		private void heapify(int index, int heapSize) {
   
   
			int left = index * 2 + 1;
			while (left < heapSize) {
   
   
				int largest = left + 1 < heapSize && (comparator.compare(heap.get(left + 1), heap.get(left)) < 0)
						? left + 1
						: left;
				largest = comparator.compare(heap.get(largest), heap.get(index)) < 0 ? largest : index;
				if (largest == index) {
   
   
					break;
				}
				swap(largest, index);
				index = largest;
				left = index * 2 + 1;
			}
		}
		private void swap(int i, int j) {
   
   
			T o1 = heap.get(i);
			T o2 = heap.get(j);
			heap.set(i, o2);
			heap.set(j, o1);
			indexMap.put(o1, j);
			indexMap.put(o2, i);
		}
	}

結語

第一次寫部落格，搞了一晚上，肯定寫的不好，希望大家不吝賜教，也希望能幫助到大家，也為自己總結使用，如果有不對的地方，歡迎大家指正

「其他文章」