大三黨，大資料專業，正在為面試準備，歡迎學習交流，`

文章中總結了四種常見的查找方法，內容包括了基本概念及代碼實作，內容較多，特別是哈希查詢的內容比較多，可能有所遺漏，但是總結了大部分的內容，
附帶一本熱銷的電子書配套適用更佳，鏈接如下
大話資料結構
提取碼：mazy

往期文章
緒論-資料結構的基本概念
緒論-演算法
線性表-順序表和鏈式表概念及其代碼實作

文章目錄

1 常見的查找演算法
2 平均查找長度ASL比較查找演算法性能
3 順序查找
- 3.1 順序查找的思想
- 3.2 順序查找代碼
- 3.3 順序表上順序查找的平均查找長度（性能分析）
4 折半查找
- 4.1 折半查找的前提條件及查找程序
- 4.2 折半查找代碼
- 4.3 折半查找的性能分析
- 4.4 折半查找特點
5 索引查找
- 5.1 索引的使用方法
- 5.2 索引表的構建
- 5.3 索引查找代碼
- 5.4 索引順序查找的ASL
6 三種查找演算法的比較
7 哈希查找
- 7.1 哈希查詢的思想
- 7.2 哈希函式的定義
- 7.3 哈希表的定義
- 7.4 常見的哈希函式
- - 7.4.1 直接哈希函式
  - 7.4.2 數字分析法
  - 7.4.3 平方去中法
  - 7.4.4 折疊法
  - 7.4.5 除留余數法
  - 7.4.6 亂數法
- 7.5 哈希函式選取通常需要考慮的因素
- 7.6 哈希函式沖突的處理方法
- - 7.6.1 開放地址法
  - 7.6.2 再哈希法
  - 7.6.3 鏈地址法
  - 7.6.4 公共溢位區法
- 7.7 哈希表查找代碼實作及實體
- 7.8 哈希查找性能分析
總結

1 常見的查找演算法

順序查找
二分查找
索引查找
哈希查找

2 平均查找長度ASL比較查找演算法性能

公式：ASL=P1C1+P2C2+…+PnC

Pi——查找第i個元素的概率
Ci——查找第i個元素需要的比較次數

3 順序查找

3.1 順序查找的思想

在這里插入圖片描述

從表中指定位置（一般為最后一個，第0個位置設為崗哨）
的記錄開始，沿某個方向將記錄的關鍵字與給定值相比較，
若某個記錄的關鍵字和給定值相等，則查找成功；
反之，若找完整個順序表，都沒有與給定關鍵字值相等的
記錄，則此順序表中沒有滿足查找條件的記錄，查找失敗，

3.2 順序查找代碼

int seqsearch(DataType R[], KeyType key)
{
R[0]=key, i=n;//第一個位置設為崗哨
while (R[i] != key) 
i=i-1;//從最后一個位置往前查找
return i;
}

3.3 順序表上順序查找的平均查找長度（性能分析）

在這里插入圖片描述
對于順序表的
Ci=n-i+1
Pi =1/n
則可以得到如下計算結果（等引數列的計算）：

4 折半查找

4.1 折半查找的前提條件及查找程序

前提條件
如果順序表中的紀律按關鍵字值有序即R[i].≤R[i+1]，i=1,2,…,n-1，則稱順序表為有序表，
在這里插入圖片描述

4.2 折半查找代碼

int BinarySearch(DataType SL[], KeyType key, int n){
/*在長度為n的有序表SL中折半查找其關鍵字等于key的記錄*/
/*查找成功回傳其在有序表中的位置，查找失敗否回傳0*/
int low=1;
int high=n;
while(low<=high){
mid=(low+high)/2;//取整 小的數 右邊的數
if(key = = SL[mid]) 
{
  return mid;
}
else if( key>SL[mid])//查找值在左邊 移動low
low=mid+1;
else //查找值在右邊 移動low 
high=mid-1;
}
return 0;
}

查找程序
將待查關鍵字與有序表中間位置的記錄進行比較，若相等，查找成功，若小于，則只可能在有序表的前半部分，若大于則只可能在有序表的后半部分，因此，經過一次比較，就將查找范圍縮小一半，這樣一直進行下去直到找到所需記錄或記錄不在查找表中，

4.3 折半查找的性能分析

引入判定樹
在這里插入圖片描述
其中6查找一次，3 9查找兩次，1 4 7 10 查找3次，2 5 8 11 查找4次，

4.4 折半查找特點

折半查找的查找效率高；
平均查找性能和最壞性能相當接近；
折半查找要求查找表為有序表；
并且，折半查找只適用于順序存盤結構

5 索引查找

5.1 索引的使用方法

先分析資料規律，建立索引
再根據索引進行快速定位
在定位的地方進行細致搜索

5.2 索引表的構建

分塊：第Rk 塊中所有關鍵字< Rk+1塊中所有關鍵字，（k=1, 2, …, L-1）
建立索引項：關鍵字項：記載該塊中最大關鍵字值；指標項：記載該塊第一個記錄在表中位置，
建立索引表：所有索引項組成索引表
如下圖展示

索引項展示

5.3 索引查找代碼



typedef struct IndexType
{
KeyType key;//最大關鍵字
int Link;  //地址項
} IndexType;

int IndexSequelSearch(IndexType ls[], DataType s[], int m, KeyType key){
/*索引表為ls[0]-ls[m-1]，順序表為s*/
i=0;
while(i<m && key>ls [i ].key) i++; /*塊間查找*/
if(i==m)return -1; /*查找失敗*//*不在查找范圍內*/
else{ /*在塊內順序查找*/
j=ls[ i ].Link;
while(Key!=s[j].key && j<ls[ i+1 ].Link) //j<是為了不超出當前塊
j++;
if(key = = s[j].key)return j; /*查找成功*/
else return -1; /*查找失敗*/
}
}

5.4 索引順序查找的ASL

ASL=ASL(索引表）+ASL（塊內）
在這里插入圖片描述

6 三種查找演算法的比較

在這里插入圖片描述

7 哈希查找

7.1 哈希查詢的思想

以學號查詢為例子，取給定學號的后三位，不需要經過比較，便可直接從查找表中找到給定學生的記錄，因為如下圖我們建立了關鍵字和存盤地址之間的映射關系，
在這里插入圖片描述

7.2 哈希函式的定義

一般情況下，需在關鍵字與記錄在表中的存盤位置之間建立一個函式關系，以 H(key) 作為關鍵字為key 的記錄在表中的位置，通常稱這個函式 h(key) 為哈希函式，
在這里插入圖片描述

哈希函式是一個映象，即：將關鍵字的集合映射
到某個地址集合上，它的設定很靈活，只要這個地
址集合的大小不超出允許范圍即可；
由于哈希函式是一個壓縮映象，因此，在一般
情況下，很容易產生“沖突”現象，即： key1！=
key2，而 h(key1) = h(key2)，例如下圖 key分別是100和1000
很難找到一個不產生沖突的哈希函式，一般情況
下，只能選擇恰當的哈希函式，使沖突盡可能少地產
生，

7.3 哈希表的定義

根據設定的哈希函式 H(key) 和提供的處理沖突的方法，將一組關鍵字映象到一個地址連續的地址空間上，并以關鍵字在地址空間中的“象”作為相應記錄在表中的存盤位置，如此構造所得的查找表稱之為哈希表，
在這里插入圖片描述

7.4 常見的哈希函式

7.4.1 直接哈希函式

在這里插入圖片描述

7.4.2 數字分析法

在這里插入圖片描述

7.4.3 平方去中法

思想：以關鍵字的平方值的中間幾位作為存盤地址，求“關鍵字的平方值” 的目的是“擴大差別”和“貢獻均衡”，
在這里插入圖片描述

7.4.4 折疊法

在這里插入圖片描述

7.4.5 除留余數法

在這里插入圖片描述

7.4.6 亂數法

在這里插入圖片描述

7.5 哈希函式選取通常需要考慮的因素

計算哈希函式所需時間；
關鍵字的長度；
哈希表的大小；
關鍵字的分布情況；
記錄的查找頻率，

7.6 哈希函式沖突的處理方法

7.6.1 開放地址法

為產生沖突的地址H(key)重新求得求得一個地址序列，通過如下的公式：
H0 = H(key)
Hi = ( H(key) + di) MOD m
H0, H1, H2, …, Hs 1≤ s≤m-1

Hi 為第i次沖突的地址
H(key)為Hash函式值
m 為Hash表表長
di 為增量序列

對于di的取法有是三種，如下圖：
在這里插入圖片描述
由于并不復雜我們以線性探測再散列舉例：

關鍵字 { 19, 01, 23, 14, 55, 68, 11, 82, 36 }

設定哈希函式 H(key) = key MOD 11 ( 表長=11 )

選用線性探測再散列處理沖突

19/11=7 沒有沖突放入表中
1/11=1 沒有沖突放入表中
23/11=1 產生沖突 1的位置已經存放了，使用函式 Hi = ( H(key) + di) MOD m，第一次沖突di取1 H1 = ( H(key) + di) MOD m=（23+1）mod 11=2 放入2
依次類推沖突一次 di依次取 1 2 3 4 5（實際意義就是往右邊找空格子）
最終結果如下，下方數次表示第幾次成功
計算ASL(成功)=(1+1+2+1+3+6+2+5+1)/9
計算ASL(失敗)=(9+8+7+6+5+4+3+2+1)/9（假設格子如圖占完余數從0~8要查找幾次后再能解決沖突得到了如上數字計算）

7.6.2 再哈希法

第一次沖突使用RH1哈希函式
第二次沖突使用RH2哈希函式
…
每次對應不同的哈希函式
在這里插入圖片描述

7.6.3 鏈地址法

重點關注一下ASL失敗怎么求，同上
在這里插入圖片描述

7.6.4 公共溢位區法

在這里插入圖片描述

7.7 哈希表查找代碼實作及實體

思想：

給定K值，根據構造表時所用的哈希函式求哈希地址j
若此位置無記錄, 則查找不成功；否則比較關鍵字，若和給定的關鍵字相等則成功；否則根據構造表時設定的沖突處理的方法計算“下一地址”，重復2）

Status SearchHash(HashTable H, KeyType key, int &p, int &c){
/*在開放定址哈希表H中查找關鍵字為key的資料*/
/*用c記錄發生沖突的次數，初值為0*/
p=Hash(k); /*求哈希地址*/
while(H.data[p].key!=NULL && H.data[p].key!=key)
/*該位置填有資料且與所查關鍵字不同*/
collision(p, ++c); /*求下一探查地址p*/
if(H.data[p].key==key )
return SUCCESS; /*查找成功,p回傳待查資料元素位置*/
else return UNSUCCESS; /*查找不成功,p回傳插入位置*/
}

Status InsertHash(HashTable &H, DataType e){
/*查找不成功時在H中插入資料元素e，并回傳SUCCESS*/
/*若沖突次數過大，則重建哈希表*/
c=0;
if(SearchHash (H, e.key, p, c))
return UNSUCCESS; /*資料已在哈希表中，不需插入*/
else if(c<hashsize[H.sizeindex]/2){
H.data[p]=e; ++H.count; /*次數c還未達到上限，插入e*/
return SUCCESS;
}
else {
RecreatHashTable(H); /*重建哈希表，當哈希表用了一半以上的空間*/
return SUCCESS;
}
}

查找實體
在這里插入圖片描述

7.8 哈希查找性能分析

實際上，哈希表的ASL是處理沖突方法和裝載因子α 的函式
在這里插入圖片描述

在這里插入圖片描述
哈希表的平均查找長度是裝填因子 α 的函式，而不是 n 的函式，這說明，用哈希表構造查找表時，可以選擇一個適當的裝填因子 α，使得平均查找長度限定在某個范圍，

選擇哈希函式
給定平均查找長度
根據沖突策略（隨機探測線性探測鏈地址）選擇對應的公式求出α裝載因子
由裝載因子和我們關鍵字（資料）個數求的表長裝載因子=關鍵字個數/表長
建立查找表

總結

內容較多，可能有所遺漏和錯誤的地方，歡迎指出，

附帶一本熱銷的電子書配套適用更佳，鏈接如下
大話資料結構
提取碼：mazy

往期文章
緒論-資料結構的基本概念
緒論-演算法
線性表-順序表和鏈式表概念及其代碼實作

轉載請註明出處，本文鏈接：https://www.uj5u.com/ruanti/262088.html

標籤：其他

上一篇：[css] 請你解釋下什么是浮動和它的作業原理是什么？同時浮動會引起什么問題？

下一篇：單鏈表的增刪查改

查找-順序+折半+索引+哈希【資料結構與演算法】

文章目錄

1 常見的查找演算法

2 平均查找長度ASL比較查找演算法性能

3 順序查找

3.1 順序查找的思想

3.2 順序查找代碼

3.3 順序表上順序查找的平均查找長度（性能分析）

4 折半查找

4.1 折半查找的前提條件及查找程序

4.2 折半查找代碼

4.3 折半查找的性能分析

4.4 折半查找特點

5 索引查找

5.1 索引的使用方法

5.2 索引表的構建

5.3 索引查找代碼

5.4 索引順序查找的ASL

6 三種查找演算法的比較

7 哈希查找

7.1 哈希查詢的思想

7.2 哈希函式的定義

7.3 哈希表的定義

7.4 常見的哈希函式

7.4.1 直接哈希函式

7.4.2 數字分析法

7.4.3 平方去中法

7.4.4 折疊法

7.4.5 除留余數法

7.4.6 亂數法

7.5 哈希函式選取通常需要考慮的因素

7.6 哈希函式沖突的處理方法

7.6.1 開放地址法

7.6.2 再哈希法

7.6.3 鏈地址法

7.6.4 公共溢位區法

7.7 哈希表查找代碼實作及實體

7.8 哈希查找性能分析

總結