主頁 > 軟體設計 > 查找-順序+折半+索引+哈希【資料結構與演算法】

查找-順序+折半+索引+哈希【資料結構與演算法】

2021-02-22 10:36:41 軟體設計

大三黨,大資料專業,正在為面試準備,歡迎學習交流,`

文章中總結了四種常見的查找方法,內容包括了基本概念及代碼實作,內容較多,特別是哈希查詢的內容比較多,可能有所遺漏,但是總結了大部分的內容,
附帶一本熱銷的電子書配套適用更佳,鏈接如下
大話資料結構
提取碼:mazy

往期文章
緒論-資料結構的基本概念
緒論-演算法
線性表-順序表和鏈式表概念及其代碼實作

文章目錄

  • 1 常見的查找演算法
  • 2 平均查找長度ASL比較查找演算法性能
  • 3 順序查找
    • 3.1 順序查找的思想
    • 3.2 順序查找代碼
    • 3.3 順序表上順序查找的平均查找長度(性能分析)
  • 4 折半查找
    • 4.1 折半查找的前提條件及查找程序
    • 4.2 折半查找代碼
    • 4.3 折半查找的性能分析
    • 4.4 折半查找特點
  • 5 索引查找
    • 5.1 索引的使用方法
    • 5.2 索引表的構建
    • 5.3 索引查找代碼
    • 5.4 索引順序查找的ASL
  • 6 三種查找演算法的比較
  • 7 哈希查找
    • 7.1 哈希查詢的思想
    • 7.2 哈希函式的定義
    • 7.3 哈希表的定義
    • 7.4 常見的哈希函式
      • 7.4.1 直接哈希函式
      • 7.4.2 數字分析法
      • 7.4.3 平方去中法
      • 7.4.4 折疊法
      • 7.4.5 除留余數法
      • 7.4.6 亂數法
    • 7.5 哈希函式選取通常需要考慮的因素
    • 7.6 哈希函式沖突的處理方法
      • 7.6.1 開放地址法
      • 7.6.2 再哈希法
      • 7.6.3 鏈地址法
      • 7.6.4 公共溢位區法
    • 7.7 哈希表查找代碼實作及實體
    • 7.8 哈希查找性能分析
  • 總結

1 常見的查找演算法

  • 順序查找
  • 二分查找
  • 索引查找
  • 哈希查找

2 平均查找長度ASL比較查找演算法性能

公式:ASL=P1C1+P2C2+…+PnC

Pi——查找第i個元素的概率
Ci——查找第i個元素需要的比較次數

3 順序查找

3.1 順序查找的思想

在這里插入圖片描述

  • 從表中指定位置(一般為最后一個,第0個位置設為崗哨)
    的記錄開始,沿某個方向將記錄的關鍵字與給定值相比較,
    若某個記錄的關鍵字和給定值相等,則查找成功
  • 反之,若找完整個順序表,都沒有與給定關鍵字值相等的
    記錄,則此順序表中沒有滿足查找條件的記錄,查找失敗,

3.2 順序查找代碼

int seqsearch(DataType R[], KeyType key)
{
R[0]=key, i=n;//第一個位置設為崗哨
while (R[i] != key) 
i=i-1;//從最后一個位置往前查找
return i;
}

3.3 順序表上順序查找的平均查找長度(性能分析)

在這里插入圖片描述
對于順序表的
Ci=n-i+1
Pi =1/n
則可以得到如下計算結果(等引數列的計算):
在這里插入圖片描述

4 折半查找

4.1 折半查找的前提條件及查找程序

前提條件
如果順序表中的紀律按關鍵字值有序即R[i].≤R[i+1],i=1,2,…,n-1,則稱順序表為有序表,
在這里插入圖片描述

4.2 折半查找代碼

int BinarySearch(DataType SL[], KeyType key, int n){
/*在長度為n的有序表SL中折半查找其關鍵字等于key的記錄*/
/*查找成功回傳其在有序表中的位置,查找失敗否回傳0*/
int low=1;
int high=n;
while(low<=high){
mid=(low+high)/2;//取整 小的數 右邊的數
if(key = = SL[mid]) 
{
  return mid;
}
else if( key>SL[mid])//查找值在左邊 移動low
low=mid+1;
else //查找值在右邊 移動low 
high=mid-1;
}
return 0;
}

查找程序
將待查關鍵字與有序表中間位置的記錄進行比較,若相等,查找成功,若小于,則只可能在有序表的前半部分,若大于則只可能在有序表的后半部分,因此,經過一次比較,就將查找范圍縮小一半,這樣一直進行下去直到找到所需記錄或記錄不在查找表中,

4.3 折半查找的性能分析

引入判定樹
在這里插入圖片描述
其中6查找一次,3 9查找兩次,1 4 7 10 查找3次,2 5 8 11 查找4次,
在這里插入圖片描述

4.4 折半查找特點

  • 折半查找的查找效率高;
  • 平均查找性能和最壞性能相當接近;
  • 折半查找要求查找表為有序表;
  • 并且,折半查找只適用于順序存盤結構

5 索引查找

5.1 索引的使用方法

  • 先分析資料規律,建立索引
  • 再根據索引進行快速定位
  • 在定位的地方進行細致搜索

5.2 索引表的構建

  1. 分塊:第Rk 塊中所有關鍵字< Rk+1塊中所有關鍵字,(k=1, 2, …, L-1)
  2. 建立索引項:關鍵字項:記載該塊中最大關鍵字值; 指標項: 記載該塊第一個記錄在表中位置,
  3. 建立索引表:所有索引項組成索引表
    如下圖展示
    在這里插入圖片描述
    索引項展示
    在這里插入圖片描述

5.3 索引查找代碼



typedef struct IndexType
{
KeyType key;//最大關鍵字
int Link;  //地址項
} IndexType;

int IndexSequelSearch(IndexType ls[], DataType s[], int m, KeyType key){
/*索引表為ls[0]-ls[m-1],順序表為s*/
i=0;
while(i<m && key>ls [i ].key) i++; /*塊間查找*/
if(i==m)return -1; /*查找失敗*//*不在查找范圍內*/
else{ /*在塊內順序查找*/
j=ls[ i ].Link;
while(Key!=s[j].key && j<ls[ i+1 ].Link) //j<是為了不超出當前塊
j++;
if(key = = s[j].key)return j; /*查找成功*/
else return -1; /*查找失敗*/
}
}

5.4 索引順序查找的ASL

ASL=ASL(索引表)+ASL(塊內)
在這里插入圖片描述

6 三種查找演算法的比較

在這里插入圖片描述

7 哈希查找

7.1 哈希查詢的思想

以學號查詢為例子,取給定學號的后三位,不需要經過比較,便可直接從查找表中找到給定學生的記錄,因為如下圖我們建立了關鍵字和存盤地址之間的映射關系,
在這里插入圖片描述

7.2 哈希函式的定義

一般情況下,需在關鍵字與記錄在表中的存盤位置之間建立一個函式關系,以 H(key) 作為關鍵字為key 的記錄在表中的位置,通常稱這個函式 h(key) 為哈希函式,
在這里插入圖片描述

  • 哈希函式是一個映象,即:將關鍵字的集合映射
    到某個地址集合上, 它的設定很靈活,只要這個地
    址集合的大小不超出允許范圍即可;

  • 由于哈希函式是一個壓縮映象,因此,在一般
    情況下,很容易產生“沖突”現象,即: key1!=
    key2,而 h(key1) = h(key2),例如下圖 key分別是100和1000
    在這里插入圖片描述

  • 很難找到一個不產生沖突的哈希函式,一般情況
    下,只能選擇恰當的哈希函式,使沖突盡可能少地產
    生,

7.3 哈希表的定義

根據設定的哈希函式 H(key) 和提供的處理沖突的方法,將一組關鍵字映象到一個地址連續的地址空間上,并以關鍵字在地址空間中的“象”作為相應記錄在表中的存盤位置,如此構造所得的查找表稱之為哈希表,
在這里插入圖片描述

7.4 常見的哈希函式

7.4.1 直接哈希函式

在這里插入圖片描述

7.4.2 數字分析法

在這里插入圖片描述

7.4.3 平方去中法

思想:以關鍵字的平方值的中間幾位作為存盤地址,求“關鍵字的平方值” 的目的是“擴大差別”和“貢獻均衡”,
在這里插入圖片描述

7.4.4 折疊法

在這里插入圖片描述

7.4.5 除留余數法

在這里插入圖片描述

7.4.6 亂數法

在這里插入圖片描述

7.5 哈希函式選取通常需要考慮的因素

  • 計算哈希函式所需時間;
  • 關鍵字的長度;
  • 哈希表的大小;
  • 關鍵字的分布情況;
  • 記錄的查找頻率,

7.6 哈希函式沖突的處理方法

7.6.1 開放地址法

為產生沖突的地址H(key)重新求得求得一個地址序列,通過如下的公式:
H0 = H(key)
Hi = ( H(key) + di) MOD m
H0, H1, H2, …, Hs 1≤ s≤m-1

  • Hi 為第i次沖突的地址
  • H(key)為Hash函式值
  • m 為Hash表表長
  • di 為增量序列

對于di的取法有是三種,如下圖:
在這里插入圖片描述
由于并不復雜我們以線性探測再散列舉例:

關鍵字 { 19, 01, 23, 14, 55, 68, 11, 82, 36 }

設定哈希函式 H(key) = key MOD 11 ( 表長=11 )

選用線性探測再散列處理沖突

  • 19/11=7 沒有沖突 放入表中
  • 1/11=1 沒有沖突 放入表中
  • 23/11=1 產生沖突 1的位置已經存放了,使用函式 Hi = ( H(key) + di) MOD m,第一次沖突di取1 H1 = ( H(key) + di) MOD m=(23+1)mod 11=2 放入2
  • 依次類推 沖突一次 di依次取 1 2 3 4 5(實際意義就是往右邊找空格子)
  • 最終結果如下,下方數次表示第幾次成功
    在這里插入圖片描述
  • 計算ASL(成功)=(1+1+2+1+3+6+2+5+1)/9
  • 計算ASL(失敗)=(9+8+7+6+5+4+3+2+1)/9(假設格子如圖占完 余數從0~8要查找幾次后再能解決沖突 得到了如上數字計算)

7.6.2 再哈希法

第一次沖突使用RH1哈希函式
第二次沖突使用RH2哈希函式

每次對應不同的哈希函式
在這里插入圖片描述

7.6.3 鏈地址法

重點關注一下ASL失敗怎么求,同上
在這里插入圖片描述

7.6.4 公共溢位區法

在這里插入圖片描述

7.7 哈希表查找代碼實作及實體

思想:

  • 給定K值,根據構造表時所用的哈希函式求哈希地址j
  • 若此位置無記錄, 則查找不成功;否則比較關鍵字,若和給定的關鍵字相等則成功; 否則根據構造表時設定的沖突處理的方法計算“下一地址”, 重復2)
Status SearchHash(HashTable H, KeyType key, int &p, int &c){
/*在開放定址哈希表H中查找關鍵字為key的資料*/
/*用c記錄發生沖突的次數,初值為0*/
p=Hash(k); /*求哈希地址*/
while(H.data[p].key!=NULL && H.data[p].key!=key)
/*該位置填有資料且與所查關鍵字不同*/
collision(p, ++c); /*求下一探查地址p*/
if(H.data[p].key==key )
return SUCCESS; /*查找成功,p回傳待查資料元素位置*/
else return UNSUCCESS; /*查找不成功,p回傳插入位置*/
}

Status InsertHash(HashTable &H, DataType e){
/*查找不成功時在H中插入資料元素e,并回傳SUCCESS*/
/*若沖突次數過大,則重建哈希表*/
c=0;
if(SearchHash (H, e.key, p, c))
return UNSUCCESS; /*資料已在哈希表中,不需插入*/
else if(c<hashsize[H.sizeindex]/2){
H.data[p]=e; ++H.count; /*次數c還未達到上限,插入e*/
return SUCCESS;
}
else {
RecreatHashTable(H); /*重建哈希表,當哈希表用了一半以上的空間*/
return SUCCESS;
}
}

查找實體
在這里插入圖片描述在這里插入圖片描述

7.8 哈希查找性能分析

實際上,哈希表的ASL是處理沖突方法裝載因子α 的函式
在這里插入圖片描述

在這里插入圖片描述
哈希表的平均查找長度是裝填因子 α 的函式,而不是 n 的函式,這說明,用哈希表構造查找表時,可以選擇一個適當的裝填因子 α,使得平均查找長度限定在某個范圍,
在這里插入圖片描述

  1. 選擇哈希函式
  2. 給定平均查找長度
  3. 根據沖突策略(隨機探測 線性探測 鏈地址)選擇對應的公式求出α裝載因子
  4. 由裝載因子和我們關鍵字(資料)個數求的表長 裝載因子=關鍵字個數/表長
  5. 建立查找表

總結

內容較多,可能有所遺漏和錯誤的地方,歡迎指出,

附帶一本熱銷的電子書配套適用更佳,鏈接如下
大話資料結構
提取碼:mazy

往期文章
緒論-資料結構的基本概念
緒論-演算法
線性表-順序表和鏈式表概念及其代碼實作

轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/262088.html

標籤:其他

上一篇:[css] 請你解釋下什么是浮動和它的作業原理是什么?同時浮動會引起什么問題?

下一篇:單鏈表的增刪查改

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 面試突擊第一季,第二季,第三季

    第一季必考 https://www.bilibili.com/video/BV1FE411y79Y?from=search&seid=15921726601957489746 第二季分布式 https://www.bilibili.com/video/BV13f4y127ee/?spm_id_fro ......

    uj5u.com 2020-09-10 05:35:24 more
  • 第三單元作業總結

    1.前言 這應該是本學期最后一次寫作業總結了吧。總體來說,對作業的節奏也差不多掌握了,作業做起來的效率也更高了。雖然和之前的作業一樣,作業中都要用到新的知識,但是相比之前,更加懂得了如何利用工具以及資料。雖然之間卡過殼,但總體而言,這幾次作業還算完成的比較好。 2.作業程序總結 相比前兩個單元,此單 ......

    uj5u.com 2020-09-10 05:35:41 more
  • 北航OO(2020)第四單元博客作業暨課程總結博客

    北航OO(2020)第四單元博客作業暨課程總結博客 本單元作業的架構設計 在本單元中,由于UML圖具有比較清晰的樹形結構,因此我對其中需要進行查詢操作的元素進行了包裝,在樹的父節點中存盤所有孩子的參考。考慮到性能問題,我采用了快取機制,一次查詢后盡可能快取已經遍歷過的資訊,以減少遍歷次數。 本單元我 ......

    uj5u.com 2020-09-10 05:35:48 more
  • BUAA_OO_第四單元

    一、UML決議器設計 ? 先看下題目:第四單元實作一個基于JDK 8帶有效性檢查的UML(Unified Modeling Language)類圖,順序圖,狀態圖分析器 MyUmlInteraction,實際上我們要建立一個有向圖模型,UML中的物件(元素)可能與同級元素連接,也可與低級元素相連形成 ......

    uj5u.com 2020-09-10 05:35:54 more
  • 6.1邏輯運算子

    邏輯運算子 1. && 短路與 運算式1 && 運算式2 01.運算式1為true并且運算式2也為true 整體回傳為true 02.運算式1為false,將不會執行運算式2 整體回傳為false 03.只要有一個運算式為false 整體回傳為false 2. || 短路或 運算式1 || 運算式2 ......

    uj5u.com 2020-09-10 05:35:56 more
  • BUAAOO 第四單元 & 課程總結

    1. 第四單元:StarUml檔案決議 本單元采用了圖模型決議UML。 UML檔案可以抽象為圖、子圖、邊的邏輯結構。 在實作中,圖的節點包括類、介面、屬性,子圖包括狀態圖、順序圖等。 采用了三次遍歷UML元素的方法建圖,第一遍遍歷建點,第二、三次遍歷設定屬性、連邊,實作圖物件的初始化。這里借鑒了一些 ......

    uj5u.com 2020-09-10 05:36:06 more
  • 談談我對C# 多型的理解

    面向物件三要素:封裝、繼承、多型。 封裝和繼承,這兩個比較好理解,但要理解多型的話,可就稍微有點難度了。今天,我們就來講講多型的理解。 我們應該經常會看到面試題目:請談談對多型的理解。 其實呢,多型非常簡單,就一句話:呼叫同一種方法產生了不同的結果。 具體實作方式有三種。 一、多載 多載很簡單。 p ......

    uj5u.com 2020-09-10 05:36:09 more
  • Python 資料驅動工具:DDT

    背景 python 的unittest 沒有自帶資料驅動功能。 所以如果使用unittest,同時又想使用資料驅動,那么就可以使用DDT來完成。 DDT是 “Data-Driven Tests”的縮寫。 資料:http://ddt.readthedocs.io/en/latest/ 使用方法 dd. ......

    uj5u.com 2020-09-10 05:36:13 more
  • Python里面的xlrd模塊詳解

    那我就一下面積個問題對xlrd模塊進行學習一下: 1.什么是xlrd模塊? 2.為什么使用xlrd模塊? 3.怎樣使用xlrd模塊? 1.什么是xlrd模塊? ?python操作excel主要用到xlrd和xlwt這兩個庫,即xlrd是讀excel,xlwt是寫excel的庫。 今天就先來說一下xl ......

    uj5u.com 2020-09-10 05:36:28 more
  • 當我們創建HashMap時,底層到底做了什么?

    jdk1.7中的底層實作程序(底層基于陣列+鏈表) 在我們new HashMap()時,底層創建了默認長度為16的一維陣列Entry[ ] table。當我們呼叫map.put(key1,value1)方法向HashMap里添加資料的時候: 首先,呼叫key1所在類的hashCode()計算key1 ......

    uj5u.com 2020-09-10 05:36:38 more
最新发布
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:20:47 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:20:25 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:20:17 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:20:10 more
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:19:44 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:19:07 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:18:57 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:18:49 more
  • 05單件模式

    #經典的單件模式 public class Singleton { private static Singleton uniqueInstance; //一個靜態變數持有Singleton類的唯一實體。 // 其他有用的實體變數寫在這里 //構造器宣告為私有,只有Singleton可以實體化這個類! ......

    uj5u.com 2023-04-19 08:42:51 more
  • 【架構與設計】常見微服務分層架構的區別和落地實踐

    軟體工程的方方面面都遵循一個最基本的道理:沒有銀彈,架構分層模型更是如此,每一種都有各自優缺點,所以請根據不同的業務場景,并遵循簡單、可演進這兩個重要的架構原則選擇合適的架構分層模型即可。 ......

    uj5u.com 2023-04-19 08:42:41 more