主頁 >  其他 > (番外一)Arm32 中虛擬地址機制分析(Arm cortex-A系列 MMU作業機制分析)

(番外一)Arm32 中虛擬地址機制分析(Arm cortex-A系列 MMU作業機制分析)

2020-10-18 04:32:20 其他

Arm Cortex-A 系列 記憶體管理單元(MMU)

由于直接分析 linux arm32 mmu版 的啟動代碼會涉及到記憶體直接物理映射模式到開啟虛擬地址映射模式的轉換,這需要對 ARM32 中的虛擬地址實作機制有足夠的了解才行,本文通過分析Arm Cortex-A 系列記憶體管理單元來分析ARM32中的虛擬地址機制, Memory Management Unit 簡稱為 MMU ,它的一個最主要的功能就是進行地址轉換,將處理器發出的 虛擬地址 轉換為 物理地址 ,有了 MMU 的支持,才能讓我們更容易地設計處多任務作業系統,以及在作業系統上開發應用程式,如果學習過逆向分析,就知道不同的可執行檔案(區別于元件與可重定向檔案)的裝載地址(entry point)在一般情況下都是相同的,并且在不同的程式中,也會有極大概率訪問到相同的記憶體地址,為了防止沖突以及不必要的重定向任務, 虛擬地址 與地址轉換的概念應運而生,只要作業系統為每一個行程維護一個虛擬地址轉換表,這樣就可以通過地址轉換將處理器發出的相同地址轉換為不同的物理地址,程式中也不再存在訪問同一個地址發生沖突的問題,也有效阻止了一個行程非法讀寫另一個行程的記憶體資料的現象發生,


在不同的處理器架構中,虛擬地址轉換的實作往往各不相同,本文主要分析 Arm Cortex-A 系列處理器的 MMU 與虛擬地址轉換程序,

首先拋開理論,憑感覺簡單考慮一下處理器發出記憶體訪問請求后,按道理應該出現的一個操作流程:

  • 1、首先處理器從記憶體中讀入一個指令,例如:ldr r0, [r1] ,而 r1 在之前已經被賦上了某個標號的值,這個值代表這個標號的所在地址,而此地址是一個虛擬地址,在程式原始碼 通過鏈接程序,將目標檔案鏈接為可執行檔案 的時候就已經確定下來了,可執行檔案和元件不同,可執行檔案沒有重映射表,所以當裝載到記憶體后,不會進行指令地址重映射操作,程式中的每一個指令對記憶體的認知就只局限在被鏈接的時候所分配的虛擬地址,處理器通過查看 opcode 發現這個指令需要寫記憶體,但是它知道這個是虛擬記憶體,通過這個記憶體地址直接找物理記憶體一定是一無所獲的,所以它將地址交給了另一個處理單元,即 MMU

  • 2、 MMU 收到了虛擬地址后,它應該會通過某種映射機制來將此虛擬地址轉換為物理地址,這就需要在某處持續保存且更新這個映射資訊,但是由于片內高速快取資源是非常有限的,不可能將所有的映射資訊全部存盤在片內高速快取中,并且在設備重啟或掉電的時候,作業系統與其他應用程式會重新載入并運行,而不是繼續運行,所以也沒有必要將映射資訊持久化保存;這樣我們可以猜測這個映射資訊應該是會被保存在記憶體中的某個位置,并且很有可能為了提高查詢映射資訊的速度而將部分資訊存盤在高速快取中,

  • 3、如果映射資訊在記憶體中,則 MMU 必須知道映射資訊位置的物理實際地址,而不是虛擬地址,要不然就發生永不停息的遞回查詢了,而這個物理地址必須是 MMU 事先知道的,比如存盤在記憶體中的固定位置, MMU 通過訪問記憶體能得到這個物理地址,或者是存盤在特殊的暫存器中, MMU 獲取到這個物理地址后才能找到映射資訊,并使用映射資訊把虛擬地址映射為物理地址,最后在此轉換得到的物理地址上執行 ldr 指令,


在上文中需要注意的資訊有以下兩點:

  • 映射資訊與其存盤位置
  • 映射資訊的物理地址

這兩點是支持地址轉換的重要元素,
現在通過手冊仔細閱讀 MMU 實作原理與作業機制,來驗證我們的猜想,這里我使用的手冊是 《Arm Cortex-A Series Programmer’s Guide》version 4 Chapter 9 (在本次分析中不涉及 Large Physical Address Extensions 技術),

通過閱讀手冊知道,Arm 中的 translation table 就對應著上文提到的映射資訊, MMU 通過查詢 translation table 來獲取虛擬地址與物理地址的映射關系,而這個查詢與轉換程序如何實作,則與這個所謂的 translation table 的結構與定義有著很大的關系,這就需要深入了解這個 translation table 的結構組織了,根據手冊描述,Arm 將可尋址的 4GB 大小的記憶體空間分為特定大小的塊,每一個塊被稱作頁(page),然后再給每一個塊建立一個映射關系表項來完成虛擬地址中的塊到物理地址中的塊的映射(這個與虛擬地址中的塊所對應的物理地址空間中的塊被稱作頁框 page frame),這個以分塊來映射的機制就叫做分頁技術(paging),為什么要分塊呢?可以想象一下如果將每一個位元組,甚至每一個位元都設定一個特定的映射關系,那需要多少空間來存盤這個映射資訊呢?如果每一個物理記憶體都被映射到了虛擬記憶體上,是不是所有物理記憶體上存盤的都是映射資訊?那就不用干別的事情了,所以要給虛擬地址空間進行磁區,每一個特定大小的塊做一個映射關系,每個塊內部地址映射關系則是線性的(虛擬地址空間塊中的每個位置到塊起始位置的偏移都與物理地址空間的塊中的相應位置到物理地址空間塊的起始位置的偏移相同),這樣就不用存盤過多的資訊了,但是這個塊又不能太大,不然如果每個應用行程都只占用一個塊中的很小空間,那么就會留下很多的記憶體碎片無法被利用,會產生極大的浪費,關于塊的大小,可以通過配置 translation table 表項的屬性來決定,Arm 留給了作業系統開發人員極大的可定制空間,

了解了映射機制后,來具體探究一下 translation table 的結構:
每個 translation table 都占據了一塊連續的物理地址,并將這塊物理地址分為大小相等的塊,每一塊代表一個表項 (translation table entry),可以認為 translation table 是一個陣列,每個元素都是一個 table entry,每個表項中都存盤有特定的資訊,或者是未映射,或者是映射到下一級 tranlation table(Arm 中的地址轉換可以是多級的,即通過多層映射來獲取虛擬地址對應的物理地址),或者是直接映射到一個物理地址上(Arm 中的地址轉換也可以是單級的,即表項中包含的地址即為虛擬地址所對應的物理地址),在沒有啟用 LPAE 技術時,Arm 最多可以分成兩級頁表,即 L1 translation table 與 L2 translation table,

現在我們有 translation table 了,也知道 translation table 的表項中存盤有映射地址資訊了,那問題是 MMU 獲得一個虛擬地址后,怎么知道去查詢哪個 translation table 和查詢 translation table 中的哪個表項?

查詢哪個地址轉換表

上文說過,想要查詢 translation table , MMU 一定需要通過某種方式獲得這個 translation table 的實際物理地址,而這個物理地址就存盤在協處理器 CP15C2 暫存器中(在 《ARM 體系結構與編程》第二版的第 178 頁有全部的 CP15 協處理器的暫存器的作用),叫做地址轉換表基址,當 MMU 收到一個虛擬地址,它通過查詢協處理器 CP15C2 寄存器來獲取地址轉換表的基址,然后通過這個地址轉換表來進行地址轉換,當考慮多任務作業系統時,往往每一個行程都會存盤一個地址轉換表基址,當發生行程切換時,會將這個存盤的基址加載到處理器 CP15C2 暫存器中,然后就能對這個行程對虛擬地址的訪問進行轉換作業了,

查詢哪個地址轉換表表項

MMU 收到的所有與記憶體訪問有關的資訊只有處理器傳過來的虛擬地址,所以查詢哪個表項這個問題只能通過這個虛擬地址本身來決定,對于 ARM32 平臺下,這個虛擬地址一定是 32bits 長的, MMU 使用虛擬地址的高 12bits 來決定查詢的地址轉換表項,虛擬地址高 12bits 表示的數值代表表項的下標索引,即從頭開始的 第幾個 表項(注意這個數值不代表偏移地址,而是代表“第幾個表項”),所以當設虛擬地址高 12bits 的值為 INDEX ,并且協處理器 CP15C2 暫存器的值為 BASE 那這個表項在記憶體中的實際物理地址就是 INDEX * 4 + BASE ,從這一點我們也可以看出,我們用了高 12bits 去尋找一級地址轉換表的表項,還剩下 20 bits沒有使用,這就代表每個表項可以分割 2^20 bytes 的地址空間,即 1MB 的記憶體段,以類似的方式我們可以在虛擬地址中提取出二級地址轉換表表項的索引值,或者直接使用這 20bits 去映射物理記憶體,這些具體細節將在下文描述,

L1 Translation Table

上文已經解釋過如何定位一級地址轉換表,也提到了一級地址轉換表可以指向二級地址轉換表,也可以直接指向物理地址進行映射,現在來看一下一級地址轉換表的表項的結構來明確一下怎么分辨表項指向的是物理地址還是下一級地址轉換表,一級地址轉換表一共有 4096 個表項,每個表項的大小為 32bits,他將整個 4GB 虛擬記憶體空間分為 4096份,每份 1MB 大小,一級地址轉換表的表項一共有 4種,如下圖所示:
在這里插入圖片描述

可以看到表項之間通過第0、1位來判斷表項的種類,像 00 代表沒有進行映射的表項,01 代表表項指向下一級(圖中的 Level 2 Descriptor Base Address ),即二級地址轉換表的基地址,而 10 的情況比較特殊,這兩個都是直接映射物理地址,但是 section 類表項代表直接映射 1MB 大小的物理地址空間,而 supersection 通過幾個表項組合的方式來映射 16MB 大小的物理地址空間,supersection 比較特殊,就不展開討論,這塊內容在手冊的 9.4 節有具體描述,在這里主要描述 01 表項的情況,我們注意到 Level 2 Descriptor Base Address 的大小為 22bits 這顯然不能覆寫所有 4GB 大小的記憶體空間,看來二級地址轉換表的存盤位置必定會受到限制,22bits 表示的大小可以將記憶體均勻分為 4194304 個區域,每個區域大小為 1KB,而 Arm 剛好定義二級地址轉換表的大小為 1KB,并且二級轉換表的起始位置為 1KB 對齊的,所以我們均勻分出來的 4194304 個區域,每個區域都正好能存盤一個二級地址轉換表,嗯,二級地址轉換表的基地址在記憶體中 1KB 對齊,并且大小為 1KB,這樣就能通過一級地址轉換表的表項中的 22bits 大小的 Level 2 Descriptor Base Address 來尋找二級地址轉換表,

L2 Translation Table

通過上文的方式我們已經找到了二級地址轉換表的位置,現在我們要利用二級地址轉換表繼續進行地址映射(注:我們已經利用了虛擬地址的高 12bits 來進行一級地址轉換表表項的尋址作業,只剩下 20bits 來尋找二級地址轉換表表項了),這里要強調一下,進行地址轉換的程序是不存在浪費地址空間的行為,即一級地址轉換表將記憶體劃分為 1MB 大小的塊,如果不進行直接物理地址映射的話,那么二級地址轉換表必須保證能夠將每個 1MB 的塊全部分配出去,現在我們還剩下 20bits,理論上可以進行 1MB 大小的記憶體尋址,但是需要利用這 20bits 的前幾位來尋找二級地址表的表項,后幾位來作為這個表項所映射的物理地址空間的地址偏移值,而我們也知道二級地址轉換表的大小為 1KB,如果我們利用前 8bits 來進行地址表項的尋找,這樣可以將轉換表分為 256 個表項,每個表項 4bytes,并且每個表項應該表示 1MB / 256 = 4KB 大小的頁框(上文已經提到頁框這個術語)的起始地址,而 4bytes 全部用來尋找頁框起始物理地址才能讓頁框的起始物理地址在記憶體的任意位置,但是為了給頁框加一些必要的訪問屬性(可讀可寫之類的屬性),不能用表項的全部 4bytes 表示頁框的起始物理地址,這樣就引出了經典問題,頁框的起始地址不能是 4GB 空間中的任意位置,當然如果細想一下也不應該是任意位置,如果一個頁框起始地址往上1KB又是另一個頁框的起始地址,那么這兩個頁框不就重疊了么?這必定會引起訪問沖突,所以最好的辦法還是讓 4KB 的頁框的起始地址以 4KB 進行對齊,這樣就能將 4GB 地址空間均勻分為 1048576 份,這個數量正好能用 20bits 來尋址,所以二級地址轉換表的表項中的 20bits 應該用于映射頁框,而剩下的 12bits 可以用來表示頁框的屬性,上述分析只是二級地址轉換表表項的其中一種表示方法,二及地址轉換表表項也有 3 個表示方法,如下圖所示:
在這里插入圖片描述

未完待續

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/177350.html

標籤:其他

上一篇:Python爬蟲入門教程 95-100 幫粉絲寫Python爬蟲之【全網通用評論爬蟲】

下一篇:2006-京淘Day15

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more