主頁 >  其他 > 深度強化學習入門介紹

深度強化學習入門介紹

2021-09-20 14:26:29 其他

深度強化學習是一種機器學習,其中智能體(Agent,也翻譯作代理)通過執行操作(Action)和查看結果(Reward)來學習如何在環境中采取最佳的動作或策略,

自 2013 年Deep Q-Learning 論文[1]以來,強化學習已經有了很多突破,從擊敗世界上最好 Dota2 玩家的[2]OpenAI到Dexterity [3],我們正處于深度強化學習研究的激動人心的時刻,

cccd9808cdf59795bf22f6ef5d0817dd.png

OpenAI 5,一個 打敗了世界上最好的 Dota2 玩家 [4] 的人工智能

此外,由于很多開源庫(TF-智能體s, Stable-Baseline 2.0…)和仿真環境的公開:Mine強化學習 (Minecraft), Unity ML-智能體s, OpenAI retro (NES, SNES, Genesis games…),大家現在可以隨時使用仿真游戲環境來測驗自己的強化學習程式,

在本課程中,您將通過使用 Tensorflow 和 PyTorch 來訓練能玩太空入侵者、Minecraft、星際爭霸、刺猬索尼克等游戲的聰明的智能體,

在第一章中,您將學習到深度強化學習的基礎知識,在訓練深度強化學習智能體之前,掌握這些深度學習的基礎知識非常重要,讓我們開始吧!

.什么是強化學習?

為了理解什么是強化學習,讓我們從強化學習的核心思想開始,

強化學習的核心思想是,智能體(AI)將通過與環境互動(通過反復試驗)并接收獎勵(負面或正面)作為執行動作的反饋來從環境中學習,

例如,想象一下你把你的弟弟放在一個他從未玩過的電子游戲面前,手里拿著一個控制器,讓他一個人呆著,

c13bb8e3a5431f89834e9651049c0035.png


游戲場景

他通過按右鍵(動作)與環境(視頻游戲)互動,得到了一枚硬幣,這是+1的獎勵,也許在這場比賽中,他只是知道必須得到金幣,

5dff3aa6c5d56ba44065fd12ef08fcfd.png

獲得獎勵

當他碰到敵人時,獲得-1的懲罰,

c2f32cb8457654ca09e01b8bf90d041b.png

獲得懲罰

通過反復試驗與他的環境互動,你的弟弟才明白,在這個環境中,他需要獲得金幣,但要避開敵人,

在沒有任何監督的情況下,孩子會越來越擅長玩游戲,

這就是人類和動物通過互動學習的方式,強化學習就是一種從行動中學習的最優解的方法,

1、正式定義

我們現在給出強化學習的一個正式的定義:

強化學習是一種通過構建智能體來解決控制任務(也稱為決策問題)的框架,智能體通過與環境互動、反復試驗和領取獎勵來制定自己的策略,

但是強化學習是如何作業的呢?

.強化學習框架

  1. 強化學習程序

713dbabb97a696c5fe5fc7944375cf3e.png

強化學習程序:狀態、動作、獎勵和下一個狀態的回圈

為了理解 強化學習 程序,讓我們想象一個智能體學習玩平臺游戲:

e7eff20d2da4b1480d22bb4fa6b82d89.png

智能體玩游戲場景
  • 我們的智能體從環境接收狀態 S0——我們接收游戲的第一幀(環境),

  • 基于狀態 S0,智能體采取行動 A0——我們的智能體將向右移動,

  • 環境轉換到新狀態 S1 — 新框架,

  • 環境給了智能體一些獎勵 R1——我們沒有死*(Positive Reward +1)*,

這個強化學習回圈輸出狀態、動作和獎勵以及下一個狀態的序列,

d36bc590c1a665d5afa8280a03d27134.png


狀態、動作、獎勵、下一個狀態

2、預期回報

智能體的目標是最大化累積獎勵,稱為預期回報,為什么智能體的目標是最大化預期回報?

因為強化學習是基于獎勵假設,即所有目標都可以描述為預期回報(預期累積獎勵)的最大化,這就是為什么在強化學習中,為了獲得最佳行為,我們需要最大化預期累積獎勵,

3、觀察/狀態空間

觀察/狀態是我們的智能體從環境中獲得的資訊,在視頻游戲的情況下,它可以是一張截圖,在交易智能體的情況下,它可以是某只股票的價值等,

觀察和狀態之間有一個區別:

State s:是對環境狀態的完整描述(沒有隱藏資訊),在完全觀察的環境中,

2e24414f7b83374f1c15d2dd4b649118.png

國際象棋游戲中,我們從環境中接收狀態,因為我們可以訪問整個棋盤資訊,
對于國際象棋游戲,我們處于完全觀察的環境中,因為我們可以訪問整個棋盤資訊,

觀察 o:是狀態的部分描述,在部分觀察的環境中,

25805e75067c5c238fdde11243c2621f.png

在《超級馬里奧兄弟》中,我們只能看到靠近玩家的關卡的一部分,因此我們收到了觀察結果,

在《超級馬里奧兄弟》中,我們只是處于一個部分觀察的環境中,我們收到了一個觀察結果,因為我們只看到了關卡的一部分,

4、行動空間

動作空間是環境中所有可能動作的集合,動作可以來自離散或連續空間:

離散空間:可能動作的數量是有限的,

78468f3596ece45ba0842f9f792fde88.png

在《超級馬里奧兄弟》中,我們只有 4 個方向并且可以跳躍

在《超級馬里奧兄弟》中,我們有一組有限的動作,因為我們只有 4 個方向和跳躍,

連續空間:可能的動作數量是無限的,

自動駕駛汽車智能體有無數種可能的動作,因為他可以左轉 20°、21°、22°、鳴喇叭、右轉 20°、20,1°……

99fafbc7c9598a30f978ae19a539ad62.png

自動駕駛場景

考慮這些資訊是至關重要的,因為它在我們將來選擇強化學習 演算法時很重要,


5、獎勵和折扣因子

獎勵是強化學習的基礎,因為它是智能體和環境互動后的唯一反饋,有了它,我們的智能體才知道所采取的行動是否足夠好,

每個時間步長 t 的累積獎勵可以寫成:

31de7c87990c1e88e35a1a2152f9e798.png

累積獎勵等于該序列所有獎勵的總和,

等式還可以寫成:

04551a65c15a21dc4f8daa2f9c58db6d.png

累積獎勵等于該序列所有獎勵的總和,

但實際上,我們不能就這樣簡單累加獎勵,在游戲開始時出現的獎勵更有可能發生,因為它們比未來的獎勵更可預測,

假設您的智能體是這只小老鼠,它可以在每個時間步移動一步,而您的對手是貓(它也可以移動),你的目標是在被貓吃掉之前吃掉最大量的奶酪,

6b03ea10c52f4aca0a0d4bf063f1c5f7.png

我們附近的奶酪比貓附近的奶酪更有可能被吃掉(我們離貓越近,它就越危險)

因此,靠近貓的獎勵,即使它更大(更多的奶酪),該獎勵的風險也會更大,因為我們不確定我們能否吃到它,為了計算這部分獎勵,我們定義了折扣獎勵,

為了計算折扣獎勵,我們是這樣進行的:

1、定義一個稱為 的γ 的折扣銀子,它必須介于 0 和 1 之間,

γ越大,折扣越小,這意味著我們的智能體更關心長期獎勵,另一方面,γ越小,折扣越大,這意味著我們的智能體更關心短期獎勵(最近的奶酪),

2、每個獎勵將通過 γ 折現為時間步長的指數

隨著時間步長的增加,貓離我們越來越近,所以未來的獎勵發生的可能性越來越小,

我們的折扣累積預期獎勵是:

fba7277e3ee0f7a269bb8beeacec6361.png


折扣累積預期獎勵

6、任務型別

任務是強化學習問題的一個實體,我們可以有兩種型別的任務:離散的和連續的,

離散任務,在這種情況下,我們有一個起點和一個終點(終止狀態),這將創建一個序列:狀態、操作、獎勵和新狀態,

例如,在《超級馬里奧兄弟》游戲中,這個序列從新馬里奧關卡開始,并馬里奧被殺或到達關卡終點時結束,

73cce0e871c7d273ccd0679266d27076.png

序列的開始

連續任務,這些是永遠持續的任務(沒有終止狀態),在這種情況下,智能體必須學習如何選擇最佳動作并隨時與環境互動,

例如,進行自動股票交易的智能體,對于這個任務,沒有起點和終點,智能體一直運行,直到我們決定關閉它,

6f49a9f05877cde0c08c994495e24035.png

股票交易場景

7、探索/利用權衡

最后,在研究強化學習解決問題的不同方法之前,我們必須討論一個非常重要的點:探索/利用,

探索是通過嘗試隨機動作來探索環境,以找到有關環境的更多資訊,利用是根據已知的資訊來最大化獎勵,

我們強化學習智能體的目標是最大化預期累積獎勵,然而,我們可能會陷入一個陷阱,

23c930161a0f9fc2fbdf70eaaf0ad3df.png

老鼠吃奶酪游戲

在這個游戲中,我們的老鼠可以擁有無限量的小奶酪(每個+1),但是在迷宮的頂部,有一堆大奶酪(+1000),

如果我們只專注于利用,我們的智能體永遠到不了大奶酪那里(探索),它只會獲取最近的獎勵,即使這個獎勵很小(利用),

但是如果我們的智能體做一點探索,它可以發現更大的獎勵(一堆大奶酪),

這就是我們所說的探索/利用的權衡,我們需要平衡對環境的探索程度和對環境的了解程度,

因此,我們必須定義一個規則來處理這種情況,我們將在以后的章節中看到不同的處理方式,如果這個問題令人困惑,請考慮一個真正的問題:餐廳的選擇,

ac0ee9e5b4bc23afaf536559626c890d.png

餐廳的選擇

利用:每天都去同一家您認為不錯的餐廳,并冒著錯過另一家更好餐廳的風險,

  • 探索:嘗試以前從未去過的餐廳,冒著體驗不好的風險,但可能有機會獲得美妙的體驗,

三、解決強化學習問題的兩種主要方法

既然我們學習了強化學習框架,那么我們如何解決強化學習問題呢?換句話說,如何構建一個可以選擇最大化其預期累積獎勵的動作的強化學習智能體?

1、策略π:智能體的大腦

策略π是我們智能體的大腦,它是告訴我們在給定狀態下要采取什么行動的函式,所以它定義了在給定一段時間內的智能體行為,

7ea955618c836e34560b471d1ba3ec29.png

狀態、策略、動作

將策略視為我們智能體的大腦,該功能將告訴我們在給定狀態下采取的行動,這個策略π就是我們要學習的函式,我們的目標是找到最優策略π*,當智能體按照它行動時,是期望收益最大化的策略,我們通過訓練找到了這個π*,

有兩種方法可以訓練我們的智能體來找到這個最優策略π*:

  • 直接地,基于策略的方法:通過教智能體學習在給定狀態下要采取的行動,

  • 間接地,基于價值的方法:教智能體了解哪個狀態更有價值,然后采取會出現更有價值狀態的行動,

2、基于策略的方法

在基于策略的方法中,我們直接學習策略函式,該函式將從每個狀態映射到該狀態的最佳對應動作,或者該狀態下一組可能動作的概率分布,

4f612115278c7a7ab8aeee3e3fe22dc1.png

基于策略的函式

正如我們在這里看到的,策略(確定性的)直接指示每一步要采取的行動,

我們有兩種型別的策略:

  • 確定地:在給定狀態下該策略將始侄訓傳相同的操作,

244aaed7aab74eff77111a33dac19b68.png

行動 = 政策(狀態)

a0fb3b5ed7fda18515f922bc878ef57a.png


給定狀態下輸出動作

  • 隨機地:在給定狀態下該該策略輸出動作的概率分布,

6304b07b8615e3a1e3422b60b048d205.png

policy(actions | state) = 給定當前狀態的一組動作的概率分布

d02dedf2540bc9080516bd826caf96b2.png


給定一個初始狀態,隨機策略將輸出該狀態下可能動作的概率分布

3、基于價值的方法

在基于價值的方法中,我們不是訓練策略函式,而是訓練一個將狀態映射到處于該狀態的預期值的值函式,

一個狀態的價值是如果智能體從該狀態開始,根據我們的策略采取行動,它可以獲得的最大的折扣累積預期獎勵,

“按照我們的策略行事”意味著我們的策略是“走向價值最高的”,

00f0032585875552a10342360c13fa40.png

價值函式為每個可能的狀態定義了價值

a4b273675fbf0a5fd2248aa203be10a7.png

價值函式在迷宮游戲的使用

有了我們的價值函式,在每一步,我們的策略都會選擇價值函式定義的具有最大價值的狀態:-7,然后是-6,然后是-5(等等)來實作目標,

強化學習的深度

談到了強化學習,但我們為什么要談論深度強化學習?深度強化學習引入了深度神經網路來解決強化學習問題——因此得名“深度”,

例如,在下一篇文章中,我們將研究 Q-Learning(經典強化學習)和 Deep Q-Learning,兩者都是基于價值的強化學習演算法,

您會看到不同之處在于,在第一種方法中,我們使用傳統演算法來創建 Q 表,以幫助我們找到對每個狀態要采取的操作,

在第二種方法中,我們將使用神經網路(來近似 q 值),

f6ffe7c0bb4dcb2868123c81155a54f7.png


Q-Learning和 Deep Q-Learning

總結

我們總結一下今天學到的知識:

強化學習是一種從行動中學習的計算方法,我們構建了一個智能體,它通過反復試驗與環境互動并接收獎勵(負面或正面)作為反饋,從環境中學習到動作的好壞,

任何強化學習智能體的目標都是最大化其預期累積獎勵(也稱為預期回報),因為強化學習基于獎勵假設,所有目標都可以描述為預期累積獎勵的最大化,

強化學習程序是一個回圈,可以定義為:狀態、動作、獎勵和下一個狀態的序列,

為了計算預期累積獎勵(預期回報),我們對獎勵打折:較早(在游戲開始時)出現的獎勵更有可能發生,因為它們比長期未來獎勵更可預測,

要解決強化學習問題,需要找到最佳策略,策略是智能體的“大腦”,它會告訴我們在給定狀態下要采取什么行動,最佳的一種策略能提供最大化預期回報的行動,

有兩種方法可以找到最佳策略:

通過直接訓練的策略:基于策略的方法,

通過訓練一個價值函式,告訴我們智能體在每個狀態下將獲得的預期回報,并使用這個函式來定義我們的策略:基于價值的方法,

最后,我們談論深度強化學習,因為我們引入了深度神經網路來估計要采取的動作(基于策略)或估計狀態的值(基于值),因此稱為“深度”,

參考資料

[1]Deep Q-Learning 論文:

https://www.cs.toronto.edu/~vmnih/docs/dqn.pdf

[2]擊敗世界上最好 Dota2 玩家的:

https://www.twitch.tv/videos/293517383

[3]Dexterity :

https://openai.com/blog/learning-dexterity/

[4]打敗了世界上最好的 Dota2 玩家:

https://www.twitch.tv/videos/293517383

原文鏈接:

https://thomassimonini.medium.com/an-introduction-to-deep-reinforcement-learning-17a565999c0c

- EOF -


 

526627bb98684d86d92200d2fe98316d.png


 

 

 
往期精彩回顧




適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料列印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯
AI基礎下載機器學習的數學基礎專輯黃海廣老師《機器學習課程》視頻課

本站qq群851320808,加入微信群請掃碼:

2bbccb8ff43978035964eda9ed0bb7c3.png

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/301611.html

標籤:其他

上一篇:貪吃蛇小游戲完整代碼塊

下一篇:python應用篇之外星人入侵專案——外星人(中)

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more