主頁 >  其他 > 人工智能最新研究發展方向——OCR文字識別簡述

人工智能最新研究發展方向——OCR文字識別簡述

2021-12-27 09:07:24 其他

1 研究背景

人工智能是研究開發能夠模擬、延伸和擴展人類智能的理論、方法、技術及應用系統的一門新的技術科學,研究目的是促使智能機器會聽(語音識別、機器翻譯等)、會看(影像識別、文字識別等)、會說(語音合成、人機對話等)、會思考(人機對弈、定理證明等)、會學習(機器學習、知識表示等)、會行動(機器人、自動駕駛汽車等),
人工智能充滿未知的探索道路曲折起伏,如何描述人工智能自1956年以來60余年的發展歷程,學術界可謂仁者見仁、智者見智,通過查閱資料將人工智能的發展歷程劃分為以下6個階段:
一是起步發展期:1956年—20世紀60年代初,人工智能概念提出后,相繼取得了一批令人矚目的研究成果,如機器定理證明、跳棋程式等,掀起人工智能發展的第一個高潮,
二是反思發展期:20世紀60年代—70年代初,人工智能發展初期的突破性進展大大提升了人們對人工智能的期望,人們開始嘗試更具挑戰性的任務,并提出了一些不切實際的研發目標,然而,接二連三的失敗和預期目標的落空(例如,無法用機器證明兩個連續函式之和還是連續函式、機器翻譯鬧出笑話等),使人工智能的發展走入低谷,
三是應用發展期:20世紀70年代初—80年代中,20世紀70年代出現的專家系統模擬人類專家的知識和經驗解決特定領域的問題,實作了人工智能從理論研究走向實際應用、從一般推理策略探討轉向運用專門知識的重大突破,專家系統在醫療、化學、地質等領域取得成功,推動人工智能走入應用發展的新高潮,
四是低迷發展期:20世紀80年代中—90年代中,隨著人工智能的應用規模不斷擴大,專家系統存在的應用領域狹窄、缺乏常識性知識、知識獲取困難、推理方法單一、缺乏分布式功能、難以與現有資料庫兼容等問題逐漸暴露出來,
五是穩步發展期:20世紀90年代中—2010年,由于網路技術特別是互聯網技術的發展,加速了人工智能的創新研究,促使人工智能技術進一步走向實用化,1997年國際商業機器公司(簡稱IBM)深藍超級計算機戰勝了國際象棋世界冠軍卡斯帕羅夫,2008年IBM提出“智慧地球”的概念,以上都是這一時期的標志性事件,
六是蓬勃發展期:2011年至今,隨著大資料、云計算、互聯網、物聯網等資訊技術的發展,泛在感知資料和圖形處理器等計算平臺推動以深度神經網路為代表的人工智能技術飛速發展,大幅跨越了科學與應用之間的“技術鴻溝”,諸如影像分類、語音識別、知識問答、人機對弈、無人駕駛等人工智能技術實作了從“不能用、不好用”到“可以用”的技術突破,迎來爆發式增長的新高潮,

2 OCR文字識別

2.1什么是OCR?

在這里插入圖片描述
圖 自然場景OCR文字識別
OCR英文全稱是Optical Character Recognition,中文叫做光學字符識別,它是利用光學技術和計算機技術把印在或寫在紙上的文字讀取出來,并轉換成一種計算機能夠接受、人又可以理解的格式,文字識別是計算機視覺研究領域的分支之一,而且這個課題已經是比較成熟了,并且在商業中已經有很多落地專案了,比如漢王OCR,百度OCR,阿里OCR等等,很多企業都有能力都是拿OCR技術開始掙錢了,其實我們自己也能感受到,OCR技術確實也在改變著我們的生活:比如一個手機APP就能幫忙掃描名片、身份證,并識別出里面的資訊;汽車進入停車場、收費站都不需要人工登記了,都是用車牌識別技術;我們看書時看到不懂的題,拿個手機一掃,APP就能在網上幫你找到這題的答案,太多太多的應用了,OCR的應用在當今時代確實是百花齊放,

2.2 OCR的分類

如果要給OCR進行分類分為兩類:手寫體識別和印刷體識別,
這兩個可以認為是OCR領域兩個大主題了,當然印刷體識別較手寫體識別要簡單得多,也能從直觀上理解,印刷體大多都是規則的字體,因為這些字體都是計算機自己生成再通過列印技術印刷到紙上,在印刷體的識別上有其獨特的干擾:在印刷程序中字體很可能變得斷裂或者墨水粘連,使得OCR識別例外困難,當然這些都可以通過一些影像處理的技術幫他盡可能的還原,進而提高識別率,總的來說,單純的印刷體識別在業界已經能做到很不錯了,但說100%識別是肯定不可能的,但是說識別得不錯那是沒毛病,
在這里插入圖片描述

圖 手寫字體展示
印刷體已經識別得不錯了,那么手寫體呢?手寫體識別一直是OCR界一直想攻克的難關,但是時至今天,感覺這個難關還沒攻破,還有很多學者和公司在研究,為什么手寫體識別的難度在于因為人類手寫的字往往帶有個人特色,每個人寫字的風格基本不一樣,印刷體一般都比較規則,字體都基本就那幾十種,機器學習這幾十種字體并不是一件難事,但是手寫體,每個人都有一種字體的話,那機器該學習大量字體,這就是難度所在,

2.3 OCR流程

假如輸入系統的影像是一頁文本,那么識別時的第一件事情是判斷頁面上的文本朝向,因為得到的這頁檔案往往都不是很完美的,很可能帶有傾斜或者污漬,那么要做的第一件事就是進行影像預處理,做角度矯正和去噪,然后要對檔案版面進行分析,進每一行進行行分割,把每一行的文字切割下來,最后再對每一行文本進行列分割,切割出每個字符,將該字符送入訓練好的OCR識別模型進行字符識別,得到結果,但是模型識別結果往往是不太準確的,需要對其進行識別結果的矯正和優化,比如可以設計一個語法檢測器,去檢測字符的組合邏輯是否合理,比如,考慮單詞Because,設計的識別模型把它識別為8ecause,那么就可以用語法檢測器去糾正這種拼寫錯誤,并用B代替8并完成識別矯正,這樣子,整個OCR流程就走完了,從大的模塊總結而言,一套OCR流程可以分為:
在這里插入圖片描述

從上面的流程圖可以看出,要做字符識別并不是單純一個OCR模塊就能實作的(如果單純的OCR模塊,識別率相當低),都要各個模塊的組合來保證較高的識別率,上面的流程分的比較粗,每個模塊下還是有很多更細節的操作,每個操作都關系著最終識別結果的準確性,做過OCR的童鞋都知道,送入OCR模塊的影像越清晰(即預處理做的越好),識別效果往往就越好,那現在對這流程中最為重要的字符識別技術做一個總結,

2.4 OCR的簡單應用

在這里插入圖片描述
圖 瓶蓋的生產日期識別
在一些簡單環境下OCR的準確度已經比較高了(比如電子檔案),但是在一些復雜環境下的字符識別,在當今還沒有人敢說自己能做的很好,現在大家都很少會把目光還放在如何對電子檔案的文字識別該怎么進一步提高準確率了,因為他們把目光放在更有挑戰性的領域,OCR傳統方法在應對復雜圖文場景的文字識別顯得力不從心,越來越多人把精力都放在研究如何把文字在復雜場景讀出來,并且讀得準確作為研究課題,用學界術語來說,就是場景文本識別(文字檢測+文字識別),
在這里插入圖片描述

圖 人工智能課本識別圖

3文本檢測CTPN

2016年出了一篇很有名的文本檢測的論文:《Detecting Text in Natural Image withConnectionist Text Proposal Network》,這個深度神經網路叫做CTPN,直到今天這個網路框架一直是OCR系統中做文本檢測的一個常用網路,極大地影響了后面文本檢測演算法的方向,
回顧一下Faster RCNN做目標檢測的一個缺點就是,沒有考慮帶文本自身的特點,文本行一般以水平長矩形的形式存在,而且文本行中每個字都有間隔,針對這個特點,CTPN剔除一個新奇的想法,把文本檢測的任務拆分,第一步檢測文本框中的一部分,判斷它是不是一個文本的一部分,當對一幅圖里所有小文本框都檢測之后,將屬于同一個文本框的小文本框合并,合并之后得到一個完整的、大的文本框了,也就完成了文本的檢測任務,這個想法很有創造性,有點像“分治法”,先檢測大物體的一小部分,等所有小部分都檢測出來,大物體也就可以檢測出來了,
在這里插入圖片描述
圖 RPN和CTPN對比
如圖所示,左邊的圖是直接使用Faster RCNN中的RPN來進行候選框提取,可以看出,這種候選框太粗糙了,效果并不好,而右圖是利用許多小候選框來合并成一個大文本預測框,可以看出這個演算法的效果非常不錯,需要說明的是,紅色框表示這個小候選框的置信度比較高,而其他顏色的候選框的置信度比較低,可以看到,一個大文本的邊界都是比較難預測的,那怎么解決這個邊界預測不準的問題呢?后面會提到,
剛提到CTPN的其中一個閃光點,即檢測小框代替直接檢測大文本框,除了這個新意,CTPN還提出了在文本檢測中應加入RNN來進一步提升效果,為什么要用RNN來提升檢測效果?文本具有很強的連續字符,其中連續的背景關系資訊對于做出可靠決策來說很重要,RNN常用于序列模型,比如事件序列,語言序列等等,那CTPN演算法中,把一個完整的文本框拆分成多個小文本框集合,其實這也是一個序列模型,可以利用過去或未來的資訊來學習和預測,所以同樣可以使用RNN模型,而且,在CTPN中,用的還是BiLSTM(雙向LSTM),因為一個小文本框,對于它的預測,不僅與其左邊的小文本框有關系,而且還與其右邊的小文本框有關系!這個解釋就很有說服力了,如果僅僅根據一個文本框的資訊區預測該框內含不含有文字其實是很草率的,應該多參考這個框的左邊和右邊的小框的資訊后(尤其是與其緊挨著的框)再做預測準確率會大大提升,
在這里插入圖片描述

圖 CTPN候選框
如上圖所示,如果單純依靠1號框內的資訊來直接預測1號框中否存在文字(或者說是不是文本的一部分),其實難度相當大,因為1號框只包含文字的很小一部分,但是如果把2號框和3號框的資訊都用上,來預測1號框是否存在文字,那么就會有比較大的把握來預測1號框確實有文字,還可以看看為什么邊緣的文本框的置信度會較中間的低呢?個人認為很大一部分原因就在于因為這些框都位于總文本的邊緣,沒有辦法充分利用左右相鄰序列的資訊做預測(比如位于最左的文本框丟失了其右邊的資訊),這就是雙向LSTM的作用,把左右兩個方向的序列資訊都加入到學習的程序中去,
CTPN借助了Faster RCNN中anchor回歸機制,使得RPN能有效地用單一尺寸的滑動視窗來檢測多尺寸的物體,當然CTPN根據文本檢測的特點做了比較多的創新,比如RPN中anchor機制是直接回歸預測物體的四個引數(x,y,w,h),但是CTPN采取之回歸兩個引數(y,h),即anchor的縱向偏移以及該anchor的文本框的高度,因為每個候選框的寬度w已經規定為16個像素,不需要再學習,而x坐標直接使用anchor的x坐標,也不用學習,所以CTPN的思路就是只學習y和h這兩個引數來完成小候選框的檢測!跟RPN相類似,CTPN中對于每個候選框都使用了K個不同的anchors(k在這里默認是10),但是與RPN不同的是,這里的anchors的width是固定的16個像素,而height的高度范圍為11~273(每次對輸入影像的height除以0.7,一共K個高度),當然CTPN中還是保留了RPN大多數的思路,比如還是需要預測候選框的分數score(該候選框有文本和無文本的得分),
文本行構建很簡單,通過將那些text/no-text score > 0.7的連續的text proposals相連接即可,文本行的構建如下,首先,為一個proposal Bi定義一個鄰居(Bj):Bj?>Bi,其中,Bj在水平距離上離Bi最近,該距離小于50 pixels它們的垂直重疊(vertical overlap) > 0.7,另外,如果同時滿足Bj?>Bi和Bi?>Bj,會將兩個proposals被聚集成一個pair,接著,一個文本行會通過連續將具有相同proposal的pairs來進行連接來構建,
在這里插入圖片描述

圖 CTPN網路架構
首先CTPN的基礎網路使用了VGG16用于特征提取,在VGG的最后一個卷積層CONV5,CTPN用了3×3的卷積核來對該feature map做卷積,這個CVON5 特征圖的尺寸由輸入影像來決定,而卷積時的步長卻限定為16,感受野被固定為228個像素,卷積后的特征將送入BLSTM繼續學習,最后接上一層全連接層FC輸出要預測的引數:2K個縱向坐標y,2k個分數,k個x的水平偏移量,看到這里大家可能有個疑問,這個x的偏移到底是什么,為什么需要回歸這個引數?如果需要X的引數,為什么不在候選框引數回歸時直接預測成(x,y,h)三個引數呢,而要多此一舉把該引數單獨預測,這個X的作用作者提到這也是他們論文的一大亮點,稱之為Side-refinement,可以理解為文本框邊緣優化,回顧一下上面提到的一個問題,文本框檢測中邊緣部分的預測并不準確,那么改咋辦,CTPN就是用這個X的偏移量來精修邊緣問題,這個X是指文本框在水平方向的左邊界和右邊界,通過回歸這個左邊界和右邊界引數進而可以使得對文本框的檢測更為精準,在這里想舉個例子說明一下回歸這個x引數的重要性,
通過觀察下圖,第一幅圖張看到有很多小候選框,位于左邊的候選框我標記為1、2、3、4號框,1號框和2號框為藍色,表明得分不高就不把這兩個框合并到大文本框內,對于3號框和4號框那就比較尷尬了,如果取3號框作為文本框的邊緣框,那么顯然左邊邊緣留白太多,精準度不夠,但如果去掉3號框而使用4號框作為左邊緣框,則有些字體區域沒有檢測出來,同樣檢測精度不足,這種情況其實非常容易出現,所以CTPN采取了Side-refinement 思路進一步優化邊緣位置的預測即引入回歸X引數,X引數直接標定了完整文本框的左右邊界,做到精確的邊界預測,第二幅圖中的紅色框就是經過Side-refinement后的檢測結果,可以看出檢測準確率有了很大的提升, side-refinement確實可以進一步提升位置準確率,在SWT的Multi-Lingual datasets上產生2%的效果提升,
在這里插入圖片描述
再看多幾幅圖,體驗一下Side-refinement后的效果,
在這里插入圖片描述

最后總結一下CTPN這個流行的文本檢測框架的三個閃光點:

  • 將文本檢測任務轉化為一連串小尺度文本框的檢測;
  • 引入RNN提升文本檢測效果;
  • Side-refinement(邊界優化)提升文本框邊界預測精準度,

當然,CTPN也有一個很明顯的缺點:對于非水平的文本的檢測效果并不好,CTPN論文中給出的文本檢測效果圖都是文本位于水平方向的,顯然CTPN并沒有針對多方向的文本檢測有深入的探討,

4總結

通過查閱相關資料學習什么是OCR并且查閱了如何實作OCR文字識別中的文字檢測,并且通過理論實作流程并且用代碼對CPTN文字檢測進行復現,通過對文字資料預處理并且進行文字字符分割,看似簡單,做起來其實很難做得很好,我們也對此查閱了很多論文,發現其實很多論文也談到了,漢字確實很那做到一個高正確率的分割,直至現在還沒有一統江湖的解決方案,漢字切割的失敗,就會直接導致了后面OCR識別的失敗,這也是當前很多一些很厲害的OCR公司都沒法把漢字做到100%識別的一個原因,所以這個問題就必須得到很好的解決,最后我們解決漢字切割的較好方法是,在OCR識別中再把它修正,并且通過文字分割后對資料進行資料增強生成了大量資料防止模型的過擬合,并且通過學習CPTN論文,學習到了思路上的創新,在檢測水平上的文字置信度很高,但是也有一些弊端對于非水平的文本檢測效果并不好,

5參考文獻

[1] Detecting Text in Natural Image with Connectionist Text Proposal Network.作者: Zhi Tian; Weilin Huang; Tong He; Pan He; Yu Qiao 0001
[2]基于深度學習的漢字識別方法研究[D].任鳳麗.東華大學. 2021
[3]基于深度學習的光學字符識別技術研究[D].馮亞南.南京郵電大學 2020
[4]基于卷積神經網路的手寫數字識別研究與設計[D].劉辰雨.成都理工大學2018
[5]基于CRNN的中文手寫識別方法研究[J]. 石鑫,董寶良,王俊豐.資訊技術. 2019(11)

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/394134.html

標籤:AI

上一篇:畢業設計 : 垃圾分類管理系統的設計與實作

下一篇:JavaCV的攝像頭實戰之十二:性別檢測

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more