我已經使用image_read(從magick包中)讀取了兩個 .jpg 檔案,然后使用cat和image_ocr從兩者中提取文本并將它們組合成一個回傳。這確實回傳了文本,但是有很多錯誤需要使用正則運算式來糾正。但是,我似乎無法使用正則運算式并讓它再次回傳文本。這最初將向量的類顯示為“NULL”,所以我在as.character函式中添加了我前面的代碼,希望這能讓我在使用正則運算式后回傳文本,但它現在只回傳“字符(0)”。我嘗試使用lapply將向量轉換為字符,并嘗試使用unlist(text)以查看是否有幫助,但得到了類似的結果。這是我目前所擁有的:
#read in image files
text.1 <- image_read("dthw02_Olympics_1.jpg")
text.2 <- image_read("dthw02_Olympics_2.jpg")
#return ocr date from both images combined
text <- as.character(cat(image_ocr(text.1), (image_ocr(text.2))))
class(text) #returns "character"
#regular expressions test to replace lower case with upper case
text <- gsub("paris", "PARIS", text)
text #returns character(0) and doesn't show the text
這是我在這條線之后得到的
text <- as.character(cat(image_ocr(text.1), (image_ocr(text.2))))
我實際上不必呼叫text它只是在線路運行時回傳它。
? 洛杉磯 2028 5 北京 2008 2 首爾 1988 & B 墨西哥 1968 害羞的倫敦 1948
a 巴黎 2024 a 雅典 2004 cs 洛杉磯 1984 @ 東京 1964 柏林 1936
? =
'東京 2020 =| 悉尼 2000 莫斯科 1980 毫秒羅馬 1960 oe 洛杉磯 1932 & | 6 墨爾本/克
cos RIO 2016 亞特蘭大 1996 ae 蒙特利爾 1976 | 斯德哥爾摩 656 阿姆斯特丹 1928 D4 倫敦 2012 巴塞羅那 1992 sm 慕尼黑 1972 1 -| 赫爾辛基 1952 年“巴黎 1924 8 安特衛普 1920 克雅典 1896 2 斯德哥爾摩 1912
8 倫敦 1908
英石。路易 1904
4s 巴黎 1900
我對正則運算式的測驗只是想用 PARIS 替換 paris,但在那之后我將有很多作業要做正則運算式。
uj5u.com熱心網友回復:
在評論中解決:
您需要使用c(image_ocr(text.1), (image_ocr(text.2)))OR paste(image_ocr(text.1), (image_ocr(text.2))),具體取決于您想要向量還是一個長字串。
該cat(...)函式是連接和列印,不會回傳您的字串。(?cat()詳情見)
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/357433.html
