我現在有大概一千萬條string,編碼方式為UTF-8,每條長度在一百位元組左右。現在想要一種快速的判斷方法,篩選出所有全是英文的字串或含有漢字的字串。我想要一個函式,能實作以下兩個功能中的一個就行:第一個:判斷字串全是英文字母;第二個:判斷字串包含漢字。請問哪一個更容易實作,更快速啊
uj5u.com熱心網友回復:
我認為用 re 判斷全英文更快。uj5u.com熱心網友回復:
re直接判斷里面是否有中文就行了,沒有中文肯定就是英文了,如果判斷是否算英文很難處理標點符號uj5u.com熱心網友回復:
判斷全ascii太耗硬體了,只要判斷其中是否有一個中文就停止判斷效率要高很多uj5u.com熱心網友回復:
[\u4E00-\u9FA5]用這個號匹配轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/126240.html
上一篇:Anaconda3安裝后開始選單只有Anaconda Prompt,沒有conda.exe和active.bat
