簡介 Introduction

正則運算式（Regular Expression）是計算機科學的一個概念，正則運算式是使用單個字串來描述和匹配一系列符合句法規則的字串，在很多文本編輯器里，正則運算式通常被用來檢索和替換那些符合某個模式的文本，

匹配規則

在正則運算式中，只表示其自身字符含義的叫做字面量字符，其實，大部分字符都表示字面含義，如：

/a/    #匹配 'a'
/b/    #匹配 'b'
/ab/   #匹配 'ab'

還有一些字符代表特殊含義，而不是其自身意義，叫做元字符，如：

/a|b/      #匹配 'a' 或者 'b'
/a｜b｜c/   #匹配 'a' 或 'b' 或 'c'
/ab｜cd/    #匹配 'ab' 或 'cd' 而不匹配 'a' 或 'b' 或 'c' 或 'd'

/a.b/  #可匹配a，b之間任意字符，如：'acb'，'a0b'等，但不匹配中間含有多個字符的情況

/^123/  #可匹配'123'出現在開始位置的字串，如'12345'
/123$/  #可匹配'123'出現在結束位置的字串，如'0123'

如果想要匹配正則運算式中的元字符本身，則需要在它們前面加反斜杠\，如：

/a\+b/  #匹配 'a+b'

正則運算式中需要反斜杠轉義的有：｜，.，^，$，{，[，(，)，\，+，*

正則運算式對一些不能列印的字符提供了特殊的表示方法：

字符類表示給定一系列字符，只要匹配其中任意一個即可，字符序列被放入方括號[]中，如：

/[abc]/  #可匹配'app，因為'app'含有字符'a'，但不能匹配'def'，因為'def'不含'abc'中任意一個

/[^abc]/  #可以匹配'cde'，但不能匹配'cba'

如果方括號內沒有其他字符，只有[^]，就表示匹配一切字符，其中包括換行符，相比之下，點號作為元字符（.）是不包括換行符的
^只有在字符類的第一個位置才有特殊含義，否則就是字面含義，
某些情況下，對于連續序列的字符，連字符（-）用來提供簡寫形式，表示字符的連續范圍，比如，[abc]可以寫成[a-c]，[0123456789]可以寫成[0-9],26個大寫字母可以寫成[A-Z]，

修飾符放在正則運算式的末尾，表示一些附加規則，如：

/abc/i     #可匹配 'abc' 或 'ABC'

/name$/    #不能匹配'my name\n'因為結尾不是name，而是換行符
/name$/m   #可以匹配'my name\n'

/aaaaa/    #只匹配第一個'a'
/aaaaa/g   #匹配所有的'a'

數量符用來表示某個模式的出現次數，

/n?ame/  #可匹配'name'，'ame'
/n*ame/  #可匹配'name'，'ame'，'nname'
/n+ame/  #可匹配'name'，'nname'

數量符默認為貪婪匹配，在數量符后加?可以將其變為非貪婪匹配：

貪婪匹配指匹配到下一個字符不滿足要求為止，而非貪婪匹配則只匹配到第一個滿足要求的字符，

表示模式的精確匹配次數，使用大括號{}表示，{n}表示恰好重復n次，{n,}表示至少重復n次，{n,m}表示重復不少于n次，不多于m次，

/a{2}b/   #可匹配'aab'
/a{2,}b/  #可匹配'aab'，'aaab'
/a{2,4}b/ #匹配'aaab'

預定義模式指的是某些常見模式的簡寫方式，

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/509023.html

標籤：其他