模式修正符

模式修正符 -- 解說正則表達式模式中使用的修正符

說明

下面列出了現用的在 PCRE 中可能使用的修正符。括號中是這些修正符的內定 PCRE 名。修正符中的空格和換行被忽略,其它字元會導致錯誤。

i (PCRE_CASELESS)

若果設定此修正符,模式中的字元將同時符合大小寫字母。

m(PCRE_MULTILINE)

預設情況下,PCRE 將目的字串作為單一的一「行」字元所組成的(甚至其中包括有換行符也是如此)。「行起始」元字元(^)僅僅符合字串的起始,「行結束」元字元($)僅僅符合字串的結束,或是最後一個字元是換行符時其前面(除非設定了 D 修正符)。這和 Perl 是一樣的。

當設定了此修正符,「行起始」和「行結束」除了符合整個字串開頭和結束外,還分別符合其中的換行符的之後和之前。這和 Perl 的 /m 修正符是等效的。若果目的字串中沒有「\n」字元或是模式中沒有 ^ 或 $,則設定此修正符沒有任何效果。

s(PCRE_DOTALL)

若果設定了此修正符,模式中的圓點元字元(.)符合所有的字元,內含換行符。沒有此設定的話,則不內含換行符。這和 Perl 的 /s 修正符是等效的。排除字元類例如 [^a] 總是符合換行符的,無論是否設定了此修正符。

x(PCRE_EXTENDED)

若果設定了此修正符,模式中的空白字元除了被轉義的或在字元類中的以外完全被忽略,在未轉義的字元類之外的 # 以及下一個換行符之間的所有字元,內含兩頭,也都被忽略。這和 Perl 的 /x 修正符是等效的,使得可以在複雜的模式中加入注解。然而注意,這僅適用於資料字元。空白字元可能永遠不會出現於模式中的特殊字元序列,例如引入條件子模式的序列 (?( 中間。

e

若果設定了此修正符,preg_replace() 在置換字串中對逆向引用作標準的置換,將其作為 PHP 代碼求值,並用其結果來置換所搜尋的字串。

只有 preg_replace() 使用此修正符,其它 PCRE 函數將忽略之。

注: 本修正符在 PHP3 中不可用。

A(PCRE_ANCHORED)

若果設定了此修正符,模式被強制為「anchored」,即強制僅從目的字串的開頭開始符合。此效果也可以通過適當的模式本身來實現(在 Perl 中實現的唯一方法)。

D(PCRE_DOLLAR_ENDONLY)

若果設定了此修正符,模式中的美元元字元僅符合目的字串的結尾。沒有此選項時,若果最後一個字元是換行符的話,美元符號也會符合此字元之前(但不會符合任何其它換行符之前)。若果設定了 m 修正符則忽略此選項。Perl 中沒有與其等價的修正符。

S

當一個模式將被使用若干次時,為加速符合起見值得先對其進行分析。若果設定了此修正符則會進行額外的分析。目前,分析一個模式僅對沒有單一固定起始字元的 non-anchored 模式有用。

U(PCRE_UNGREEDY)

本修正符反轉了符合數量的值使其不是預設的重複,而變成在後面跟上「?」才變得重複。這和 Perl 不相容。也可以通過在模式之中設定 (?U) 修正符或是在數量符之後跟一個問號(如 .*?)來啟用此選項。

X(PCRE_EXTRA)

此修正符啟用了一個 PCRE 中與 Perl 不相容的額外功能。模式中的任何反斜線後面跟上一個沒有特殊意義的字母導致一個錯誤,從而保留此組合以備將來擴充。預設情況下,和 Perl 一樣,一個反斜線後面跟一個沒有特殊意義的字母被當成該字母本身。現用的沒有其它特性受此修正符控制。

u(PCRE_UTF8)

此修正符啟用了一個 PCRE 中與 Perl 不相容的額外功能。模式字串被當成 UTF-8。本修正符在 Unix 下自 PHP 4.1.0 起可用,在 win32 下自 PHP 4.2.3 起可用。自 PHP 4.3.5 起開始檢查模式的 UTF-8 合法性。