2007年02月27日

轉貼正規表示式

網路上看到一篇還不錯的總結,轉貼上來
來源:http://www.erp100.com/viewthread.php?tid=7061

用 Oracle Database 10g 使用正規表達式
  您可以使用最新引進的 Oracle SQL REGEXP_LIKE 操作符和 REGEXP_INSTR、REGEXP_SUBSTR 以及 REGEXP_REPLACE 函數來發揮正規表達式的作用。您將體會到這個新的功能如何對 LIKE 操作符和 INSTR、SUBSTR 和 REPLACE 函數進行了補充。實際上,它們類似於已有的操作符,但現在增加了強大的模式匹配功能。被搜索的數據可以是簡單的字符串或是存儲在數據庫字符列中的大量文 本。正規表達式讓您能夠以一種您以前從未想過的方式來搜索、替換和驗證數據,並提供高度的靈活性。

語法附件
表 1:定位元字符
元字符說明
^使表達式定位至一行的開頭
$使表達式定位至一行的末尾

表 2:量詞或重複操作符 
量詞說明
*匹配 0 次或更多次
?匹配 0 次或 1 次
+匹配 1 次或更多次
{m}正好匹配 m
{m,}至少匹配 m
{m, n}至少匹配 m 次但不超過 n

表 3:預定義的 POSIX 字符類 
字符類說明
[:alpha:]字母字符
[:lower:]小寫字母字符
[:upper:]大寫字母字符
[:digit:]數字
[:alnum:]字母數字字符
[:space:]空白字符(禁止打印),如回車符、換行符、豎直製表符和換頁符
[:punct:]標點字符
[:cntrl:]控制字符(禁止打印)
[:print:]可打印字符

表 4:表達式的替換匹配和分組 
元字符說明
|替換分隔替換選項,通常與分組操作符 () 一起使用
( )分組將子表達式分組為一個替換單元、量詞單元或後向引用單元(參見「後向引用」部分)
[char]字符列表表示一個字符列表;一個字符列表中的大多數元字符(除字符類、^- 元字符之外)被理解為文字

表 5:REGEXP_LIKE 操作符 
語法說明
REGEXP_LIKE(source_string, pattern
[, match_parameter])
source_string 支持字符數據類型(CHAR、VARCHAR2、CLOB、NCHAR、NVARCHAR2NCLOB,但不包括 LONG)。pattern 參數是正則表達式的另一個名稱。match_parameter 允許可選的參數(如處理換行符、保留多行格式化以及提供對區分大小寫的控制)。

表 6:REGEXP_INSTR 函數 
語法說明
REGEXP_INSTR(source_string, pattern
[, start_position
[, occurrence
[, return_option
[, match_parameter]]]])
該函數查找 pattern ,並返回該模式的第一個位置。您可以隨意指定您想要開始搜索的 start_positionoccurrence 參數默認為 1,除非您指定您要查找接下來出現的一個模式。return_option 的默認值為 0,它返回該模式的起始位置;值為 1 則返回符合匹配條件的下一個字符的起始位置。

表 7: 5 位數字加 4 位郵政編碼表達式的說明 
語法說明

必須匹配的空白
[:digit:]POSIX 數字類
]字符列表的結尾
{5}字符列表正好重複出現 5 次
(子表達式的開頭
-一個文字連字符,因為它不是一個字符列表內的範圍元字符
[字符列表的開頭
[:digit:]POSIX [:digit:]
[字符列表的開頭
]字符列表的結尾
{4}字符列表正好重複出現 4 次
)結束圓括號,結束子表達式
?? 量詞匹配分組的子表達式 0 或 1 次,從而使得 4 位代碼可選
$定位元字符,指示行尾

表 8:REGEXP_SUBSTR 函數 
語法說明
REGEXP_SUBSTR(source_string, pattern
[, position [, occurrence
[, match_parameter]]])
REGEXP_SUBSTR 函數返回匹配模式的子字符串。

表 9: REGEXP_REPLACE 函數 
語法說明
REGEXP_REPLACE(source_string, pattern
[, replace_string [, position
[,occurrence, [match_parameter]]]])
該函數用一個指定的 replace_string 來替換匹配的模式,從而允許複雜的「搜索並替換」操作。

表 10:後向引用元字符 
元字符說明
\digit反斜線緊跟著一個 1 到 9 之間的數字,反斜線匹配之前的用括號括起來的第 digit 個子表達式。
(注意:反斜線在正則表達式中有另一種意義,取決於上下文,它還可能表示 Escape 字符。

表 11:模式交換正則表達式的說明 
正則表達式項目說明
(第一個子表達式的開頭
.匹配除換行符之外的任意單字符
*重複操作符,匹配之前的 . 元字符 0 到 n
)第一個子表達式的結尾;匹配結果在 \1
中獲取(在這個例子中,結果為 Ellen。)

必須存在的空白
(第二個子表達式的開頭
.匹配除換行符之外的任意單個字符
*重複操作符,匹配之前的 . 元字符 0 到 n
)第二個子表達式的結尾;匹配結果在 \2
中獲取(在這個例子中,結果為 Hildi。)

空白
(第三個子表達式的開頭
.匹配除換行符之外的任意單字符
*重複操作符,匹配之前的 . 元字符 0 到 n
)第三個子表達式的結尾;匹配結果在 \3
中獲取(在這個例子中,結果為 Smith。)

表 12:社會保險號碼正則表達式的說明 
正則表達式項目說明
^行首字符(正則表達式在匹配之前不能有任何前導字符。)
(開始子表達式並列出用 | 元字符分開的可替換選項
[字符列表的開頭
[:digit:]POSIX 數字類
]字符列表的結尾
{3}字符列表正好重複出現 3 次
-連字符
[字符列表的開頭
[:digit:]POSIX 數字類
]字符列表的結尾
{2}字符列表正好重複出現 2 次
-另一個連字符
[字符列表的開頭
[:digit:]POSIX 數字類
]字符列表的結尾
{4}字符列表正好重複出現 4 次
|替換元字符;結束第一個選項並開始下一個替換表達式
[字符列表的開頭
[:digit:]POSIX 數字類
]字符列表的結尾
{9}字符列表正好重複出現 9 次
)結束圓括號,結束用於替換的子表達式組
$定位元字符,指示行尾;沒有額外的字符能夠符合模式




Posted by my_work at 樂多Roodo! │14:43 │回應(0)引用(0)DB
樂多分類:網路/3C 共同主題:Oracle 工具:編輯本文
Ads by Roodo! 

引用URL

http://cgi.blog.roodo.com/trackback/2776889