例如,考慮下面的匹配日期的正則表達式:
復制代碼 代碼如下:
/\A((?:19|20)[0-9]{2})[\- \/.](0[1-9]|1[012])[\- \/.](0[1-9]|[12][0-9]|3[01])\z/
使用Re之后,正則表達式可以短小易讀的表達式為基礎,一步一步地構建出來,例如:
復制代碼 代碼如下:
require 're'
include Re
delim = re.any("- /.")
century_prefix = re("19") | re("20")
under_ten = re("0") + re.any("1-9")
ten_to_twelve = re("1") + re.any("012")
ten_and_under_thirty = re.any("12") + re.any("0-9")
thirties = re("3") + re.any("01")
year = (century_prefix + re.digit.repeat(2)).capture(:year)
month = (under_ten | ten_to_twelve).capture(:month)
day = (under_ten | ten_and_under_thirty | thirties).capture(:day)
date = (year + delim + month + delim + day).all
雖然代碼量增加了,但是每個部分都很短小,也很容易驗證。同時,捕獲的部分可以通過相應的變量名訪問:
復制代碼 代碼如下:
result = date.match("2009-01-23")
result[:year] # => "2009"
result[:month] # => "01"
result[:day] # => "23"
注意,用Re構建正則表達式會很慢,所以推薦創建正則表達式并復用。匹配的時候,性能和原生的正則表達式很接近。(額外的方法調用和創建Re::Result以返回匹配結果影響一點點性能。)如果你需要追求極致的性能,你仍然可以使用Re來構建正則表達式,然后抽取出原始的Ruby Regexp來匹配。這樣的話,性能就和使用原生正則表達式一樣了。
例如,構建匹配電話號碼的正則表達式:
復制代碼 代碼如下:
PHONE_RE = re.digit.repeat(3).capture(:area) +
re("-") +
re.digit.repeat(3).capture(:exchange) +
re("-") +
re.digit.repeat(4)).capture(:subscriber)
然后抽取出原始的正則對象,直接使用它來匹配:
復制代碼 代碼如下:
PHONE_REGEXP = PHONE_RE.regexp
if PHONE_REGEXP =~ string
# blah blah blah
end