トップ 差分 一覧 ソース 検索 ヘルプ PDF RSS ログイン

R.reg

Rで正規表現


参考サイト:http://www.okadajp.org/RWiki/?R%20%E3%81%AB%E3%81%8A%E3%81%91%E3%82%8B%E6%AD%A3%E8%A6%8F%E8%A1%A8%E7%8F%BE


他のプログラミング言語と違う注意点

  1. エスケープは2回 \\
  2. 文字クラスの指定も2回 [[ ]]

メタ文字

. ピリオド一つは何でも一文字

* アスタリスクは直前の文字の0回以上の繰り返し
*? とすると「最短一致」

+ プラス記号は直前の文字の1回以上の繰り返し
+? とすると「最短一致」

? 疑問符は直前の文字(項目)の0回もしくは1回の繰り返し。つまり、あってもなくてもよい。

(  ) 丸かっこで囲むとその中の文字列が連続したカタマリとして扱われる。 [  ] との違いに注意。

| は、その前後の文字のどちらか。( | ) で囲むと、その前後の文字列のどちらか。

文字クラス


[ ] で囲まれた「クラス」はその中のどれか一文字

[ - ] で、−の前後の連続する文字列の範囲 例:[a-z] は小文字aからzまで

[^ ] と最初に ^ を置くと、そこに並ぶいずれの文字でもないもの、という意味

[:space:] で半角スペース・タブ記号・改行記号

[:punct:] で句読点類

[:digit:] で数字

[:lower:] 小文字

[:upper:] 大文字

[:alpha:] 大文字・小文字

[:alnum:] で半角英数

\w で半角英数とアンダースコア

\W \w以外のもの

\b 「単語」の境界