正規表現について (基礎編)

正規表現について Internet Explorer や Opera は使わないこと!


Charactorbot 公式wiki 正規表現 参照


EasyBotterなどで使われている{ }で囲んで指定するものは、キャラボットでは # # で指定するタグに該当します。


メタ文字は、全て半角


メタ文字の半角文字や記号を、反応語句(キーワード)内に混ぜて登録すると
反応語句ではなく正規表現指定文字としてプログラムに読み取られ
ボットが誤作動を起こす原因になるので注意(特に顔文字)



基礎編 メタ文字



.  任意の1文字にマッチ

*  0回以上の繰り返し(最長一致)

.*  何でもいいから0文字以上続く

+  1回以上の繰り返し(最長一致)

?  0回もしくは1回の繰り返し(最長一致)

|(半角だとこのページでは表示されないので全角になってますが、本来は半角) もしくは、または

^  先頭にマッチ

$  末尾にマッチ

\  直後の記号をエスケープする。

( )  ( )内の正規表現を、まとめて1つの正規表現として扱う。グループ化。

[abc]  [ ]内のどれか1文字にマッチ

[a-z]  [ ]内のa〜zにマッチ

[^abc]  [ ]内以外の任意の1文字にマッチ

{n}  ちょうどn回の繰り返し

{n,}  少なくともn回の繰り返し

{n,m}  n回以上、m回以下の繰り返し

*?  直前の正規表現の、0回以上の繰り返し(最短一致)

+?  直前の正規表現の、1回以上の繰り返し(最短一致)



用語     意味

エスケープ メタ文字を普通の文字として扱うために、メタ文字の前に「¥」をつけること。

グループ化 何文字かの正規表現をまとめて1つの正規表現として扱うこと

ゼロ幅 ゼロ幅アサーション、ゼロ幅の言明、などとも言う。位置にマッチする「^」や「$」のこと。

マッチ 正規表現が特定の文字列にあてはまること。

メタ文字 正規表現の中で、特別な意味を持つ文字。メタシーケンスとも言う。

最短一致 量指定子が可能な限り短い文字列にマッチすること。非欲張りな量指定子とも言う。

最長一致 量指定子が可能な限り長い文字列にマッチすること。欲張りな量指定子とも言う。

文字クラス ある文字のひとまとまりの中の1文字を表すメタ文字。

量指定子 直前の正規表現の〜回の繰り返し、を表すメタ文字。

シングルラインモード 単一行モードとも言う。ONなら、「.」が改行にもマッチする。

マルチラインモード 複数行モードとも言う。ONなら、「^」「$」が行頭・行末にマッチする。


  上記を確認しつつ、他の正規表現に関する記事を見て下さい 





もっと詳しく「正規表現」について知りたければ、正規表現 基礎 などとして
検索すれば、初心者にも分かりやすく詳しく説明してくれるサイトが見つかると思います。







  • 最終更新:2012-05-11 16:47:53

このWIKIを編集するにはパスワード入力が必要です

認証パスワード