初心者

【初心者向け】正規表現パターンの作り方

はじめに

・ルールはなんとなくわかるけど、具体的につくる。となるとつくれない

という人向けの内容です。

基本となる簡単な作り方とそこからの発展をそれぞれ1例づつ。で進めていきます。

ふくろーおじさん
ふくろーおじさん
それではいきましょう。

正規表現の作り方

まず、準備です。(これが一番大事だったりします。)

準備:抽出したいパターンを洗い出す。

正規表現はパターンにマッチするものを抽出するので、抽出したいものが洗い出せていないとなにもできません。

今回は一般的な型を抽出したい。とします。

【抽出したいパターン】
vd,u1,u2,u4,s1,s2,s4

簡単な作り方

  • STEP1
    抽出したいパターンをグループ化してorでつなげる
    (vd|u1|u2|u4|s1|s2|s4)
  • 補足
    メリット・デメリット
    メリット:簡単に作れる、わかりやすい、不要なものが含まれない。
    デメリット:抽出したい語句の数が多い場合、記載が手間になる。

発展(共通項をまとめる)

①vd,②u1,u2,u4,③s1,s2,s4と分けて考えます。

  • STEP1
    ②をuでグループ化する
    ①vd,②u(1|2|4),③s1,s2,s4
  • STEP2
    ③をsでグループ化する
    ①vd,②u(1|2|4),③s(1|2|4)
  • STEP3
    ②と③をu,sでグループ化する
    ①vd,②③(u|s)(1|2|4)
  • STEP4
    ①と②③をまとめる
    ①②③(vd|(u|s)(1|2|4))
  • 補足
    メリット・デメリット
    メリット:記載が容易。
    デメリット:正しく設計できていないと、不要なものが含まれてしまう事がある。
さいごに

いかがでしたでしょうか。
慣れないうちは脳内で実施せずに、抽出パターンや作成途中を紙やデータにまとめながら作る事で自分の考えもまとまっていくと思います。

以上参考になればうれしいです。
最後までお読みいただき、ありがとうございました。