【Googleスプレッドシート】正規表現で特定の文字を抽出する｜REGEXREPLACE関数

GoogleSpreadsheet(スプレッドシート)

2023.02.05

この記事は約3分で読めます。

セルの中から、特定の規則に従った文字を抽出したい場合は「REGEXREPLACE関数」が使えます。

REGEXREPLACE関数とは？

REGEXREPLACEは、Google Sheetsで文字列中のテキストを正規表現パターンに基づいて置換するために使用される関数です。

次のような構文を持ちます：

=REGEXREPLACE（テキスト、正規表現、置換）

例：

=REGEXREPLACE("Hello World！","Hello","Goodbye")

この時、結果は「Goodbye World！」を返します。

上記の場合だと、文字をただ置換しただけですので、SUBSTITUTE関数と同じような扱いになります。

REGEXREPLACE関数のメリットは「正規表現」が使えるところですので、少し応用してみます。

例えば、このようなデータがあった場合に、他の列にそれぞれの内容を抽出して表示させる場合を考えてみます。

この場合は、「■商品名」が見つかったら次の行である「レースブラウスシャツ」を抽出、「■色」が見つかったら「黄」・・・といったように正規表現で見つけていきます。

なお、Google では RE2 構文のみをサポートしているようです。

RE2構文の正規表現（例）：

例えば、下のような表から、正規表現でそれぞれの項目を抽出してみます。

[rml_read_more]

=REGEXEXTRACT(SUBSTITUTE($A2, CHAR(10), ""),"(?)■商品名(.+)■色")

=REGEXEXTRACT(SUBSTITUTE($A2, CHAR(10), ""),"(?)■色(.+)■サイズ")

=REGEXEXTRACT(SUBSTITUTE($A2, CHAR(10), ""),"(?)■サイズ(.+)■種類")

=REGEXEXTRACT(SUBSTITUTE($A2, CHAR(10), ""),"(?)■種類(.+)■価格")

=REGEXEXTRACT(SUBSTITUTE($A2, CHAR(10), ""),"■価格(.+)")

これで、■色～■サイズ、■サイズ～■種類、■種類～■価格、■価格～、のそれぞれの文字が抽出できました。

このように、EGEXREPLACE関数を使うと、正規表現を使って、様々な文字列を抽出したり置換することができます。

使い方次第でかなり便利に使えますので、ぜひ覚えておくと便利です。