文字列に日本語が含まれているかどうかを調べる

文字列に日本語が含まれているかどうかを調べるには、正規表現を利用することができます。次のメタ文字を使って、漢字かひらがなかカタカナが含まれていることをチェックします。文字列は、内部文字列になっている必要があります。

文字種 メタ文字
漢字 \p{Han}
ひらがな \p{Hiragana}
カナカナ \p{Katakana}
use strict;
use warnings;
use utf8;

my $str = 'あいウエ三';
if ($str =~ /[\p{Han}\p{Hiragana}\p{Katakana}]/) {
  # 日本語を含んでいる
}
Perlテキスト処理のエッセンス
  • 初級者向け・テキスト処理と正規表現の基本をマスター
業務に役立つPerl
  • 実務者向け・ログ解析など日本語を含むテキスト処理の実践!
Perlクラブ
  • 仲間と出会い
    ゆとりあるエンジニアライフを送る