ある文字のユニコードのコードポイントを調べる方法
ある文字のユニコードのコードポイントを知りたい場合は、次のようにします。utf8プラグマは有効にして、ソースコードをUTF-8で保存する必要があります。
use utf8; my $str = 'あ'; # 十六進数として表示 printf "%x\n", ord($str);
ord関数で文字のコードポイントを知ることができます。printf関数で%xというフォーマット指定をして16進数で表示しています。
出力結果は以下のようになり「あ」という文字のコードポイントは3042であることがわかります。
3042
Data::Dumperで簡易的に調べる
Data::Dumperモジュールを使って簡易的に調べる方法もあります。Data::DumperはASCIIの範囲でない文字であれば、内部文字列を出力するときに、コードポイントに変換するからです。
use utf8; my $str = 'あ'; use Data::Dumper; print Dumper $str;
以下のようにユニコードのコードポイントが16進数で出力されます。
$VAR1 = "\x{3042}";