コンテンツへスキップ

Char

Char は、32ビットのUnicode コードポイントを表します。

通常、単一引用符でUTF-8文字を囲むことで、charリテラルを使用して作成されます。

'a'
'z'
'0'
'_'
'あ'

バックスラッシュは特殊文字を表し、名前付きエスケープシーケンスまたはUnicodeコードポイントの数値表現のいずれかになります。

使用可能なエスケープシーケンス

'\''         # single quote
'\\'         # backslash
'\a'         # alert
'\b'         # backspace
'\e'         # escape
'\f'         # form feed
'\n'         # newline
'\r'         # carriage return
'\t'         # tab
'\v'         # vertical tab
'\0'         # null character
'\uFFFF'     # hexadecimal unicode character
'\u{10FFFF}' # hexadecimal unicode character

バックスラッシュの後に `u` が続くものはUnicodeコードポイントを表します。Unicodeバイトを表す正確に4つの16進数文字(`\u0000` から `\uFFFF`)の後に続くか、中括弧で囲まれた1〜6個の16進数文字(`\u{0}` から `\u{10FFFF}`)の後に続くことができます。

'\u0041'    # => 'A'
'\u{41}'    # => 'A'
'\u{1F52E}' # => '🔮'