Char¶
Char は、32ビットのUnicode コードポイントを表します。
通常、単一引用符でUTF-8文字を囲むことで、charリテラルを使用して作成されます。
'a'
'z'
'0'
'_'
'あ'
バックスラッシュは特殊文字を表し、名前付きエスケープシーケンスまたはUnicodeコードポイントの数値表現のいずれかになります。
使用可能なエスケープシーケンス
'\'' # single quote
'\\' # backslash
'\a' # alert
'\b' # backspace
'\e' # escape
'\f' # form feed
'\n' # newline
'\r' # carriage return
'\t' # tab
'\v' # vertical tab
'\0' # null character
'\uFFFF' # hexadecimal unicode character
'\u{10FFFF}' # hexadecimal unicode character
バックスラッシュの後に `u` が続くものはUnicodeコードポイントを表します。Unicodeバイトを表す正確に4つの16進数文字(`\u0000` から `\uFFFF`)の後に続くか、中括弧で囲まれた1〜6個の16進数文字(`\u{0}` から `\u{10FFFF}`)の後に続くことができます。
'\u0041' # => 'A'
'\u{41}' # => 'A'
'\u{1F52E}' # => '🔮'