<Python> 文字コード
文字コード Character Codes
で少し遊んだ。
UTF-8
のコード表。
このコード表を元にデコードdecode
してみる。
In [36]: b'\xe3\x81\x82'.decode() Out[36]: 'あ' In [37]: b'\xc3\xa0'.decode() Out[37]: 'à'
なるへそ。
じゃ、ってことで、エンコードしてみる。
In [38]: 'あ'.encode() Out[38]: b'\xe3\x81\x82'
ふむふむ。
で、わかりずらかったのがリテラル
ちゅうやつ。
要はどう表記するか? ということらしい。
アスキー文字ascii
君達は、\x
で始まるコード記号でスタートしなくても認識してくれるようだ。
In [40]: b'7'.decode() Out[40]: '7' In [41]: b'\x37'.decode() Out[41]: '7'
参考。
マニュアル。
https://docs.python.jp/3/howto/unicode.html#converting-to-bytes