<Python> 文字コード

文字コード Character Codesで少し遊んだ。

UTF-8のコード表。

UTF-8コード表(1)

このコード表を元にデコードdecodeしてみる。

In [36]: b'\xe3\x81\x82'.decode()
Out[36]: 'あ'

In [37]: b'\xc3\xa0'.decode()
Out[37]: 'à'

なるへそ。
じゃ、ってことで、エンコードしてみる。

In [38]: 'あ'.encode()
Out[38]: b'\xe3\x81\x82'

ふむふむ。

で、わかりずらかったのがリテラルちゅうやつ。
要はどう表記するか? ということらしい。

アスキー文字ascii君達は、\xで始まるコード記号でスタートしなくても認識してくれるようだ。

In [40]: b'7'.decode()
Out[40]: '7'

In [41]: b'\x37'.decode()
Out[41]: '7'

参考。

qiita.com

uxmilk.jp

マニュアル。

https://docs.python.jp/3/howto/unicode.html#converting-to-bytes