在Python中,要将中文字符串转换为Unicode编码,你可以使用`str.encode()`方法。默认情况下,编码格式为UTF-8。以下是一个示例代码:
chinese_str = "中文"
unicode_str = chinese_str.encode('utf-8')
print(unicode_str)
如果你需要将Unicode编码转换回中文字符串,可以使用`str.decode()`方法,并指定编码格式为'utf-8':
unicode_str = b'\xe4\xb8\xad\xe6\x96\x87' 这是"中文"的UTF-8编码
chinese_str = unicode_str.decode('utf-8')
print(chinese_str)
请注意,在Python 2中,如果遇到编码错误,例如"UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-5: ordinal not in range(128)",你可以尝试将默认编码设置为'utf-8',如下所示:
import sys
reload(sys)
sys.setdefaultencoding('utf-8') 注意:在Python 3中,此操作不再需要
以上方法适用于Python 2和Python 3。如果你使用的是Python 3,通常不需要手动设置默认编码,因为Python 3默认使用UTF-8编码。