在Python中,文本数据通常被表示为字符串(string)。字符串是一系列Unicode字符的有序序列,可以包含任何语言的字符,包括中文。在Python 3中,字符串默认就是Unicode类型,这意味着你可以直接使用引号来包裹中文字符。
```python
-*- coding: utf-8 -*-
直接使用中文字符
print("你好,世界!")
使用Unicode转义序列
print("\u4f60\u597d\uff0c\u4e16\u754c\uff01")
使用中文字符串变量
chinese_str = "你好,世界!"
使用Unicode编码的好处是可以在代码中直接表示和处理各种字符,包括不同语言的文字,避免了编码转换和字符集问题。Python还提供了一些内置的函数,如`encode()`和`decode()`,用于在不同的字符编码之间进行转换