在Python中,提取字符串中的中文字可以使用正则表达式模块 `re`。以下是一个使用 `re.findall()` 函数提取字符串中所有中文字符的示例:
import re
示例字符串
text = "这是一个包含中文字符的字符串example。"
使用正则表达式提取中文字符
chinese_characters = re.findall(r'[\u4e00-\u9fff]+', text)
输出提取结果
print(chinese_characters)
这段代码会输出:
['这是一个包含中文字符的字符串example']
正则表达式 `[\u4e00-\u9fff]+` 用于匹配所有的中文字符。其中 `\u4e00-\u9fff` 表示Unicode字符集中的中文字符范围。`+` 表示匹配一个或多个这样的字符。