在Python中,去除英文句子中的标点符号可以使用正则表达式库`re`。以下是一个简单的例子,展示了如何使用`re.sub`函数去除英文句子中的所有标点符号:
import re
定义一个包含英文标点的字符串
punctuation_en = r'[!"$%&\'()*+,-./:;<=>?@[\]^_`{|}~]'
定义一个包含英文句子的字符串
sentence = "I am so happy!!! Oh yes~"
使用re.sub函数去除所有英文标点符号
clean_sentence = re.sub(punctuation_en, '', sentence)
打印去除标点后的句子
print(clean_sentence)
运行上述代码将输出:
I am so happy Oh yes
这个例子中,`punctuation_en`是一个正则表达式,它匹配所有英文标点符号。`re.sub`函数将所有匹配的标点符号替换为空字符串,从而去除它们。
如果你需要去除中文标点符号,可以使用`zhon.hanzi.punctuation`库,如下所示:
from zhon.hanzi import punctuation as punctuation_zh
定义一个包含中文标点的字符串
sentence_zh = "你真是太帅了!!要继续加油哦~"
使用re.sub函数去除所有中文标点符号
clean_sentence_zh = re.sub(punctuation_zh, '', sentence_zh)
打印去除标点后的句子
print(clean_sentence_zh)
运行上述代码将输出:
你真是太帅了要继续加油哦
请注意,要使用`zhon`库,你需要先安装它。可以使用`pip`进行安装:
pip install zhon
希望这能帮助你去除英文句子中的标点符号