我有一个如下所示的多行字符串:
st = '''emp:firstinfo\n:secondinfo\nthirdinfo'''print(st)
我正在尝试做的是从我的字符串中跳过第二个’:’,并获得如下所示的输出:
'''emp:firstinfo\nsecondinfo\nthirdinfo'''
简单说,如果它以’:'开头,我只想忽略它。
这是我所做的:
'''遇到问题没人解答?小编创建了一个Python学习交流QQ群:778463939寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!'''mat_obj = re.match(r'(.*)\n*([^:](.*))\n*(.*)' , st)print(mat_obj.group())
显然,我没有看到我的错误,但是谁可以帮助我告诉我哪里出错了吗?
1 Answer:
您可以在此正则表达式中使用re.sub:
'''遇到问题没人解答?小编创建了一个Python学习交流QQ群:778463939寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!'''>>> print (re.sub(r'([^:\n]*:[^:\n]*\n)\s*:(.+)', r'\1\2', st))emp:firstinfosecondinfothirdinfo
正则表达式详细信息:
(: 开始第一个捕获组[^:\n]*: 匹配0个或多个不是:的任何字符和换行符:: 匹配冒号[^:\n]*: 匹配0个或多个不是:的任何字符和换行符\n: 匹配换行): 结束第一个捕获组\s*: 匹配0个或多个空格::匹配一个冒号(.+): 匹配第二个捕获组中的任何一个或多个字符(换行符除外)\1\2: 用于替换组1和2中捕获的子字符串。
2 Answer:
您可以改用sub,只是不要捕获不需要的部分。
(.*\n)[^:]*:(.*\n)(.*)
\1\2\3
替换为
import reregex = r"(.*\n)[^:]*:(.*\n)(.*)"test_str = ("emp:firstinfo\\n\n"" :secondinfo\\n\n"" thirdinfo")subst = "\\1\\2\\3"# You can manually specify the number of replacements by changing the 4th argumentresult = re.sub(regex, subst, test_str, 0, re.MULTILINE)