直接通过“re.split”（在 Python 中）将每个相邻的不同数字之间的字符串分开？-解网

问：

例如，我想转换为 .当然，这可以在不使用任何正则表达式的情况下在 for 循环中完成，但我想知道这是否可以通过单个正则表达式来完成。目前，我找到了两种方法："91234 5g556７\t7₇89^"["9","1","2","3","4 5g55","6７\t7₇8","9^"]

>>> import re
>>> def way0(char: str):
...     delimiter = ""
...     while True:
...         delimiter += " "
...         if delimiter not in char:
...             substitution = re.compile("([0-9])(?!\\1)([0-9])")
...             replacement = "\\1"+delimiter+"\\2"
...             cin = [char]
...             while True:
...                 cout = []
...                 for term in cin: cout.extend(substitution.sub(replacement,term).split(delimiter))
...                 if cout == cin:
...                     return cin
...                 else:
...                     cin = cout
...
>>> way0("91234 5g556７\t7₇89^")
['9', '1', '2', '3', '4 5g55', '6７\t7₇8', '9^']
>>> import functools
>>> way1 = lambda w: ["".join(list(y)) for x, y in itertools.groupby(re.split("(0+|1+|2+|3+|4+|5+|6+|7+|8+|9+)", w), lambda z: z != "") if x]
>>> way1("91234 5g556７\t7₇89^")
['9', '1', '2', '3', '4 5g55', '6７\t7₇8', '9^']

然而，两者都不是简洁的（和理想的）。我已经阅读了的帮助页面;遗憾的是，以下代码未返回所需的输出：way0way1re.split

>>> re.split(r"(\d)(?!\1)(\d)","91234 5g556７\t7₇89^")
['', '9', '1', '', '2', '3', '4 5g5', '5', '6', '７\t7₇', '8', '9', '^']

可以直接解决这个问题（即无需额外转换）吗？（请注意，这里我不关注效率。re.split

之前有一些关于这个主题的问题（例如，两位数不相同的两位数的正则表达式，匹配 2 位数字但不同的数字的正则表达式，以及匹配不相等或反转的数字集的正则表达式），但它们是关于“RegMatch”的。事实上，我的问题是关于“RegSplit”（而不是“RegMatch”或“RegReplace”）。

Python 正则表达式拆分

直接通过“re.split”（在 Python 中）将每个相邻的不同数字之间的字符串分开？

Separate a string between each two neighbouring different digits via `re.split` DIRECTLY (in Python)?

评论

评论