Разделить строку на основе регулярного выражения


у меня вывод команды в табличной форме. Я разбираю этот вывод из файла результатов и сохраняю его в строке. Каждый элемент в одной строке разделен одним или несколькими пробелами, поэтому я использую регулярные выражения, чтобы соответствовать 1 или более пробелам и разделить его. Однако между каждым элементом вставляется пробел:

>>> str1="a    b     c      d" # spaces are irregular
>>> str1
'a    b     c      d'
>>> str2=re.split("( )+", str1)
>>> str2
['a', ' ', 'b', ' ', 'c', ' ', 'd'] # 1 space element between!!!

есть ли лучший способ сделать это?

после каждого раскола str2 добавляется в список.

4 90

4 ответа:

С помощью (,), вы захватываете группу, если вы просто удалите их у вас не будет этой проблемы.

>>> str1 = "a    b     c      d"
>>> re.split(" +", str1)
['a', 'b', 'c', 'd']

однако нет необходимости в регулярном выражении,str.split без какого-либо указанного разделителя разделит это пробелом для вас. Это было бы лучшим способом в данном случае.

>>> str1.split()
['a', 'b', 'c', 'd']

если вы действительно хотели регулярное выражение, Вы можете использовать это ('\s' представляет пробелы и понятнее):

>>> re.split("\s+", str1)
['a', 'b', 'c', 'd']

или вы можете найти все без пробелов персонажи

>>> re.findall(r'\S+',str1)
['a', 'b', 'c', 'd']

The str.split метод автоматически удалит все пробелы между элементами:

>>> str1 = "a    b     c      d"
>>> str1.split()
['a', 'b', 'c', 'd']

документы здесь:http://docs.python.org/library/stdtypes.html#str.split

при использовании re.split и шаблон разделения содержит группы захвата, группы сохраняются в выходных данных. Если вы не хотите этого, используйте вместо этого группу без захвата.

его очень просто. Попробуйте это:

str1="a    b     c      d"
splitStr1 = str1.split()
print splitStr1