Вопрос-Ответ

How to correctly sort a string with a number inside? [duplicate]

Как правильно отсортировать строку с числом внутри?

У меня есть список строк, содержащих числа, и я не могу найти хороший способ их сортировки.
Например, я получаю что-то вроде этого:

something1
something12
something17
something2
something25
something29

с помощью sort() метода.

Я знаю, что мне, вероятно, нужно каким-то образом извлечь числа, а затем отсортировать список, но я понятия не имею, как это сделать самым простым способом.

Переведено автоматически
Ответ 1

Возможно, вы ищете человеческую сортировку (также известную как естественная сортировка):

import re

def atoi(text):
return int(text) if text.isdigit() else text

def natural_keys(text):
'''
alist.sort(key=natural_keys) sorts in human order
http://nedbatchelder.com/blog/200712/human_sorting.html
(See Toothy's implementation in the comments)
'''

return [ atoi(c) for c in re.split(r'(\d+)', text) ]

alist=[
"something1",
"something12",
"something17",
"something2",
"something25",
"something29"]

alist.sort(key=natural_keys)
print(alist)

дает

['something1', 'something2', 'something12', 'something17', 'something25', 'something29']

PS. Я изменил свой ответ, чтобы использовать реализацию естественной сортировки от Toothy (опубликованную в комментариях здесь), поскольку это значительно быстрее, чем мой первоначальный ответ.


Если вы хотите отсортировать текст с помощью чисел с плавающей точкой, то вам нужно будет изменить регулярное выражение с того, которое соответствует целым числам (т.Е. (\d+)) на регулярное выражение, которое соответствует числам с плавающей точкой:

import re

def atof(text):
try:
retval = float(text)
except ValueError:
retval = text
return retval

def natural_keys(text):
'''
alist.sort(key=natural_keys) sorts in human order
http://nedbatchelder.com/blog/200712/human_sorting.html
(See Toothy's implementation in the comments)
float regex comes from https://pythonly.ru/a/12643073/190597
'''

return [ atof(c) for c in re.split(r'[+-]?([0-9]+(?:[.][0-9]*)?|[.][0-9]+)', text) ]

alist=[
"something1",
"something2",
"something1.0",
"something1.25",
"something1.105"]

alist.sort(key=natural_keys)
print(alist)

дает

['something1', 'something1.0', 'something1.105', 'something1.25', 'something2']
python regex sorting string