Sorting a Python list by two fields [duplicate]

Сортировка списка Python по двум полям

У меня есть следующий список, созданный из отсортированного csv

list1 = sorted(csv1, key=operator.itemgetter(1))

На самом деле я хотел бы отсортировать список по двум критериям: сначала по значению в поле 1, а затем по значению в поле 2. Как мне это сделать?

Переведено автоматически

Ответ 1

При использовании лямбда-функций ничего импортировать не нужно.
Следующая сортировка list выполняется по первому элементу, затем по второму элементу. Вы также можете выполнить сортировку, например, по возрастанию одного поля и по убыванию другого.:

sorted_list = sorted(list, key=lambda x: (x[0], -x[1]))

Ответ 2

вот так:

import operator
list1 = sorted(csv1, key=operator.itemgetter(1, 2))

Ответ 3

В Python существует стабильная сортировка, поэтому при условии, что производительность не является проблемой, самый простой способ - отсортировать его по полю 2, а затем снова отсортировать по полю 1.

Это даст вам желаемый результат, единственная загвоздка в том, что если это большой список (или вы хотите сортировать его часто), то повторный вызов sort может оказаться неприемлемыми накладными расходами.

list1 = sorted(csv1, key=operator.itemgetter(2))
list1 = sorted(list1, key=operator.itemgetter(1))

Выполнение этого способа также упрощает обработку ситуации, когда вы хотите, чтобы некоторые столбцы были отсортированы в обратном порядке, просто включите параметр 'reverse = True', когда это необходимо.

В противном случае вы можете передать несколько параметров в itemgetter или вручную создать кортеж. Вероятно, это будет быстрее, но проблема в том, что это плохо обобщает, если некоторые столбцы требуется отсортировать в обратном порядке (числовые столбцы все еще можно изменить, отрицая их, но это останавливает стабильность сортировки).

Итак, если вам не нужны столбцы с обратной сортировкой, перейдите по нескольким аргументам в itemgetter, если возможно, и столбцы не числовые, или вы хотите сохранить стабильность сортировки, перейдите к нескольким последовательным сортировкам.

Редактировать: Для комментаторов, у которых возникли проблемы с пониманием того, как это отвечает на исходный вопрос, вот пример, который точно показывает, как стабильный характер сортировки гарантирует, что мы можем выполнять отдельные сортировки по каждому ключу и в конечном итоге получать данные, отсортированные по нескольким критериям:

DATA = [
    ('Jones', 'Jane', 58),
    ('Smith', 'Anne', 30),
    ('Jones', 'Fred', 30),
    ('Smith', 'John', 60),
    ('Smith', 'Fred', 30),
    ('Jones', 'Anne', 30),
    ('Smith', 'Jane', 58),
    ('Smith', 'Twin2', 3),
    ('Jones', 'John', 60),
    ('Smith', 'Twin1', 3),
    ('Jones', 'Twin1', 3),
    ('Jones', 'Twin2', 3)
]

# Sort by Surname, Age DESCENDING, Firstname
print("Initial data in random order")
for d in DATA:
    print("{:10s} {:10s} {}".format(*d))

print('''
First we sort by first name, after this pass all
Twin1 come before Twin2 and Anne comes before Fred''')
DATA.sort(key=lambda row: row[1])

for d in DATA:
    print("{:10s} {:10s} {}".format(*d))

print('''
Second pass: sort by age in descending order.
Note that after this pass rows are sorted by age but
Twin1/Twin2 and Anne/Fred pairs are still in correct
firstname order.''')
DATA.sort(key=lambda row: row[2], reverse=True)
for d in DATA:
    print("{:10s} {:10s} {}".format(*d))

print('''
Final pass sorts the Jones from the Smiths.
Within each family members are sorted by age but equal
age members are sorted by first name.
''')
DATA.sort(key=lambda row: row[0])
for d in DATA:
    print("{:10s} {:10s} {}".format(*d))

Это выполнимый пример, но для экономии времени людей, выполняющих его, вывод выглядит следующим образом:

Initial data in random order
Jones      Jane       58
Smith      Anne       30
Jones      Fred       30
Smith      John       60
Smith      Fred       30
Jones      Anne       30
Smith      Jane       58
Smith      Twin2      3
Jones      John       60
Smith      Twin1      3
Jones      Twin1      3
Jones      Twin2      3

First we sort by first name, after this pass all
Twin1 come before Twin2 and Anne comes before Fred
Smith      Anne       30
Jones      Anne       30
Jones      Fred       30
Smith      Fred       30
Jones      Jane       58
Smith      Jane       58
Smith      John       60
Jones      John       60
Smith      Twin1      3
Jones      Twin1      3
Smith      Twin2      3
Jones      Twin2      3

Second pass: sort by age in descending order.
Note that after this pass rows are sorted by age but
Twin1/Twin2 and Anne/Fred pairs are still in correct
firstname order.
Smith      John       60
Jones      John       60
Jones      Jane       58
Smith      Jane       58
Smith      Anne       30
Jones      Anne       30
Jones      Fred       30
Smith      Fred       30
Smith      Twin1      3
Jones      Twin1      3
Smith      Twin2      3
Jones      Twin2      3

Final pass sorts the Jones from the Smiths.
Within each family members are sorted by age but equal
age members are sorted by first name.

Jones      John       60
Jones      Jane       58
Jones      Anne       30
Jones      Fred       30
Jones      Twin1      3
Jones      Twin2      3
Smith      John       60
Smith      Jane       58
Smith      Anne       30
Smith      Fred       30
Smith      Twin1      3
Smith      Twin2      3

Обратите особое внимание на то, что на втором шаге параметр reverse=True сохраняет порядок имен, тогда как простая сортировка с последующим переворачиванием списка приведет к потере желаемого порядка для третьего ключа сортировки.

Ответ 4

list1 = sorted(csv1, key=lambda x: (x[1], x[2]) )