Как сделать список без повторяющихся значений python
Много раз мы имеем дело со списками, имеющими идентичные номера в качестве последовательности, и мы хотим просто сохранить 1-е вхождение элемента и заменить все вхождения другим номером. Давайте обсудим некоторые способы, которыми это может быть сделано.
Способ № 1: Использование списка понимания + enumerate()
Эта задача может быть достигнута с использованием понимания списка для обхода и проверки на наличие элемента, а проверка индекса может быть выполнена с помощью функции перечисления.
test_list = [ 2 , 2 , 3 , 3 , 3 , 3 , 4 , 4 , 5 , 5 , 5 ]
print ( "The original list : " + str (test_list))
res = [ False if (ele in test_list[ :idx]) else ele
for idx, ele in enumerate (test_list)]
print ( "The altered duplicate list is : " + str (res))
The original list : [2, 2, 3, 3, 3, 3, 4, 4, 5, 5, 5]
The altered duplicate list is : [2, False, 3, False, False, False, 4, False, 5, False, False]
Способ № 2: Использование itertools.groupby() + понимание списка
Эта конкретная задача также может быть выполнена с использованием комбинации вышеуказанной функции, с использованием функции groupby для получения групп различных элементов и составления списка для изменения дубликатов.
from itertools import groupby
test_list = [ 2 , 2 , 3 , 3 , 3 , 3 , 4 , 4 , 5 , 5 , 5 ]
print ( "The original list : " + str (test_list))
res = [val for key, grp in groupby(test_list)
for val in Как сделать список без повторяющихся значений python + [ False ] * ( len ( list (grp)) - 1 )]
print ( "The altered duplicate list is : " + str (res))
The original list : [2, 2, 3, 3, 3, 3, 4, 4, 5, 5, 5]
The altered duplicate list is : [2, False, 3, False, False, False, 4, False, 5, False, False]
С оздание списка в Python может понадобиться для хранения в них коллекции объектов. Списки могут хранить объекты всех типов в одном, в отличие от массива в другом языке программирования. Также размер списка доступен к изменению.
Ниже разберёмся, как устроены списки, как с ними работать и приведём 6 примеров из практики.
Что такое список
Список (list) — тип данных, предназначенный для хранения набора или последовательности разных элементов.
Его можно сравнить со списком покупок для магазина: точно так же вносятся элементы, их тоже можно добавлять и корректировать.
Как списки хранятся в памяти?
Базовая C-структура списков в Python (CPython) выглядит следующим образом:
Когда мы создаём список, в памяти под него резервируется объект, состоящий из 3-х частей:
- PyObject_VAR_HEAD — заголовок;
- ob_item — массив указателей на элементы списка;
- allocated — количество выделенной памяти под элементы списка.
Объект списка хранит указатели на объекты, а не на сами объекты
Python размещает элементы списка в памяти, затем размещает указатели на эти элементы. Таким образом, список в Python — это массив указателей.
Базовая работа со списками
Объявление списка
Объявление списка — самый первый и главный этап его создания. Для объявления списка в Python существует несколько способов.
Вариант №1 : Через литерал (выражение, создающее объект):
>>> elements = [1, 3, 5, 6] >>> type(elements) >>> print(elements) [1, 3, 5, 6]
В данном примере мы создали список с заранее известными данными. Если нужен пустой список, в квадратных скобках ничего не указывается — elements = [] .
Вариант №2 : Через функцию list() :
>>> elements = list() >>> type(elements) >>> print(elements) []
В этом примере создается пустой список.
Обращение к элементу списка в Python
Некоторые операции, рассмотренные выше, имеют два варианта выбора элемента: либо выбор непосредственно его по имени, либо обращение по индексу. Индексом называют его порядковый номер, начиная с нуля.
Существует также отрицательный индекс, рассмотрим на примере:
elements = [1, 2, 3, 'word']
Индексы (позиции в списке) соответственно будут: 0, 1, 2, 3 .
Нумерация элементов списка в Python начиная с нуля
Отрицательными индексами называют расположение элементов в списке справа налево, то есть индекс значения "1" будет -4, а отрицательный индекс 'word' будет -1.
>>> elements[-4] 1 >>> elements[-1] 'word'
💡 Отрицательным индексом удобно пользоваться, когда необходимо обратиться к последнему в списке элементу, не высчитывая его номер. Любой конечный элемент будет с индексом, равным -1.
Добавление в список
В списках доступно добавление, изменение, удаление элементов. Рассмотрим каждый способ изменения элементов на примерах.
Для того чтобы добавить новый элемент в список, используется list.append(x) , где list — список, x — нужное значение.
>>> elements = [1, 2, 3, 'word'] >>> elements.append('meow') >>> print(elements) [1, 2, 3, 'word', 'meow']
Для простого примера, рассмотрим создание списка с нуля с помощью метода append() :
>>> elements = [] >>> elements.append(1) >>> elements.append('word') >>> elements.append('meow') >>> print(elements) [1, 'word', 'meow']
Добавление в список на указанную позицию
Немаловажно обратить внимание на метод list.insert(i, x) , где list — список, i — позиция, x — нужное значение.
>>> elements = [1, 2, 4] >>> print(elements) [1, 2, 4] >>> elements.insert(2, 3) >>> print(elements) [1, 2, 3, 4]
Изменение элементов списка
Изменение элементов списка происходит следующим образом: нужно выбрать элемент по индексу (порядковому номеру элемента) и присвоить новое значение.
>>> elements = [2, 4, 6] >>> elements[2] = 8 >>> print(elements) [2, 4, 8]
В примере выше мы заменили 6 на 8.
Не забывайте, что счёт начинается с нуля, и в данном списке цифра 6 это 2-й элемент
Удаление элемента из списка
Для удаление из списка используют инструкцию del list[i] , где list — список, i — индекс (позиция) элемента в списке:
>>> elements = [1, "test", 5, 7] >>> del elements[1] >>> print(elements) [1, 5, 7]
Удалять можно как из текущего списка, так и из вложенных списков:
>>> my_list = ["hello", "world", "!"] >>> elements = [1, my_list, "ok"] >>> del elements[1][2] >>> print(elements) [1, ['hello', 'world'], 'ok']
Можно удалять целыми диапазонами:
Еще один способ удаления из списка — list.remove(x) , где list — список, x — значение, которое нужно удалить:
>>> elements = [2, "test", 4] >>> elements.remove("test") >>> print(elements) [2, 4]
Как проверить наличие элемента в списке
Для того чтобы проверить существование какого-либо элемента в списке, нужно воспользоваться оператором in . Рассмотрим на примере:
>>> elements = ['слон', 'кот', 'лошадь', 'змея', 'рыба'] >>> if 'кот' in elements: print('meow') meow
Объединение списков
Списки в Python можно объединят с помощью оператора + или метода extend . Выглядит это так:
Копирование списка Python
Если вы захотите скопировать список оператором = , вы скопируете не сам список, а только его ссылку.
Для копирования списков можно использовать несколько вариантов:
- elements.copy() — встроенный метод copy (доступен с Python 3.3);
- list(elements) — через встроенную функцию list() ;
- copy.copy(elements) — функция copy() из пакета copy;
- elements[:] — через создание среза (устаревший синтаксис).
Рассмотрим на примере каждый из этих способов:
Важно : copy.copy(a) делает поверхностное копирование. Объекты внутри списка будут скопированы как ссылки на них (как в случае с оператором = ). Если необходимо рекурсивно копировать всех элементов в списке, используйте copy.deepcopy(a)
Цикл по списку
Для перебора списков в Python есть два цикла: for и while .
elements = [1, 2, 3, "meow"] for el in elements: print(el)
Попробуем построить цикл while . Он выполняется, когда есть какое-либо определённое условие:
elements = [1, 2, 3, "meow"] elements_len = len(elements) i = 0 while i
Из примеров выше можем сделать вывод, что конструкция for выглядит заметно компактнее, чем while .
Методы списков
- list.append(x) — позволяет добавлять элемент в конец списка;
- list1.extend(list2) — предназначен для сложения списков;
- list.insert(i, x) — служит для добавления элемента на указанную позицию( i — позиция, x — элемент);
- list.remove(x) — удаляет элемент из списка (только первое вхождение);
- list.clear() — предназначен для удаления всех элементов (после этой операции список становится пустым []);
- list.copy() — служит для копирования списков.
- list.count(x) — посчитает количество элементов x в списке;
- list.index(x) — вернет позицию первого найденного элемента x в списке;
- list.pop(i) — удалит элемент из позиции i ;
- list.reverse() — меняет порядок элементов в списке на противоположный;
- list.sort() — сортирует список.
Пример использования методов:
Вложенные списки
Список может содержать объекты разных типов: числовые, буквенные, а также списки. Список списков выглядит следующим образом:
>>> elements = [1, 2, [0.1, 0.2, 0.3]]
Для обращения к элементу вложенного списка нужно использовать два индекса: первый указывает на индекс главного списка, второй — индекс элемента во вложенном списке. Вот пример:
>>> elements = [["яблоки", 50], ["апельсины", 190], ["груши", 100]] >>> print(elements[0]) ['яблоки', 50] >>> print(elements[1][0]) апельсины
Срезы
Срезы (slices) — это подмножества элементов списка. Срезу нужны, когда необходимо извлечь часть списка из полного списка.
У них есть свой собственный синтаксис. Записывается срез так же, как обращение к элементу, используя индекс. Пример:
В этом случае берётся срез от номера start (включительно) до stop (не включая его), а step — это шаг. По умолчанию start и stop равны 0, step равен 1.
Генераторы списков
Генератором списка называется способ построения списка с применением выражения к каждому элементу, входящему в последовательность. Есть схожесть генератора списка и цикла for . На этом примере мы рассмотрим простейший генератор списков:
>>> c = [c * 3 for c in 'list'] >>> print(c) ['lll', 'iii', 'sss', 'ttt']
Таким образом мы получили отдельно взятые утроенные буквы слова, введённого в кавычки. Есть множество вариантов применения генератора списков.
Пример генератора списка:
>>> nums = [i for i in range(1, 15)] >>> print(nums) [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14]
>>> c = [c + d for c in 'list' if c != 'i' for d in 'spam' if d != 'a'] >>> print(c) ['ls', 'lp', 'lm', 'ss', 'sp', 'sm', 'ts', 'tp', 'tm']
Это усложнённая конструкция генератора списков, в которой мы сделали все возможные наборы сочетаний букв из введённых слов. Буквы-исключения видны по циклу, где стоит знак != для одной переменной и другой.
Best Practices
Последние абзацы статьи будут посвящены лучшим решениям практических задач, с которыми так или иначе сталкивается Python-разработчик.
Как получить список в обратном порядке
Изменить порядок размещения элементов в списке помогает функция list.reverse() :
>>> elements = [1, 2, 3, 4, 5, 6] >>> elements.reverse() >>> print(elements) [6, 5, 4, 3, 2, 1]
Как перевести список в другой формат?
Иногда требуется перевести список в строку, в словарь или в JSON. Для этого нужно будет вывести список без скобок.
Перевод списка в строку осуществляется с помощью функции join(). На примере это выглядит так:
>>> fruits = ["яблоко", "груша", "ананас"] >>> print(', '.join(fruits)) яблоко, груша, ананас
В данном случае в качестве разделителя используется запятая.
Словарь в Python — это такая же встроенная структура данных, наряду со списком. Преобразование списка в словарь — задача тоже несложная. Для этого потребуется воспользоваться функцией dict() . Вот пример преобразования:
>>> elements = [['1', 'a'],['2', 'b'],['3', 'c']] >>> my_dict = dict(elements) >>> print(my_dict)
JSON — это JavaScript Object Notation. В Python находится встроенный модуль json для кодирования и декодирования данных JSON. С применением метода json.dumps(x) можно запросто преобразовать список в строку JSON.
>>> import json >>> json.dumps(['word', 'eye', 'ear']) '["word", "eye", "ear"]'
Как узнать индекс элемента в списке?
Узнать позицию элемента в последовательности списка бывает необходимым, когда элементов много, вручную их не сосчитать, и нужно обращение по индексу. Для того чтобы узнать индекс элемента, используют функцию list.index(x) .
>>> elements = [1, 3, 6, 9, 55] >>> print(elements.index(9)) 3
В качестве аргумента передаем значение, а на выходе получаем его индекс.
Как посчитать количество уникальных элементов в списке?
Самый простой способ — приведение списка к set (множеству). После этого останутся только уникальные элементы, которые мы посчитаем функцией len() :
>>> words = ["one", "two", "one", "three", "one"] >>> len(set(words)) 3
Как проверить список на пустоту?
Как создать список числовых элементов с шагом
Создание списка числовых элементов с шагом может понадобиться не так и часто, но мы рассмотрим пример построения такого списка.
Шагом называется переход от одного элемента к другому. Если шаг отрицательный, произойдёт реверс массива, то есть отсчёт пойдёт справа налево. Вот так выглядит список с шагом.
>>> elements = [1, 2, 3, 4, 5, 8, 9, 10, 11, 14, 20] >>> print(elements[0:11:2]) [1, 3, 5, 9, 11, 20]
Еще один вариант — воспользоваться генератором списков:
При разработке на языке Python, списки встречаются довольно часто. Знание основ работы со списками поможет быстро и качественно писать программный код 😉.
Для работы с наборами данных Python предоставляет такие встроенные типы как списки, кортежи и словари.
Список (list) представляет тип данных, который хранит набор или последовательность элементов. Для создания списка в квадратных скобках ([]) через запятую перечисляются все его элементы. Во многих языках программирования есть аналогичная структура данных, которая называется массив. Например, определим список чисел:
Также для создания списка можно использовать конструктор list() :
Оба этих определения списка аналогичны - они создают пустой список.
Конструктор list для создания списока может принимать другой список:
Для обращения к элементам списка надо использовать индексы, которые представляют номер элемента в списка. Индексы начинаются с нуля. То есть второй элемент будет иметь индекс 1. Для обращения к элементам с конца можно использовать отрицательные индексы, начиная с -1. То есть у последнего элемента будет индекс -1, у предпоследнего - -2 и так далее.
Если необходимо создать список, в котором повторяется одно и то же значение несколько раз, то можно использовать символ звездочки *. Например, определим список из шести пятерок:
Кроме того, если нам необходим последовательный список чисел, то для его создания удобно использовать функцию range , которая имеет три формы:
range(end) : создается набор чисел от 0 до числа end
range(start, end) : создается набор чисел от числа start до числа end
range(start, end, step) : создается набор чисел от числа start до числа end с шагом step
Например, следующие два определения списка будут аналогичны, но за счет функции range мы сокращаем объем кода:
Список необязательно должен содержать только однотипные объекты. Мы можем поместить в один и тот же список одновременно строки, числа, объекты других типов данных:
Перебор элементов
Для перебора элементов можно использовать как цикл for, так и цикл while.
Перебор с помощью цикла for:
Здесь вместо функции range мы сразу можем подставить имеющийся список companies.
Перебор с помощью цикла while:
Для перебора с помощью функции len() получаем длину списка. С помощью счетчика i выводит по элементу, пока значение счетчика не станет равно длине списка.
Сравнение списков
Два списка считаются равными, если они содержат один и тот же набор элементов:
В данном случае оба списка будут равны.
Методы и функции по работе со списками
Для управления элементами списки имеют целый ряд методов. Некоторые из них:
append(item) : добавляет элемент item в конец списка
insert(index, item) : добавляет элемент item в список по индексу index
remove(item) : удаляет элемент item. Удаляется только первое вхождение элемента. Если элемент не найден, генерирует исключение ValueError
clear() : удаление всех элементов из списка
index(item) : возвращает индекс элемента item. Если элемент не найден, генерирует исключение ValueError
pop([index]) : удаляет и возвращает элемент по индексу index. Если индекс не передан, то просто удаляет последний элемент.
count(item) : возвращает количество вхождений элемента item в список
sort(Как сделать список без повторяющихся значений python) : сортирует элементы. По умолчанию сортирует по возрастанию. Но с помощью параметра key мы можем передать функцию сортировки.
reverse() : расставляет все элементы в списке в обратном порядке
Кроме того, Python предоставляет ряд встроенных функций для работы со списками:
len(list) : возвращает длину списка
sorted(list, Как сделать список без повторяющихся значений python) : возвращает отсортированный список
min(list) : возвращает наименьший элемент списка
max(list) : возвращает наибольший элемент списка
Добавление и удаление элементов
Для добавления элемента применяются методы append() и insert , а для удаления - методы remove() , pop() и clear() .
Проверка наличия элемента
Если определенный элемент не найден, то методы remove и index генерируют исключение. Чтобы избежать подобной ситуации, перед операцией с элементом можно проверять его наличие с помощью ключевого слова in :
Выражение item in companies возвращает True, если элемент item имеется в списке companies. Поэтому конструкция if item in companies может выполнить последующий блок инструкций в зависимости от наличия элемента в списке.
Подсчет вхождений
Если необходимо узнать, сколько раз в списке присутствует тот или иной элемент, то можно применить метод count() :
Сортировка
Для сортировки по возрастанию применяется метод sort() :
Если необходимо отсортировать данные в обратном порядке, то мы можем после сортировки применить метод reverse() :
При сортировке фактически сравниваются два объекта, и который из них "меньше", ставится перед тем, который "больше". Понятия "больше" и "меньше" довольно условны. И если для чисел все просто - числа расставляются в порядке возрастания, то для строк и других объектов ситуация сложнее. В частности, строки оцениваются по первым символам. Если первые символы равны, оцениваются вторые символы и так далее. При чем цифровой символ считается "меньше", чем алфавитный заглавный символ, а заглавный символ считается меньше, чем строчный. Подробнее про сравнение строк описывалось в статье Операции со строками.
Таким образом, если в списке сочетаются строки с верхним и нижним регистром, то мы можем получить не совсем корректные результаты, так как для нас строка "bob" должна стоять до строки "Tom". И чтобы изменить стандартное поведение сортировки, мы можем передать в метод sort() в качестве параметра функцию:
Кроме метода sort мы можем использовать встроенную функцию sorted , которая имеет две формы:
sorted(list) : сортирует список list
sorted(list, key) : сортирует список list, применяя к элементам функцию key
При использовании этой функции следует учитывать, что эта функция не изменяет сортируемый список, а все отсортированные элементы она помещает в новый список, который возвращается в качестве результата.
Минимальное и максимальное значения
Встроенный функции Python min() и max() позволяют найти минимальное и максимальное значения соответственно:
Копирование списков
При копировании списков следует учитывать, что списки представляют изменяемый (mutable) тип, поэтому если обе переменных будут указывать на один и тот же список, то изменение одной переменной, затронет и другую переменную:
Это так называемое "поверхностное копирование" (shallow copy). И, как правило, такое поведение нежелательное. И чтобы происходило копирование элементов, но при этом переменные указывали на разные списки, необходимо выполнить глубокое копирование (deep copy). Для этого можно использовать метод deepcopy() , который определен во встроенном модуле copy :
Копирование части списка
Если необходимо скопировать не весь список, а только его какую-то определенную часть, то мы можем применять специальный синтаксис. который может принимать следующие формы:
list[:end] : через параметр end передается индекс элемента, до которого нужно копировать список
list[start:end] : параметр start указывает на индекс элемента, начиная с которого надо скопировать элементы
list[start:end:step] : параметр step указывает на шаг, через который будут копироваться элементы из списка. По умолчанию этот параметр равен 1.
Соединение списков
Для объединения списков применяется операция сложения (+):
Списки списков
Списки кроме стандартных данных типа строк, чисел, также могут содержать другие списки. Подобные списки можно ассоциировать с таблицами, где вложенные списки выполняют роль строк. Например:
Чтобы обратиться к элементу вложенного списка, необходимо использовать пару индексов: users[0][1] - обращение ко второму элементу первого вложенного списка.
Добавление, удаление и исменение общего списка, а также вложенных списков аналогично тому, как это делается с обычными (одномерными) списками:
Список Python создается путем помещения элементов в квадратные скобки, разделенных запятой.
В списке можно хранить разные типы элементов.
У нас также могут быть вложенные списки.
Мы можем создать пустой, не имея элементов внутри квадратных скобок.
Доступ к элементам
Мы можем получить доступ к элементам списка с помощью index. Значение индекса начинается с 0.
Если индекс не входит в диапазон, возникает IndexError.
Мы также можем передать отрицательное значение индекса. В этом случае элемент возвращается от конца к началу. Допустимый диапазон значений индекса — от -1 до — (длина).
Это полезно, когда нам нужен определенный элемент быстро, например, последний элемент, второй последний элемент и т. д.
Доступ к элементам вложенного списка
Мы можем получить доступ к элементам вложенного списка с помощью вложенных индексов. Давайте разберемся в этом на нескольких простых примерах.
Вложенный элемент может быть любой другой последовательностью, которая также поддерживает доступ на основе индекса. Например, результат будет таким же для вложенного списка [1, (2, 3), (4, 5, 6), 7].
Мы также можем использовать отрицательные индексы с вложенными списками. Приведенный выше фрагмент кода можно переписать следующим образом.
Обновление
Мы можем использовать оператор присваивания, чтобы изменить значение списка по указанному индексу.
Итерация по списку
Мы можем использовать цикл for для перебора элементов списка.
Если вы хотите перебирать элементы в обратном порядке, вы можете использовать встроенную функцию reversed().
Как проверить существует ли элемент?
Удаление
Нарезка
Мы можем использовать нарезку, чтобы создать новый список из элементов. Это полезно при создании нового из исходного.
Техника нарезки содержит два индекса, разделенных двоеточием. Левый индекс включен, а правый индекс исключен из результата.
Объединение (оператор +)
Мы можем объединить несколько списков элементов для создания нового с помощью оператора +.
Повторяющиеся элементы (оператор *)
Python List также поддерживает оператор * для создания нового списка с элементами, повторяющимися указанное количество раз.
Как найти длину списка Python?
Мы можем получить длину или размер списка с помощью встроенной функции len().
Встроенный конструктор list()
Мы можем создать список из итерируемого, используя встроенный конструктор list(). Эта функция принимает итеративный аргумент, поэтому мы можем передавать String, Tuple и т. д.
Функции
Давайте посмотрим на некоторые функции, представленные в объекте списка.
1. Append (объект)
Эта функция используется для добавления элемента в конец.
2. index(объект, начало, конец)
Эта функция возвращает первый индекс объекта. Если объект не найден, возникает ValueError .
Начало и конец являются необязательными аргументами, чтобы указать индекс, с которого следует начать и закончить поиск объекта.
3. count (объект)
Эта функция возвращает количество вхождений объекта.
4. reverse()
Эта функция меняет местами элементы.
5. clear()
Эта функция удаляет все элементы.
6. copy()
Эта функция возвращает копию.
7. extend(итерация)
Эта функция добавляет все элементы из итерируемого в конец этого списка. Некоторые из известных итераций в Python — это Tuple, List и String.
8. insert (индекс, объект)
Этот метод вставляет объект непосредственно перед указанным индексом.
Если значение индекса больше, чем длина списка, объект добавляется в конец.
Если значение индекса отрицательное и не входит в диапазон, то объект добавляется в начало.
9. pop (индекс)
Эта функция удаляет элемент по заданному индексу и возвращает его. Если индекс не указан, последний элемент удаляется и возвращается.
Эта функция вызывает IndexError, если список пуст или индекс выходит за пределы допустимого диапазона.
10. remove(объект)
Эта функция удаляет первое вхождение данного объекта. Если объект не найден, возникает ошибка ValueError.
11. sort(ключ, реверс)
Эта функция используется для сортировки элементов. Элементы списка должны реализовывать функцию __lt __ (self, other).
Мы можем указать имя функции как ключ, который будет использоваться для сортировки. Таким образом, мы можем определить нашу собственную пользовательскую функцию, которая будет использоваться для сортировки элементов.
reverse принимает логическое значение. Если True, то список сортируется в обратном порядке. Значение по умолчанию Reverse — False, и элементы сортируются в естественном порядке.
Читайте также: