Коллекции в Python. Часть II

24-07-2024 Около 6600 слов - просмотров

/notes/collections2/feature.png

Конспект посвящён модулю collections и его составляющим, а именно именованному кортежу, специфическим типам словарей и т.п. Вторая часть конспектов про типы данных в Python

Модуль collections

Python содержит встроенный модуль collections, который содержит специализированные типы коллекций, альтернативных традиционным list, tuple, dict:

namedtuple
defaultdict
OrderedDict
Counter
ChainMap
и прочие

Начнём с разбора именованных кортежей.

Namedtuple

Для использования: from collections import namedtuple

Именованные кортежи (тип namedtuple) — это подтип обычных кортежей в Python. У них те же функции, что и у обычных, но их значения можно получать как с помощью индекса (например, [0]), так и с помощью имени через точку (например, .name). Их основным назначением является улучшение читаемости кода.

Опишем точку на плоскости, имеющую две координаты x и y с помощью именованного кортежа:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
from collections import namedtuple

Point = namedtuple('Point', ['x', 'y'])     # создаём подкласс кортежа Point (именованный кортеж)

point = Point(3, 7)                         # создаём экземпляр Point

print(point)
print(point.x, point.y)
print(point[0], point[1])
print(type(point))

1
2
3
4
5
# Вывод:
Point(x=3, y=7)
3 7
3 7
<class '__main__.Point'>

Как и обычный, именованный кортеж может содержать изменяемые значения, но стоит помнить, что такие кортежи не будут хэшируемы:

1
2
3
4
5
6
7
8
9
from collections import namedtuple

Person = namedtuple('Person', ['name', 'children'])

sveta = Person('Sveta Ivanova', ['Larisa', 'Keksik'])
print(sveta)

sveta.children.append('Romka')
print(sveta)

1
2
3
# Вывод:
Person(name='Sveta Ivanova', children=['Larisa', 'Keksik'])
Person(name='Sveta Ivanova', children=['Larisa', 'Keksik', 'Romka'])

Опасность

Очевидно, что подобный код sveta.children = ['Larisa', 'Keksik', 'Romka'] привёл бы к ошибке

Создавать кортежи можно также с помощью именованных аргументов:

1
2
3
4
5
6
7
8
from collections import namedtuple

Point = namedtuple('Point', ['x', 'y'])
point1 = Point(2, 4)                     # позиционные аргументы
point2 = Point(y=10, x=3)                # именованные аргументы

print(point1)
print(point2)

1
2
3
# Вывод:
Point(x=2, y=4)
Point(x=3, y=10)

При работе с именованными кортежами можно пользоваться срезами (результатом будет обычный кортеж)

Функция `namedtuple()`

Эта фабричная функция (понятие из ООП) позволяет создавать подклассы кортежа с именованными полями (классы именованных кортежей).

Сигнатура: namedtuple(typename, field_names, *, rename=False, defaults=None, module=None). Разберёмся с каждым параметров по-отдельности.

`typename` и `field_names`

Параметр typename отвечает за имя создаваемого класса namedtuple (который и возвращает функция namedtuple()), а параметр fieldnames за название полей, которые мы будем использовать, чтобы получить доступ к значениям определённого экземпляра именованного кортежа. В качестве параметра field_names можно использовать:

Список.

1
2
3
4
5
from collections import namedtuple

Point = namedtuple('Point', ['x', 'y'])  # передаем список
point =  Point(2, 4)
print(point)                             # выводит Point(x=2, y=4)

Кортеж.

1
2
3
4
5
from collections import namedtuple

Point = namedtuple('Point', ('x', 'y'))  # передаем кортеж
point =  Point(2, 4)
print(point)                             # выводит Point(x=2, y=4)

Словарь. В этом случае для полей именованного кортежа используются ключи словаря, поэтому в качестве значений можно указать, все что угодно.

1
2
3
4
5
from collections import namedtuple

Point = namedtuple('Point', {'x': 0, 'y': 69})  # передаем словарь
point =  Point(2, 4)
print(point)                                    # выводит Point(x=2, y=4)

Строка. При создании именованного кортежа с помощью строки мы указываем поля либо через символ пробела, либо разделяя их символом ,.

1
2
3
4
5
from collections import namedtuple

Point = namedtuple('Point', 'x y')  # передаем строку (можно 'x,y')
point =  Point(2, 4)
print(point)                        # выводит Point(x=2, y=4)

Множество. Можно создать именованный кортеж с помощью множества, но делать это не рекомендуется, так как множество — неупорядоченный набор данных, поэтому поля могут перемешаться.

1
2
3
4
5
from collections import namedtuple

Point = namedtuple('Point', {'x', 'y'})  # в качестве второго параметра передаем множество
point =  Point(2, 4)
print(point)                             # выводит Point(x=2, y=4) или Point(y=2, x=4)

Совет

В качестве параметра field_names можно передавать любой итерируемый объект, например, результат вызова функций map() и filter()

В качестве названия полей для именованных кортежей мы можем использовать любое корректное название имени переменной, за исключением:

имён, начинающихся с символа _;
ключевых слов языка Python (if, with, else, class, …).

`rename`

При rename=True названия полей, переданных в field_names, которые содержат ключевые слова Python, переименовываются в соответствии с их порядковыми номерами (начиная с нуля), перед которыми ставится символ _. Посмотрим на пример:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
from collections import namedtuple

headers = ('name', 'surname', 'age', 'class', 'with', 'color', 'name', 'class', 'if')

Student = namedtuple('Student', headers, rename=True)

stud = Student('Иван', 'Бережной', 19, 2, 'me', 'green', 'Cake', '2A', 'else')
print(stud)

# Вывод: Student(name='Иван', surname='Бережной', age=19, _3=2, _4='me', color='green', _6='Cake', _7='2A', _8='else')

`defaults`

Параметр defaults (работает в Python 3.7+) используется для того, чтобы установить значения по умолчанию для полей именованного кортежа. Можно указать значение по умолчанию только для некоторых полей, при этом defaults присваивает значения по умолчанию с хвоста.

1
2
3
4
5
6
7
8
from collections import namedtuple

Point = namedtuple('Point', ['x', 'y'], defaults=(0, 0))
point = Point()      # используем значения по умолчанию

print(point)

# Вывод: Point(x=0, y=0)

`module`

Посмотрим на вывод следующего кода:

1
2
3
4
5
6
7
from collections import namedtuple

Point = namedtuple('Point', ['x', 'y'])
point = Point(1, 2)
print(type(point))

# Вывод: <class '__main__.Point'>

Если мы укажем допустимое имя модуля для этого аргумента, тогда атрибуту .__ module__ результирующего именованного кортежа будет присвоено это значение:

1
2
3
4
5
6
7
from collections import namedtuple

Point = namedtuple('Point', ['x', 'y'], module='custom')
point = Point(1, 2)
print(point.__module__)

# Вывод: custom

Инфо

Параметр module был добавлен в Python 3.6 для того, чтобы появилась возможность сериализовать/десериализовать именованные кортежи с помощью модуля pickle в разных реализациях Python (IronPython, Jython и т.д.)

Распаковка именованного кортежа

Именованный кортеж распаковывается также, как и обычный:

1
2
3
4
5
6
7
8
9
from collections import namedtuple

Person = namedtuple('Person', ['name', 'age', 'height'])

ivan = Person('Иван', 19, 179)

print(*ivan)

# Вывод: Иван 19 179

Атрибуты `_fields` и `_field_defaults`

Именованные кортежи имеют два дополнительных атрибута: _fields и _field_defaults. Первый содержит кортеж строк, в котором перечислены имена полей. Второй атрибут содержит словарь, который сопоставляет имена полей с соответствующими значениями по умолчанию, если таковые имеются.

1
2
3
4
5
6
7
8
9
from collections import namedtuple

Person = namedtuple('Person', ['name', 'age', 'height'])

ivan = Person('Иван', 19, 179)

print(ivan)
print(ivan._fields)
print(Person._fields)

1
2
3
4
# Вывод:
Person(name='Иван', age=19, height=179)
('name', 'age', 'height')
('name', 'age', 'height')

Как видно из примера выше, можно обращаться к атрибуту _fields как через переменную (ivan), так и через сам тип именованного кортежа (Person).

С помощью атрибута _fields можно создавать новые именованные кортежи на основании уже существующих. В следующем примере создаётся новый именованный кортеж с именем ExtendedPerson, который расширяет старый Person новым полем weight:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
from collections import namedtuple

Person = namedtuple('Person', ['name', 'age', 'height'])

ExtendedPerson = namedtuple('ExtendedPerson', [*Person._fields, 'weight'])  # распаковка полей старого кортежа

ivan = ExtendedPerson('Иван', 19, 179, 63)

print(ivan)
print(ExtendedPerson._fields)

1
2
3
# Вывод:
ExtendedPerson(name='Иван', age=19, height=179, weight=63)
('name', 'age', 'height', 'weight')

Мы также можем использовать атрибут _fields для перебора полей и их значений с помощью встроенной функции zip():

1
2
3
4
5
6
7
8
from collections import namedtuple

Person = namedtuple('Person', ['name', 'age', 'height'])

ivan = Person('Иван', 19, 179)

for field, value in zip(Person._fields, ivan):
    print(field, '->', value)

1
2
3
4
# Вывод:
name -> Иван
age -> 19
height -> 179

С помощью атрибута _field_defaults мы можем выяснить, какие поля именованного кортежа имеют значения по умолчанию:

1
2
3
4
5
6
7
8
9
from collections import namedtuple

Person = namedtuple('Person', ['name', 'age', 'height', 'country'], defaults=['Russia'])

ivan = Person('Иван', 19, 179)

print(ivan)
print(ivan._field_defaults)
print(Person._field_defaults)

1
2
3
4
# Вывод:
Person(name='Иван', age=19, height=179, country='Russia')
{'country': 'Russia'}
{'country': 'Russia'}

Инфо

Если именованный кортеж не предоставляет значений по умолчанию, тогда атрибут _field_defaults содержит пустой словарь.

Методы `_make()`, `_replace()`, `_asdict()`

_make() — метод класса (не экземпляра), работающий как альтернативный конструктор класса и возвращающий новый экземпляр именованного кортежа typename.

1
2
3
4
5
6
7
8
9
from collections import namedtuple

Person = namedtuple('Person', ['name', 'age', 'height'])

ivan = Person._make(['Ivan', 19, 179])

print(ivan)

# Вывод: Person(name='Ivan', age=19, height=179)

_asdict() преобразует именованные кортежи в словари, в которых имена полей используются в качестве ключей. Ключи результирующего словаря находятся в том же порядке, что и поля в исходном именованном кортеже.

1
2
3
4
5
6
7
8
9
from collections import namedtuple

Person = namedtuple('Person', ['name', 'age', 'height'])

ivan = Person._make(['Иван', 19, 179])

print(ivan._asdict())

# Вывод: {'name': 'Иван', 'age': 19, 'height': 179}

_replace() создаёт новый именованный кортеж на основе уже существующего с заменой некоторых значений. Потребность в данном методе вызвана тем, что именованные кортежи являются неизменяемыми.

1
2
3
4
5
6
7
8
9
from collections import namedtuple

Person = namedtuple('Person', ['name', 'age', 'height', 'country'])

ivan1 = Person('Иван', 19, 179, 'Russia')
ivan2 = ivan1._replace(age=20, country='Germany')

print(ivan1)
print(ivan2)

1
2
3
# Вывод:
Person(name='Иван', age=19, height=179, country='Russia')
Person(name='Иван', age=20, height=179, country='Germany')

Схожесть со словарями

Функционал именованных кортежей можно полностью заменить функционалом словарей, тогда зачем вообще нужен этот namedtuple? Если коротко, то он более быстрый и занимает меньше места в памяти. Сравним эти показатели с помощью нехитрых программ.

Начнём с потребления памяти:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
from collections import namedtuple
from pympler import asizeof

Person = namedtuple('Person', ['name', 'age', 'height'])

ivan = Person('Иван', 19, 179)
ivan_dct = {'name': 'Иван', 'age': 19, 'height': 179}

print(f'Именованный кортеж: {asizeof.asizeof(ivan)} байт')
print(f'Словарь: {asizeof.asizeof(ivan_dct)} байт')

1
2
3
# Вывод:
Именованный кортеж: 112 байт
Словарь: 304 байт

Теперь посмотрим на производительность:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
from collections import namedtuple
from time import perf_counter

def average_time(structure, test_func):
    time_measurements = []
    for _ in range(1_000_000):
        start = perf_counter()
        test_func(structure)
        end = perf_counter()
        time_measurements.append(end - start)
    return sum(time_measurements) / len(time_measurements) * int(10**9)

def time_dict(dictionary):
    'name' in dictionary
    'missing_key' in dictionary
    28 in dictionary.values()
    'missing_value' in dictionary.values()
    dictionary['age']

def time_namedtuple(named_tuple):
    'name' in named_tuple._fields
    'missing_field' in named_tuple._fields
    28 in named_tuple
    'missing_value' in named_tuple
    named_tuple.age

Person = namedtuple('Person', ['name', 'age', 'height'])

ivan = Person('Иван', 19, 179)
ivan_dct = {'name': 'Иван', 'age': 19, 'height': 179}

print(f'Именованный кортеж: {average_time(ivan, time_namedtuple)} наносекунд')
print(f'Словарь: {average_time(ivan_dct , time_dict)} наносекунд')

1
2
3
# Вывод:
Именованный кортеж: 382 наносекунд
Словарь: 508 наносекунд

Defaultdict

Для использования: from collections import defaultdict

Основная проблема при работе с обычными словарями — попытка получить доступ к несуществующему ключу, которая вызывает ошибку KeyError. С этим можно справиться через setdefault(), get() или проверкой наличия ключа в словаря (try/except или оператор in), а можно воспользоваться типом данных defaultdict.

Тип defaultdict ведет себя почти так же, как обычный словарь dict, но если мы попытаемся получить доступ (или изменить значение) по несуществующему ключу, то defaultdict автоматически создаст ключ и сгенерирует для него значение по умолчанию. Такое поведение делает этот тип данных удобным вариантом обработки недостающих ключей в словарях.

defaultdict является является наследником класса dict, а значит обладает всеми его методами.

Функция defaultdict() принимает в качестве аргумента тип элемента по умолчанию. Таким образом, для ключей, к которым происходит обращение, словарь defaultdict поставит в соответствие дефолтный элемент данного типа:

int – число 0;
float – число 0.0;
bool – значение False;
str – пустая строка '';
list – пустой список [];
tuple – пустой кортеж ();
set – пустое множество set();
dict – пустой словарь {}.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
from collections import defaultdict

info = defaultdict(int)       # создаем словарь со значением по умолчанию 0

info['name'] = 'Ivan'
info['age'] = 19
info['job'] = 'Darkstore'

print(info['salary'])
print(info)

1
2
3
# Вывод:
0
defaultdict(<class 'int'>, {'name': 'Ivan', 'age': 19, 'job': 'Darkstore', 'salary': 0})

Помимо первого аргумента — типа элемента по умолчанию — мы можем передать второй аргумент: словарь, на основании которого будет создан defaultdict.

1
2
3
4
5
6
7
from collections import defaultdict

info = defaultdict(int, {'name': 'Ivan', 'age': 19, 'job': 'Darkstore'})

print(info['name'])
print(info['salary'])
print(info)

1
2
3
4
# Вывод:
Ivan
0
defaultdict(<class 'int'>, {'name': 'Ivan', 'age': 19, 'job': 'Darkstore', 'salary': 0})

Также допустимы все способы, которые мы используем при создании обычных словарей, а именно передача именованных аргументов или итерируемого объекта, содержащего пары ключ-значение (например, список кортежей). Правда, следующий код приведёт к ошибке, так как в качестве первого аргумента должен быть указан тип элемента по умолчанию, а не итерируемый объект с парами ключ-значение:

1
2
3
4
5
from collections import defaultdict

info = defaultdict([('name', 'Ivan'), ('age', 19), ('job', 'Darkstore')])

print(info)

Если же создать экземпляр defaultdict словаря без указания default_factory (значения по умолчанию для отсутствующих ключей), то поведение defaultdict будет таким же, как и у обычного словаря (тип dict). То же самое произойдёт, если передать значение None (является значением по умолчанию для default_factory) Следующий код вызовет ошибку KeyError:

1
2
3
4
5
from collections import defaultdict

data = defaultdict()    # или data = defaultdict(None)

print(data['salary'])

Если в ходе написания кода потребуется изменить значение по умолчанию, это можно осуществить через атрибут default_factory:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
from collections import defaultdict

data = defaultdict(int)
print(data['salary1'])

data.default_factory = list
print(data['salary2'])

data.default_factory = float
print(data['salary3'])

1
2
3
4
# Вывод:
0
[]
0.0

При создании defaultdict словаря можно указывать не только тип данных для значений по умолчанию, но и любую функцию, не принимающую аргументов и возвращающую некоторое дефолтное значение.

Передадим функцию, объявленную с помощью def:

1
2
3
4
5
6
7
8
9
from collections import defaultdict

def get_default():
    return 69

info = defaultdict(get_default, {'name': 'Ivan', 'age': 19, 'job': 'Darkstore'})

print(info['name'])
print(info['salary'])

1
2
3
# Вывод:
Ivan
69

Теперь передадим lambda-функцию:

1
2
3
4
5
6
from collections import defaultdict

info = defaultdict(lambda: '1000000$', {'name': 'Ivan', 'age': 19, 'job': 'Darkstore'})

print(info['name'])
print(info['salary'])

1
2
3
# Вывод:
Ivan
1000000$

Рассмотрим задачу и решим её с помощью defaultdict: пусть задан список чисел numbers, в котором некоторые числа встречаются несколько раз. Нужно узнать, сколько именно раз встречается каждое из чисел.

1
2
3
4
5
6
7
from collections import defaultdict

numbers = [9, 8, 32, 1, 10, 1, 10, 23, 1, 4, 10, 4, 2, 2, 2, 2, 1, 10, 1, 2, 2, 32, 23, 23]
result = defaultdict(int)

for num in numbers:
    result[num] += 1

defaultdict часто используют в связке с пустым списком в качестве значения по умолчанию, чтобы начинать добавление элементов без лишнего кода.

1
2
3
4
5
6
7
8
9
from collections import defaultdict

my_dict = defaultdict(list)

for i in range(7):
    my_dict[i].append(i)

for key in my_dict:
    print(key, my_dict[key])

1
2
3
4
5
6
7
8
# Вывод:
0 [0]
1 [1]
2 [2]
3 [3]
4 [4]
5 [5]
6 [6]

Таким образом, при использовании defaultdict нет необходимости ни проверять наличие соответствующих ключей в словаре, ни создавать предварительно пустые списки.

Python позволяет сравнивать defaultdict и dict:

1
2
3
4
5
6
7
8
from collections import defaultdict

info1 = {'name': 'Ivan', 'age': 19, 'job': 'Darkstore'}
info2 = defaultdict(int, {'name': 'Ivan', 'age': 19, 'job': 'Darkstore'})

print(info1 == info2)

# Вывод: True

Когда использовать `defaultdict`?

Есть несколько рекомендаций:

Если ваш код в значительной степени основан на словарях и вы все время имеете дело с отсутствующими ключами, вам следует подумать об использовании defaultdict, а не обычного dict;
Если элементы вашего словаря необходимо инициализировать некоторым значением по умолчанию, вам следует подумать об использовании defaultdict, вместо dict;
Если ваш код использует словари для агрегирования, накопления, подсчета или группировки значений, вам следует подумать об использовании defaultdict, вместо dict.

К слову, тип defaultdict работает быстрее чем использование методов setdefault() и get() обычного словаря.

OrderedDict

Для использования: from collections import OrderedDict

В Python 3.6 словари были переработаны так, чтобы повысилась их производительность (и понизилось потребление памяти на 20-25%). Следствием такой переработки явился один очень интересный побочный эффект — словари стали упорядоченными, то есть стали сохранять порядок вставки элементов, хотя на тот момент официально этот порядок не гарантировался. «Официально не гарантируется» означает, что это была просто деталь реализации, которая могла быть изменена в будущих версиях Python. Но начиная с Python 3.7, в спецификации языка гарантируется сохранение порядка вставки элементов в словарь.

Задолго до переработки устройства словарей в рамках релиза Python 3.1 в стандартную библиотеку был добавлен тип OrderedDict, который на тот момент решал проблему неупорядоченности обычных словарей.

Стоит учесть, что в OrderedDict стоит использовать только для обратной совместимости со старыми программами на версиях Python, когда dict ещё не был упорядочен, ведь обычный словарь быстрее на 40% и занимает на 50% меньше памяти.

Таблица различий и особенностей классов dict и OrderedDict:

Функционал	`OrderedDict	dict
Сохранность порядка вставки ключей	Да (начиная с Python 3.1)	Да (начиная с Python 3.6)
Удобочитаемость и сигнализация о намерениях	Высокая	Низкая
Возможность менять порядок элементов	Да (метод `move_to_end()`)	Нет
Производительность операций	Низкая	Высокая
Потребление памяти	Высокое	Низкое
Учет порядка элементов при сравнении на равенство	Да	Нет
Перебор ключей в обратном порядке	Да (начиная с Python 3.5)	Да (начиная с Python 3.8)
Возможность добавления пользовательских атрибутов	Да (атрибут `.__dict__`)	Нет
Возможность использовать операторы `\|` и `\|=`	Да (начиная с Python 3.9)	Да (начиная с Python 3.9)

OrderedDict является подклассом dict, а значит обладает всеми его методами, также имея собственные методы.

Как и defaultdict, эти словари можно создавать любым из доступных способов, как и обычные словари:

1
2
3
4
5
from collections import OrderedDict

numbers1 = OrderedDict({'one': 1, 'two': 2, 'three': 3})
numbers2 = OrderedDict({('one', 1), ('two', 2), ('three', 3)})
numbers3 = OrderedDict(one=1, two=2, three=3)

В большинстве случаев OrderedDict ведёт себя как и обычный словарь: программист может добавлять, обновлять, удалять, перебирать (по keys(), values() и items()) элементы, объединять словари с помощью операторов | и |= (конкатенация словарей). Словарь (обычный или OrderedDict) можно “развернуть” функцией reversed().
Обновляя значение ключа, позиция сохраняется, удаляя ключ и снова добавляя его, он помещается в конец словаря.

Инфо

Значение по ключу можно обновить как через квадратные скобки, так и через словарный метод update()

Метод `move_to_end()`

Метод move_to_end() позволяет переместить существующий элемент либо в конец, либо в начало словаря. Ему можно передать два аргумента:

key (обязательный) – ключ, который идентифицирует перемещаемый элемент
last=True (необязательный) – логическое значение (тип bool), которое определяет, в какой конец словаря мы перемещаем элемент, значение True (по умолчанию) перемещает элемент в конец, значение False – в начало

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
from collections import OrderedDict

numbers = OrderedDict(one=1, two=2, three=3)
print(numbers)

numbers.move_to_end('one')       # last=True
print(numbers)

numbers.move_to_end('three', last=False)       # last=False
print(numbers)

1
2
3
4
# Вывод:
OrderedDict({('one', 1), ('two', 2), ('three', 3)})
OrderedDict({('two', 2), ('three', 3), ('one', 1)})
OrderedDict({('three', 3), ('two', 2), ('one', 1)})

С помощью метода move_to_end() можно сортировать OrderedDict по ключам:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
from collections import OrderedDict

letters = OrderedDict(b=2, d=4, a=1, c=3)

for key in sorted(letters):
    letters.move_to_end(key)

print(letters)

# Вывод: OrderedDict({('a', 1), ('b', 2), ('c', 3), ('d', 4)})

Метод `popitem()`

Метод popitem(last=True) по умолчанию удаляет и возвращает элемент в порядке LIFO (Last-In/First-Out, последний пришел/первый ушел), то есть удаляет элементы с конца словаря.

1
2
3
4
5
6
7
8
9
from collections import OrderedDict

numbers = OrderedDict(one=1, two=2, three=3)

print(numbers.popitem())
print(numbers)

print(numbers.popitem())
print(numbers)

1
2
3
4
5
# Вывод:
('three', 3)
OrderedDict({('one', 1), ('two', 2)})
('two', 2)
OrderedDict({('one', 1)})

Атрибут `.dict`

OrderedDict словари содержат дополнительный атрибут __dict__, которого нет у обычного словаря. Данный атрибут используется для динамического наделения объектов дополнительным функционалом. Этот атрибут позволяет динамически добавлять пользовательские атрибуты в OrderedDict. Использовать его можно двумя способами:

В стиле словаря: ordered_dict.__dict__['attr'] = value;
Через точечную нотацию: ordered_dict.attr = value.

1
2
3
4
5
6
7
8
9
from collections import OrderedDict

letters = OrderedDict(b=2, d=4, a=1, c=3)
print(letters)
print(letters.__dict__)

letters.__dict__['advanced'] = '144'
print(letters)
print(letters.__dict__)

1
2
3
4
5
# Вывод:
OrderedDict({('b', 2), ('d', 4), ('a', 1), ('c', 3)})
{}
OrderedDict({('b', 2), ('d', 4), ('a', 1), ('c', 3)})
{'advanced': '144'}

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
from collections import OrderedDict

letters = OrderedDict(b=2, d=4, a=1, c=3)

letters.sorted_keys = lambda: sorted(letters.keys())

print(letters)
print(letters.sorted_keys())

letters['e'] = 5
print(letters)
print(letters.sorted_keys())

for key in letters.sorted_keys():
    print(key, '->', letters[key])

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
# Вывод:
OrderedDict({('b', 2), ('d', 4), ('a', 1), ('c', 3)})
['a', 'b', 'c', 'd']
OrderedDict({('b', 2), ('d', 4), ('a', 1), ('c', 3), ('e', 5)})
['a', 'b', 'c', 'd', 'e']
a -> 1
b -> 2
c -> 3
d -> 4
e -> 5

Если же методу передать необязательный аргумент last=False, то он начнет удалять и возвращать элементы в порядке FIFO (First-In/First-Out, первый пришел/первый ушел).

Сравнение словарей

Стоит просто запомнить три истины:

При сравнении на равенство обычных словарей порядок расположения их элементов неважен.
При сравнении на равенство dict и OrderedDict словарей порядок расположения их элементов неважен.
При сравнение на равенство OrderedDict словарей порядок расположения их элементов важен.

Counter

Для использования: from collections import Counter

Counter является подклассом dict, специально разработанным для подсчёта хэшируемых объектов в Python. Он хранит объекты в качестве ключей, а их количество — в качестве значений. Для подсчёта класс Counter использует высокооптимизированную функцию, написанную на языке C.

Инфо

С помощью типа Counter можно реализовать концепцию мультимножества

Есть несколько способов создать объект Counter. Например, можно передать коллекцию или итератор в конструктор:

1
2
3
4
5
6
from collections import Counter

counter = Counter('mississippi')
print(counter)

# Вывод: Counter({'i': 4, 's': 4, 'p': 2, 'm': 1})

Инфо

Counter выдает результат в порядке убывания количества вхождений объектов

Также при создании объекта Counter можно задавать начальные значения количества объектов:

1
2
3
4
5
6
7
from collections import Counter

counter1 = Counter({'i': 4, 's': 4, 'p': 2, 'm': 1})
counter2 = Counter(i=4, s=4, p=2, m=1)

print(counter1)
print(counter2)

1
2
3
# Вывод:
Counter({'i': 4, 's': 4, 'p': 2, 'm': 1})
Counter({'i': 4, 's': 4, 'p': 2, 'm': 1})

Класс Counter, будучи подклассом типа dict, наследует все методы, предоставляемые обычным словарем. Но вызов метода fromkeys() всегда будет приводить к возникновению ошибки. Такое поведение не случайно, оно позволяет избежать ошибок неоднозначности при создании объектов типа Counter, например следующий код: counter = Counter.fromkeys('mississippi', 2) мог бы создать объект типа Counter на основе строки mississippi со значением по умолчанию равным 2 для всех символов строки, несмотря на реальное количество вхождений символов в строке mississippi.

Как и в обычных словарях, ключи в объектах Counter должны быть хэшируемы. Ограничений на тип значений нет, но для нормальной работы подсчёта объектов в качестве значений должны быть целые неотрицательные числа.

Доступ к элементам и итерирование по Counter словарям работает так же, как и у обычных словарей. Мы можем перебирать ключи напрямую или можем использовать словарные методы items(), keys() и values(). При этом, если обратиться по ключу, которого нет в Counter словаре, то ошибка KeyError возникать не будет. Будет возвращено нулевое значение (ключ создан не будет).

Объекты типа Counter можно сравнивать между собой. Очевидно, что одинаковыми будут те, что имеют одинаковые элементы (ключ: значение). Также до версии Python 3.10 словари Counter(i=4) и Counter(i=4, s=0) считались разными, но, начиная с Python 3.10 сравнение рассматривает отсутствующие элементы как имеющие нулевое значение, поэтому следующий код вернёт True:

1
2
3
4
5
6
from collections import Counter

counter1 = Counter(i=4)
counter2 = Counter(i=4, s=0)

print(counter1 == counter2)

Объекты класса Counter, аналогично объектам OrderedDict, содержат дополнительный атрибут __dict__, который используется для динамического наделения объектов дополнительным функционалом:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
from collections import Counter

counter = Counter(green=10, red=25, blue=5)

print(counter.__dict__)

counter.__dict__['min_value'] = lambda: min(counter.values())
counter.max_value = lambda: max(counter.values())

print(counter.min_value())
print(counter.max_value())

1
2
3
4
# Вывод:
{}
5
25

Метод `update()`

Для изменения объектов типа Counter рекомендуется использовать метод update(). Он не заменяет значения как у обычных словарей, а суммирует существующие. При этом для новых объектов update() создаёт новые пары ключ: количество.

1
2
3
4
5
6
7
from collections import Counter

letters = Counter({'i': 4, 's': 4, 'p': 2, 'm': 1})
letters.update('missouri')
print(letters)

# Вывод: Counter({'i': 6, 's': 6, 'p': 2, 'm': 2, 'o': 1, 'u': 1, 'r': 1})

Метод update() принимает любой итерируемый объект: список, строку, кортеж и т.д., другой объект типа Counter, либо обычный словарь. Также его можно использовать с именованными аргументами, например следующие две строки кода равнозначны: sales.update(apple=3, orange=12, banana=7) и sales.update(monday_sales).

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
from collections import Counter

sales = Counter(apple=20, orange=5, banana=10)
monday_sales = Counter(apple=3, orange=12, banana=7)
tuesday_sales = {'apple': 4, 'orange': 5, 'tomato': 6}

print(sales)

sales.update(monday_sales)
print(sales)

sales.update(tuesday_sales)
print(sales)

1
2
3
4
# Вывод:
Counter({'apple': 20, 'banana': 10, 'orange': 5})
Counter({'apple': 23, 'orange': 17, 'banana': 17})
Counter({'apple': 27, 'orange': 22, 'banana': 17, 'tomato': 6})

Если значения по ключам будут иметь тип, отличный от int, но работающий с оператором +, то то ошибки при вызове метода update() не возникнет:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
from collections import Counter

counter1 = Counter(i=4, s='4')
counter2 = Counter(i=5, s='5')

counter1.update(counter2)

print(counter1)

# Вывод: Counter({'i': 9, 's': '54'})

Из предыдущего кода также можем заметить, что под ключом 's' содержится не '45', а '54'. Так устроен метод update() — он складывает значение переданного объекта с изменяемым, но не наоборот, то есть '5' + '4'.

Метод `most_common()`

most_common() возвращает список наиболее повторяемых элементов и количество каждого из них в виде кортежей (ключ, число повторений).

1
2
3
4
5
6
7
from collections import Counter

letters = Counter('mississippi')
numbers = Counter([5, 6, 7, 1, 3, 9, 9, 1, 2, 5, 5, 7, 7, 9])

print(letters.most_common())
print(numbers.most_common())

1
2
3
# Вывод:
[('i', 4), ('s', 4), ('p', 2), ('m', 1)]
[(5, 3), (7, 3), (9, 3), (1, 2), (6, 1), (3, 1), (2, 1)]

Если методу most_common() передать целочисленный аргумент n, то он вернет n самых часто повторяющихся элементов.

1
2
3
4
5
6
from collections import Counter

letters = Counter('mississippi')
print(letters.most_common(2))

# Вывод: [('i', 4), ('s', 4)]

Для поиска самых редких элементов, можно использовать срезы с отрицательным шагом.

Метод `elements()`

elements() возвращает итератор по элементам, в котором каждый элемент повторяется столько раз, во сколько установлено его значение. Элементы возвращаются в порядке их появления. При этом, если количество элементов по некоторому ключу меньше единицы, то метод elements() просто проигнорирует его.

1
2
3
4
5
6
7
from collections import Counter

letters = Counter('mississippi')
numbers = Counter([5, 6, 7, 1, 3, 9, 9, 1, 2, 5, 5, 7, 7, 9])

print(list(letters.elements()))
print(list(numbers.elements()))

1
2
3
# Вывод:
['m', 'i', 'i', 'i', 'i', 's', 's', 's', 's', 'p', 'p']
[5, 5, 5, 6, 7, 7, 7, 1, 1, 3, 9, 9, 9, 2]

Метод `total()`

В Python 3.10 появился метод total(), который вычисляет сумму всех значений Counter словаря, включая отрицательные.

1
2
3
4
5
6
7
from collections import Counter

letters = Counter(i=4, s=4, a=0, p=2, b=-98, m=1)

print(letters.total())

# Вывод: -87

Метод `subtract()`

subtract() вычитает из значений элементов одного словаря Counter значения элементов другого словаря. Этот метод подобен update(), но вычитает количества, а не складывает их. При этом у результирующего словаря значения ключей могут быть нулевыми или отрицательными.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
from collections import Counter

counter1 = Counter(i=4, s=40, a=1, p=20, b=98, z=69)
counter2 = Counter(i=2, s=20, a=6, p=12, m=1, z=69)

counter1.subtract(counter2)

print(counter1)

# Вывод: Counter({'b': 98, 's': 20, 'p': 8, 'i': 2, 'z': 0, 'm': -1, 'a': -5})

Помимо словарей, метод subtract() может принимать любой итерируемый объект: список, строку, кортеж и т.д., а также его можно использовать с именованными аргументами.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
from collections import Counter

counter = Counter(i=4, s=40, a=1, p=20, b=98, z=69)
letters = 'iisssssapppz'

counter.subtract(letters)       # обновляем значения в counter

print(counter)

# Вывод: Counter({'b': 98, 'z': 68, 's': 35, 'p': 17, 'i': 2, 'a': 0})

Операторы `+, -, &, |`

Как мы уже знаем, методы update() и subtract() объединяют Counter словари путем сложения и вычитания количества соответствующих элементов. Python предоставляет удобные операторы сложения (+) и вычитания (-), которые могут заменить вызовы данных методов. При использовании этих операторов из результирующего словаря исключаются элементы с нулевыми и отрицательными значениями.

1
2
3
4
5
6
7
8
from collections import Counter

counter1 = Counter(i=10, s=40, p=10, m=1)
counter2 = Counter(i=2, s=8, p=10, m=3)

print(counter1 + counter2)
print(counter1 - counter2)
print(counter2 - counter1)

1
2
3
4
# Вывод:
Counter({'s': 48, 'p': 20, 'i': 12, 'm': 4})
Counter({'s': 32, 'i': 8})
Counter({'m': 2})

Инфо

Операторы + и - работают только с Counter словарями, в то время как методы update() и subtract() — с любым итерируемым объектом

Counter позволяет также использовать унарные операторы сложения и вычитания. В первом случае мы получаем новый Counter словарь, который содержит только элементы с положительными значениями, во втором — элементы с отрицательными значениями. Другими словами, операторы унарного сложения и вычитания прибавляют пустой Counter словарь или вычитают исходный из пустого. Следующие два блока кодов равнозначны:

1
2
3
4
5
6
from collections import Counter

counter = Counter(a=5, b=-9, c=0)

print(+counter)
print(-counter)

1
2
3
4
5
6
from collections import Counter

counter = Counter(a=5, b=-9, c=0)

print(+counter)
print(-counter)

и выводят:

1
2
3
# Вывод:
Counter({'a': 5})
Counter({'b': 9})

Помимо указанных выше операторов, Python также предоставляет операторы пересечения (&) и объединения (|), которые возвращают минимум и максимум из соответствующих значений.

1
2
3
4
5
6
7
from collections import Counter

counter1 = Counter(i=10, s=40, p=10, m=1)
counter2 = Counter(i=2, s=8, p=10, m=3)

print(counter1 & counter2)
print(counter1 | counter2)

1
2
3
# Вывод:
Counter({'p': 10, 's': 8, 'i': 2, 'm': 1})
Counter({'s': 40, 'i': 10, 'p': 10, 'm': 3})

ChainMap

Для использования: from collections import ChainMap

ChainMap представляет из себя объединение нескольких словарей. Этот объект группирует словари вместе, что позволяет рассматривать их как единое целое.

ChainMap был добавлен в модуль collections в версии Python 3.3. Этот класс не создаёт новый словарь, вместо этого он хранит ссылки на исходные словари в списке, что, грубо говоря, позволяет программисту иметь несколько одноимённых ключей в одном словаре.

Раз ChainMap содержит ссылки на объекты, то изменение содержания любого словаря, на основании которого создан ChainMap, изменяет и сам ChainMap объект. Аналогично, изменение ChainMap объекта приводит к изменению словаря, на основании которого он создан.

Чтобы создать объект ChainMap, можно, например, передать в конструктор словари:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
from collections import ChainMap

empty_chain_map = ChainMap()
print(empty_chain_map)

numbers = {'one': 1, 'two': 2}
letters = {'a': 'A', 'b': 'B'}

chain_map = ChainMap(numbers, letters)
print(chain_map)

1
2
3
# Вывод:
ChainMap({})
ChainMap({'one': 1, 'two': 2}, {'a': 'A', 'b': 'B'})

В ChainMap можно также передать любой из уже изученных словарей: defaultdict, OrderedDict, Counter. При этом нужно понимать, что поиск по ChainMap объекту будет учитывать особенность поиска по соответствующим словарям. Для defaultdict, в случае если ключ отсутствует, вернётся значение по умолчанию, для Counter — нулевое значение.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
from collections import defaultdict, OrderedDict, Counter, ChainMap

numbers = OrderedDict(one=1, two=2)
letters = defaultdict(str, {'a': 'A', 'b': 'B'})
counter = Counter('aabbbcccc')

chain_map = ChainMap(numbers, letters, counter)

print(chain_map)

# Вывод: ChainMap(OrderedDict([('one', 1), ('two', 2)]), defaultdict(<class 'str'>, {'a': 'A', 'b': 'B'}), Counter({'c': 4, 'b': 3, 'a': 2}))

Либо же, можно воспользоваться методом fromkeys():

1
2
3
4
5
6
7
from collections import ChainMap

chain_map1 = ChainMap.fromkeys(['one', 'two', 'three'])
chain_map2 = ChainMap.fromkeys(['one', 'two', 'three'], -1)

print(chain_map1)
print(chain_map2)

1
2
3
# Вывод:
ChainMap({'one': None, 'two': None, 'three': None})
ChainMap({'one': -1, 'two': -1, 'three': -1})

Для получения значений по ключу в ChainMap объектах используется такой же механизм, как и в обычных словарях. Либо мы используем квадратные скобки, либо метод get(). Рассмотрим объект, в котором ключи повторяются:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
from collections import ChainMap

for_adoption = {'dogs': 15, 'cats': 8, 'pythons': 9}
vet_treatment = {'dogs': 7, 'cats': 2, 'tigers': 3}

pets = ChainMap(for_adoption, vet_treatment)

print(pets['dogs'])
print(pets['cats'])

print(pets['pythons'])
print(pets['tigers'])

1
2
3
4
5
# Вывод:
15
8
9
3

Как видно, в ситуации, когда у объединяемых словарей есть повторяющиеся ключи, возвращается только первое вхождение этого ключа. Таким образом, поиск по ChainMap объекту всегда осуществляется в том же порядке, в котором словари были указаны при создании этого объекта, при этом поиск останавливается, как только значение по нужному ключу найдено.

Встроенная функция len() вернёт количество уникальных ключей ChainMap объекта.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
from collections import ChainMap

for_adoption = {'dogs': 15, 'cats': 8, 'pythons': 9}
vet_treatment = {'dogs': 7, 'cats': 2, 'tigers': 3}

pets = ChainMap(for_adoption, vet_treatment)

print(len(pets))

# Вывод: 4

Итерирование по `ChainMap`

Итерирование по ChainMap объекту происходит в обратном порядке от последнего указанного словаря к первому.

1
2
3
4
5
6
7
8
9
from collections import ChainMap

numbers = {'one': 1, 'two': 2}
letters = {'a': 'A', 'b': 'B'}

alpha_num = ChainMap(numbers, letters)

for key in alpha_num:
    print(key, '->', alpha_num[key])

1
2
3
4
5
# Вывод:
a -> A
b -> B
one -> 1
two -> 2

При этом, если присутствуют дубликаты ключей, возвращаться будет последнее значение (имеется ввиду последнее при итерировании по объекту ChainMap, то есть первое значение, если идти сверху вниз).

1
2
3
4
5
6
7
8
9
from collections import ChainMap

for_adoption = {'dogs': 15, 'cats': 8, 'pythons': 9}
vet_treatment = {'dogs': 7, 'cats': 2, 'tigers': 3}

pets = ChainMap(for_adoption, vet_treatment)

for key in pets:
    print(key, '->', pets[key])

1
2
3
4
5
# Вывод:
dogs -> 15
cats -> 8
tigers -> 3
pythons -> 9

При итерировании, как и с обычными словарями, позволяется использовать методы keys(), values(), items():

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
from collections import ChainMap

for_adoption = {'dogs': 15, 'cats': 8, 'pythons': 9}
vet_treatment = {'dogs': 7, 'cats': 2, 'tigers': 3}

pets = ChainMap(for_adoption, vet_treatment)

for key in pets.keys():
    print(key, '->', pets[key])

print()

for value in pets.values():
    print(value)

print()

for key, value in pets.items():
    print(key, '->', value)

Мутация `ChainMap`

Для изменения объектов типа ChainMap можно использовать те же способы, что и для изменения обычного словаря. Позволяется обновлять, добавлять, удалять и извлекать элементы. При этом нужно знать, что все эти операции действуют только на первый из объединяемых словарей.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
from collections import ChainMap

numbers = {'one': 1, 'two': 2}
letters = {'a': 'A', 'b': 'B'}

alpha_num = ChainMap(numbers, letters)
print(alpha_num)

alpha_num['c'] = 'C'
print(alpha_num)

alpha_num['b'] = 'b'
print(alpha_num)

alpha_num.pop('two')
print(alpha_num)

del alpha_num['c']
print(alpha_num)

alpha_num.clear()
print(alpha_num)

1
2
3
4
5
6
7
# Вывод:
ChainMap({'one': 1, 'two': 2}, {'a': 'A', 'b': 'B'})
ChainMap({'one': 1, 'two': 2, 'c': 'C'}, {'a': 'A', 'b': 'B'})
ChainMap({'one': 1, 'two': 2, 'c': 'C', 'b': 'b'}, {'a': 'A', 'b': 'B'})
ChainMap({'one': 1, 'c': 'C', 'b': 'b'}, {'a': 'A', 'b': 'B'})
ChainMap({'one': 1, 'b': 'b'}, {'a': 'A', 'b': 'B'})
ChainMap({}, {'a': 'A', 'b': 'B'})

Опасность

При попытке удаления значения по ключу, которого нет в первом словаре, возникает ошибка KeyError

Указывая в качестве первого аргумента для ChainMap пустой словарь, получается поведение, при котором все изменения ChainMap объекта не затрагивают объединяемые (исходные) словари.

Сравнение `ChainMap`

Два объекта типа ChainMap (к примеру, chainmap1 и chainmap2) считаются равными, если значение следующего выражения равно True: dict(chainmap1.items()) == dict(chainmap2.items()).

Учитывая специфику работы метода items(), равенство двух объектов типа ChainMap не гарантирует того, что эти объекты в точности совпадают:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
from collections import ChainMap

chainmap1 = ChainMap({'a': 10, 'b': 20})
chainmap2 = ChainMap({'a': 10, 'b': 20})

print(chainmap1 == chainmap2)

chainmap1 = ChainMap({'a': 10, 'b': 20}, {'a': 1, 'b': 2})
chainmap2 = ChainMap({'a': 10, 'b': 20})

print(chainmap1 == chainmap2)

1
2
3
# Вывод:
True
True

Атрибут `maps`

Как уже было сказано, Объект ChainMap хранит ссылки на все объединяемые словари во внутреннем списке, который доступен через атрибут maps и может быть изменён. Порядок словарей в списке maps соответствует порядку, в котором словари были указаны при создании объекта ChainMap.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
from collections import ChainMap

for_adoption = {'dogs': 15, 'cats': 8, 'pythons': 9}
vet_treatment = {'dogs': 7, 'cats': 2, 'tigers': 3}

pets = ChainMap(for_adoption, vet_treatment)

print(pets)
print(pets.maps)
print(type(pets.maps))

1
2
3
4
# Вывод:
ChainMap({'dogs': 15, 'cats': 8, 'pythons': 9}, {'dogs': 7, 'cats': 2, 'tigers': 3})
[{'dogs': 15, 'cats': 8, 'pythons': 9}, {'dogs': 7, 'cats': 2, 'tigers': 3}]
<class 'list'>

Инфо

При создании пустого ChainMap объекта его maps будет содержать пустой словарь.

Атрибут maps является обычным списком, поэтому он поддерживает все основные операции со списками. Мы можем добавлять в него новые словари, удалять уже добавленные, а также изменять их порядок.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
from collections import ChainMap

for_adoption = {'dogs': 15, 'cats': 8, 'pythons': 9}
vet_treatment = {'dogs': 7, 'cats': 2, 'tigers': 3}

pets = ChainMap(for_adoption, vet_treatment)

pets.maps.reverse()
pets.maps[0]['lions'] = 10
del pets.maps[1]['cats']

print(pets)
print(pets.maps)

1
2
3
# Вывод:
ChainMap({'dogs': 7, 'cats': 2, 'tigers': 3, 'lions': 10}, {'dogs': 15, 'pythons': 9})
[{'dogs': 7, 'cats': 2, 'tigers': 3, 'lions': 10}, {'dogs': 15, 'pythons': 9}]

Инфо

Изменяя порядок словарей в списке атрибута maps, мы также меняем сами объединяемые словари, а также порядок поиска в объекте ChainMap

Атрибут maps можно использовать для обработки абсолютно всех значений во всех словарях. С помощью этого атрибута мы можем обойти поведение по умолчанию, заключающееся в получении (изменении) первого значения из первого словаря.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
from collections import ChainMap

for_adoption = {'dogs': 15, 'cats': 8, 'pythons': 9}
vet_treatment = {'dogs': 7, 'cats': 2, 'tigers': 3}

pets = ChainMap(for_adoption, vet_treatment)

for animals in pets.maps:
    for key, value in animals.items():
        print(key, '->', value)

1
2
3
4
5
6
7
# Вывод:
dogs -> 15
cats -> 8
pythons -> 9
dogs -> 7
cats -> 2
tigers -> 3

Метод `new_child()`

new_child() возвращает новый объект ChainMap(), содержащий новый переданный словарь в качестве первого элемента, за которым следуют все исходные словари объекта, к которому этот метод применялся. Вызов этого метода (например, d.new_child()) эквивалентен вызову ChainMap({}, *d.maps).

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
from collections import ChainMap

dad = {'name': 'Timur', 'age': 29}
mom = {'name': 'Rosaly', 'age': 28}

old_family = ChainMap(dad, mom)

son = {'name': 'Soslan', 'age': 0}

new_family = old_family.new_child(son)

print(old_family)
print(new_family)

1
2
3
# Вывод:
ChainMap({'name': 'Timur', 'age': 29}, {'name': 'Rosaly', 'age': 28})
ChainMap({'name': 'Soslan', 'age': 0}, {'name': 'Timur', 'age': 29}, {'name': 'Rosaly', 'age': 28})

Атрибут `parents`

parents возвращает новый объект ChainMap, содержащий все словари, кроме первого. Может пригодиться в случае, когда нужно пропустить первый словарь при поиске ключей. Обращение к этому атрибуту (например, d.parents) эквивалентно вызову ChainMap(*d.maps[1:]).

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
from collections import ChainMap

dad = {'name': 'Timur', 'age': 29}
mom = {'name': 'Rosaly', 'age': 28}
son = {'name': 'Soslan', 'age': 0}

family = ChainMap(son, dad, mom)

print(family)
print(family.parents)
print(type(family.parents))

1
2
3
4
# Вывод:
ChainMap({'name': 'Soslan', 'age': 0}, {'name': 'Timur', 'age': 29}, {'name': 'Rosaly', 'age': 28})
ChainMap({'name': 'Timur', 'age': 29}, {'name': 'Rosaly', 'age': 28})
<class 'collections.ChainMap'>

Где используется

Основным вариантом использования ChainMap является эффективное управление несколькими областями видимости и определение приоритетов доступа дубликатов ключей. Например, в документации по ChainMap можно найти, как Python обращается к именами переменных в разных пространствах имён. Когда интерпретатор ищет имя (переменную), он последовательно обращается к локальной, глобальной и встроенной (print, list, input и т.д.) областям видимости, которые представляют из себя словари, отображающие имена на объекты.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
from collections import ChainMap
import builtins


input = 42

pylookup = ChainMap(locals(), globals(), vars(builtins))
print(pylookup["input"])

del globals()["input"]
print(pylookup["input"])

1
2
3
# Вывод:
42
<built-in function input>

Вообще, варианты применения этого типа данных довольно специфичны:

Эффективная группировка нескольких словарей в одном представлении
Поиск по нескольким словарям с определенным приоритетом
Представление цепочки значений по умолчанию и управление их приоритетами
Повышение производительности кода, который часто вычисляет подмножества словаря

Основной источник: https://stepik.org/course/82541

Дополнительные источники:

Поддержать автора

cloudtips

Коллекции в Python. Часть II

Модуль collections

Namedtuple

Функция namedtuple()

typename и field_names

rename

defaults

module

Распаковка именованного кортежа

Атрибуты _fields и _field_defaults

Методы _make(), _replace(), _asdict()

Схожесть со словарями

Defaultdict

Когда использовать defaultdict?

OrderedDict

Метод move_to_end()

Метод popitem()

Атрибут .__dict__

Сравнение словарей

Counter

Метод update()

Метод most_common()

Метод elements()

Метод total()

Метод subtract()

Операторы +, -, &, |

ChainMap

Итерирование по ChainMap

Мутация ChainMap

Сравнение ChainMap

Атрибут maps

Метод new_child()

Атрибут parents

Где используется

Функция `namedtuple()`

`typename` и `field_names`

`rename`

`defaults`

`module`

Атрибуты `_fields` и `_field_defaults`

Методы `_make()`, `_replace()`, `_asdict()`

Когда использовать `defaultdict`?

Метод `move_to_end()`

Метод `popitem()`

Атрибут `.dict`

Метод `update()`

Метод `most_common()`

Метод `elements()`

Метод `total()`

Метод `subtract()`

Операторы `+, -, &, |`

Итерирование по `ChainMap`

Мутация `ChainMap`

Сравнение `ChainMap`

Атрибут `maps`

Метод `new_child()`

Атрибут `parents`