Извлечь подмножество пар ключ-значение из объекта словаря Python?
У меня есть большой объект словаря, который имеет несколько пар ключ-значение (около 16), но меня интересуют только 3 из них. Каков наилучший способ (самый короткий/эффективный/самый элегантный) для достижения этого?
лучшее, что я знаю:
bigdict = {'a':1,'b':2,....,'z':26}
subdict = {'l':bigdict['l'], 'm':bigdict['m'], 'n':bigdict['n']}
Я уверен, что есть более элегантный способ, чем этот. Идеи?
9 ответов:
вы можете попробовать:
dict((k, bigdict[k]) for k in ('l', 'm', 'n'))
... или в
Python 3Python версии 2.7 или более поздней (спасибо Фабио Динис указывая на то, что он тоже работает в 2.7):{k: bigdict[k] for k in ('l', 'm', 'n')}
Обновление: Как Håvard S указывает, я предполагаю, что вы знаете, что ключи будут в словаре - см. ответ если вы не в состоянии сделать такое предположение. В качестве альтернативы, как тимбо указывает в комментариях, если вы хотите ключ, который отсутствует в
bigdict
на картеNone
, вы можете сделать:{k: bigdict.get(k, None) for k in ('l', 'm', 'n')}
если вы используете Python 3, и вы только хотите хотите ключи в новом dict, которые фактически существуют в исходном, вы можете использовать тот факт, что объекты представления реализуют некоторые операции набора:
{k: bigdict[k] for k in bigdict.keys() & {'l', 'm', 'n'}}
немного короче, по крайней мере:
wanted_keys = ['l', 'm', 'n'] # The keys you want dict((k, bigdict[k]) for k in wanted_keys if k in bigdict)
interesting_keys = ('l', 'm', 'n') subdict = {x: bigdict[x] for x in interesting_keys if x in bigdict}
этот ответ использует понимание словаря, подобное выбранному ответу, но не будет за исключением отсутствующего элемента.
версия python 2:
{k:v for k, v in bigDict.iteritems() if k in ('l', 'm', 'n')}
версия python 3:
{k:v for k, v in bigDict.items() if k in ('l', 'm', 'n')}
немного сравнения скорости для всех упомянутых методов:
Python 2.7.11 |Anaconda 2.4.1 (64-bit)| (default, Jan 29 2016, 14:26:21) [MSC v.1500 64 bit (AMD64)] on win32 In[2]: import numpy.random as nprnd keys = nprnd.randint(1000, size=10000) bigdict = dict([(_, nprnd.rand()) for _ in range(1000)]) %timeit {key:bigdict[key] for key in keys} %timeit dict((key, bigdict[key]) for key in keys) %timeit dict(map(lambda k: (k, bigdict[k]), keys)) %timeit dict(filter(lambda i:i[0] in keys, bigdict.items())) %timeit {key:value for key, value in bigdict.items() if key in keys} 100 loops, best of 3: 3.09 ms per loop 100 loops, best of 3: 3.72 ms per loop 100 loops, best of 3: 6.63 ms per loop 10 loops, best of 3: 20.3 ms per loop 100 loops, best of 3: 20.6 ms per loop
как и ожидалось: словарь понимания являются лучшим вариантом.
может быть:
subdict=dict([(x,bigdict[x]) for x in ['l', 'm', 'n']])
Python 3 даже поддерживает следующее:
subdict={a:bigdict[a] for a in ['l','m','n']}
обратите внимание, что вы можете проверить на наличие в словаре следующим образом:
subdict=dict([(x,bigdict[x]) for x in ['l', 'm', 'n'] if x in bigdict])
респ. для python 3
subdict={a:bigdict[a] for a in ['l','m','n'] if a in bigdict}
вы также можете использовать карту (которая является очень полезная функция, чтобы узнать в любом случае):
sd = dict(map(lambda k: (k, l.get(k, None)), l))
пример:
large_dictionary = {'a1':123, 'a2':45, 'a3':344} list_of_keys = ['a1', 'a3'] small_dictionary = dict(map(lambda key: (key, large_dictionary.get(key, None)), list_of_keys))
PS. Я одолжил его .получить (ключ, нет) из предыдущего ответа:)
хорошо, это то, что беспокоило меня несколько раз, так что спасибо Jayesh за то, что спросил его.
ответы выше кажутся столь же хорошим решением, как и любое другое, но если вы используете это во всем своем коде, имеет смысл обернуть функциональность IMHO. Кроме того, здесь есть два возможных варианта использования: один, где вы заботитесь о том, все ли ключевые слова находятся в исходном словаре. и тот, где вы не. Было бы хорошо к обоим отношусь одинаково.
Итак, для моих двух-пеннет стоит, я предлагаю написать подкласс словаря, например
class my_dict(dict): def subdict(self, keywords, fragile=False): d = {} for k in keywords: try: d[k] = self[k] except KeyError: if fragile: raise return d
Теперь вы можете вытащить под-словарь с
orig_dict.subdict(keywords)
примеры использования:
# ## our keywords are letters of the alphabet keywords = 'abcdefghijklmnopqrstuvwxyz' # ## our dictionary maps letters to their index d = my_dict([(k,i) for i,k in enumerate(keywords)]) print('Original dictionary:\n%r\n\n' % (d,)) # ## constructing a sub-dictionary with good keywords oddkeywords = keywords[::2] subd = d.subdict(oddkeywords) print('Dictionary from odd numbered keys:\n%r\n\n' % (subd,)) # ## constructing a sub-dictionary with mixture of good and bad keywords somebadkeywords = keywords[1::2] + 'A' try: subd2 = d.subdict(somebadkeywords) print("We shouldn't see this message") except KeyError: print("subd2 construction fails:") print("\toriginal dictionary doesn't contain some keys\n\n") # ## Trying again with fragile set to false try: subd3 = d.subdict(somebadkeywords, fragile=False) print('Dictionary constructed using some bad keys:\n%r\n\n' % (subd3,)) except KeyError: print("We shouldn't see this message")
Если вы запустите весь приведенный выше код, вы должны увидеть (что-то вроде) следующий вывод (извините за форматирование):
оригинальный словарь:
{'a': 0, 'c': 2, 'b': 1, 'e': 4, 'd': 3, 'g': 6, 'f': 5, 'i': 8, 'h': 7, 'k': 10, 'j': 9, 'm': 12, 'l': 11, 'o': 14, 'n': 13, 'q': 16, 'p': 15, 's': 18, 'r': 17, 'u': 20, 't': 19, 'w': 22,' v': 21,' y': 24,' x': 23,' z': 25}словарь из нечетных ключей:
{'a': 0,' c': 2,' e': 4,' g': 6,' i': 8,' k': 10,' m': 12,' o': 14,' q': 16,' s': 18,' u': 20,' w': 22,' y': 24}subd2 строительство не удается:
оригинальный словарь не содержит некоторых ключейсловарь построен с использованием некоторых плохие ключи:
{'b': 1, 'd': 3, 'f': 5, 'h': 7, 'j': 9, 'l': 11, 'n': 13, 'p': 15, 'r': 17, 't': 19, 'v': 21, 'x': 23, 'z': 25}