파이썬에서 카운트별로 여러 목록의 순위 요소

https://stackoverflow.com/questions/1829470

11-09-2019
|

문제

각 목록에 얼마나 자주 나타나는지 요소에 따라 여러 목록을 순위하고 싶습니다. 예시:

List1 = 1,2,3,4
List2 = 4,5,6,7
List3 = 4,1,8,9

결과 = 4,1,2,3,4,5,6,7,8 (4는 세 번, 1 번, 나머지는 한 번)로 계산됩니다)

나는 다음을 시도했지만 더 똑똑하고 목록의 탄약으로 할 수있는 일이 필요합니다.


 l = []
 l.append([ 1, 2, 3, 4, 5])
 l.append([ 1, 9, 3, 4, 5])
 l.append([ 1, 10, 8, 4, 5])
 l.append([ 1, 12, 13, 7, 5])
 l.append([ 1, 14, 13, 13, 6])

 x1 = set(l[0]) & set(l[1]) & set(l[2]) & set(l[3])
 x2 = set(l[0]) & set(l[1]) & set(l[2]) & set(l[4])
 x3 = set(l[0]) & set(l[1]) & set(l[3]) & set(l[4])
 x4 = set(l[0]) & set(l[2]) & set(l[3]) & set(l[4])
 x5 = set(l[1]) & set(l[2]) & set(l[3]) & set(l[4])
 set1 = set(x1) | set(x2) | set(x3) | set(x4) | set(x5)

 a1 = list(set(l[0]) & set(l[1]) & set(l[2]) & set(l[3]) & set(l[4]))
 a2 = getDifference(list(set1),a1)
 print a1
 print a2

이제 여기에 문제가 있습니다 ... A3, A4 및 A5를 사용하여 계속해서 할 수 있지만 너무 복잡한 경우에는 기능이 필요합니다 ...하지만 어떻게 모르겠습니다 ... 내 수학이 멈췄습니다. ;)

해결 : 토론에 감사드립니다. Newbee로서 나는이 시스템이 어떻게 든 좋아합니다 : Fast+Informative. 당신은 나를 도와주었습니다! Ty

해결책

import collections

data = [
  [1, 2, 3, 4, 5],
  [1, 9, 3, 4, 5],
  [1, 10, 8, 4, 5],
  [1, 12, 13, 7, 5],
  [1, 14, 13, 13, 6],
]

def sorted_by_count(lists):
  counts = collections.defaultdict(int)
  for L in lists:
    for n in L:
      counts[n] += 1

  return [num for num, count in
          sorted(counts.items(),
                 key=lambda k_v: (k_v[1], k_v[0]),
                 reverse=True)]

print sorted_by_count(data)

이제 일반화합시다 (반복적이고, 해시 가능 요구 사항을 풀기 위해), 키 및 리버스 매개 변수를 허용하고 (정렬 된 일치) freq_sorted:

def freq_sorted(iterable, key=None, reverse=False, include_freq=False):
  """Return a list of items from iterable sorted by frequency.

  If include_freq, (item, freq) is returned instead of item.

  key(item) must be hashable, but items need not be.

  *Higher* frequencies are returned first.  Within the same frequency group,
  items are ordered according to key(item).
  """
  if key is None:
    key = lambda x: x

  key_counts = collections.defaultdict(int)
  items = {}
  for n in iterable:
    k = key(n)
    key_counts[k] += 1
    items.setdefault(k, n)

  if include_freq:
    def get_item(k, c):
      return items[k], c
  else:
    def get_item(k, c):
      return items[k]

  return [get_item(k, c) for k, c in
          sorted(key_counts.items(),
                 key=lambda kc: (-kc[1], kc[0]),
                 reverse=reverse)]

예시:

>>> import itertools
>>> print freq_sorted(itertools.chain.from_iterable(data))
[1, 5, 4, 13, 3, 2, 6, 7, 8, 9, 10, 12, 14]
>>> print freq_sorted(itertools.chain.from_iterable(data), include_freq=True)
# (slightly reformatted)
[(1, 5),
 (5, 4),
 (4, 3), (13, 3),
 (3, 2),
 (2, 1), (6, 1), (7, 1), (8, 1), (9, 1), (10, 1), (12, 1), (14, 1)]

다른 팁

이미 게시 된 몇 가지 아이디어를 결합했습니다.

from itertools import chain
from collections import defaultdict

def frequency(*lists):
    counter = defaultdict(int)
    for x in chain(*lists):
        counter[x] += 1
    return [key for (key, value) in 
        sorted(counter.items(), key=lambda kv: (kv[1], kv[0]), reverse=True)]

메모:

Python 2.7에서는 사용할 수 있습니다 Counter 대신에 defaultdict(int).
이 버전은 여러 목록을 인수로 취합니다. 선행 별표는 모두 튜플에 포장 될 것임을 의미합니다. 모든 목록이 포함 된 단일 목록을 전달하려면 해당 리더스리스트를 생략하십시오.
목록에 해시가없는 유형이 포함 된 경우 중단됩니다.

def items_ordered_by_frequency(*lists):

    # get a flat list with all the values
    biglist = []
    for x in lists:
        biglist += x

    # sort it in reverse order by frequency
    return sorted(set(biglist), 
                  key=lambda x: biglist.count(x), 
                  reverse=True)

이거 한번 해봐:

def rank(*lists):
    d = dict()
    for lst in lists:
        for e in lst:
            if e in d: d[e] += 1
            else: d[e] = 1
    return [j[1] for j in sorted([(d[i],i) for i in d], reverse=True)]

사용 예 :

a = [1,2,3,4]
b = [4,5,6,7]
c = [4,1,8,9]

print rank(a,b,c)

목록 수를 입력으로 사용할 수 있습니다

각 요소 (히스토그램)의 모양 수를 계산 한 다음 다음으로 정렬 할 수 있습니다.

def histogram(enumerable):
  result = {}
  for x in enumerable:
    result.setdefault(x, 0)
    result[x] += 1
  return result

lists = [ [1,2,3,4], [4,5,6,7], ... ]

from itertools import chain

h = histogram(chain(*lists))
ranked = sorted(set(chain(*lists)), key = lambda x : h[x], reverse = True)

이 코드를 시도하십시오 :

def elementFreq(myList):
    #myList is the list of lists
    from collections import Counter
    tmp = []
    for i in myList: tmp += i        
    return(Counter(tmp))

참고 : 목록은 해시 가능 유형이어야합니다

라이센스 : CC-BY-SA ~와 함께 속성

제휴하지 않습니다 StackOverflow