Pergunta

Olá, sou novo na programação e quero aprender Python. Estou trabalhando em um código que deve retornar itens mais redundantes em uma lista. Se houver mais de 1, ele deve devolver tudo. Ex.

List = ['a','b','c','b','d','a'] #then it should return both a and b.
List = ['a','a','b','b','c','c','d'] #then it should return a b and c.
List = ['a','a','a','b','b','b','c','c','d','d','d'] #then it should return a b and d.

Nota: não sabemos qual elemento é mais comum na lista, então precisamos encontrar o elemento mais comum e, se houver mais de um, ele deve devolver tudo. Se a lista tiver números ou outras seqüências como elementos, também o código deve funcionar

Não tenho ideia de como proceder. Eu posso usar uma pequena ajuda.

Aqui está todo o programa:

from collections import Counter

def redundant(List):
    c = Counter(List)
    maximum = c.most_common()[0][1]
    return [k for k, v in c.items()if v == maximum]

def find_kmers(DNA_STRING, k):
    length = len(DNA_STRING)
    a = 0
    List_1 = []
    string_1 = ""
    while a <= length - k:
        string_1 = DNA_STRING[a:a+k]
        List_1.append(string_1)
        a = a + 1
    redundant(List_1)

Este programa deve tomar a corda de DNA e o comprimento do KMER e encontrar quais são os Kemers desse comprimento presentes nessa sequência de DNA.

Entrada de amostra:

ACGTTGCATGTCGCATGATGCATGAGAGCT
4

Saída de amostra:

CATG GCAT  
Foi útil?

Solução

Você pode usar collections.Counter:

from collections import Counter
def solve(lis):
    c = Counter(lis)
    mx = c.most_common()[0][1]
    #or mx = max(c.values())
    return [k for k, v in c.items() if v == mx]

print (solve(['a','b','c','b','d','a']))
print (solve(['a','a','b','b','c','c','d']))
print (solve(['a','a','a','b','b','b','c','c','d','d','d'] ))

Resultado:

['a', 'b']
['a', 'c', 'b']
['a', 'b', 'd']

Uma versão ligeiramente diferente do código acima usando itertools.takewhile:

from collections import Counter
from itertools import takewhile
def solve(lis):
    c = Counter(lis)
    mx = max(c.values())
    return [k for k, v in takewhile(lambda x: x[1]==mx, c.most_common())]

Outras dicas

inputData = [['a','b','c','b','d','a'], ['a','a','b','b','c','c','d'], ['a','a','a','b','b','b','c','c','d','d','d'] ]
from collections import Counter
for myList in inputData:
    temp, result = -1, []
    for char, count in Counter(myList).most_common():
        if temp == -1: temp = count
        if temp == count: result.append(char)
        else: break
    print result

Resultado

['a', 'b']
['a', 'c', 'b']
['a', 'b', 'd']
>>> def maxs(L):
...   counts = collections.Counter(L)
...   maxCount = max(counts.values())
...   return [k for k,v in counts.items() if v==maxCount]
... 
>>> maxs(L)
['a', 'b']
>>> L = ['a','a','b','b','c','c','d']
>>> maxs(L)
['a', 'b', 'c']
>>> L = ['a','a','a','b','b','b','c','c','d','d','d']
>>> maxs(L)
['d', 'a', 'b']

Apenas para dar uma solução a não usar collections e usando as compreensões da lista.

given_list = ['a','b','c','b','d','a']
redundant = [(each, given_list.count(each)) for each in set(given_list) if given_list.count(each) > 1]
count_max = max(redundant, key=lambda x: x[1])[1]
final_list = [char for char, count in redundant if count == count_max]

PS - eu mesmo não usei Counters ainda :( hora de aprender!

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top