Pregunta

Hola, soy nuevo en la programación y quiero aprender Python. Estoy trabajando en un código que debería devolver elementos que sean más redundantes en una lista. Si hay más de 1, entonces debería devolver todo. Ex.

List = ['a','b','c','b','d','a'] #then it should return both a and b.
List = ['a','a','b','b','c','c','d'] #then it should return a b and c.
List = ['a','a','a','b','b','b','c','c','d','d','d'] #then it should return a b and d.

Nota: No sabemos qué elemento es más común en la lista, por lo que tenemos que encontrar el elemento más común y si hay más de uno, debería devolver todo. Si la lista tiene números u otras cadenas como elementos, entonces también el código tiene que funcionar

No tengo idea de cómo proceder. Puedo usar un poco de ayuda.

Aquí está todo el programa:

from collections import Counter

def redundant(List):
    c = Counter(List)
    maximum = c.most_common()[0][1]
    return [k for k, v in c.items()if v == maximum]

def find_kmers(DNA_STRING, k):
    length = len(DNA_STRING)
    a = 0
    List_1 = []
    string_1 = ""
    while a <= length - k:
        string_1 = DNA_STRING[a:a+k]
        List_1.append(string_1)
        a = a + 1
    redundant(List_1)

Este programa debe tomar la cadena de ADN y la longitud de KMER y encontrar cuáles son los kemers de esa longitud que están presentes en esa cadena de ADN.

Entrada de muestra:

ACGTTGCATGTCGCATGATGCATGAGAGCT
4

Salida de muestra:

CATG GCAT  
¿Fue útil?

Solución

Puedes usar collections.Counter:

from collections import Counter
def solve(lis):
    c = Counter(lis)
    mx = c.most_common()[0][1]
    #or mx = max(c.values())
    return [k for k, v in c.items() if v == mx]

print (solve(['a','b','c','b','d','a']))
print (solve(['a','a','b','b','c','c','d']))
print (solve(['a','a','a','b','b','b','c','c','d','d','d'] ))

Producción:

['a', 'b']
['a', 'c', 'b']
['a', 'b', 'd']

Una versión ligeramente diferente del código anterior usando itertools.takewhile:

from collections import Counter
from itertools import takewhile
def solve(lis):
    c = Counter(lis)
    mx = max(c.values())
    return [k for k, v in takewhile(lambda x: x[1]==mx, c.most_common())]

Otros consejos

inputData = [['a','b','c','b','d','a'], ['a','a','b','b','c','c','d'], ['a','a','a','b','b','b','c','c','d','d','d'] ]
from collections import Counter
for myList in inputData:
    temp, result = -1, []
    for char, count in Counter(myList).most_common():
        if temp == -1: temp = count
        if temp == count: result.append(char)
        else: break
    print result

Producción

['a', 'b']
['a', 'c', 'b']
['a', 'b', 'd']
>>> def maxs(L):
...   counts = collections.Counter(L)
...   maxCount = max(counts.values())
...   return [k for k,v in counts.items() if v==maxCount]
... 
>>> maxs(L)
['a', 'b']
>>> L = ['a','a','b','b','c','c','d']
>>> maxs(L)
['a', 'b', 'c']
>>> L = ['a','a','a','b','b','b','c','c','d','d','d']
>>> maxs(L)
['d', 'a', 'b']

Solo por el bien de dar una solución que no usa collections & Uso de la lista de comprensiones.

given_list = ['a','b','c','b','d','a']
redundant = [(each, given_list.count(each)) for each in set(given_list) if given_list.count(each) > 1]
count_max = max(redundant, key=lambda x: x[1])[1]
final_list = [char for char, count in redundant if count == count_max]

PD: yo mismo no he usado Counters Sin embargo :( ¡Es hora de aprender!

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top