« Splitting » la sortie d'un RLE (groupby) en fonction d'une valeur définie (le « caractère » pour diviser le RLE sur)
Question
Considérons la « chaîne » (traiter comme un tableau de chiffres)
0 0 1 8 8 8 1 0
Le RLE ( "groupby") est:
[(0,2), (1, 1), (8,3), (1, 1), (0, 1)]
Nous enrichissons alors la RLE ci-dessus avec la somme des longueurs d'exécution des éléments précédents.
Par conséquent, la version enrichie de ce qui précède devient:
[(0, (0,2)), (0+2, (1, 1)), (0+2+1, (8,3)), (0+1+2+3, (1, 1)), (0+1+2+3+1, (0, 1))]
La division "string" sur 1:
0 0 , 8 8 8 , 0
RLE division sur 1
[(0,2)] , [(8,3)] , [(0, 1)]
La division "string" sur 8:
0 0 1 , , , 1 0
RLE division sur 8
[(0,2), (1, 1)] , , , [(1, 1), (0, 1)]
Remarque: Dans mes exemples, je viens de citer le « split RLE sur Z » listes sans les enrichir. Ce ne serait pas ainsi. Je les ai laissés pour réduire l'encombrement. Par exemple, le « split RLE sur 1 » devrait vraiment être traitée comme:
[(0, (0,2))] , [(0+2+1, (8,3))] , [(0+1+2+3+1, (0, 1)]
Comment puis-je obtenir ce "RLE split" sur Z (= 1, 8, dans ce cas)
Il est bien de laisser des tableaux vides (après split).
Peut-être un échantillon de liste intelligente.? (Il semble un peu plus facile à résoudre avec une boucle avec un append imbriqué dans)
La solution
Juste pour montrer le chemin comment, je vous conseille fortement de ne pas utiliser ce
"élégant" laid chemin:
>>> data
[0, 0, 1, 8, 8, 8, 4, 4, 1, 0]
>>> def fromDataToSplitRLE(dat,n):
RLE=[(k,len(tuple(g))) for k,g in itertools.groupby(dat)]
tmp=tuple(zip(*RLE))
return [list(g) for k,g in itertools.groupby((zip((sum(tmp[1][:i]) for i in range(len(tmp[1]))) ,(zip(*tmp)))),lambda x:x[1][0]!=n) if k]
>>> fromDataToSplitRLE(data,1)
[[(0, (0, 2))], [(3, (8, 3)), (6, (4, 2))], [(9, (0, 1))]]
Autres conseils
import itertools
def get_rle(list_of_digits, split_on=None):
count = 0
rle = []
active_group = []
rle_app = rle.append
for item, group in itertools.groupby(list_of_digits):
L = len(list(group))
if item == split_on:
rle_app(active_group)
active_group = []
else:
active_group.append((count, (item, L)))
count += L
rle_app(active_group)
return rle
list_of_digits = map(int, '0 0 1 8 8 8 1 0'.split())
print get_rle(list_of_digits)
print get_rle(list_of_digits, 8)
print get_rle(list_of_digits, 1)
aaron@aaron-laptop:~/code/tmp$ python rle.py
[[(0, (0, 2)), (2, (1, 1)), (3, (8, 3)), (6, (1, 1)), (7, (0, 1))]]
[[(0, (0, 2)), (2, (1, 1))], [(6, (1, 1)), (7, (0, 1))]]
[[(0, (0, 2))], [(3, (8, 3))], [(7, (0, 1))]]