オブジェクトの属性に基づいてオブジェクトのリストをソートする方法は?
質問
Pythonオブジェクトのリストがあり、それらをオブジェクト自体の属性でソートします。リストは次のようになります。
>>> ut
[<Tag: 128>, <Tag: 2008>, <Tag: <>, <Tag: actionscript>, <Tag: addresses>,
<Tag: aes>, <Tag: ajax> ...]
各オブジェクトにはカウントがあります:
>>> ut[1].count
1L
カウントを降順でリストをソートする必要があります。
このためのいくつかの方法を見てきましたが、Pythonのベストプラクティスを探しています。
解決
# To sort the list in place...
ut.sort(key=lambda x: x.count, reverse=True)
# To return a new list, use the sorted() built-in function...
newlist = sorted(ut, key=lambda x: x.count, reverse=True)
の詳細 他のヒント
特にリストに多くのレコードがある場合、最速の方法は operator.attrgetter(&quot; count&quot;)
を使用することです。ただし、これはPythonの操作前バージョンで実行される可能性があるため、フォールバックメカニズムがあれば便利です。次に、次の操作を実行します。
try: import operator
except ImportError: keyfun= lambda x: x.count # use a lambda if no operator module
else: keyfun= operator.attrgetter("count") # use operator since it's faster than lambda
ut.sort(key=keyfun, reverse=True) # sort in-place
読者はkey =メソッドに気付くはずです:
ut.sort(key=lambda x: x.count, reverse=True)
は、リッチ比較演算子をオブジェクトに追加するよりも何倍も高速です。これを読んでびっくりしました(「Python in a Nutshell」の485ページ)。これを確認するには、この小さなプログラムでテストを実行します。
#!/usr/bin/env python
import random
class C:
def __init__(self,count):
self.count = count
def __cmp__(self,other):
return cmp(self.count,other.count)
longList = [C(random.random()) for i in xrange(1000000)] #about 6.1 secs
longList2 = longList[:]
longList.sort() #about 52 - 6.1 = 46 secs
longList2.sort(key = lambda c: c.count) #about 9 - 6.1 = 3 secs
私の非常に最小限のテストでは、最初のソートは10倍以上遅いことが示されていますが、本では一般的に5倍程度遅いだけだと書かれています。彼らが言う理由は、Pythonで使用される高度に最適化されたソートアルゴリズム( timsort )によるものです。
それでも、.sort(lambda)が古い.sort()よりも速いというのは非常に奇妙です。彼らがそれを修正することを願っています。
from operator import attrgetter
ut.sort(key = attrgetter('count'), reverse = True)
オブジェクト指向アプローチ
順序付けが必要な各インスタンスに組み込むのではなく、オブジェクトのソートロジックを、該当する場合はクラスのプロパティにすることをお勧めします。
これにより一貫性が確保され、定型コードの必要がなくなります。
これが機能するには、少なくとも __ eq __
および __ lt __
操作を指定する必要があります。次に、 sorted(list_of_objects)
を使用します。
class Card(object):
def __init__(self, rank, suit):
self.rank = rank
self.suit = suit
def __eq__(self, other):
return self.rank == other.rank and self.suit == other.suit
def __lt__(self, other):
return self.rank < other.rank
hand = [Card(10, 'H'), Card(2, 'h'), Card(12, 'h'), Card(13, 'h'), Card(14, 'h')]
hand_order = [c.rank for c in hand] # [10, 2, 12, 13, 14]
hand_sorted = sorted(hand)
hand_sorted_order = [c.rank for c in hand_sorted] # [2, 10, 12, 13, 14]
これは、Django ORMモデルインスタンスのリストによく似ています。
次のようにクエリで並べ替えない理由:
ut = Tag.objects.order_by('-count')
リッチ比較演算子をオブジェクトクラスに追加し、リストのsort()メソッドを使用します。
Pythonでのリッチ比較を参照してください。
更新:この方法は機能しますが、トリプティクのソリューションは簡単なため、お客様のケースに適していると思います。