题
在 Python 中创建按字母顺序排序的列表的最佳方法是什么?
解决方案
基本回答:
mylist = ["b", "C", "A"]
mylist.sort()
这会修改您的原始列表(即就地排序)。要获取列表的排序副本而不更改原始列表,请使用 sorted()
功能:
for x in sorted(mylist):
print x
但是,上面的示例有点幼稚,因为它们没有考虑区域设置,并且执行区分大小写的排序。您可以利用可选参数 key
指定自定义排序顺序(另一种方法是使用 cmp
, ,是一个已弃用的解决方案,因为它必须多次评估 - key
每个元素仅计算一次)。
因此,要根据当前区域设置进行排序,并考虑特定于语言的规则(cmp_to_key
是 functools 的辅助函数):
sorted(mylist, key=cmp_to_key(locale.strcoll))
最后,如果需要,您可以指定 自定义区域设置 用于排序:
import locale
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale
assert sorted((u'Ab', u'ad', u'aa'),
key=cmp_to_key(locale.strcoll)) == [u'aa', u'Ab', u'ad']
最后说明:您将看到不区分大小写的排序示例,其中使用 lower()
方法 - 这些是不正确的,因为它们仅适用于字符的 ASCII 子集。对于任何非英语数据,这两个都是错误的:
# this is incorrect!
mylist.sort(key=lambda x: x.lower())
# alternative notation, a bit faster, but still wrong
mylist.sort(key=str.lower)
其他提示
list.sort()
真的就是这么简单:)
对字符串进行排序的正确方法是:
import locale
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale
assert sorted((u'Ab', u'ad', u'aa'), cmp=locale.strcoll) == [u'aa', u'Ab', u'ad']
# Without using locale.strcoll you get:
assert sorted((u'Ab', u'ad', u'aa')) == [u'Ab', u'aa', u'ad']
前面的例子是 mylist.sort(key=lambda x: x.lower())
对于纯 ASCII 上下文来说效果很好。
但这如何处理特定于语言的排序规则呢?它是否考虑了区域设置?
不, list.sort()
是一个通用的排序函数。如果要根据 Unicode 规则排序,则必须定义自定义排序键函数。您可以尝试使用 皮尤卡 模块,但我不知道它有多完整。
请使用Python3中的sorted()函数
items = ["love", "like", "play", "cool", "my"]
sorted(items2)
认为 s = "ZWzaAd"
要对上面的字符串进行排序,简单的解决方案将是下面的一个。
print ''.join(sorted(s))
或者可能:
names = ['Jasmine', 'Alberto', 'Ross', 'dig-dog']
print ("The solution for this is about this names being sorted:",sorted(names, key=lambda name:name.lower()))
不隶属于 StackOverflow