Uniq по атрибуту объекта в Ruby
-
02-07-2019 - |
Вопрос
Какой самый элегантный способ выбрать в массиве объекты, уникальные по одному или нескольким атрибутам?
Эти объекты хранятся в ActiveRecord, поэтому использование методов AR тоже подойдет.
Решение
Использовать Array#uniq
с блоком:
@photos = @photos.uniq { |p| p.album_id }
Другие советы
Добавить uniq_by
метод для массива в вашем проекте.Это работает по аналогии с sort_by
.Так uniq_by
это uniq
как sort_by
это sort
.Использование:
uniq_array = my_array.uniq_by {|obj| obj.id}
Реализация:
class Array
def uniq_by(&blk)
transforms = []
self.select do |el|
should_keep = !transforms.include?(t=blk[el])
transforms << t
should_keep
end
end
end
Обратите внимание, что он возвращает новый массив, а не изменяет текущий.Мы не написали uniq_by!
метод, но если вы захотите, это должно быть достаточно легко.
РЕДАКТИРОВАТЬ:Tribalvibes указывает, что эта реализация — O(n^2).Лучше было бы что-то вроде (непроверено)...
class Array
def uniq_by(&blk)
transforms = {}
select do |el|
t = blk[el]
should_keep = !transforms[t]
transforms[t] = true
should_keep
end
end
end
Сделайте это на уровне базы данных:
YourModel.find(:all, :group => "status")
Вы можете использовать этот трюк, чтобы выбрать уникальные по нескольким атрибутам элементы из массива:
@photos = @photos.uniq { |p| [p.album_id, p.author_id] }
Изначально я предлагал использовать select
метод на массиве.А именно:
[1, 2, 3, 4, 5, 6, 7].select{|e| e%2 == 0}
дает нам [2,4,6]
назад.
Но если вам нужен первый такой объект, используйте detect
.
[1, 2, 3, 4, 5, 6, 7].detect{|e| e>3}
дает нам 4
.
Хотя я не уверен, чего вы здесь добиваетесь.
Мне нравится использование Jmah хеша для обеспечения уникальности.Вот еще пара способов снять шкуру с этой кошки:
objs.inject({}) {|h,e| h[e.attr]=e; h}.values
Это хороший однострочник, но я подозреваю, что это может быть немного быстрее:
h = {}
objs.each {|e| h[e.attr]=e}
h.values
Если я правильно понял ваш вопрос, я решил эту проблему, используя квази-хакерский подход сравнения маршалированных объектов, чтобы определить, меняются ли какие-либо атрибуты.Примером может служить внедрение в конце следующего кода:
class Foo
attr_accessor :foo, :bar, :baz
def initialize(foo,bar,baz)
@foo = foo
@bar = bar
@baz = baz
end
end
objs = [Foo.new(1,2,3),Foo.new(1,2,3),Foo.new(2,3,4)]
# find objects that are uniq with respect to attributes
objs.inject([]) do |uniqs,obj|
if uniqs.all? { |e| Marshal.dump(e) != Marshal.dump(obj) }
uniqs << obj
end
uniqs
end
Самый элегантный способ, который я нашел, — это выделение с использованием Array#uniq
с блоком
enumerable_collection.uniq(&:property)
… и читается лучше!
Вы можете использовать хеш, который содержит только одно значение для каждого ключа:
Hash[*recs.map{|ar| [ar[attr],ar]}.flatten].values
В Rails также есть метод #uniq_by — см. Параметризованный массив#uniq (т. е. uniq_by)
Мне нравятся ответы Джмаха и Хэда.Но сохраняют ли они порядок массива?Они могут появиться в более поздних версиях Ruby, поскольку в спецификацию языка были записаны некоторые требования по сохранению порядка вставки хешей, но вот похожее решение, которое мне нравится использовать, которое сохраняет порядок независимо от этого.
h = Set.new
objs.select{|el| h.add?(el.attr)}
Реализация ActiveSupport:
def uniq_by
hash, array = {}, []
each { |i| hash[yield(i)] ||= (array << i) }
array
end
Теперь, если вы можете сортировать значения атрибутов, это можно сделать:
class A
attr_accessor :val
def initialize(v); self.val = v; end
end
objs = [1,2,6,3,7,7,8,2,8].map{|i| A.new(i)}
objs.sort_by{|a| a.val}.inject([]) do |uniqs, a|
uniqs << a if uniqs.empty? || a.val != uniqs.last.val
uniqs
end
Это для уникального 1-атрибута, но то же самое можно сделать и с лексикографической сортировкой...