Вопрос

Какой самый элегантный способ выбрать в массиве объекты, уникальные по одному или нескольким атрибутам?

Эти объекты хранятся в ActiveRecord, поэтому использование методов AR тоже подойдет.

Это было полезно?

Решение

Использовать Array#uniq с блоком:

@photos = @photos.uniq { |p| p.album_id }

Другие советы

Добавить uniq_by метод для массива в вашем проекте.Это работает по аналогии с sort_by.Так uniq_by это uniq как sort_by это sort.Использование:

uniq_array = my_array.uniq_by {|obj| obj.id}

Реализация:

class Array
  def uniq_by(&blk)
    transforms = []
    self.select do |el|
      should_keep = !transforms.include?(t=blk[el])
      transforms << t
      should_keep
    end
  end
end

Обратите внимание, что он возвращает новый массив, а не изменяет текущий.Мы не написали uniq_by! метод, но если вы захотите, это должно быть достаточно легко.

РЕДАКТИРОВАТЬ:Tribalvibes указывает, что эта реализация — O(n^2).Лучше было бы что-то вроде (непроверено)...

class Array
  def uniq_by(&blk)
    transforms = {}
    select do |el|
      t = blk[el]
      should_keep = !transforms[t]
      transforms[t] = true
      should_keep
    end
  end
end

Сделайте это на уровне базы данных:

YourModel.find(:all, :group => "status")

Вы можете использовать этот трюк, чтобы выбрать уникальные по нескольким атрибутам элементы из массива:

@photos = @photos.uniq { |p| [p.album_id, p.author_id] }

Изначально я предлагал использовать select метод на массиве.А именно:

[1, 2, 3, 4, 5, 6, 7].select{|e| e%2 == 0}дает нам [2,4,6] назад.

Но если вам нужен первый такой объект, используйте detect.

[1, 2, 3, 4, 5, 6, 7].detect{|e| e>3} дает нам 4.

Хотя я не уверен, чего вы здесь добиваетесь.

Мне нравится использование Jmah хеша для обеспечения уникальности.Вот еще пара способов снять шкуру с этой кошки:

objs.inject({}) {|h,e| h[e.attr]=e; h}.values

Это хороший однострочник, но я подозреваю, что это может быть немного быстрее:

h = {}
objs.each {|e| h[e.attr]=e}
h.values

Если я правильно понял ваш вопрос, я решил эту проблему, используя квази-хакерский подход сравнения маршалированных объектов, чтобы определить, меняются ли какие-либо атрибуты.Примером может служить внедрение в конце следующего кода:

class Foo
  attr_accessor :foo, :bar, :baz

  def initialize(foo,bar,baz)
    @foo = foo
    @bar = bar
    @baz = baz
  end
end

objs = [Foo.new(1,2,3),Foo.new(1,2,3),Foo.new(2,3,4)]

# find objects that are uniq with respect to attributes
objs.inject([]) do |uniqs,obj|
  if uniqs.all? { |e| Marshal.dump(e) != Marshal.dump(obj) }
    uniqs << obj
  end
  uniqs
end

Самый элегантный способ, который я нашел, — это выделение с использованием Array#uniq с блоком

enumerable_collection.uniq(&:property)

… и читается лучше!

Вы можете использовать хеш, который содержит только одно значение для каждого ключа:

Hash[*recs.map{|ar| [ar[attr],ar]}.flatten].values

В Rails также есть метод #uniq_by — см. Параметризованный массив#uniq (т. е. uniq_by)

Мне нравятся ответы Джмаха и Хэда.Но сохраняют ли они порядок массива?Они могут появиться в более поздних версиях Ruby, поскольку в спецификацию языка были записаны некоторые требования по сохранению порядка вставки хешей, но вот похожее решение, которое мне нравится использовать, которое сохраняет порядок независимо от этого.

h = Set.new
objs.select{|el| h.add?(el.attr)}

Реализация ActiveSupport:

def uniq_by
  hash, array = {}, []
  each { |i| hash[yield(i)] ||= (array << i) }
  array
end

Теперь, если вы можете сортировать значения атрибутов, это можно сделать:

class A
  attr_accessor :val
  def initialize(v); self.val = v; end
end

objs = [1,2,6,3,7,7,8,2,8].map{|i| A.new(i)}

objs.sort_by{|a| a.val}.inject([]) do |uniqs, a|
  uniqs << a if uniqs.empty? || a.val != uniqs.last.val
  uniqs
end

Это для уникального 1-атрибута, но то же самое можно сделать и с лексикографической сортировкой...

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top