Самый чистый способ индексировать коллекцию по свойству элемента, который сам является коллекцией.
-
20-12-2019 - |
Вопрос
у меня есть List<Foo>
и хочу гуаву Multimap<String, Foo>
где мы сгруппировали Foo
по каждому тегу своего Collection<String> getTags()
функция.
Я использую Java 8, поэтому лямбды и ссылки на методы в порядке/приветствуются.
Например, если у меня есть:
foo1, tags=a,b,c
foo2, tags=c,d
foo3, tags=a,c,e
я бы получил Multimap<String, Foo>
с:
a -> foo1, foo3
b -> foo1
c -> foo1, foo2, foo3
d -> foo2
e -> foo3
Решение
Для этого вы можете использовать собственный сборщик:
Multimap<String, Foo> map = list.stream().collect(
ImmutableMultimap::builder,
(builder, value) -> value.getTags().forEach(tag -> builder.put(tag, value)),
(builder1, builder2) -> builder1.putAll(builder2.build())
).build();
Это не вызывает дополнительных побочных эффектов (см. здесь по этому поводу), является одновременной и более идиоматичной.
Вы также можете извлечь эти специальные лямбды в полноценный сборщик, примерно так:
public static <T, K> Collector<T, ?, Multimap<K, T>> toMultimapByKey(Function<? super T, ? extends Iterable<? extends K>> keysMapper) {
return new MultimapCollector<>(keysMapper);
}
private static class MultimapCollector<T, K> implements Collector<T, ImmutableMultimap.Builder<K, T>, Multimap<K, T>> {
private final Function<? super T, ? extends Iterable<? extends K>> keysMapper;
private MultimapCollector(Function<? super T, ? extends Iterable<? extends K>> keysMapper) {
this.keysMapper = keysMapper;
}
@Override
public Supplier<ImmutableMultimap.Builder<K, T>> supplier() {
return ImmutableMultimap::builder;
}
@Override
public BiConsumer<ImmutableMultimap.Builder<K, T>, T> accumulator() {
return (builder, value) -> keysMapper.apply(value).forEach(k -> builder.put(k, value));
}
@Override
public BinaryOperator<ImmutableMultimap.Builder<K, T>> combiner() {
return (b1, b2) -> b1.putAll(b2.build());
}
@Override
public Function<ImmutableMultimap.Builder<K, T>, Multimap<K, T>> finisher() {
return ImmutableMultimap.Builder<K, T>::build;
}
@Override
public Set<Characteristics> characteristics() {
return Collections.emptySet();
}
}
Тогда коллекция будет выглядеть так:
Multimap<String, Foo> map = list.stream().collect(toMultimapByKey(Foo::getTags));
Вы также можете вернуться EnumSet.of(Characteristics.UNORDERED)
от characteristics()
метод, если порядок для вас не важен.Это может повысить эффективность работы внутренних механизмов сбора, особенно в случае параллельного сокращения.
Другие советы
ImmutableMultimap.Builder<String, Foo> builder = ImmutableMultimap.builder();
list.forEach(foo -> foo.getTags().forEach(tag -> builder.put(tag, foo));
return builder.build();
Это немного более идиоматично для потоков Java 8:
Multimap<String, Foo> map = list.stream()
//First build a stream of Pair<String, Foo>
.flatMap(f -> f.tags.stream().map(s -> new AbstractMap.SimpleImmutableEntry<>(s, f)))
//Then collect it up into a multimap.
.collect(
Multimaps.toMultimap(
x -> x.getKey(),
x -> x.getValue(),
MultimapBuilder.hashKeys().arrayListValues()::build
)
);
Я знаю, что использование парного класса — это некрасиво, но главное, что я хотел показать, — это Multimaps.toMultmap
коллектор.Также есть Multmaps.flatteningToMultimap
для других случаев использования.