PostgreSQL: existe vs jointure gauche
-
29-09-2019 - |
Question
J'ai entendu à plusieurs reprises que les poignées de Postgres existe requêtes encore plus vite alors rejoindre gauche . http://archives.postgresql.org/pgsql-performance/2002- 12 / msg00185.php
C'est certainement vrai pour une agrégation de table.
Mais dans notre cas, leur est plus d'un et la même version de requête avec existe que postgres make à accrocher pour toujours:
explain
SELECT count(DISTINCT "groups".id) AS count_all
FROM "groups"
WHERE (exists(
select * from products p where groups.id = p.group_id AND exists(
select * from products_categories pc where p.id = pc.product_id AND pc.category_id in (2,3))) AND groups.id != 3)
résultat:
Aggregate (cost=26413436.66..26413436.67 rows=1 width=4)
-> Seq Scan on groups (cost=0.00..26413403.84 rows=13126 width=4)
Filter: ((id <> 3) AND (subplan))
SubPlan
-> Index Scan using index_products_on_group_id on products p (cost=0.00..1006.13 rows=1 width=1483)
Index Cond: ($1 = group_id)
Filter: (subplan)
SubPlan
-> Seq Scan on products_categories pc (cost=0.00..498.49 rows=1 width=8)
Filter: ((category_id = ANY ('{2,3}'::integer[])) AND ($0 = product_id))
C'est la cause profonde du temps d'exécution très longue? Est-ce une sorte de problème de configuration?
Merci, Bogdan.
La solution
Eh bien, pour chaque ligne de « groupes », postgresql fait une analyse complète de products_categories, ce qui est bon. Pas nécessairement un problème de configuration, mais peut-être la requête pourrait être déclaré sans sous-requêtes de nidification comme ça?
SELECT count(DISTINCT "groups".id) AS count_all
FROM "groups"
WHERE exists(
select 1 from products p where groups.id = p.group_id
join products_categories pc on pc.product_id = p.id
where pc.category_id in (2,3)
) and groups.id <> 3
Aussi ne products_categories
ont un indice sur product_id
?