Хранение полного графа в СУБД
-
02-07-2019 - |
Вопрос
У меня есть несколько типов сущностей, каждый со своими полями, которые хранятся в отдельных таблицах.
Каждая запись в такой таблице может быть связана с нулем или более записями в другой таблице, т. е. связана с записями из разных типов сущностей.
Если я использую таблицы поиска, я получаю (m(m-1))/2=O(m^2) отдельные таблицы поиска, которые необходимо инициализировать.
Хотя это все еще возможно для 6 или 7 различных типов объектов, будет ли это по-прежнему актуально для более чем 50 таких типов?
В частности, данная запись должна иметь ссылки на большинство других типов сущностей, поэтому теоретически я буду иметь дело с почти полным, неориентированным, n-сторонним графом.
Может ли кто-нибудь пролить свет на то, как хранить эту структуру в реляционной СУБД?
(Я использую Postgresql, если это имеет значение, но любые решения для других СУБД будут одинаково полезны).
Спасибо за ваше время!
Юваль
Решение
Это объектно-реляционное сопоставление, классически сложная задача.Чтобы сделать это правильно, вам действительно нужен инструмент ORM, иначе он сведет вас с ума.
Проблема с подключением, о которой вы говорите, является одной из ловушек, и она требует очень тщательной оптимизации и настройки запросов, иначе это приведет к снижению производительности (например,проблема N+1 SELECT).
Я не могу быть более конкретным, не зная, какая у вас платформа приложений — используемая СУБД на самом деле не имеет отношения к проблеме.
Другие советы
Вы можете использовать общий базовый тип для всех типов сущностей и обрабатывать отношения через этот базовый тип - это то, что практически любой инструмент ORM может делать, используя столбец дискриминатора и отношения внешнего ключа (хотя я не знаком с CLSA).
При таком подходе у вас остается ровно одна таблица отношений.
Редактировать: Вот как вы это настраиваете:
CREATE TABLE base (
id int(10) unsigned NOT NULL auto_increment,
type enum('type1','type2') NOT NULL,
PRIMARY KEY (id)
);
CREATE TABLE type1 (
id int(10) unsigned NOT NULL,
PRIMARY KEY (id),
CONSTRAINT FK_type1_1 FOREIGN KEY (id) REFERENCES base (id)
);
CREATE TABLE type2 (
id int(10) unsigned NOT NULL,
PRIMARY KEY (id),
CONSTRAINT FK_type2_1 FOREIGN KEY (id) REFERENCES base (id)
);
CREATE TABLE x_relations (
from_id int(10) unsigned NOT NULL,
to_id int(10) unsigned NOT NULL,
PRIMARY KEY (from_id,to_id),
KEY FK_x_relations_2 (to_id),
CONSTRAINT FK_x_relations_1 FOREIGN KEY (from_id) REFERENCES base (id),
CONSTRAINT FK_x_relations_2 FOREIGN KEY (to_id) REFERENCES base (id)
ON DELETE CASCADE ON UPDATE CASCADE
);
Обратите внимание на столбец дискриминатора (type
), который поможет вашему решению ORM найти правильный подтип для строки (type1
или type2
).В документации ORM должен быть раздел о том, как сопоставить полиморфизм с базовой таблицей.
Другой вариант — использовать Объектно-ориентированная база данных например db40 или Cache.Возможно, вам стоит подумать об этом, если производительность не является большой проблемой и вы полны решимости сохранить весь граф объектов.