Хранение полного графа в СУБД

https://stackoverflow.com/questions/146093

02-07-2019
|

Вопрос

У меня есть несколько типов сущностей, каждый со своими полями, которые хранятся в отдельных таблицах.
Каждая запись в такой таблице может быть связана с нулем или более записями в другой таблице, т. е. связана с записями из разных типов сущностей.
Если я использую таблицы поиска, я получаю (m(m-1))/2=O(m^2) отдельные таблицы поиска, которые необходимо инициализировать.
Хотя это все еще возможно для 6 или 7 различных типов объектов, будет ли это по-прежнему актуально для более чем 50 таких типов?
В частности, данная запись должна иметь ссылки на большинство других типов сущностей, поэтому теоретически я буду иметь дело с почти полным, неориентированным, n-сторонним графом.
Может ли кто-нибудь пролить свет на то, как хранить эту структуру в реляционной СУБД?
(Я использую Postgresql, если это имеет значение, но любые решения для других СУБД будут одинаково полезны).
Спасибо за ваше время!

Юваль

Решение

Это объектно-реляционное сопоставление, классически сложная задача.Чтобы сделать это правильно, вам действительно нужен инструмент ORM, иначе он сведет вас с ума.

Проблема с подключением, о которой вы говорите, является одной из ловушек, и она требует очень тщательной оптимизации и настройки запросов, иначе это приведет к снижению производительности (например,проблема N+1 SELECT).

Я не могу быть более конкретным, не зная, какая у вас платформа приложений — используемая СУБД на самом деле не имеет отношения к проблеме.

Другие советы

Вы можете использовать общий базовый тип для всех типов сущностей и обрабатывать отношения через этот базовый тип - это то, что практически любой инструмент ORM может делать, используя столбец дискриминатора и отношения внешнего ключа (хотя я не знаком с CLSA).

При таком подходе у вас остается ровно одна таблица отношений.

Редактировать: Вот как вы это настраиваете:

CREATE TABLE base (
  id int(10) unsigned NOT NULL auto_increment,
  type enum('type1','type2') NOT NULL,
  PRIMARY KEY  (id)
);

CREATE TABLE type1 (
  id int(10) unsigned NOT NULL,
  PRIMARY KEY  (id),
  CONSTRAINT FK_type1_1 FOREIGN KEY (id) REFERENCES base (id)
);

CREATE TABLE type2 (
  id int(10) unsigned NOT NULL,
  PRIMARY KEY  (id),
  CONSTRAINT FK_type2_1 FOREIGN KEY (id) REFERENCES base (id)
);


CREATE TABLE x_relations (
  from_id int(10) unsigned NOT NULL,
  to_id int(10) unsigned NOT NULL,
  PRIMARY KEY  (from_id,to_id),
  KEY FK_x_relations_2 (to_id),
  CONSTRAINT FK_x_relations_1 FOREIGN KEY (from_id) REFERENCES base (id),
  CONSTRAINT FK_x_relations_2 FOREIGN KEY (to_id) REFERENCES base (id) 
  ON DELETE CASCADE ON UPDATE CASCADE
);

Обратите внимание на столбец дискриминатора (type), который поможет вашему решению ORM найти правильный подтип для строки (type1 или type2).В документации ORM должен быть раздел о том, как сопоставить полиморфизм с базовой таблицей.

Другой вариант — использовать Объектно-ориентированная база данных например db40 или Cache.Возможно, вам стоит подумать об этом, если производительность не является большой проблемой и вы полны решимости сохранить весь граф объектов.

Лицензировано под: CC-BY-SA с атрибуция

Не связан с StackOverflow