質問

私は、以下のデータ構造とデータ:

CREATE TABLE `parent` (
  `id` int(11) NOT NULL auto_increment,
  `name` varchar(10) NOT NULL,
  PRIMARY KEY  (`id`)
) ENGINE=MyISAM DEFAULT CHARSET=latin1;

INSERT INTO `parent` VALUES(1, 'parent 1');
INSERT INTO `parent` VALUES(2, 'parent 2');

CREATE TABLE `other` (
  `id` int(11) NOT NULL auto_increment,
  `name` varchar(10) NOT NULL,
  PRIMARY KEY  (`id`)
) ENGINE=MyISAM DEFAULT CHARSET=latin1;

INSERT INTO `other` VALUES(1, 'other 1');
INSERT INTO `other` VALUES(2, 'other 2');

CREATE TABLE `relationship` (
  `id` int(11) NOT NULL auto_increment,
  `parent_id` int(11) NOT NULL,
  `other_id` int(11) NOT NULL,
  PRIMARY KEY  (`id`)
) ENGINE=MyISAM DEFAULT CHARSET=latin1;

INSERT INTO `relationship` VALUES(1, 1, 1);
INSERT INTO `relationship` VALUES(2, 1, 2);
INSERT INTO `relationship` VALUES(3, 2, 1);

を見つけていきたいのは、親データの両方でその他の第1-2.

こんどろ風mikiモデルを作ってみ出していると思う疑問がある場合はより良い方法:

SELECT p.id, p.name
FROM parent AS p
    LEFT JOIN relationship AS r1 ON (r1.parent_id = p.id)
    LEFT JOIN relationship AS r2 ON (r2.parent_id = p.id)
WHERE r1.other_id = 1 AND r2.other_id = 2;

その結果、1、"親1"である。問題はただの一覧を取得します5+に加わっちとの関係をテーブル提案などを行っている研究室で取得します。

ありそうです。

私が使っているMySQL、PHP、これかのクラスを提供します。.

役に立ちましたか?

解決

[OK]を、私はこれをテストしました。最高から最悪へのクエリは以下の通りであった。

クエリ1:参加(0.016s;基本的にはのインスタントの)

SELECT p.id, name
FROM parent p
JOIN relationship r1 ON p.id = r1.parent_id AND r1.other_id = 100
JOIN relationship r2 ON p.id = r2.parent_id AND r2.other_id = 101
JOIN relationship r3 ON p.id = r3.parent_id AND r3.other_id = 102
JOIN relationship r4 ON p.id = r4.parent_id AND r4.other_id = 103

クエリ2:(0.625s)が存在する

SELECT id, name
FROM parent p
WHERE EXISTS (SELECT 1 FROM relationship WHERE parent_id = p.id AND other_id = 100)
AND EXISTS (SELECT 1 FROM relationship WHERE parent_id = p.id AND other_id = 101)
AND EXISTS (SELECT 1 FROM relationship WHERE parent_id = p.id AND other_id = 102)
AND EXISTS (SELECT 1 FROM relationship WHERE parent_id = p.id AND oth

クエリ3:集約(1.016s)

SELECT p.id、p.name 親Pから WHERE(PARENT_ID = p.id関係からCOUNT(*)を選択し、IN(100101102103)をother_id)

クエリ4:UNION集合(2.39s)

SELECT id, name FROM (
  SELECT p1.id, p1.name
  FROM parent AS p1 LEFT JOIN relationship as r1 ON(r1.parent_id=p1.id)
  WHERE r1.other_id = 100
  UNION ALL
  SELECT p2.id, p2.name
  FROM parent AS p2 LEFT JOIN relationship as r2 ON(r2.parent_id=p2.id)
  WHERE r2.other_id = 101
  UNION ALL
  SELECT p3.id, p3.name
  FROM parent AS p3 LEFT JOIN relationship as r3 ON(r3.parent_id=p3.id)
  WHERE r3.other_id = 102
  UNION ALL
  SELECT p4.id, p4.name
  FROM parent AS p4 LEFT JOIN relationship as r4 ON(r4.parent_id=p4.id)
  WHERE r4.other_id = 103
) a
GROUP BY id, name
HAVING count(*) = 4
それはどちらか間違っているか、私はそれと間違って何かをしたように、

実際には上記のは間違ったデータを生成されました。いずれにせよ、上記のは、ちょうど悪い考えです。

それは高速でない場合は、

あなたは、クエリの実行計画を見てする必要があります。あなたはおそらく、適切な指標を欠いています。でそれを試してみてください。

CREATE INDEX ON relationship (parent_id, other_id)

あなたは<あなたが読むべき集合のルート(SELECT COUNT(*)FROM ...)を下る前のhref = "https://stackoverflow.com/questions/477006/sql-statement-join-vs-グループごとおよび-持つ/ 477013#477013" > SQL文 - 『グループ別』 Vsは 『参加して』 に持つ

注:上記タイミングが基づいている:

CREATE TABLE parent (
  id INT PRIMARY KEY,
  name VARCHAR(50)
);

CREATE TABLE other (
  id INT PRIMARY KEY,
  name VARCHAR(50)
);

CREATE TABLE relationship (
  id INT PRIMARY KEY,
  parent_id INT,
  other_id INT
);

CREATE INDEX idx1 ON relationship (parent_id, other_id);
CREATE INDEX idx2 ON relationship (other_id, parent_id);

として作成されたほぼ80万記録ます:

<?php
ini_set('max_execution_time', 600);

$start = microtime(true);

echo "<pre>\n";
mysql_connect('localhost', 'scratch', 'scratch');
if (mysql_error()) {
    echo "Connect error: " . mysql_error() . "\n";
}
mysql_select_db('scratch');
if (mysql_error()) {
    echo "Selct DB error: " . mysql_error() . "\n";
}

define('PARENTS', 100000);
define('CHILDREN', 100000);
define('MAX_CHILDREN', 10);
define('SCATTER', 10);
$rel = 0;
for ($i=1; $i<=PARENTS; $i++) {
    query("INSERT INTO parent VALUES ($i, 'Parent $i')");
    $potential = range(max(1, $i - SCATTER), min(CHILDREN, $i + SCATTER));
    $elements = sizeof($potential);
    $other = rand(1, min(MAX_CHILDREN, $elements - 4));
    $j = 0;
    while ($j < $other) {
        $index = rand(0, $elements - 1);
        if (isset($potential[$index])) {
            $c = $potential[$index];
            $rel++;
            query("INSERT INTO relationship VALUES ($rel, $i, $c)");
            unset($potential[$index]);
            $j++;
        }
    }
}
for ($i=1; $i<=CHILDREN; $i++) {
    query("INSERT INTO other VALUES ($i, 'Other $i')");
}

$count = PARENTS + CHILDREN + $rel;
$stop = microtime(true);
$duration = $stop - $start;
$insert = $duration / $count;

echo "$count records added.\n";
echo "Program ran for $duration seconds.\n";
echo "Insert time $insert seconds.\n";
echo "</pre>\n";

function query($str) {
    mysql_query($str);
    if (mysql_error()) {
        echo "$str: " . mysql_error() . "\n";
    }
}
?>

だから、もう一度、一日を運ぶ参加します。

他のヒント

親テーブルは、あなたがこれを行うことができます(PARENT_ID、other_id)上で一意のキーが含まれていることを考えるます:

select p.id, p.name 
  from parent as p 
 where (select count(*) 
        from relationship as r 
       where r.parent_id = p.id 
         and r.other_id in (1,2)
        ) >= 2

ビットの簡素化、これが効率的に動作し、必要があります。

  

DISTINCT p.id、p.nameを選択
  親のp
FROM   INNERはp.id = r1.parent_id AND r1.other_id = 1
ON関係R1を登録しよう   INNERはp.id = r2.parent_id AND r2.other_id = 2

ON関係R2をJOIN

少なくとも一方がそれぞれ「その他」の値のレコードを参加必要とするであろう。そして、オプティマイザはそれだけで1試合ごとを見つける必要があり、それが唯一のインデックスを読み取る必要はなく、どちらかの子会社のテーブルの、のいずれかが、まったく参照されていません。

知っておくべきこと

私は実際にそれをテストしていませんが、の線に沿って何かます:

SELECT id, name FROM (
  SELECT p1.id, p1.name
  FROM parent AS p1 LEFT JOIN relationship as r1 ON(r1.parent_id=p1.id)
  WHERE r1.other_id = 1
  UNION ALL
  SELECT p2.id, p2.name
  FROM parent AS p2 LEFT JOIN relationship as r2 ON(r2.parent_id=p2.id)
  WHERE r2.other_id = 2
   -- etc
) GROUP BY id, name
HAVING count(*) = 2

アイデアは、あなたがマルチウェイ合流を行う必要はありませんです。普通のの結果を連結することは、あなたのIDによってグループに参加して、すべてのセグメントに現れた行を選択します。

この問題点を検索する場合は複数の従業員を多く加入。これはしばしば遭遇サービスの"タグ"の概念などStackoverflow

自分がその後は、より良い建築のためのタグの場の"その他")ストレージ

検索は二つのステップ:

  1. すべての可能candiatesのTagCollectionsいずファイルのバックアップすべてのタグが必要となることができます使用のカーソルのループ構築)
  2. 選択データに基づく一致するTagCollection

性能はいつもより速くよりも大幅にTagCollectionsよりデータの項目を検索

あなたは、ネストされた選択でそれを行うことができ、私は、MSSQL 2005年にそれをテストしていますが、それはかなり一般的なあるべきと述べたように、

SELECT * FROM parent p
WHERE p.id in(
    SELECT r.parent_Id 
    FROM relationship r 
    WHERE r.parent_id in(1,2) 
    GROUP BY r.parent_id
    HAVING COUNT(r.parent_Id)=2
)

COUNT(r.parent_Id)=2で数2)が必要な加入の数に応じている。

あなたが理想的であるテーブルにother_id値のリストを置くことができます。以下のコードは、与えられたAT LEASTのIDを持つ親を探します。あなたはそれがまったく同じIDS(すなわち無余分を)持っているしたい場合は、少しのクエリを変更する必要があります。

SELECT
     p.id,
     p.name
FROM
     My_Other_IDs MOI
INNER JOIN Relationships R ON
     R.other_id = MOI.other_id
INNER JOIN Parents P ON
     P.parent_id = R.parent_id
GROUP BY
     p.parent_id,
     p.name
HAVING
     COUNT(*) = (SELECT COUNT(*) FROM My_Other_IDs)
ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top