Frage

Wie wähle ich die richtigen Schlüssel für data.table Objekte?

Sind die Überlegungen ähnlich wie für RDBMS? Meine erste Vermutung war, nach Dokumentation zu Indizes und Schlüssel für RDBMSS zu suchen. Google hat diesen hilfreichen Stackoverflow entwickelt Frage im Zusammenhang mit Oracle.

Gilten die Überlegungen aus dieser Antwort für Daten.tabellen? Vielleicht mit Ausnahme derjenigen, die sich auf Aktualisierung, Einfügen oder Löschen von Anweisungen in Verbindung setzen, einfügen oder löschen? Ich vermute, dass unsere data.tables Objekte werden auf diese Weise nicht wirklich verwendet.

Ich versuche, mich mit der Dokumentation und den Beispielen um dieses Zeug zu machen, aber ich habe keine Diskussion über die Schlüsselauswahl gesehen.

PS: Danke an @crayola Zeigen Ich in Richtung des data.table Paket in erster Linie!

War es hilfreich?

Lösung

Ich bin mir nicht sicher, ob dies eine sehr hilfreiche Antwort ist, aber da Sie mich in der Frage erwähnen, werde ich sagen, was ich jedenfalls denke. Aber denken Sie daran, dass ich ein bisschen ein bin data.table Neuling selbst.

Ich persönlich benutze nur Schlüssel, wenn es einen klaren Vorteil dafür gibt, z. B. das Zusammenführen von DataTables oder wo klar ist, dass dies die Dinge beschleunigt (z. B. wiederholt auf einer Variablen). Meines Wissens besteht jedoch manchmal überhaupt keine wirkliche Notwendigkeit, Schlüssel zu definieren; Das Paket ist bereits schneller als data.frame ohne Schlüssel.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top