Вопрос

Как выбрать правильные ключи для data.table объекты?

Являются ли соображения аналогичны соображениям для RDBMS? Моим первым предположением было поиск документации об индексах и ключах для RDBMS. Google придумал этот полезный Stackoverflow вопрос Связано с Oracle.

Применяются ли соображения из этого ответа к Data.tables? Возможно, за исключением тех, которые касаются обновления, вставки или удаления операторов типа? Я предполагаю, что наш data.tables Объекты действительно не будут использоваться таким образом.

Я пытаюсь разобраться с этим, используя документацию и примеры, но я не видел никаких обсуждений по выбору ключей.

PS: спасибо @crayola указание я к data.table Пакет в первую очередь!

Это было полезно?

Решение

Я не уверен, что это очень полезный ответ, но так как вы упомянули меня в вопросе, я все равно скажу то, что думаю. Но помните, что я немного data.table новичок сам.

Я лично использую ключи только в том случае, если для этого есть четкая выгода, например, объединение данных или где ясно, что это ускорит ситуацию (например, подмножество на переменной). Но, насколько мне известно, иногда нет реальной необходимости определять ключи вообще; пакет уже быстрее, чем data.frame без ключей.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top