SQL-подобная функциональность в R
Вопрос
Я привык писать логику манипулирования данными в SQL, и теперь, когда я изучаю R, я иногда ловлю себя на том, что мне просто хочется сделать что-то, что было бы простым в SQL, но мне приходится изучать кучу вещей с R, чтобы выполнять те же манипуляции с R фреймом данных.Есть ли простой обходной путь?
Решение
посмотрите на пакет sqldf. http://code.google.com/p/sqldf/ Кажется, он идеально подходит для ваших нужд.
Другие советы
Мне также более удобен SQL, но при работе с большими наборами данных в R моим любимым инструментом манипулирования является data.table
посылка.В отличие от sqldf
, который позволяет вам писать SQL на R, data.table
позволяет вам записать R в R - но дает вам возможность добавлять индексы к фреймам данных (ну, data.table
s, если быть точным).Возможность индексировать фреймы данных значительно ускоряет "объединения".И, будучи реализацией R, ваш код по-прежнему выглядит как R.