Вопрос

Я буду анализировать огромное количество данных, связанных с сетевыми трафиками, а также предварительно обработает данные, чтобы проанализировать его. Я обнаружил, что R и SPSS являются одними из самых популярных инструментов для статистического анализа. Я также буду генерировать довольно много графов и диаграмм. Поэтому мне было интересно, какова базовая разница между этими двумя витаминами.

Я не спрашиваю, какой из них лучше, но просто хотел знать, каковы разница с точки зрения рабочего процесса между двумя (помимо того, что SPSS имеет графический интерфейс). Я буду в любом случае, я буду в основном работать с скриптами в любом случае, поэтому я хотел знать о других различиях.

Это было полезно?

Решение

Я работаю в компании, которая использует SPSS для большинства наших данных анализа данных, и по разным причинам - я начал пытаться использовать R для все больше и больше своего собственного анализа. Некоторые из самых больших различий, в которых я столкнулся:

  1. Выходные таблицы - SPSS имеет основные таблицы, общие таблицы, пользовательские таблицы и т. Д., Все выводят на этот нефте просмотра данных или все, что они называют это. Это может относительно легко перевозить в слов документы или листы Excel для дальнейшего анализа / презентации. Эквивалентная функция в R включает в себя обучение LaTex или использование А. odfWeave или Lyx или что-то из этого природы.
  2. Маркировка данных -> SPSS делает довольно хорошую работу с переменными этикетками и значению этикетки. Я не нашел надежное решение для R для достижения этой же задачи.
  3. Вы упоминаете, что вы собираетесь сценарировать большую часть своей работы, и лично я нахожу синтаксис SPSS-сценариев абсолютно ужасного, до такой степени, что я перестал работать с SPSS, когда это возможно. Синтаксис r кажется гораздо более логичным и более тесно следит за стандартами программирования, и существует очень активное сообщество, чтобы полагаться, если вы должны столкнуться с проблемами (так, например,). Я не нашел хорошего сообщества SPSS, чтобы задать вопросы, когда я столкнулся с проблемами.

Другие указали некоторые из больших различий с точки зрения стоимости и функциональности программ. Если вам придется сотрудничать с другими, их уровень комфорта с SPSS или R должен воспроизводить фактор, поскольку вы не хотите быть единственным в вашей группе, которые могут работать или редактировать скрипт, который вы написали в будущем.

Если вы собираетесь учиться R, этот пост на веб-сайте Exchange Stats есть куча отличных ресурсов для обучения R: https://stats.stackexchange.com/questions/138/resources-for-learning-r.

Другие советы

Вот то, что я разместил в списке рассылки R-HELP A, а я думаю, что он дает хороший обзор высокого уровня общего разницы в R и SPSS:

Говоря о пользователе, дружественную коммущалью компьютерное программное обеспечение, мне нравится аналогия автомобилей против автобусов:

Автобусы очень просты в использовании, вам просто нужно знать, какой автобус, чтобы войти, куда начать, и куда выйти (и вам нужно оплатить ваш тариф). Автомобили, с другой стороны, требуют гораздо большего работы, вам нужно иметь какой-то тип карты или направления (даже если карта находится в вашей голове), вам нужно поставить газ в каждый день, а затем вам нужно знать правила Дорога (есть какой-то тип водительских прав). Большим преимуществом автомобиля является то, что он может взять вас в кучу мест, которые автобус не ходит, и для некоторых поездок есть быстрее, что потребует передачи между шинами.

Используя эту аналогию программы, такие как SPSS, - это шины, простые в использовании для стандартных вещей, но очень расстраивают, если вы хотите сделать то, что еще не предварительно запрограммировано.

R - это 4-х колесный привод внедорожника (хотя и экологически чистый) с велосипедом на спине, каяк на вершине, хорошая ходьба и кроссовки на сиденье Pasenger, а также альпинизм и спелангированное снаряжение.

R может взять вас в куда угодно, если вы хотите пойти, если вы займете время, чтобы учиться, как использовать оборудование, но это займет больше времени, чем обучение, где автобусные остановки находятся в SPSS.

Есть Guis для R, который делает его немного проще в использовании, но также ограничить функциональность, которые можно легко использовать. SPSS имеет сценарию, которые выходят на нее простые автобус, но общая философия SPSS управляет людьми к графическому градусу, а не скрипты.

Первоначальный рабочий процесс для SPSS включает в себя оправдание записи большой чек на жир. R свободно доступны.

У r имеет один язык для «сценариев», но не думайте об этом, R - это действительно язык программирования с отличными манипуляцией, статистикой и графикой, встроенным функциями графики. SPSS имеет «синтаксис», «скрипты» и Также написано в Python.

Другим BIGGIE заключается в том, что SPSS сжимает свои данные в структуру таблицы электронной таблицы. Работа с другими структурами данных, вероятно, очень тяжело, но приходит естественным образом R. Я бы не узнал, где начать обработку данных сетевого графика в SPSS, но есть пакет для этого для R.

Также с R Вы можете интегрировать свой рабочий процесс с помощью своей отчетности с помощью SWEAVE - вы пишете документ с встроенными битами R Code, который генерирует сюжеты или таблицы, запустите файл через систему, и выходит отчет в виде PDF. Отлично подходит для того, что когда вы хотите сделать еженедельный отчет, или вы делаете тело работы, а затем босс дает вам обновленный набор данных. Перебежать, прочитайте его, это сделано.

Но вы знаете, ваш звонок ...

Ну, ты приличный программист? Если вы есть, то стоит изучать R. Вы можете сделать больше с вашими данными, как с точки зрения манипуляции, так и с точки зрения манипуляции, так и в статистическом моделировании, чем вы можете с SPSS, и ваши графики, скорее всего, будут лучше. С другой стороны, если вы никогда раньше не запрограммировали, или не найду идею проведения нескольких месяцев, становясь программистом, запугивающим, вы, вероятно, получите больше ценности из SPSS. Уровень вещей, которые вы можете сделать с r без погружения в свою силу, так как полноценный язык программирования, вероятно, не оправдывает усилия.

Есть еще один вариант - сотрудничать. Знаете ли вы кого-то, с которым вы можете работать с вашим проектом (вы не говорите, будь то академик или промышленность, но в любом случае ...), кто знает хорошо?

Есть интересное (и разумно справедливое) сравнение между рядом инструментов статистики здесь

http://anyall.org/blog/2009/02/comprison-of-data-analys-packages-r-matlab-scipy-excel-sas-spsss-stata/

Я работаю как в компании, так и могу сказать следующее:

  • Если у вас есть большая команда разных людей (не все данные ученых), SPSS полезен, потому что это просто (относительно), чтобы понять. Например, если пользователи будут запускать модель, чтобы получить вывод (оценки продаж, и т. Д.), SPSS прозрачна и проста в использовании.

Это сказано, я нахожу r лучше практически во всех других смыслах:

  • R быстрее (хотя иногда спорятно)
  • Как указано ранее, синтаксис в SPSS stawfy (я не могу напрямую этого достаточно). С другой стороны, R могут быть болезненными, чтобы учиться, но есть тонны ресурсов в Интернете, и в конце концов он платит гораздо больше из-за разных вещей, которые вы можете сделать.
  • Опять же, как и все остальные говорят, небо - это предел с R. Tons из пакетов, ресурсов и более важно, независимо от того, чтобы сделать как вы, пожалуйста. В моей организации у нас есть несколько функций очень высокого уровня, которые много сделают. Тяжелая часть создает их один раз, но затем они выполняют сложные задачи, которые SPSS будет путать в бесконечной сети холста. Это особенно верно для вещей, таких как петли.

Это часто упускается из виду, но также есть множество особенностей для сотрудничества между командами (интеграция GitHub с Rstudio и легким зданием пакета с Devtools).

На самом деле, если все в вашей организации знают R, все, что вам нужно, это поддерживать базовый пакет на Github, чтобы поделиться всем. Это, конечно, не является нормой, поэтому я думаю, что SPSS, хотя и худший продукт, все еще имеет рынок.

У меня нет данных для этого, но из моего опыта я могу сказать вам одну вещь:

SPSS намного медленнее, чем r. Отказ (И с большим, я действительно много значит)

Величина разницы, вероятно, настолько велика, чем один между C ++ и R.

Например, мне никогда не придется ждать дольше, чем пару секунд в R., используя SPSS и аналогичные данные, у меня были расчеты, которые заняли более 10 минут.

В качестве не связанной стороны примечания: в моих глазах, в недавнем дискуссии по скорости R, этот момент был как-то упущен из виду (т. Е. Сравнение с SPSS). Кроме того, я удивлен, как эта дискуссия накапливалась на некоторое время и тихо снова исчез.

Существует несколько отличных ответов выше, но я постараюсь предоставить мои 2 цента. Мой отдел полностью полагается на SPSS за нашу работу, но в последние месяцы я прилагаю сознание, чтобы учиться R; Частично для некоторых причин подробно описана выше (скорость, огромные структуры данных, доступные пакеты и т. Д.)

Это сказано, вот несколько вещей, которые я взял по пути:

  1. Если у вас нет некоторых программирования опыта, я думаю, что создание сводных таблиц в CTables уничтожает любую доступную опцию в R. На сегодняшний день, я не знаю, что может воспроизвести то, что может быть создано с использованием пользовательских таблиц.

  2. SPSS, кажется, медленнее, когда сценарии, и да, синтаксис SPSS ужасен. То, что сказал, что я обнаружил, что SCIPTS в SPSS всегда могут быть улучшены, но с помощью команды Execute экономно.

  3. SPSS и R могут взаимодействовать друг с другом, хотя кажется, что это один из способов (только при использовании r внутри SPSS, а не наоборот). Тем не менее, я обнаружил, что это будет мало пользоваться другим, чем если я хочу использовать GGPlot2 или для некоторых других передовых методов управления данными. (Я презираю SPSS Macros).

  4. Я давно чувствовал, что «отчетность», созданная в СПСС, далеко уступает другим решениям. Как упомянуто выше, если вы можете использовать латекс и Sweave, вы будете очень довольны своими эффективными рабочими процессами.

  5. Я смог сделать какой-то расширенный анализ, используя OMS в SPSS. Почти все могут быть направлены на новый набор данных, но я обнаружил, что большинство пользователей SPSS не используют эту функциональность. Также при взгляде на примеры в R он просто чувствует себя «проще», чем использование OMS.

Короче говоря, я нахожусь в использовании SPSS, когда я не могу быстро понять это быстро в R, но я искренне имею все намерение уйти от SPSS и использовать R полностью в какой-то момент в ближайшем будущем.

SPSS предоставляет графический интерфейс, чтобы легко интегрировать существующие программы R или разработать новые. Для получения дополнительной информации см. SPSS сообщество На IBM разработчик работает.

@Henrik, я сделал то же задачу, которую вы упомянули (C ++ и R) на SPSS. И оказалось, что SPSS быстрее по сравнению с R на этом. В моем случае SPSS является aprox. В 7 раз быстрее. Я удивлен этим.

Вот код, который я использовал в SPSS.

data list free
 /x (f8.3).
begin data
1
end data.

comp n = 1e6.

comp t1 = $time.

loop #rep = 1 to 10.
comp x = 1.
loop #i=1 to n.
comp x = 1/(1+x).
end loop.
end loop.

comp t2 = $time.

comp elipsed = t2 - t1.

form elipsed (f8.2).

exe.

Проверьте это видео, почему хорошо сочетаться в SPSS и R ...

Связь

http://bluemixanalytics.wordpress.com/2014/08/29/7-good-reasons-to-combine-ibm-spsss-analytics-and-r/

Если у вас есть совместимая копия r установлена, вы можете подключиться к нему из IBM SPSS Modeler и выполнять модель здания и модели моделей, используя пользовательские алгоритмы R, которые могут быть развернуты в IBM SPSS Modeler. У вас также должна быть копия IBM SPSS Modeler - Essentials for R установлена. IBM SPSS Modeler - Essentials for R предоставляет вам инструменты, необходимые для начала разработки пользовательских приложений R для использования с IBM SPSS Modeler.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top