Frage

werde ich große Menge an Netzwerkverkehr bezogenen Daten werden in Kürze die Analyse und wird vorverarbeitet die Daten, um sie zu analysieren. Ich habe festgestellt, dass R und SPSS unter den beliebtesten Tools für statistische Analysen sind. Ich werde auch eine ganze Reihe von Grafiken und Diagramme werden zu generieren. Deshalb habe ich frage mich, was zwischen diesen beiden Softwares der grundlegende Unterschied ist.

Ich frage nicht, welches besser ist, aber wollte nur wissen, was der Unterschied in Bezug auf Workflow sind zwischen den beiden (neben der Tatsache, dass SPSS eine GUI hat). Ich werde meist mit Skripten in jedem Fall arbeiten sowieso so dass ich über die anderen Unterschiede wissen wollte.

War es hilfreich?

Lösung

Ich arbeite bei einer Firma, die SPSS für die Mehrheit unserer Datenanalyse verwendet und für eine Vielzahl von Gründen - Ich habe begonnen, für mehr Einsatz R versuchen und mehr meine eigenen Analyse. Einige der größten Unterschiede, die ich laufen haben in beinhalten:

  1. Ausgabe von Tabellen - SPSS hat grundlegende Tabellen, allgemeine Tabellen, benutzerdefinierte Tabellen, etc., die alle Ausgaben in diesem geschickten Daten-Viewer sind oder was auch immer sie es nennt. Diese können relativ leicht zu Word-Dokumente oder Excel-Tabellen zur weiteren Analyse / Präsentation transportiert werden. Die entsprechende Funktion in R beinhaltet LaTex Lernen oder eine odfWeave oder Lyx oder etwas in der Art verwendet wird.
  2. Kennzeichnung von Daten -> SPSS hat einen ziemlich guten Job mit den variablen und Wertelabels. Ich habe gefunden, nicht eine robuste Lösung für R dieselbe Aufgabe zu erfüllen.
  3. Sie erwähnen, dass Sie gehen, die meisten Ihrer Arbeit zu scripting, und ich persönlich finde SPSS die Skript-Syntax absolut horrend, bis zu dem Punkt, dass ich aufgehört habe mit SPSS arbeiten, wann immer möglich. R Syntax scheint viel logische und folgt Programmierstandards enger und es gibt eine sehr aktive Community zu verlassen sich auf, sollten Sie laufen in Schwierigkeiten (SO zum Beispiel). Ich habe keine gute SPSS Community gefunden, Fragen zu stellen, als ich auf Probleme stoßen.

Andere haben einige der großen Unterschiede in Bezug auf Kosten und Funktionalität der Programme hingewiesen. Wenn Sie mit anderen zusammenzuarbeiten haben, ihren Komfort mit SPSS oder R sollte einen Faktor spielen, da Sie nicht der einzige in der Gruppe sein wollen, die auf oder bearbeiten ein Skript arbeiten können, dass Sie in der Zukunft geschrieben.

Wenn Sie vorhaben, R zu lernen, dieser Beitrag auf der Statistiken Exchange-Website hat eine Reihe von großen Ressourcen für das Lernen R: https://stats.stackexchange.com/questions/138/resources-for-learning-r

Andere Tipps

Hier ist etwas, dass ich an der R-Hilfe-Mailingliste eines gepostete Weile zurück, aber ich denke, dass es eine gute Übersicht auf hohe Ebene des allgemeinen Unterschiedes in der R und SPSS gibt:

Wenn man über die Benutzerfreundlichkeit von Computer-Software wie ich die Analogie von Autos vs. Busse:

Die Busse sind sehr einfach zu bedienen, einfach müssen wissen, welcher Bus auszukommen, wo auszukommen, und wo ich aussteigen (Und Sie müssen Ihren Tarif bezahlen). Autos auf der anderen Seite erfordert viel mehr Arbeit, müssen Sie irgendeine Art von haben Karte oder Richtungen (auch wenn die Karte ist im Kopf), müssen Sie Gas setzen in ab und zu, was Sie wissen müssen die Regeln der Straße (eine Art haben der Führerschein). Der große Vorteil des Autos ist, dass es ein nehmen Haufen von Orten, dass der Bus nicht gehen und es ist schneller für einige Reisen das würde erfordern transfering zwischen Busse.

Mit dieser Analogie Programmen wie SPSS sind Busse, einfach für die verwenden Standard Dinge, aber sehr frustrierend wenn Sie etwas tun wollen, das ist nicht bereits vorprogrammiert.

R ist ein 4-Rad-Antrieb SUV (obwohl umweltfreundlich) mit einem Fahrrad auf der Rückseite, einen Kajak auf der Oberseite, gut Wandern und Schuhe im Rennen pasenger Sitz und Bergsteigen und Spelunking Gang in den Rücken.

R können Sie überall hin mitnehmen Sie gehen wollen wenn Sie Zeit zu Leard nehmen, wie man den Einsatz die Ausrüstung, aber die zu geht länger dauern als das Lernen, wo die Bushaltestellen sind in SPSS.

Es gibt GUIs für R, die es ein bisschen einfacher zu bedienen, sondern auch die Funktionalität beschränken, die leicht verwendet werden kann. SPSS hat Scripting haben, die es braucht nur ein Bus jenseits des Seins, sondern die allgemeine phylosophy von SPSS Stieren Menschen auf die GUI anstatt die Skripte.

Der erste Workflow für SPSS beinhaltet rechtfertigen einen großen dicken Scheck zu schreiben. R ist frei verfügbar.

R hat eine einzige Sprache für ‚Scripting‘, aber glaube nicht, es so, R ist wirklich eine Programmiersprache mit großer Datenmanipulation, Statistiken und Grafiken Funktionalität eingebaut. SPSS hat ‚Syntax‘, ‚Scripts 'und ist auch skript in Python.

Ein weiteres großes Problem ist, dass SPSS seine Daten in eine spreadsheety Tabellenstruktur quetscht. wahrscheinlich sehr schwer mit anderen Datenstrukturen zu tun, sondern kommt natürlich auf R. Mich würde nicht wissen, wo Umgang mit Netzwerkdiagrammtyp Daten in SPSS zu starten, aber es gibt ein Paket für R zu tun.

mit R Auch können Sie Ihren Workflow mit Ihrer Berichterstattung integrieren, indem Sweave mit - Sie ein Dokument mit eingebetteten Bits von R Code schreiben, Plots oder Tabellen zu generieren, führen Sie die Datei durch das System und aus kommt der Bericht als PDF. Groß für, wenn Sie wollen einen wöchentlichen Bericht zu tun, oder Sie tun, ein Werk, und dann der Chef gibt Ihnen einen aktualisierten Datensatz. Re-run, lesen Sie es über, ihre getan.

Aber wissen Sie, Ihr Anruf ...

Nun, Sie sind ein anständiger Programmierer? Wenn Sie sind, dann lohnt es sich, R. Sie lernen können mehr tun, mit Ihren Daten, sowohl in Bezug auf Manipulation und statistische Modellierung, als können Sie mit SPSS, und Ihre Diagramme werden wahrscheinlich besser werden. Auf der anderen Seite, wenn Sie habe wirklich noch nie programmiert, oder finde die Idee von einem Programmierer einschüchternd, mehrere Monate verbringen werden Sie wahrscheinlich mehr Wert aus SPSS erhalten. Die Höhe der Sachen, die Sie mit R ohne Tauchen in seiner Macht Stehende zu tun, als eine vollwertige Programmiersprache wahrscheinlich nicht die Mühe rechtfertigen.

Es gibt eine andere Option - collaborate. Kennen Sie jemand, den Sie mit an Ihrem Projekt arbeiten können (Sie können nicht sagen, ob es wissenschaftliche oder in der Industrie, aber so oder so ...), wer weiß R gut?

Es ist ein interessantes (und einigermaßen fair) Vergleich zwischen einer Reihe von Statistiken Tool hier

http://anyall.org/blog/2009/02/comparison-of-data-analysis-packages-r-matlab-scipy-excel-sas-spss-stata/

Ich arbeite mit beiden in einem Unternehmen und kann folgende sagen:

  • Wenn Sie ein großes Team von verschiedenen Menschen haben (nicht alle Daten Wissenschaftler), ist SPSS nützlich, weil es klar ist (relativ) zu verstehen. Zum Beispiel, wenn Benutzer ein Modell ausgeführt werden einen Ausgang (Umsatzschätzungen usw.) zu bekommen, ist SPSS klar und einfach zu bedienen.

Das heißt, ich finde R besser in fast allen anderen Sinn:

  • R ist schneller (obwohl manchmal fraglich)
  • Wie bereits erwähnt, ist die Syntax in SPSS ist aweful (Ich kann nicht genug betonen). Auf der anderen Seite kann R schmerzhaft sein, zu lernen, aber es gibt Unmengen an Ressourcen online und am Ende zahlt es sich viel mehr wegen der verschiedenen Dinge, die Sie tun können.
  • Wieder, wie jeder andere auch sagt, der Himmel ist die Grenze mit R. Tonnen von Paketen, die Ressourcen und was noch wichtiger ist: indepedence wie Sie tun Sie bitte. In meiner Organisation haben wir einige sehr hohe Level-Funktionen, die eine Menge zu erledigen. Der schwierige Teil ist die Schaffung sie einmal, aber dann erfüllt sie Aufgaben kompliziert, dass SPSS in einer nie endenden Bahn aus Leinwand verwickeln würde. Dies gilt besonders für Dinge wie Schleifen.

Es wird oft übersehen, aber R hat auch viele Funktionen zwischen den Teams (Github Integration mit RStudio und einfach Paket Gebäude mit devtools) zu kooperieren.

Eigentlich, wenn jeder in Ihrer Organisation R weiß, alles, was Sie brauchen, ist ein Basispaket auf Github zu teilen alles zu halten. Das ist natürlich nicht die Norm, weshalb ich SPSS denken, obwohl schlimmsten Produkt, das noch einen Markt.

Ich habe keine Daten für sie, aber aus meiner Erfahrung kann ich Ihnen sagen, eine Sache:

SPSS ist viel langsamer als R . (Und mit viel, ich meine wirklich viel)

Die Größe der Differenz ist wahrscheinlich so groß wie die zwischen C ++ und R .

Zum Beispiel habe ich nie länger warten müssen als ein paar Sekunden in R. Mit SPSS und ähnliche Daten, ich Berechnungen hatten, die länger dauerte als 10 Minuten.

Als unabhängige Seite Anmerkung: In meinen Augen in der jüngsten Diskussion über die Geschwindigkeit von R, wurde dieser Punkt irgendwie übersehen (das heißt, der Vergleich mit SPSS). Außerdem bin ich erstaunt, wie diese Diskussion für eine Weile tauchte und leise verschwand wieder.

Es gibt einige große Antworten oben, aber ich werde versuchen, meine 2 Cent zu liefern. Meine Abteilung verlässt sich voll und ganz auf SPSS für unsere Arbeit, aber in den letzten Monaten habe ich eine bewusste Anstrengungen unternommen, R zu lernen; teilweise aufgeschlüsselt für einige der oben genannten Gründe (Geschwindigkeit, große Datenstrukturen, verfügbare Pakete usw.)

sagte, hier sind ein paar Dinge, die ich auf dem Weg abgeholt:

  1. Wenn Sie einige Erfahrung Programmierung haben, ich glaube, Erstellung von Übersichtstabellen in CTABLES jede verfügbare Option zerstört in R. Bis heute bin ich nicht bewusst Paket, das replizieren kann, was erstellt werden können benutzerdefinierte Tabellen verwenden.

  2. SPSS scheint langsamer zu sein, wenn Scripting, und ja, SPSS Syntax ist schrecklich. Das heißt, ich festgestellt, dass scipts in SPSS kann immer verbessert werden, aber mit dem Befehl EXECUTE sparsam.

  3. SPSS und R können miteinander eine Schnittstelle, obwohl es scheint, dass es eine Möglichkeit ist (nur bei Verwendung von R innerhalb von SPSS, nicht umgekehrt). Das heißt, ich dies wenig hilfreich gefunden haben, werden anders als wenn ich will ggplot2 verwenden oder für einige andere erweiterte Datenmanagement-Techniken. (I despise SPSS-Makros).

  4. Ich habe schon lange das Gefühl, dass „Reporting“ Arbeit in SPSS erstellt weit schlechter als andere Lösungen ist. Wie oben erwähnt, wenn Sie LaTeX und Sweave nutzen können, werden Sie mit Ihrem effizienten Workflows sehr glücklich sein.

  5. Ich konnte durch den Einsatz von OMS in SPSS eine erweiterte Analyse tun. Fast alles kann zu einem neuen Datensatz geroutet werden, aber ich habe festgestellt, dass die meisten SPSS Anwender diese Funktion nicht verwenden. Auch wenn an Beispielen in R suchen, es fühlt sich einfach "leichter" als OMS verwendet wird.

Kurz gesagt, finde ich mich SPSS verwenden, wenn ich kann es nicht herausfinden, schnell in R, aber ich habe aufrichtig jede Absicht immer weg von SPSS und mit R ganz irgendwann in der nahen Zukunft.

SPSS bietet eine grafische Oberfläche auf einfache Weise bestehende R-Programme zu integrieren oder neues zu entwickeln. Weitere Informationen finden Sie in der SPSS Gemeinschaft auf IBM Developer Works.

@Henrik, ich habe die gleiche Aufgabe, die Sie erwähnt haben ( C ++ und R ) auf SPSS. Und es stellte sich heraus, dass SPSS ist schneller im Vergleich zu R auf diesem. In meinem Fall ist SPSS aprox. 7-mal schneller. Ich bin überrascht darüber.

Hier ist ein Code, den ich in SPSS verwendet.

data list free
 /x (f8.3).
begin data
1
end data.

comp n = 1e6.

comp t1 = $time.

loop #rep = 1 to 10.
comp x = 1.
loop #i=1 to n.
comp x = 1/(1+x).
end loop.
end loop.

comp t2 = $time.

comp elipsed = t2 - t1.

form elipsed (f8.2).

exe.

In diesem Video, warum gut zu kombinieren SPSS und R ...

Link

http://bluemixanalytics.wordpress.com/2014/08/29/7-good-reasons-to-combine-ibm-spss-analytics-and-r/

Wenn Sie eine kompatible Kopie von R installiert haben, können Sie es von IBM SPSS Modeler eine Verbindung herstellen können und führen Modellbau und Modell Scoring benutzerdefinierte R-Algorithmen, die in IBM SPSS Modeler eingesetzt werden können. Sie müssen auch eine Kopie von IBM SPSS Modeler - Essentials for R installiert. IBM SPSS Modeler -. Essentials for R liefert Ihnen Tools müssen Sie mit IBM SPSS Modeler entwickeln kundenspezifische R-Anwendungen für den Einsatz starten

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top