我最近对一些事情做了更多的统计分析,我很好奇是否有任何编程语言特别适合这个目的。我知道关于 , ,但我更喜欢一些更通用的东西(或者 R 非常通用吗?)。

大家有什么建议?是否有任何语言的语法/语义特别面向于此?或者是否有任何语言拥有非常好的库?

有帮助吗?

解决方案

没有竞赛 - - [R 为主要执行的S(和一个恰好是正确的开源和GNU项目以及)。

不仅设计了S语言的正是为了这个目的的(见约翰·钱伯斯的书),但在的 <强> CRAN 是首屈一指:超过2000包以适当的质量控制,通常由本领域的专家撰写

在ACM看到它时,它给了的ACM软件系统奖以约翰·钱伯斯以同样的方式1998具有以下引文

  

约翰M.庭

     

有关的S系统,其具有永   如何改变人们分析,可视化,   和处理数据。

有关引用,这个奖项的其他获奖者的TeX,Smalltalk中,后记,RPC, '网络',马赛克,的Tcl / Tk,Java的,使...不坏公司将在

现在,如果你“只有”要收集汇总几乎任何程序或功能性的语言会做一些数据。但是,如果你想要的东西,是的设计编程数据的则R为主体的实现它。

其他提示

没有了<强> R第是统计最好的语言,如德克说。我只是想几点到这个:

首先,我认为主要的原因,你应该使用R是因为社区。正是在这个阶段使用,因此深受学术界和工业界的专家,没有其他语言甚至接近相媲美的财富上CRAN。

其次,应该承认的是,R的语言一起工作喜悦。这是我的主要语言,并尝试过的选择,我的没有的任何时间很快放弃它的意图。但它也没有一个垄断了它的实力与数据编程和这个要求可以过头。所有Lisp和函数式语言,在数据编程强劲。 Lisp的,毕竟,从“名单编程”派生,它是Lisp的R上的影响力,使这是什么语言。

有将R社区成员(如罗斯·哈卡)谁是真正观看的Lisp作为未来的统计languge(见参考了“回到未来”纸)由于一些深层次的设计问题R输入语言(如没有多线程)。

因此,虽然R是无疑用于统计计算的最佳语言时,可以看到熟悉像OCaml中,Haskell中,或(可能)的Clojure /咒术另一种语言的某个值。

看一下 咒语, , 基于 克洛尤尔. 。“ Incanter是一个基于Clojure的,类似R的统计计算和图形平台。” Clojure是一种基于LISP的语言,该语言在JVM的顶部实现。它可以轻松访问 java 库。没有比这更通用的目的了。

从我的经验, R 是一个非常强有力的语言在这些领域:

  1. 操纵和转变的数据。

  2. 统计分析。

  3. 图形。

R 不是三招小马。我们还应用的语言来的任务不完全适合进入上述类别。一些例子是:

  • 一个脚本,以协助创造OS x通用的二进制文件通过确定和匹配的静态和动态的图书馆不同的架构和运行得到的团体通过 lipo.

  • 脚本刮信息的网页。

  • 有一组脚本,以建立地理参考图像,切的图片切片集成使用 GDAL, 形成 JSON 清单描述的产出和传的结果给一个网站立即显示 OpenLayers.

我最喜欢的部分的使用 R 是的频率我得说:

哇!有个包裹没 什么?!

你可以看一下程序 智者, ,它是 python 解释器的重新实现,允许您使用 python 语法调用不同的编程语言进行统计(R、matlab、octave 等)。

编写统计程序时的主要问题之一是,您最终可能会拥有许多不同的小脚本,每个脚本都执行一项单独的任务,并且最终可能会出现混乱的文件夹和混乱的结果。

因此,除了选择编程语言(我认为其他人已经回答了您的问题)之外,您还需要一种语法来定义脚本管道:您可以使用程序“gnu/make”来制作它(例如读 )或与此 智者, ,或者还有其他解决方案。

我想说R作为最在我的大学使用的R统计课程和大多数朋友谁采取这样的课程是非常有它的范围和内容达成。

我甚至尝试MATLAB,发现它很方便。

欢呼声

R是巨大的,如果全部您正在做的是统计数据。它有一个很好的人机交互界面和可视化工具。然而,这是相当困难作为通用语言使用的,因为它的语法和语义做统计非常高度优化。如果你想要一个更通用的语言,Python和SciPy的将是一个不错的选择,虽然我已经用它,发现它的统计程序是略显稚嫩。它们通常是低效的或在拐角情况失败。

如果你正在做的大型数据集的数据挖掘,使得性能很重要,和/或你不介意使用的α-ISH工具中,d编程语言和的 dstats库就不错了。 d大约是通用的,你得到一个语言,但恕我直言dstats是非常容易使用,因为模板元编程可以很容易地即使在静态编译,贴近的金属语言设计一个很好的API。 (全面披露:我写的最dstats的,所以我当然认为这是很好)

pystats库(对于Python)是非常适合于统计分析

你有没有考虑使用somethinbg如 MatLab的?它有许多先进的功能,以进行数据分析,你可以做在环境中的某些节目。

了解塔塔什么?我有一个朋友,谁是博士经济学学生,他胡言乱语关于Stata的所有的时间。和我有一个个人亲和力数学

Matlab的是擅长统计太。它不是完全免费的,但

倍频是一个免费的克隆,可能还做你的需要。

我的一个朋友,谁侧重于市场的统计使用 SAS 。我不知道很多关于似乎它 - 它并不像一个“真正”的语言,但可能是值得一试。

我所有的Python其中R绑定。

看看 鲁菲特 包用于 . 。它被例如使用粒子物理学家进行数据分析。

根是一个 C++ 框架,还附带 python 和 ruby​​ 绑定。它还包括有限的互动 C++ 口译员。

同时我也要1为R.它可能不那么容易处理,因为STATA甚至SPSS,特别是用于非程序员。虽然我猜的平均stackoverflower的方式更多的是程序员比我。

这就是说,我倒是想给的简短概述,因为我已经看到了几个统计软件包的来自用户(经济学家(的观点。

STATA仍然是大多数经济学家的选择,并且实际上它有一些长处。 STATAs GUI有助于掌控一切的选项和统计功能的负载。除了STATA似乎是唯一具有附带至少在某种程度上接近基准邮件列表包:一对的一类将R邮件列表。还有一种可以写复杂的。做文件或下载一些从网络。 STATA可能不那么接近编程语言的R,但仍然提供了一个很好的编程语言用于统计目的。根据您的数据集的大小,你应该检查你所需要的许可证。

您也可以使用SPSS这更加GUI工具比STATA的并且例如少一点对于全面经济计量工作如TOBIT模型或面板回归,特别是离散选择模型。

There's也EVIEWS - 不幸的是我已经忘了最一下,只用它在我的研究了几个简单的回归。因此,我仅举在这里。同样关于高斯,这似乎不是包的其余部分更数学。最近,我听说过八度,这也是多个数学。

有关我个人的使用R是头部和肩膀高于一切。偶尔我配对的Python或将其连接到MySQL或PostgreSQL数据库也运行良好。 [R真的可以帮助你,因为你需要了解更多的是为了做一些事情比你需要点击通过SPSS的喜欢用自己的方式学习的统计数据。但如果你需要一个GUI,你可以尝试RKward或考虑在Windows上安装科莫多/ Sciviews-R或蒂恩-R。后面的一些地图无法图形用户界面,但编辑或多或少支持代码高亮和代码建议,这也有助于去完成它。 法恩斯沃思在计量经济学R是一个很好看的。啊,而且我不能忘记提及绘图。从哈德利韦翰的GGPLOT2包就位于钩。最好的方式来创建图形,只要你没有需要他们互动。在一天结束的时候,R是真的最灵活的包:你甚至可以在一个网络服务器安装和建立一些好的webinterface - 天空才是极限

APL 显然是各地最好的语言统计工作之一。这是不通用的,但...

它需要特殊的键盘和字体,因为它不使用ASCII。

请参阅 Conway的博弈APL 之一线位的概况是什么可以用它来完成。

由于我统计的学生。我发现R上的最好的相关软件的所有其他统计数据中。也许它有能力做的统计任何东西。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top