哪些编程语言适合统计?[关闭]
-
18-09-2019 - |
题
我最近对一些事情做了更多的统计分析,我很好奇是否有任何编程语言特别适合这个目的。我知道关于 右, ,但我更喜欢一些更通用的东西(或者 R 非常通用吗?)。
大家有什么建议?是否有任何语言的语法/语义特别面向于此?或者是否有任何语言拥有非常好的库?
解决方案
没有竞赛 - 的 - [R 强> 为主要执行的S(和一个恰好是正确的开源和GNU项目以及)。
不仅设计了S语言的正是为了这个目的的(见约翰·钱伯斯的书),但在的 <强> CRAN 强> 是首屈一指:超过2000包以适当的质量控制,通常由本领域的专家撰写页。 >
在ACM看到它时,它给了的ACM软件系统奖以约翰·钱伯斯以同样的方式1998具有以下引文
约翰M.庭
有关的S系统,其具有永 如何改变人们分析,可视化, 和处理数据。
有关引用,这个奖项的其他获奖者的TeX,Smalltalk中,后记,RPC, '网络',马赛克,的Tcl / Tk,Java的,使...不坏公司将在
现在,如果你“只有”要收集汇总几乎任何程序或功能性的语言会做一些数据。但是,如果你想要的东西,是的设计编程数据的则R为主体的实现它。
其他提示
没有了<强> R第强>是统计最好的语言,如德克说。我只是想几点到这个:
首先,我认为主要的原因,你应该使用R是因为社区。正是在这个阶段使用,因此深受学术界和工业界的专家,没有其他语言甚至接近相媲美的财富上CRAN。
其次,应该承认的是,R的语言一起工作喜悦。这是我的主要语言,并尝试过的选择,我的没有的任何时间很快放弃它的意图。但它也没有一个垄断了它的实力与数据编程和这个要求可以过头。所有Lisp和函数式语言,在数据编程强劲。 Lisp的,毕竟,从“名单编程”派生,它是Lisp的R上的影响力,使这是什么语言。
有将R社区成员(如罗斯·哈卡)谁是真正观看的Lisp作为未来的统计languge(见参考了“回到未来”纸)由于一些深层次的设计问题R输入语言(如没有多线程)。
因此,虽然R是无疑用于统计计算的最佳语言时,可以看到熟悉像OCaml中,Haskell中,或(可能)的Clojure /咒术另一种语言的某个值。
从我的经验, R
是一个非常强有力的语言在这些领域:
操纵和转变的数据。
统计分析。
图形。
但 R
不是三招小马。我们还应用的语言来的任务不完全适合进入上述类别。一些例子是:
一个脚本,以协助创造OS x通用的二进制文件通过确定和匹配的静态和动态的图书馆不同的架构和运行得到的团体通过
lipo
.脚本刮信息的网页。
有一组脚本,以建立地理参考图像,切的图片切片集成使用
GDAL
, 形成JSON
清单描述的产出和传的结果给一个网站立即显示OpenLayers
.
我最喜欢的部分的使用 R
是的频率我得说:
哇!有个包裹没 什么?!
我想说R作为最在我的大学使用的R统计课程和大多数朋友谁采取这样的课程是非常有它的范围和内容达成。
我甚至尝试MATLAB,发现它很方便。
欢呼声
R是巨大的,如果全部您正在做的是统计数据。它有一个很好的人机交互界面和可视化工具。然而,这是相当困难作为通用语言使用的,因为它的语法和语义做统计非常高度优化。如果你想要一个更通用的语言,Python和SciPy的将是一个不错的选择,虽然我已经用它,发现它的统计程序是略显稚嫩。它们通常是低效的或在拐角情况失败。
如果你正在做的大型数据集的数据挖掘,使得性能很重要,和/或你不介意使用的α-ISH工具中,d编程语言和的 dstats库就不错了。 d大约是通用的,你得到一个语言,但恕我直言dstats是非常容易使用,因为模板元编程可以很容易地即使在静态编译,贴近的金属语言设计一个很好的API。 (全面披露:我写的最dstats的,所以我当然认为这是很好)
在 pystats库(对于Python)是非常适合于统计分析
你有没有考虑使用somethinbg如 MatLab的?它有许多先进的功能,以进行数据分析,你可以做在环境中的某些节目。
我的一个朋友,谁侧重于市场的统计使用 SAS 。我不知道很多关于似乎它 - 它并不像一个“真正”的语言,但可能是值得一试。
我所有的Python其中R绑定。
同时我也要1为R.它可能不那么容易处理,因为STATA甚至SPSS,特别是用于非程序员。虽然我猜的平均stackoverflower的方式更多的是程序员比我。
这就是说,我倒是想给的简短概述,因为我已经看到了几个统计软件包的来自用户(经济学家(的观点。
STATA仍然是大多数经济学家的选择,并且实际上它有一些长处。 STATAs GUI有助于掌控一切的选项和统计功能的负载。除了STATA似乎是唯一具有附带至少在某种程度上接近基准邮件列表包:一对的一类将R邮件列表。还有一种可以写复杂的。做文件或下载一些从网络。 STATA可能不那么接近编程语言的R,但仍然提供了一个很好的编程语言用于统计目的。根据您的数据集的大小,你应该检查你所需要的许可证。
您也可以使用SPSS这更加GUI工具比STATA的并且例如少一点对于全面经济计量工作如TOBIT模型或面板回归,特别是离散选择模型。
There's也EVIEWS - 不幸的是我已经忘了最一下,只用它在我的研究了几个简单的回归。因此,我仅举在这里。同样关于高斯,这似乎不是包的其余部分更数学。最近,我听说过八度,这也是多个数学。
有关我个人的使用R是头部和肩膀高于一切。偶尔我配对的Python或将其连接到MySQL或PostgreSQL数据库也运行良好。 [R真的可以帮助你,因为你需要了解更多的是为了做一些事情比你需要点击通过SPSS的喜欢用自己的方式学习的统计数据。但如果你需要一个GUI,你可以尝试RKward或考虑在Windows上安装科莫多/ Sciviews-R或蒂恩-R。后面的一些地图无法图形用户界面,但编辑或多或少支持代码高亮和代码建议,这也有助于去完成它。 法恩斯沃思在计量经济学R是一个很好看的。啊,而且我不能忘记提及绘图。从哈德利韦翰的GGPLOT2包就位于钩。最好的方式来创建图形,只要你没有需要他们互动。在一天结束的时候,R是真的最灵活的包:你甚至可以在一个网络服务器安装和建立一些好的webinterface - 天空才是极限
。由于我统计的学生。我发现R上的最好的相关软件的所有其他统计数据中。也许它有能力做的统计任何东西。