سؤال

أقوم بإجراء المزيد من التحليل الإحصائي لبعض الأشياء مؤخرًا، ولدي فضول لمعرفة ما إذا كانت هناك أي لغات برمجة جيدة بشكل خاص لهذا الغرض.وأنا أعلم عن ر, ، لكنني أفضل نوعًا ما شيئًا أكثر عمومية (أو هل R للأغراض العامة جدًا؟).

ما هي اقتراحاتكم يا رفاق؟هل هناك أي لغات تكون تركيبتها/دلالاتها موجهة بشكل خاص نحو هذا؟أم أن هناك لغات تحتوي على مكتبات جيدة بشكل استثنائي؟

هل كانت مفيدة؟

المحلول

لا مسابقة -- رديئة كما التنفيذ الرئيسي ل S (وواحد يحدث أن يكون المصدر المفتوح المناسبة ومشروع جنو كذلك).

ليس فقط حسب اللغة المصممة بالضبط لهذا الغرض (انظر الكتب التي كتبها جون تشامبرز)، ولكن الدعم الغني للحزم الخاصة بالمجال في كرين لا أحد: أكثر من 2000 حزمة مع مراقبة الجودة المناسبة، غالبا ما يصرح به الخبراء في هذا المجال.

يرى ACM بنفس الطريقة التي أعطتها جائزة ACM Systems Systems لجون غرف في عام 1998 مع ما يلي الاقتباس

جون م. تشامبرز

بالنسبة لنظام S، الذي تغير إلى الأبد كيفية تحليل الناس وتصور البيانات ومعالجتها.

للإشارة، كان الفائزين الآخرين في هذه الجائزة TEX، Smalltalk، PostScript، RPC، "الويب"، الفسيفساء، TCL / TK، Java، جعل، ... ليست شركة سيئة أن تكون فيها.

الآن، إذا كنت ترغب فقط في جمع وتلخيص بعض البيانات فقط حول أي لغة إجرائية أو وظيفية ستفعل. ولكن إذا كنت تريد شيئا كان مصممة للبرمجة مع البيانات ثم ص كتنفيذ الرئيسي هو.

نصائح أخرى

لا شك رديئة هي أفضل لغة للإحصاءات، كما يقول ديرك. أريد فقط إضافة بعض النقاط إلى هذا:

أولا، أعتقد أن السبب الرئيسي الذي يجب عليك استخدامه هو بسبب المجتمع. يتم استخدامه بشكل كبير من قبل الخبراء في الأوساط الأكاديمية والصناعة في هذه المرحلة، أن أي لغة أخرى حتى تقترب من تنافس الثروة على Cran.

ثانيا، يجب الاعتراف بأن اللغة هي فرحة للعمل معها. إنها لغتي الأساسية، وقد جربت بدائل، لدي رقم نية التخلي عنها في أي وقت قريب. لكنه ليس لديه أيضا احتكار قوتها للبرمجة مع البيانات ويمكن اتخاذ هذه الادعاء بعيدا جدا. جميع اللغات الفعلية واللغات الوظيفية قوية في برمجة البيانات. كان LISP، بعد كل شيء، مشتق من "قائمة البرمجة"، وهو تأثير LISP على R الذي يجعل اللغة ما هو عليه.

يوجد أعضاء في مجتمع R (على سبيل المثال، روس Ihaka) الذين ينظرون في الواقع إلى LISP باعتباره الضعف الإحصائي في المستقبل (انظر ورقة "العودة إلى المستقبل" للرجوع إليها) بسبب مشاكل التصميم العميق في لغة ص ( على سبيل المثال. No multithreading).

لذلك، في حين أن R بلا شك أفضل لغة للحوسبة الإحصائية، أرى بعض القيمة في كونها على دراية بلغة أخرى مثل Ocaml أو Haskell أو (ربما) Clojure / Inciter.

القي نظرة على incinter., ، مرتكز على جلب. وبعد "IncAnter عبارة عن منهجية مقرها عباءة، ص مستعدة للحوسبة الإحصائية والرسومات." Clojure هي لغة قائمة على LISP تم تنفيذه في الجزء العلوي من JVM. لديها سهولة الوصول إلى مكتبات Java. لا يمكن الحصول على الغرض العام أكثر من ذلك.

من تجربتي، R هي لغة قوية بشكل استثنائي في هذه المجالات:

  1. التلاعب وتحويل البيانات.

  2. تحليل احصائي.

  3. الرسومات.

ولكن R ليس بأي حال من ثلاثة خدعة المهر. لقد قمت أيضا بتطبيق اللغة على المهام التي لا تناسبها بالكامل في الفئات المذكورة أعلاه. بعض الأمثلة هي:

  • سيناريو للمساعدة في إنشاء ثنائيات OSX العالمية عن طريق تحديد ومطابقة المكتبات الثابتة والديناميكية من مختلف البنيات ثم تشغيل المجموعات الناتجة من خلال lipo.

  • البرامج النصية إلى كشط معلومات من صفحات الويب.

  • مجموعة من البرامج النصية لإنشاء صور جغرافية جغرافية، وقطع الصور في البيلز باستخدام GDAL, ، شكل أ JSON بيان يصف الإخراج وتحميل النتيجة إلى موقع ويب للعرض الفوري OpenLayers.

الجزء المفضل لدي من استخدام R هو التردد الذي أحصل عليه:

قف! هناك حزمة لا الذي - التي؟!

يمكنك إلقاء نظرة على البرنامج حكيم, ، وهو إعادة تنفيذ لمترجم بايثون الذي يسمح لك باستدعاء لغات برمجة مختلفة للإحصائيات (R، matlab، octave، إلخ..) باستخدام بناء جملة بايثون.

إحدى المشكلات الرئيسية أثناء كتابة البرامج لإجراء الإحصائيات هي أنه قد ينتهي بك الأمر إلى وجود العديد من البرامج النصية الصغيرة المختلفة، كل منها يقوم بمهمة منفصلة، ​​ويمكن أن ينتهي بك الأمر إلى وجود مجلدات فوضوية وارتباك في نتائجك.

لذا، وبصرف النظر عن اختيار لغة البرمجة (أعتقد أن الأشخاص الآخرين قد أجابوا على سؤالك بالفعل) فإنك تحتاج أيضًا إلى بناء جملة لتحديد مسارات البرامج النصية:يمكنك صنعه باستخدام برنامج "gnu/make" (على سبيل المثال.يقرأ هذا) أو بهذا حكيم, أو هناك حلول أخرى.

أود أن أقول أن معظم دورات الإحصاءات في جامعتي تستخدم R ومعظم أصدقائي الذين أخذوا مثل هذه الدورات محتوى تماما مع نطاقها والوصول إليها.

لقد حاولت حتى matlab وجدت أنها مفيدة للغاية.

في صحتك

ص كبيرة إذا الكل أنت تفعل إحصائيات. لقد حصلت على واجهة تفاعلية وتصور لطيفة. ومع ذلك، من الصعب استخدامها ككلغة لأغراض عامة لأن بناء الجملة ودوانيها محسنة للغاية لفعل الإحصاءات. إذا كنت تريد لغة أكثر للأغراض العامة، فستكون بيثون مع SCIPY خيارا رائعا، على الرغم من أنني استخدمته ووجدت الروتين الإحصائي في ذلك إلى حد ما. غالبا ما تكون غير فعالة أو تفشل في حالات الزاوية.

إذا كنت تقوم بتعدين البيانات على مجموعات البيانات الكبيرة، فإن جعل الأداء مهم و / أو لا تمانع في استخدام أدوات ألفا ISH ولغة البرمجة D و مكتبة DSTATS. يمكن أن تكون جيدة جدا. د هو حول الغرض العام لغة كما تحصل عليه، لكن IMHO DSTATS سهل الاستخدام لأن Metaprogramming القالب يجعل من السهل تصميم واجهة برمجة تطبيقية لطيفة حتى في لغة محمولة قانونية وثيقة معادن. (الكشف الكامل: كتبت معظم DSTats، لذلك بالطبع أعتقد أنه جيد.)

ال مكتبة البياضات (لبثيون) مناسب تماما للتحليل الإحصائي.

هل فكرت في استخدام Somethinbg matlab.ب لديها العديد من القدرات المتقدمة لإجراء تحليل البيانات ويمكنك القيام ببعض البرمجة في البيئة.

ماذا عن انتباهب لدي صديق طالب اقتصاديا دكتوراه وتهذي يغرب عن استغا طوال الوقت. ولدي تقارب شخصي ل الرياضيات.

matlab. جيد في الإحصاء أيضا. انها ليست مجانية تماما، رغم ذلك.

اوكتاف هو استنساخ مجاني قد يفعل أيضا ما تحتاجه.

يستخدم صديق لي يركز على إحصاءات السوق ساس.. وبعد لا أعرف الكثير عن ذلك - لا يبدو الأمر بلغة "حقيقية"، ولكن قد يستحق التدقيق.

أنا كل شيء بالنسبة لبيتثون مع الروابط R.

إلقاء نظرة سقف حزمة ل جذر. وبعد يتم استخدامه من قبل EG فيزياء الجسيمات لتحليل البيانات.

الجذر هو C++ الإطار وأيضا يأتي مع ارتباطات بيثون وروبي. ويشمل أيضا تفاعلية محدودة C++ مترجم.

أود أيضًا إجراء 1+ لـ R.قد لا يكون التعامل معها سهلاً مثل STATA أو حتى SPSS، خاصة بالنسبة لغير المبرمجين.على الرغم من أنني أعتقد أن متوسط ​​​​stackoverflower هو مبرمج أكثر مني.

ومع ذلك، أود أن أقدم نظرة عامة قصيرة، لأنني رأيت بعض الحزم الإحصائية من وجهة نظر المستخدمين (الاقتصاديين).

ولا يزال برنامج STATA هو الاختيار الأمثل بالنسبة لأغلبية الاقتصاديين، وهو في واقع الأمر يحمل بعض الإيجابيات.تساعد واجهة المستخدم الرسومية لـ STATA على البقاء مسؤولاً عن مجموعة كبيرة من الخيارات والوظائف الإحصائية.بالإضافة إلى ذلك، يبدو أن STATA هي الحزمة الوحيدة التي تحتوي على قائمة بريدية تقترب على الأقل إلى حد ما من المعيار:القائمة البريدية R الفريدة من نوعها.لا يزال بإمكان المرء كتابة ملفات .do معقدة أو تنزيل بعضها من الويب.قد لا تكون STATA قريبة من لغة البرمجة مثل R ولكنها لا تزال تقدم لغة برمجة جيدة للأغراض الإحصائية.اعتمادًا على حجم مجموعات البيانات الخاصة بك، يجب عليك التحقق من الترخيص الذي تحتاجه.

يمكنك أيضًا استخدام SPSS الذي يعد أداة واجهة المستخدم الرسومية أكثر من STATA وهو أقل شمولاً قليلاً على سبيل المثال للعمل الاقتصادي القياسي مثل نماذج TOBIT أو انحدارات اللوحة، وخاصة نماذج الاختيار المنفصلة.

يوجد أيضًا برنامج Eviews - لسوء الحظ، لقد نسيت الكثير عنه ولم أستخدمه إلا في بعض التراجعات السهلة في دراستي.وبالتالي أنا فقط أسميها هنا.نفس الشيء بالنسبة لـ GAUSS، والذي يبدو أكثر رياضية من بقية الحزمة.لقد سمعت مؤخرًا عن Octave، وهو أيضًا أكثر رياضية.

بالنسبة لاستخدامي الشخصي فإن R هي الرأس والكتفين فوق أي شيء آخر.أحيانًا أقوم بإقرانه في Python أو توصيله بقواعد بيانات MySQL أو PostgreSQL التي تعمل أيضًا بشكل جيد.يساعدك R حقًا على تعلم الإحصائيات لأنك تحتاج إلى فهم المزيد للقيام بشيء ما أكثر مما قد تحتاج إلى النقر فوق أمثال SPSS.على الرغم من أنك إذا كنت بحاجة إلى واجهة المستخدم الرسومية، فيمكنك تجربة RKward أو التفكير في تثبيت Komodo / Sciviews-R أو Tinn-R على النوافذ.هذه الأخيرة ليست واجهات المستخدم الرسومية، ولكنها محررات تدعم بشكل أو بآخر Code Highlight واقتراحات التعليمات البرمجية التي تساعد أيضًا في إنجاز ذلك.تعتبر Farnsworth Econometrics in R قراءة جيدة.آه، ولا أستطيع أن أنسى أن أذكر المؤامرة.حزمة ggplot2 من هادلي ويكهام بعيدة كل البعد عن الخطاف.أفضل طريقة لإنشاء الرسومات طالما أنك لا تحتاج إليها أن تكون تفاعلية.في نهاية اليوم، تعد R حقًا الحزمة الأكثر مرونة:ويمكنك أيضًا تثبيته على خادم ويب وإنشاء واجهة ويب رائعة - لا حدود.

أمن على ما يبدو واحدة من أفضل لغة حولها لإحصائيات العمل. ليس للأغراض العامة على الرغم من ...

يتطلب لوحة مفاتيح خاصة وخط لأنها لا تستخدم ASCII.

يرى لعبة كونواي الحياة في سطر واحد من APL لبعضها نظرة عامة على ما يمكن القيام به معها.

كما أنا طالب الإحصاءات. لقد وجدت ص الأفضل بين جميع البرامج ذات الصلة الإحصائية الأخرى. ربما لديها القدرة على القيام بأي شيء مع الإحصاءات.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top