سؤال

لقد بدأت مؤخرا الحال على ضغط البيانات في الجامعة.ومع ذلك أجد أن استخدام مصطلح "الكون" كما ينطبق على علوم الكمبيوتر غامضة إلى حد ما.بقدر ما استطيع ان اقول انه يترجم تقريبا إلى "العشوائية" من نظام أو هيكل.

ما هو تعريف مناسب من علوم الكمبيوتر "الكون"?

هل كانت مفيدة؟

المحلول

الكون يمكن أن تعني أشياء مختلفة:

الحوسبة

في الحوسبة, الكون هو العشوائية التي تم جمعها قبل التشغيل النظام أو التطبيق للاستخدام في التشفير أو الاستخدامات الأخرى التي تتطلب بيانات عشوائية.هذه العشوائية غالبا ما يتم جمعها من الأجهزة مصادر إما قبل القائمة هذه كما حركات الماوس أو خاصة توفير المولدات العشوائية.

نظرية المعلومات

في نظرية المعلومات ، الكون هو قياس عدم اليقين المرتبطة بها مع متغير عشوائي.المصطلح من قبل نفسها في هذا السياق يشير عادة إلى شانون الكون ، يوضحها ، بمعنى من القيمة المتوقعة المعلومات الواردة في رسالة عادة في وحدات مثل بت.مكافئ ، شانون الكون هو مقياس متوسط محتوى المعلومات أحد في عداد المفقودين عندما لا يعرف قيمة متغير عشوائي

الكون في ضغط البيانات

الكون في ضغط البيانات قد تدل على عشوائية من البيانات التي تقوم بادخال نص إلى خوارزمية ضغط.المزيد من الكون ، أقل نسبة الضغط.هذا يعني أن أكثر عشوائية النص هو أهون يمكنك ضغط عليه.

شانون الكون يمثل الحد المطلق على أفضل وجه ممكن ضياع ضغط من أي الاتصالات:علاج الرسائل ترميز سلسلة مستقلة و بشكل مماثل-توزيع عشوائي المتغيرات شانون مصدر الترميز يدل على ان نظرية في الحد ، متوسط طول أقصر تمثيل ممكن لترميز رسائل في الأبجدية هو الكون مقسوما على لوغاريتم عدد من الرموز في الهدف الأبجدية.

نصائح أخرى

المفضلة التعريف, مع المزيد من التركيز العملي في الفصل 1 من كتاب ممتاز عملي مبرمج:من مياوم لإتقان أندرو مطاردة ديفيد توماس:

برنامج الكون

في حين أن برامج التنمية في مأمن من تقريبا كل القوانين الفيزيائية, الكون يضرب لنا الصعبة.الكون هو مصطلح من الفيزياء أن يشير إلى كمية من "اضطراب" في النظام.لسوء الحظ ، قوانين الديناميكا الحرارية ضمان أن الكون في الكون يميل نحو الأقصى.عندما اضطراب يزيد في البرمجيات والمبرمجين يطلق عليه "برنامج تتعفن".

هناك العديد من العوامل التي يمكن أن تساهم البرامج تعفن.أكثر المهم واحد ويبدو أن علم النفس ، أو الثقافة ، في العمل على المشروع.حتى لو كنت فريق من واحد, المشروع الخاص بك علم النفس يمكن أن يكون شيء دقيق جدا.على الرغم من أفضل الخطط الموضوعة و أفضل الناس ، المشروع يمكن أن لا تزال تواجه الخراب ، تسوس خلال حياته.حتى الآن هناك هي المشاريع الأخرى التي ، على الرغم من صعوبات هائلة ومستمرة النكسات النجاح في محاربة الطبيعة الميل نحو اضطراب وإدارة يخرج بشكل جيد جدا.

...

...

نافذة مكسورة.

واحد كسر النافذة اليسرى سوائلها على كبير طول الوقت ، يغرس في سكان بناء شعور من الهجر—a بمعنى أن القوى التي يمكن لا الرعاية حول المبنى.حتى آخر يحصل نافذة مكسورة.يبدأ الناس رمي النفايات.الكتابة على الجدران تظهر.خطيرة أضرار هيكلية يبدأ.في قصيرة نسبيا من الزمن ، بناء تلف بعد مالك الرغبة في إصلاحه ، الشعور بالخذلان يصبح حقيقة واقعة.

"كسر نافذة نظرية" وقد مستوحاة من قسم الشرطة نيويورك وغيرها من المدن الكبرى إلى الكراك أسفل على الأمور الصغيرة من أجل ابتعد عن الاشياء الكبيرة.يعمل:الحفاظ على أعلى من النوافذ المحطمة ، الكتابة على الجدران وغيرها من المخالفات الصغيرة قد قلل من خطورة الجريمة المستوى.

نصيحة 4

لا تعيش مع كسر النوافذ

لا تترك "النوافذ المكسورة" (سيئة تصاميم قرارات خاطئة ، أو سوء رمز) سوائلها.إصلاح كل واحد في أقرب وقت كما يتم اكتشافها.إذا كان هناك عدم كفاية الوقت لإصلاحه بشكل صحيح ، ثم بيعها.ربما يمكنك التعليق الخروج المخالف رمز ، أو عرض "لم تنفذ" رسالة ، أو استبدال بيانات وهمية بدلا من ذلك.تأخذ بعض الإجراءات لمنع المزيد من الضرر وتبين أن كنت على رأس الوضع.

النص مأخوذ من: http://pragprog.com/the-pragmatic-programmer/extracts/software-entropy

alt text
(المصدر: mit.edu)

من جامعة المكسيك

المعلومات النظرية مفهوم الكون هو التعميم من المادية الفكرة.هناك العديد من الطرق لوصف الكون.وهو مقياس من عشوائية عشوائي متغير.بل هو أيضا مقياس كمية المعلومات عشوائي متغير أو العشوائية عملية يحتوي على.كما الأدنى مبلغ رسالة يمكن مضغوط.وأخيرا هو متوسط عدد نعم/لا الأسئلة التي يجب طرحها حول عشوائي الكيان لتحديد قيمتها.

معادلة الكون في نموذج طلب حساب الاحتمالات:

وهو مبلغ فوق كل القيم rv من احتمال أن القيمة مرات سجل هذا غالبا(أيp(x)logp(x)).هذه المعادلة يمكن المستمدة من المبادئ الأولى من خصائص المعلومات.

لطالما واجه الكون بمعنى شانون الكون.

من http://en.wikipedia.org/wiki/Information_entropy:

في معلومات نظرية الكون هو قياس عدم اليقين المرتبطة متغير عشوائي.المصطلح في حد ذاته في هذا السياق يشير عادة إلى شانون الكون ، والتي يوضحها ، بمعنى من القيمة المتوقعة ، المعلومات الواردة في رسالة عادة في وحدات مثل بت.مكافئ ، شانون الكون هو مقياس متوسط محتوى المعلومات واحد مفقود عندما لا تعرف قيمة المتغير العشوائي.

حيث ضغط و معلومات نظرية الكون من المصدر هو متوسط كمية المعلومات (بت) أن رموز من المصدر يمكن أن ينقل.بشكل غير رسمي يتحدث أكثر من المرجح رمزا أكثر مفاجأة مظهره يجلب.

فقد اثنين من الرموز ، ويقول A و B, وهم من المرجح بنفس القدر ، ثم كل رمز يعبر عن نفس الكمية من المعلومات (بت واحد).مصدر مع أربعة من المرجح أيضا رموز ينقل اثنين بت لكل رمز.

أكثر إثارة للاهتمام سبيل المثال ، إذا كان المصدر من ثلاثة رموز ، A, B, ، C, حيث الأولين من ضعفي الثالثة ، ثم الثالث هو أكثر إثارة للدهشة ولكن أيضا أقل احتمالا.هناك صافي الكون 1.52 هذا المصدر ، كما يحسب أدناه.

يمكنك حساب الكون باسم "متوسط مفاجأة" ، حيث "مفاجأة" لكل رمز هو احتمال مرات السلبية سجل ثنائي من احتمال:

                            binary
symbol  weight  probability   log    surprise
  A        2        0.4      -1.32    0.53
  B        2        0.4      -1.32    0.53
  C        1        0.2      -2.32    0.46
total      5        1.0               1.52

السلبية من سجل ثنائي يستخدم (بالطبع) لأن سجلات القيم بين 0 و 1 (حصري) سلبية.

هنا هو بديل عظيم تفسير الكون في نظرية المعلومات.

الكون هو مقياس عدم اليقين المشاركة في صنع التنبؤ.

يمكننا أيضا لوصف الكون كيف مندهش لكنا إذا أردنا الحصول على النتيجة بعد توقعاتنا الأولية.

دعونا نقول لدينا عملة عازمة أن يعطينا الرأس 99 ٪ من الوقت و ذيل 1 ٪ من الوقت.لأنه ليس هناك سوى واحد في المئة من فرصة الحصول على الذيل ، ونحن لن تكون مفاجأة كبيرة إذا نحن في الواقع الحصول على الذيل.ومن ناحية أخرى ، فإنه لن يكون من المستغرب جدا إذا كان لدينا رأس كما لدينا بالفعل 99 في المئة من فرصة الحصول على الرأس.

دعونا نفترض أن لدينا دالة تسمى Surprise(x) التي من شأنها أن تعطينا كمية من مفاجأة لكل النتائج ؛ ثم يمكننا أن متوسط كمية مفاجأة على توزيع الاحتمالات.هذا متوسط كمية مفاجأة يمكن أيضا أن تستخدم لقياس مدى مؤكد نحن.هذا اليقين هو ما يسمى الكون.

تحليل تعريف سوبر بسيطة

ويمكن تعريف كلمة الكون في جملة واحدة:

"كمية المعلومات اللازمة لوصف النظام."

وتخيل للحصول على مثال توسع الكون: من البداية، وقد تم جمع جميع المواد في نقطة صغيرة قبل الانفجار الكبير، ولذا فإننا يمكن أن يوصف النظام مع "كل المسألة هي في نقطة واحدة." في حين أن المطلوب اليوم أكثر بكثير من المعلومات لوصف النظام (الكون، وهذا هو)، فإن المرء بحاجة إلى وصف جميع مواقع الكواكب، حركتهم، ما عليها وما إلى ذلك .. من ناحية نظرية المعلومات، وتعريف يعمل أيضا: منها مثلا: لمزيد من الرسائل إضافة إلى كلمة مرور (النظام)، هناك حاجة إلى مزيد من المعلومات لوصف كلمة المرور. ثم يمكنك قياسه في وحدات مختلفة، بت سبيل المثال أو أحرف، مثل "مرحبا" = 5 أحرف الكون = 40 بت من الكون (إذا charsize هو 8 بت).

من هذا يأتي أيضا أنه كلما زادت المعلومات التي لديك المزيد من الطرق التي يمكنك ترتيب تلك المعلومات في. إذا كان لديك 40 بت هناك 2 ^ 40 الطرق المختلفة التي يمكن ترتيبها. إذا كنا نتحدث كلمات السر هنا فإن الترتيبات الممكنة المزيد من المعلومات (بت) ويعد ذلك هو ذاهب الى اتخاذ تكسير (مع القوة الغاشمة أو الهجمات القاموس).

في أبسط الكلمات، الانتروبيا يعرف العشوائية. انها اكثر مثل كيف يمكن التنبؤ بها شيئا. في أكثر من الكلمات التقنية "، في الحوسبة، والكون هو العشوائية التي تم جمعها من خلال نظام التشغيل أو تطبيق لاستخدامها في التشفير أو غيرها من الاستخدامات التي تتطلب بيانات عشوائية. هذه العشوائية في كثير من الأحيان يتم جمعها من مصادر الأجهزة، سواء تلك الموجودة مسبقا مثل حركات الماوس أو قدمت خصيصا المولدات العشوائية. "كما هو محدد من قبل ويكيبيديا.

ويمكن للمرء أن يستنتج بسهولة الآن معنى الكون فيما يتعلق ملف باسم قياس مدى المختلين بايت هي في الملف. وهناك وحدات مختلفة تستخدم لتحديد الكون مثل نات، شانون أو هارتلي. حسنا، وحدة الأكثر شيوعا هي شانون. مجموعة من القيم الكون ملف يجب أن تأتي في وفقا لخوارزمية شانون هو 0 إلى 8. لذلك، عندما تكون قيمة الكون هي صفر، يمكن للمرء أن يقول النتيجة معينة. على العكس من ذلك، عندما تكون قيمة الانتروبي هو 8، فإن النتيجة هي الأكثر غير متوقعة يمكن أن يكون. الصيغة التي قدمها شانون لقياس العشوائية في نتائج الأحداث هي:

          Entropy = ∑ pi log(1/pi)

حيث <م> <ط / م> هو الحدث مع احتمال <م> بي .

وهذه المعادلة سوف يؤدي دائما بين 0-8.

لمزيد من المعلومات، انتقل من خلال الرابط: الشبكي: //www.talentcookie.com/2016/02/file-entropy-in-malware-analysis/

والكون يشير إلى مدى حيث يتم إعادة تشكيل برنامج أحيانا مستندة على متطلبات العملاء وبالتالي تكلفة إعادة تشكيل لتلبية العملاء reqrments يصبح الحد الأقصى.

والانتروبيا يشبه رمز التجزئة للباحثين الفيروس أيضا. أقل الكون تحصل عليه، فإنه يعني أنه من المرجح مشفرة أو مضغوطة كود الذي قد يكون من المحتمل أن يكون الفيروس.

وA ثنائي القياسية سيكون له الكون أعلى من واحد مضغوط أو المشفرة.

والانتروبيا لها معاني كثيرة عادة في علوم الحاسب الآلي. ذلك يعتمد على السياق. في مجال الأمن الكون يعني كم randomality كنت مكان، على سبيل المثال عند إنشاء مفتاح خاص العديد من التطبيقات يطلب منك تحريك الماوس في جميع أنحاء لتوليد الكون. وهذا يولد الكون من خلال اتخاذ العنصر "البشري" من randomality ويضيفه إلى عملية تجزئة لتوليد المفتاح.

والآن هناك أيضا defnition لهندسة البرمجيات من الكون. يمثل هذا التعريف من رمز تاريخ، أو التعليمات البرمجية التي تمت زيارتها العديد من المطورين كتابة عليه. عادة ما تستخدم في اشارة الى عندما يكون القريب الوقت لريفاكتور مشروع البرنامج. "الرمز لهذا المشروع مبلغ انورموس من الكون لأن الكثير من الأفراد الذين الحفاظ عليه ليست على المشروع حاليا".

وهنا هو استخدام المثال الثالث أن تذكرت أيضا. في موضوع محاكاة الصلب (بقدر ما علم الحاسوب هو المعني)، يوصف الكون كما مقدار الاضمحلال حدث خلال تقييم الخوارزمية.

وأعتقد أن أجيب على سؤالك رغم ذلك، ليس هناك تعريف واقعي من كلمة 'الكون' باستثناء تلك التي يمكنك أن تجد في القاموس. كيف علم الحاسوب يميل إلى تطبيق يعتمد هذا المصطلح في سياق المدى المستخدمة وما يتم تطبيقه على.

فإنه من السهل أن تجعل صفقة كبيرة للخروج من الكون.إلى ذهني هو جميل بسيطة ومفيدة مفهوم.

في الأساس كان يقيس ما ، في المتوسط ، سوف تتعلم من هذا الحدث ، مثل الضغط على العملة ، مع فرع التعليمات ، أو الفهرسة صفيف.

مثل المقارنة العملية في منتصف البحث خوارزمية معينة احتمال P أخذ فرع واحد ، 1-P أخذ البعض.

لنفترض P 1/2 ، كما هو الحال في البحث الثنائية.ثم إذا كنت تأخذ هذا الفرع, تعلم 1 أكثر مما فعلت من قبل ، لأن log(2/1) ، قاعدة 2 ، 1.من ناحية أخرى, إذا كنت تأخذ الفرع الآخر أنت أيضا تعلم 1 بت.

للحصول على متوسط كمية المعلومات سوف تتعلم, تتضاعف ما تتعلمه على أول فرع مرات احتمال كنت تأخذ هذا الفرع ، بالإضافة إلى ما تتعلمه في الفرع الثاني مرات احتمال أن فرع.

1/2 1 مرات بت بالإضافة إلى 1/2 1 مرات أكثر 1/2 بت بالإضافة إلى 1/2 بت أو المجموع 1 بت من الكون.هذا ما يمكنك أن تتوقع أن تتعلم في المتوسط من هذا القرار.

من ناحية أخرى, افترض أنك تفعل الخطية البحث في جدول 1024 الإدخالات.

في أول == اختبار احتمال نعم هو 1/1024 ، لذلك الكون من نعم في هذا القرار

1/1024 times log(1024/1)

أو 1/1024 * 10 = حوالي 1/100 بت.

إذا كان الجواب نعم, هل تعلم 10 بت ، ولكن فرصة أن حوالي 1 في الألف.

من ناحية أخرى, لا أكثر احتمالا.انه الكون هو

1023/1024 * log(1024/1023)

أو ما يقرب من 1 مرات تقريبا صفر = صفر

إضافة اثنين معا ، في المتوسط سوف تتعلم عن 1/100 قليلا على هذا القرار.

هذا هو السبب في البحث الخطي بطيء.الكون (كم كنت يمكن أن نتوقع أن تعلم) في كل قرار صغير جدا ، حيث عليك أن تتعلم 10 بت للعثور على الدخول في الجدول.

والانتروبيا في علوم الكمبيوتر يشير عادة إلى كيفية عشوائي سلسلة من البتات هي. السؤال التالي هو عن القرارات التي دقة:

كيف يمكنني حساب تقريبي الكون من سلسلة بت؟

في كلمات بسيطة إذا كنت تعرف الاحتمالات من الرموز في اللغة ، يمكن حساب متوسط محتوى المعلومات من الرمز في اللغة .

أو

الكون من اللغة هو قياس محتوى المعلومات من متوسط الرمز في اللغة

تنظر عادل العملة ؛

هناك نوعان من الرموز ، مع كل احتمال 1/2 حتى الكون يحسب

h =-(1/2*log1/2 +1/2*log1/2)=1

ولقد سمعت الناس سوء استخدام تعريفات الحرارية من الكون w.r.t CS.

ومنها مثلا. الكون آخذ في الازدياد بالتأكيد في هذا النظام.

عند ما تعنيه هو هذا الرمز يزداد سوءا وسوءا!

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top