تطبيق فعال عند التعامل مع التدفقات للاستعلام إلى نفس مجموعة البيانات

https://stackoverflow.com/questions/2201857

18-09-2019
|

سؤال

لدي مجموعة بيانات ضخمة ثابتة ولدي وظيفة لتطبيقها على ذلك.

F IN في النموذج، تقليل (الخريطة (F، DataSet))، لذلك أود استخدام هيكل عظمي MapReduce. ومع ذلك، لا أريد أن أفرخ البيانات الموجودة في كل طلب (ومن المثلج، أريد الاستفادة من الفهرسة من أجل تسريع F). هناك تطبيق MAPREDUCE الذي يتناول هذه القضية العامة؟

لقد ألقيت نظرة على iterativemapduce. وربما يفعل الوظيفة، ولكن يبدو أنه يتناول حالة مختلفة قليلا، وعدم توفر التعليمات البرمجية بعد.

المحلول

LEDOOP's MAPREDUCE (وجميع عمليات خريطة الخرائط الأخرى التي تقلل من الهيكل العظمي مستوحاة من Google) لا تنثر البيانات طوال الوقت.

مرخصة بموجب: CC-BY-SA مع الإسناد

لا تنتمي إلى StackOverflow