سؤال

بالنظر إلى هذا النص:

"الأصدقاء ودود أكثر ودية ودية وتصنيف فئة التصنيف الودية. تتدفق الزهور المزهرة من خلال اتباع تدفقات الزهور"

أحتاج إلى تطبيق النزول على النص لتحقيق النتيجة التالية:

frequency("following")                = 1
frequency("flow")                     = 2
frequency("classification")           = 1
frequency("class")                    = 1
frequency("flower")                   = 3
frequency("friend")                   = 4
frequency("friendly")                 = 4
frequency("classes")                  = 1

ونحن نواجه مع محرك البحث السريع. يقوم Fast بفهرسة المحتوى لتوفير نتائج البحث ذات الصلة إلى استعلام. جانب واحد من جوانب الفهرسة ونحن بحاجة إلى استخدام إما C# أو Ruby لحل هذا.

سوف نقدر آراء أي شخص حول أفضل طريقة

هل كانت مفيدة؟

المحلول

    public StemmingProcessorResults ProcessText(string text)
    {
            return new StemmingProcessorResults(
                    new []{
                        new StemmingProcessorResultItem("following", 1),
                        new StemmingProcessorResultItem("flow", 2),
                        new StemmingProcessorResultItem("classification", 1),
                        new StemmingProcessorResultItem("class", 1),
                        new StemmingProcessorResultItem("flower", 3),
                        new StemmingProcessorResultItem("friend", 4),
                        new StemmingProcessorResultItem("friendly", 4),
                        new StemmingProcessorResultItem("classes", 1)
                    }
                );
    }

هناك تذهب ، يجب أن يكون ذلك مثاليًا لاحتياجات ملصق النسخ الخاصة بك

نصائح أخرى

لا يمكنك "تطبيق النزول" على النص للحصول على هذه النتائج لأن معايير القبول تحتوي على خطأ. أي التردد ("صديق") يجب أن يكون 5. كل واحد تنبع خوارزمية حسب التعريف لا يمكن أن تنتج معايير القبول. وبالتالي أي الخوارزمية التي تعطي هذه القيم يجب أن تفعل - حسب روب أشتون. يمكنك أيضًا استخدام عبارة Switch أو بحث قاموس ، أيا كان ، فهو يحتاج فقط إلى إخراج هذه الأرقام.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top