استراتيجيات الاعتراف الأسماء المناسبة في البرمجة اللغوية العصبية

StackOverflow https://stackoverflow.com/questions/608743

سؤال

أنا مهتم في معرفة المزيد عن معالجة اللغة الطبيعية (البرمجة اللغوية العصبية) ، وأنا الغريب إذا كان هناك حاليا أي استراتيجيات من أجل الاعتراف الأسماء المناسبة في النص لا تعتمد على القاموس الاعتراف ؟ أيضا, يمكن لأي شخص أن يشرح أو رابط إلى الموارد التي شرح القاموس الحالي القائم على الأساليب ؟ من هم الخبراء الموثوق في البرمجة اللغوية العصبية أو ما هي نهائي الموارد على الموضوع ؟

هل كانت مفيدة؟

المحلول

مهمة تحديد الجزء الصحيح من الكلام عن كلمة في نص يسمى جزء من خطاب علامات.على بلغة بريل, على سبيل المثال, يستخدم خليط من القاموس(المفردات) الكلمات و القواعد السياقية.وأعتقد أن من أهم الأولي قاموس الكلمات هذه المهمة هي كلمات التوقف.مرة واحدة لديك (في الغالب الصحيح) أجزاء الكلام على كلماتك يمكنك البدء في بناء أكبر الهياكل. هذا الموجهة للصناعة الكتاب يميز بين الاعتراف العبارات الاسمية (NPs) والاعتراف اسمه الكيانات.عن الكتب المدرسية: ألن فهم اللغة الطبيعية هو جيد ، ولكن قليلا مؤرخة ، الكتاب. أسس إحصائية معالجة اللغة الطبيعية هو مقدمة لطيفة الإحصائية البرمجة اللغوية العصبية. الكلام معالجة اللغة هو قليلا أكثر صرامة و ربما أكثر موثوقية. جمعية اللغويات الحاسوبية هي شركة رائدة في المجتمع العلمي في اللغويات الحاسوبية.

نصائح أخرى

إلى جانب قاموس النهج القائم على اثنين آخرين تتبادر إلى ذهني:

  • نمط النهج القائمة على (استمارة بسيطة:أي شيء التي يتم رسملتها هو الاسم الصحيح)
  • آلة نهج التعلم (مارك الأسماء المناسبة في التدريب الإحضار وتدريب المصنف)

الميدان هو الغالب تسمى اسمه-الكيان استخراج وغالبا ما يعتبر الحقل الفرعي من واستخراج المعلومات.نقطة انطلاق جيدة في مختلف مجالات البرمجة اللغوية العصبية هو عادة حسب الفصل في Oxford Handbook of Computational Linguistics:

Oxford Handbook of Computational Linguistics
(المصدر: oup.com)

وحاول البحث عن "اعتراف الكيان المسمى" - هذا هو المصطلح الذي يتم استخدامه في الأدب NLP لهذا النوع من الشيء

ذلك يعتمد على ما تعنيه القائمة على القاموس.

على سبيل المثال, استراتيجية واحدة أن تأخذ الأشياء التي لا في القاموس ومحاولة المضي قدما على افتراض انهم الأسماء المناسبة.إذا كان هذا يؤدي إلى المعقول تحليل, النظر في افتراض مؤقتا من صحتها و أن نستمر وإلا نستنتج أنها ليست كذلك.

أفكار أخرى:

  • في هذا الموضوع وضع أي موضوع بسيط دون قدير هو مرشح جيد.
  • كما سبق في العبارات جر
  • في أي موقف ، أساس غيور قدير (مثلا ، بوب في "بوب أخت") هو مرشح جيد

-- MarkusQ

وبعض الأدوات المقترحة: 1. Opennlp: هناك عنصر التعرف على الكيان اسمه لمهمتك 2. LingPipe: أيضا عنصر NER لذلك 3. حزمة ستانفورد NLP: حزمة ممتازة للاستخدام الأكاديمي، وربما لم تكن ودية التجارية. 4. NLTK: حزمة بايثون NLP

وإذا كان لديك الجملة مثل "من هو بيل غيتس" وإذا قمت بتطبيق جزء من خطاب بلغة إليها. وسوف تعطي الجواب كما

و"الذي / WP هو / VBZ مشروع قانون / NN بوابات / NNS؟ /."

وU أن تجرب هذا على الإنترنت على http://cst.dk/online/pos_tagger/uk/

وهكذا كنت تحصل على ما هي كل الأسماء في هذه الجملة. الآن يمكنك بسهولة استخراج هذه الأسماء مع بعض الخوارزمية. أقترح لاستخدام الثعبان إذا كنت تستخدم معالجة اللغة الطبيعية. لديها NLTK (أدوات اللغة الطبيعية) والتي يمكنك العمل.

إذا كنت ترغب في تنفيذ معالجة اللغة الطبيعية والثعبان ولغة البرمجة الخاصة بك، ثم وهذا يمكن أن يكون مورد مفيدة للغاية: <لأ href = "http://www.youtube.com/watch؟v= kKe4M4iSclc "يختلط =" نوفولو "> http://www.youtube.com/watch؟v=kKe4M4iSclc

وعلى الرغم من أن هذا هو للغة البنغالية، ولكن يمكن استخلاص إجراء شائع تحديد الاسم الصحيح. لذلك آمل أن يكون هذا سوف يكون من المفيد لك. يرجى الاطلاع على الرابط معلمات أكثر: http://www.mecs-press.org/ijmecs /ijmecs-v6-n8/v6n8-1.html

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top