استراتيجيات الاعتراف الأسماء المناسبة في البرمجة اللغوية العصبية
-
03-07-2019 - |
سؤال
أنا مهتم في معرفة المزيد عن معالجة اللغة الطبيعية (البرمجة اللغوية العصبية) ، وأنا الغريب إذا كان هناك حاليا أي استراتيجيات من أجل الاعتراف الأسماء المناسبة في النص لا تعتمد على القاموس الاعتراف ؟ أيضا, يمكن لأي شخص أن يشرح أو رابط إلى الموارد التي شرح القاموس الحالي القائم على الأساليب ؟ من هم الخبراء الموثوق في البرمجة اللغوية العصبية أو ما هي نهائي الموارد على الموضوع ؟
المحلول
مهمة تحديد الجزء الصحيح من الكلام عن كلمة في نص يسمى جزء من خطاب علامات.على بلغة بريل, على سبيل المثال, يستخدم خليط من القاموس(المفردات) الكلمات و القواعد السياقية.وأعتقد أن من أهم الأولي قاموس الكلمات هذه المهمة هي كلمات التوقف.مرة واحدة لديك (في الغالب الصحيح) أجزاء الكلام على كلماتك يمكنك البدء في بناء أكبر الهياكل. هذا الموجهة للصناعة الكتاب يميز بين الاعتراف العبارات الاسمية (NPs) والاعتراف اسمه الكيانات.عن الكتب المدرسية: ألن فهم اللغة الطبيعية هو جيد ، ولكن قليلا مؤرخة ، الكتاب. أسس إحصائية معالجة اللغة الطبيعية هو مقدمة لطيفة الإحصائية البرمجة اللغوية العصبية. الكلام معالجة اللغة هو قليلا أكثر صرامة و ربما أكثر موثوقية. جمعية اللغويات الحاسوبية هي شركة رائدة في المجتمع العلمي في اللغويات الحاسوبية.
نصائح أخرى
إلى جانب قاموس النهج القائم على اثنين آخرين تتبادر إلى ذهني:
- نمط النهج القائمة على (استمارة بسيطة:أي شيء التي يتم رسملتها هو الاسم الصحيح)
- آلة نهج التعلم (مارك الأسماء المناسبة في التدريب الإحضار وتدريب المصنف)
الميدان هو الغالب تسمى اسمه-الكيان استخراج وغالبا ما يعتبر الحقل الفرعي من واستخراج المعلومات.نقطة انطلاق جيدة في مختلف مجالات البرمجة اللغوية العصبية هو عادة حسب الفصل في Oxford Handbook of Computational Linguistics:
(المصدر: oup.com)
وحاول البحث عن "اعتراف الكيان المسمى" - هذا هو المصطلح الذي يتم استخدامه في الأدب NLP لهذا النوع من الشيء
ذلك يعتمد على ما تعنيه القائمة على القاموس.
على سبيل المثال, استراتيجية واحدة أن تأخذ الأشياء التي لا في القاموس ومحاولة المضي قدما على افتراض انهم الأسماء المناسبة.إذا كان هذا يؤدي إلى المعقول تحليل, النظر في افتراض مؤقتا من صحتها و أن نستمر وإلا نستنتج أنها ليست كذلك.
أفكار أخرى:
- في هذا الموضوع وضع أي موضوع بسيط دون قدير هو مرشح جيد.
- كما سبق في العبارات جر
- في أي موقف ، أساس غيور قدير (مثلا ، بوب في "بوب أخت") هو مرشح جيد
-- MarkusQ
وبعض الأدوات المقترحة: 1. Opennlp: هناك عنصر التعرف على الكيان اسمه لمهمتك 2. LingPipe: أيضا عنصر NER لذلك 3. حزمة ستانفورد NLP: حزمة ممتازة للاستخدام الأكاديمي، وربما لم تكن ودية التجارية. 4. NLTK: حزمة بايثون NLP
وإذا كان لديك الجملة مثل "من هو بيل غيتس" وإذا قمت بتطبيق جزء من خطاب بلغة إليها. وسوف تعطي الجواب كما
و"الذي / WP هو / VBZ مشروع قانون / NN بوابات / NNS؟ /."
وU أن تجرب هذا على الإنترنت على http://cst.dk/online/pos_tagger/uk/
وهكذا كنت تحصل على ما هي كل الأسماء في هذه الجملة. الآن يمكنك بسهولة استخراج هذه الأسماء مع بعض الخوارزمية. أقترح لاستخدام الثعبان إذا كنت تستخدم معالجة اللغة الطبيعية. لديها NLTK (أدوات اللغة الطبيعية) والتي يمكنك العمل.
إذا كنت ترغب في تنفيذ معالجة اللغة الطبيعية والثعبان ولغة البرمجة الخاصة بك، ثم وهذا يمكن أن يكون مورد مفيدة للغاية: <لأ href = "http://www.youtube.com/watch؟v= kKe4M4iSclc "يختلط =" نوفولو "> http://www.youtube.com/watch؟v=kKe4M4iSclc
وعلى الرغم من أن هذا هو للغة البنغالية، ولكن يمكن استخلاص إجراء شائع تحديد الاسم الصحيح. لذلك آمل أن يكون هذا سوف يكون من المفيد لك. يرجى الاطلاع على الرابط معلمات أكثر: http://www.mecs-press.org/ijmecs /ijmecs-v6-n8/v6n8-1.html