Lucene QueryParser يفسر "و" كقيادة؟
سؤال
أنا أدعو لوكين باستخدام الكود التالي (بيلوسين ، لدقة):
analyzer = StandardAnalyzer(Version.LUCENE_30)
queryparser = QueryParser(Version.LUCENE_30, "text", analyzer)
query = queryparser.parse(queryparser.escape(querytext))
ولكن النظر إذا كان هذا هو محتوى querytext
:
querytext = "THE FOOD WAS HONESTLY NOT WORTH THE PRICE. MUCH TOO PRICY WOULD NOT GO BACK AND OR RECOMMEND IT"
في هذه الحالة ، تقوم "و" queryparser.escape
. كيف يمكنني تجنب رسالة الخطأ التالية؟
Java stacktrace:
org.apache.lucene.queryParser.ParseException: Cannot parse 'THE FOOD WAS HONESTLY NOT WORTH THE PRICE. MUCH TOO PRICY WOULD NOT GO BACK AND OR RECOMMEND IT': Encountered " <OR> "OR "" at line 1, column 80.
Was expecting one of:
<NOT> ...
"+" ...
"-" ...
"(" ...
"*" ...
<QUOTED> ...
<TERM> ...
<PREFIXTERM> ...
<WILDTERM> ...
"[" ...
"{" ...
<NUMBER> ...
<TERM> ...
"*" ...
at org.apache.lucene.queryParser.QueryParser.parse(QueryParser.java:187)
....
at org.apache.lucene.queryParser.QueryParser.generateParseException(QueryParser.java:1759)
at org.apache.lucene.queryParser.QueryParser.jj_consume_token(QueryParser.java:1641)
at org.apache.lucene.queryParser.QueryParser.Clause(QueryParser.java:1268)
at org.apache.lucene.queryParser.QueryParser.Query(QueryParser.java:1207)
at org.apache.lucene.queryParser.QueryParser.TopLevelQuery(QueryParser.java:1167)
at org.apache.lucene.queryParser.QueryParser.parse(QueryParser.java:182)
المحلول
انها ليست مجرد OR
, ، انها AND OR
.
أستخدم الحلول التالية:
query = queryparser.parse(queryparser.escape(querytext.replace("AND OR", "AND or")))
نصائح أخرى
QueryParser.Parse يهرب فقط من الشخصيات الخاصة (كما هو موضح في هذه الصفحة) ويترك "أو" دون تغيير ، لذلك لن يعمل في قضيتك. نظرًا لأنه من المفترض أنك استخدمت أيضًا StandardAnalyzer لتحليل النص الخاص بك ، فإن المصطلحات في الفهرس الخاص بك في حالة صغيرة بالفعل. حتى تتمكن من تغيير سلسلة الاستعلام بأكملها إلى أحرف صغيرة قبل إعطائها إلى QueryParser. لا يعتبرون المصغرين "و" و "أو" لمشغلين ، لذلك "أو" لن يتجولوا في QueryParser.
أدرك أنني متأخر إلى الحفلة هنا ، لكن وضع عروض أسعار حول سلسلة البحث هو خيار أفضل:
querytext = "\"THE FOOD WAS ... \""