DataImportHandler не индексирует таблицу MySQL в администраторе solr
-
21-12-2019 - |
Вопрос
Я пытаюсь индексировать таблицу MySQL в solr, используя DataImportHandler, но, похоже, она не индексируется.
данные-config.xml
<?xml version="1.0" encoding="UTF-8" ?>
<dataConfig>
<dataSource type="JdbcDataSource" driver="com.mysql.jdbc.Driver"
url="jdbc:mysql://localhost/solr_tut"
user="root"
password=""/>
<document>
<entity name="product_id"
query="select product_id,name,description from products">
</entity>
</document>
</dataConfig>
solrconfig.xml
<lib dir="../../../contrib/dataimporthandler/lib/" regex=".*\.jar" />
<lib dir="../../../dist/" regex="solr-dataimporthandler-\d.*\.jar" />
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
<lst name="defaults">
<str name="config">data-config.xml</str>
</lst>
</requestHandler>
Когда я пытаюсь индексировать в solr admin(http://localhost:8080/solr/dataimport?command=full-import
) я получаю этот ответ
<response>
<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">19</int>
</lst>
<lst name="initArgs">
<lst name="defaults">
<str name="config">data-config.xml</str>
</lst>
</lst>
<str name="command">full-import</str>
<str name="status">idle</str>
<str name="importResponse"/>
<lst name="statusMessages">
<str name="Total Requests made to DataSource">1</str>
<str name="Total Rows Fetched">4</str>
<str name="Total Documents Skipped">0</str>
<str name="Full Dump Started">2014-01-10 10:38:00</str>
<str name="">
Indexing completed. Added/Updated: 0 documents. Deleted 0 documents.
</str>
<str name="Committed">2014-01-10 10:38:00</str>
<str name="Total Documents Processed">0</str>
<str name="Time taken">0:0:0.33</str>
</lst>
<str name="WARNING">
This response format is experimental. It is likely to change in the future.
</str>
</response>
После того, как я поищу(http://localhost:8080/solr/select?q=*:*
), я получаю 0 результатов.
Обновление-1: схема.xml
Решение
Вы просто пропустили сопоставление столбцов результирующего набора с полями документов.Вам нужно сделать это в течение entity
элемент твоего data-config.xml
.
<?xml version="1.0" encoding="UTF-8" ?>
<dataConfig>
<dataSource type="JdbcDataSource" driver="com.mysql.jdbc.Driver"
url="jdbc:mysql://localhost/solr_tut"
user="root"
password=""/>
<document>
<entity name="product_id"
query="select product_id,name,description from products">
<!-- this is the place where you map the columns of your result set
to fields of the new solr document -->
<field column="PRODUCT_ID" name="id" />
<field column="NAME" name="name" />
<field column="DESCRIPTION" name="description" />
</entity>
</document>
</dataConfig>
В вашем случае есть одно важное сопоставление, которое вы пропустили. product_id
к id
.Solr может автоматически определять сопоставления, если имя столбца и имя поля в схеме равны, как написано в вики.
В приведенном выше примере поля сопоставлены с полями Solr.Можно полностью избежать записей полей в сущностях, если имена полей такие же (регистр не имеет значения), что и в схеме Solr.
Но, как сказано, в вашей ситуации это не так. product_id
и id
отличаются.Поскольку ваш id
поле required
эти документы не попадут в индекс.
Более подробную информацию можно найти в Wiki Solr о DataImportHandler или в справочном руководстве.