tika solr集成

| 我正在尝试使用基于curl的请求编制索引 请求是
curl \"http://localhost:8080/solr1/update/extract?literal.id=who.pdf&uprefix=attr_&fmap.content=attr_content&commit=true\" -F \"myfile=@/root/apache-solr-3.1.0/docs/who.pdf\"
在提交请求时,我遇到此错误,
 Error report</title><style><!--H1 {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;font-size:22px;} H2 {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;font-size:16px;} H3 {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;font-size:14px;} BODY {font-family:Tahoma,Arial,sans-serif;color:black;background-color:white;} B {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;} P {font-family:Tahoma,Arial,sans-serif;background:white;color:black;font-size:12px;}A {color : black;}A.name {color : black;}HR {color : #525D76;}--></style> </head><body><h1>HTTP Status 400 - ERROR:unknown field \'ignored_meta\'</h1><HR size=\"1\" noshade=\"noshade\"><p><b>type</b> Status report</p><p><b>message</b> <u>ERROR:unknown field \'ignored_meta\'</u></p><p><b>description</b> <u>The request sent by the client was syntactically incorrect (ERROR:unknown field \'ignored_meta\').</u></p><HR size=\"1\" noshade=\"noshade\"><h3>Apache Tomcat/6.0.18</h3></body></html>r
    
已邀请:
        您的问题是由于在solrconfig.xml中定义的ExtractingRequestHandler的默认处理程序将所有未识别的Tika \提取字段放入名为\'ingored_XXXXX \'的字段中。 为了解决这个问题,您只需将一个字段名\'ignored _ * \'添加到Solr配置中,如下所示:
<dynamicField name=\"ignored_*\" type=\"ignored\"/>
如果您从默认配置中删除了忽略的类型,请不要忘记添加它:
<fieldtype name=\"ignored\" stored=\"false\" indexed=\"false\" multiValued=\"true\" class=\"solr.StrField\" />
当Solr不知道的Tika索引字段时,这将阻止Solr崩溃。     

要回复问题请先登录注册