将Wiki转储解析为格式的适当方法是什么?

| 将Wiki转储解析为一种格式的最佳方法是什么,该格式包含一个自行生成的文章ID和文章内容,而不包含其他内容? 文章ID为参考ID,内容为纯文本,无URL,无参考。     
已邀请:
http://en.wikipedia.org/wiki/Wikipedia:Database_download#Database_schema 似乎很清楚。 http://www.mediawiki.org/wiki/手册:Importing_XML_dumps 似乎很清楚。 http://www.mediawiki.org/wiki/Pywikipediabot 似乎是您想要的代码。     

要回复问题请先登录注册