什么是MeCab输出和标签集?

有人可以在MeCab默认输出上启发我吗? MeCab输出的注释是什么,我在哪里可以找到morpho分析仪的标签集 http://mecab.sourceforge.net/ 任何人都可以从MeCab中解读这个输出吗?
<s>
ブギス・ジャンクション ブギス・ジャンクション ブギス・ジャンクション 名詞-一般       
に   ニ   に   助詞-格助詞-一般       
は   ハ   は   助詞-係助詞      
最も  モットモ    最も  副詞-一般       
買い  カイ  買う  動詞-自立   五段・ワ行促音便    連用形
物慣れ モノナレ    物慣れる    動詞-自立   一段  連用形
し   シ   する  動詞-自立   サ変・スル   連用形
た   タ   た   助動詞 特殊・タ    基本形
人々  ヒトビト    人々  名詞-一般       
を   ヲ   を   助詞-格助詞-一般       
も   モ   も   助詞-係助詞      
魅了  ミリョウ    魅了  名詞-サ変接続     
する  スル  する  動詞-自立   サ変・スル   基本形
品   シナ  品   名詞-一般       
揃え  ソロエ 揃える 動詞-自立   一段  連用形
が   ガ   が   助詞-格助詞-一般       
あり  アリ  ある  動詞-自立   五段・ラ行   連用形
ます  マス  ます  助動詞 特殊・マス   基本形
。   。   。   記号-句点       
</s>
    
已邀请:
示例中的输出格式似乎是chasen2,它在dicrc文件中定义。 那将是:
; ChaSen (include spaces)
node-format-chasen2 = %Mt%f[7]t%f[6]t%F-[0,1,2,3]t%f[4]t%f[5]n
unk-format-chasen2  = %Mt%mt%mt%F-[0,1,2,3]ttn
eos-format-chasen2  = EOSn
对于普通节点格式,那将是:
1. surface value, including any whitespace
2. t
3. reading
4. t
5. root form
6. t
7. part of speech
8. part of speech, subtype 1
9. part of speech, subtype 2
10. part of speech, subtype 3
11. t
12. conjugation
13. t
14. inflection
15. newline
项目7到10是连字符分隔的。 有关详细信息,请参阅mecab的出力フォーマット文档。 编辑:更新了MeCab输出格式说明页面的链接。     

要回复问题请先登录注册