如何循环遍历多个文件,保留基本名称以进行进一步处理?
我有多个需要标记的文本文件,POS和NER。我正在使用C& C标记并运行他们的教程,但我想知道是否有办法标记多个文件而不是逐个标记。
目前我正在对文件进行标记:
bin/tokkie --input working/tutorial/example.txt--quotes delete --output working/tutorial/example.tok
如下,然后是部分语音标记:
bin/pos --input working/tutorial/example.tok --model models/pos --output working/tutorial/example.pos
最后命名的实体识别:
bin/ner --input working/tutorial/example.pos --model models/ner --output working/tutorial/example.ner
我不确定如何创建一个循环来执行此操作并保持文件名与输入相同,但扩展名表示它具有标记。我正在考虑使用bash脚本或Perl来打开目录,但我不确定如何输入C& C命令以便脚本理解。
目前我手动完成它,至少可以说是非常耗时的!
没有找到相关结果
已邀请:
2 个回复
田损比报
貉骂