关于隐马尔可夫模型和条件随机场的问题
我一直在寻找隐藏的马尔可夫模型和条件随机场来完成命名实体识别的任务,我似乎坚持一个基本概念,也就是说:学习过程的目标是从训练数据中计算argmax ,并将argmax序列应用于测试数据的所有实例?
考虑这个隐马尔可夫模型示例:我有两个状态{1,0},其中1是实体,0是任何其他单词。为了简化起见,我不仅仅关注实体分类,而只关注实体检测。
我的培训数据如下:
奥巴马住在华盛顿
1 0 0 1
iPad很棒
0 1 0 0
史蒂夫乔布斯生病了
1 1 0 0
现在遵循argmax规则,:
P(状态1到状态1)= 1/9
P(状态1到状态0)= 1 - 1/9
P(状态0到状态0)= 3/9
P(状态0到状态1)= 1 - 3/9
在制定了V和U矩阵之后,我发现:
从训练数据中提取的最佳标签序列= 1 1 0 0
现在考虑测试句子:
iPhone很棒
我是否只将测试句应用于1 1 0 0,这实际上是可行的,但如果我有另一个测试句,如“索尼的发言人被解雇”,你可以看到序列1 1 0 0将完全无用那句话。
总结一下:培训的目的是提取一个最佳标签序列并将其应用于所有测试句子?这似乎不太可能!我错过了什么?
没有找到相关结果
已邀请:
1 个回复
搁手
考虑到上述参数的产品,最好的标签序列是最可能的标签(抱歉不发布公式)。 对于你的例子“索尼的发言人被解雇了”所有的序列是:
你应该计算e(A | 0),e(发言人| 0),q(0 | *,*),q(0 | *,0)等。然后相应地相乘,得到概率最高的序列。 由于这是一项耗时的任务,并且对于较长的序列呈指数增长,因此使用了维特比算法(也在讲座中描述)