关于隐马尔可夫模型和条件随机场的问题

我一直在寻找隐藏的马尔可夫模型和条件随机场来完成命名实体识别的任务，我似乎坚持一个基本概念，也就是说：学习过程的目标是从训练数据中计算argmax ，并将argmax序列应用于测试数据的所有实例？考虑这个隐马尔可夫模型示例：我有两个状态{1,0}，其中1是实体，0是任何其他单词。为了简化起见，我不仅仅关注实体分类，而只关注实体检测。我的培训数据如下：奥巴马住在华盛顿 1 0 0 1 iPad很棒 0 1 0 0 史蒂夫乔布斯生病了 1 1 0 0 现在遵循argmax规则，： P（状态1到状态1）= 1/9 P（状态1到状态0）= 1 - 1/9 P（状态0到状态0）= 3/9 P（状态0到状态1）= 1 - 3/9 在制定了V和U矩阵之后，我发现：从训练数据中提取的最佳标签序列= 1 1 0 0 现在考虑测试句子： iPhone很棒我是否只将测试句应用于1 1 0 0，这实际上是可行的，但如果我有另一个测试句，如“索尼的发言人被解雇”，你可以看到序列1 1 0 0将完全无用那句话。总结一下：培训的目的是提取一个最佳标签序列并将其应用于所有测试句子？这似乎不太可能！我错过了什么？

已邀请:

1 个回复

搁手

我强烈建议你阅读关于HMM的这个讲座。这是HMM定义的摘录任何三元组（u，v，s）的参数q（s | u，v），使得s∈K∪{STOP}，和你，v∈K∪{*}。 q（s | u，v）的值可以解释为在标签的二元组之后立即看到标签的概率（U，V）。任何x∈V，s∈K的参数e（x | s）.e（x | s）的值可以是解释为观察x与之配对的概率状态。你似乎错过了e而你没有正确计算q。

q(1|0,0) = count <0,0,1> / count <0,0>

考虑到上述参数的产品，最好的标签序列是最可能的标签（抱歉不发布公式）。对于你的例子“索尼的发言人被解雇了”所有的序列是：

* * 0 0 0 0 0 0 STOP
* * 0 0 0 0 0 1 STOP
...
* * 1 1 1 1 1 1 STOP

你应该计算e（A | 0），e（发言人| 0），q（0 | *，*），q（0 | *，0）等。然后相应地相乘，得到概率最高的序列。由于这是一项耗时的任务，并且对于较长的序列呈指数增长，因此使用了维特比算法（也在讲座中描述）

要回复问题请先登录或注册

关于隐马尔可夫模型和条件随机场的问题

1 个回复

发起人

named_entity_recognition

问题状态

关于隐马尔可夫模型和条件随机场的问题

与内容相关的链接

1 个回复

发起人

named_entity_recognition

问题状态