在关系提取(NLP)中,有监督,半监督和无监督关系提取之间有什么区别?


回答 1:

在监督学习中,有一个大数据集,其中包含学习者可能需要的所有内容。 它具有文档以及单词和所需文本之间的所有关系。 学习者需要学习如何在看不见的文档上执行此任务。

在半监督学习中,您拥有大量文档,而对于其中较小的子集,您拥有所有数据。

在无监督学习中,学习者只有文档。 它可以寻找构成数据基础的有趣模式。 这些模式可能是有意义的,但也可能是随机工件。 当存在足够的数据时,将更容易识别有意义的模式。 但是,如果没有主管查看模式,该算法将无法赋予其任何意义。 例如,它可能发现单词“ president”,“ Obama”和“ Barack”经常同时出现,或者一个单词出现在通常也发现另一个单词的情况下(指示它们可能是同义词)。 通常,找不到它描述了一个人。