国际标准期刊号: 2165- 7866
沃基内·泰塞玛
本文提出了 Afan Oromo 中多义词的义聚类。这项工作的主要思想是对上下文进行聚类,这提供了一种发现语义相关含义的有用方法。使用三个层次聚类和两个分区聚类对目标词的给定含义的相似上下文进行聚类。相关含义的所有上下文都包含在聚类中,因此在语料库中的所有上下文上执行。基本假设是聚类捕获了上下文之间反映的统一性,并且每个聚类揭示了上下文之间存在的可能关系。实验表明,在总共五个聚类中,EM 和 K-Means 聚类的准确率明显高于分层聚类(单聚类、完全聚类和平均聚类)结果。对于阿凡·奥罗莫来说,与层次聚类算法相比,EM 和 K 均值提高了意义聚类的准确性。每个簇代表一种独特的意义。有些词有两种意思到五种意思。结果显示测试集的平均准确率为 85.5%,这对于无监督机器学习工作来说是令人鼓舞的。通过使用这种方法,找到正确数量的簇相当于找到感官的数量。尽管资源需求较少,但所取得的结果令人鼓舞。找到正确数量的簇相当于找到感官的数量。尽管资源需求较少,但所取得的结果令人鼓舞。找到正确数量的簇相当于找到感官的数量。尽管资源需求较少,但所取得的结果令人鼓舞。