生物学与医学高级技术

生物学与医学高级技术
开放获取

国际标准期刊号: 2379-1764

抽象的

基于活动悬崖的QSAR模型预测效率计算的数据集分析

法蒂玛·阿迪洛娃和阿利舍尔·伊克拉莫夫

活性悬崖概念与药物化学高度相关。在此,我们探讨了“数据集可建模性”的概念,即对获得生物活性化合物数据集的外部预测 QSAR 模型的可行性进行先验估计。这一概念是在分析所谓的“活动悬崖”对 QSAR 模型整体性能的影响时出现的。一些“可建模性”指标(SALI、ISAC 和 MODI)已经众所周知。我们将 MODI 版本扩展到具有实际活性值的化合物数据集。QSAR模型的预测效率用SVM算法的正确分类率来表示,并与另外两种算法:MODI算法和作者改进的Voronin算法的结果进行比较。使用皮尔逊相关系数平方对结果进行比较分析。我们的研究表明,仅基于“活动悬崖”对数据集的预测效率评估极其缺乏。在开发更准确的方法来评估在数据样本上建立有效模型的可能性时,有必要考虑样本的其他属性,而不仅仅是“活动悬崖”的存在(和数量) 。

Top