国际标准期刊号: 0974-276X
USN Murty、Amit Kumar Banerjee 和 Neelima Arora
随着我们迎来数据驱动世界的新时代,我们面临着从大量可用数据中获取信息的巨大挑战。生成的数据量是巨大的,这需要探索新颖且有效的方法来对此类数据进行聚类和分类。CAM激酶已知该家族含有许多参与重要生理过程的酶。在本研究中,计算机模拟计算了 CAM 激酶家族 56 个序列的 13 个重要理化参数。自组织图 (SOM) 用于对相似序列进行分类和聚类以及高维数据空间的可视化,因为它们以其维持特征之间拓扑关系本质的能力而闻名。SOM 有效地产生了 4 个簇,它们彼此不同并具有特征特征。