In order to avoid the problem of multi-correlation among atomic types, the model directly extracted components from the solvent-accessible surface areas of 221 kinds atoms of amino acids by partial least squares regression.
不同于以往模型,在处理蛋白质分子时,PLSOLV模型不完全根据化学经验划分原子类型,而只是对氨基酸中的221种原子,采用偏最小二乘回归分析方法,对它们所携带的溶剂可及表面积信息进行成分提取,再进行参数拟合,避免了变量间由于多重相关性所带来的影响。
参考来源 - 蛋白质分子溶剂化能的表面加和模型研究·2,447,543篇论文数据,部分数据来源于NoteExpress
应用推荐