The purpose of this work was to calibrate a Quantitative Structure-Activity Relationship (QSAR) model to predict the half maximal inhibitory concentration (IC50) of the tyrosinase activity of 581 molecules. For geometry optimization, the molecular mechanic force field (MM+) was used, followed by the PM3 semi-empirical method to refine the structures. Then, compounds were described by 5274 alvaDesc molecular descriptors and 166 MACCS structural keys, which were merged into a single dataset and subsequently reduced by the V-WSP unsupervised variable reduction. Thus, 1692 descriptors were submitted to the Genetic Algorithms (GAs) supervised variable selection process coupled with the k-nearest neighbors classifier. In this step, the simplex method was applied in order to optimize the threshold for the separation between the high and low activity classes. A model composed of eight molecular descriptors and four neighbors classifiers was retained as the optimal one (NERtrain = 0.82). This model was validated by a cross-validation protocol based on venetian blind (NERcv = 0.82) and an external test set of 174 molecules (NERtest = 0.86). In addition, the applicability domain of the model was defined, and the mechanistic interpretation of molecular descriptors was provided. The proposed QSAR model was developed using the five principles defined by the Organization for Economic Co-operation and Development (OECD) in order to guarantee its applicability.
Resumen :
En este trabajo se ha desarrollado un modelo basado en las Relaciones Cuantitativas Estructura-Actividad (QSAR) para predecir la concentración inhibitoria media máxima (IC50) de 581 moléculas sobre la enzima tirosinasa. Cada estructura molecular fue optimizada en el programa HyperChem mediante la mecánica molecular (MM+) y el método semiempírico PM3. Posteriormente, se calcularon 5274 descriptores moleculares y 166 huellas dactilares moleculares MACCS en el programa alvaDesc, los cuales fueron reducidos mediante el método no supervisado V-WSP. Así, 1692 descriptores se sometieron a un proceso de selección supervisada de variables mediante Algoritmos Genéticos (GAs) acoplados con el método de clasificación de los k-vecinos más cercanos (kNN). En esta etapa se aplicó el método simplex para optimizar el umbral para la separación entre las clases de alta y baja actividad. Se obtuvo un modelo óptimo con ocho descriptores moleculares y cuatro vecinos (NERcal = 0.82). Este modelo se validó mediante validación cruzada de ventanas venecianas (NERcv = 0.82) y un grupo externo de predicción constituido por 174 moléculas (NERpred = 0.86). Adicionalmente, se definió el dominio de aplicabilidad del modelo y se brindó la interpretación mecánica de los descriptores moleculares. El modelo QSAR propuesto fue desarrollado usando los cinco principios definidos por la Organización para la Cooperación y el Desarrollo Económico (OECD) para garantizar su aplicabilidad.
Av. 12 de Abril y Calle Agustín Cueva, Telf: 4051000 Ext. 1311, 1312, 1313, 1314. Horario de atención: Lunes-Viernes: 07H00-21H00. Sábados: 08H00-12H00
Av. El Paraíso 3-52, detrás del Hospital Regional "Vicente Corral Moscoso", Telf: 4051000 Ext. 3144. Horario de atención: Lunes-Viernes: 07H00-19H00
Av. 12 de Octubre y Diego de Tapia, antiguo Colegio Orientalista, Telf: 4051000 Ext. 3535 2810706 Ext. 116. Horario de atención: Lunes-Viernes: 07H30-19H00