Saltar al contingut

Fonaments

La similitud molecular impregna gran part de la nostra comprensió i racionalització de la química. Això s’ha fet especialment evident en l’actual era d’investigació química intensiva en dades, on les mesures de similitud serveixen com a columna vertebral de molts procediments d’Aprenentatge Automàtic (ML) supervisats i no supervisats.

La similitud és essencial per a la cognició humana perquè ens permet generalitzar característiques al llarg d’una categoria o classificar elements de l’univers segons una matriu ordenada de conjunts quan comparteixen una característica particular. La possibilitat d’inferir algun coneixement sobre una presumpta propietat compartida entre dos elements similars depèn de l’atribut esmentat i la relació preexistent entre aquest i les propietats compartides que fan que els dos objectes siguin similars. Depenent del caràcter particular estudiat, la similitud és un reflex subjectiu dels objectes estudiats. Aquests postulats estan altament relacionats amb el principi de similitud-propietat àmpliament aplicat en química medicinal, així com en altres àrees científiques, que enuncia que “característiques estructurals similars donen lloc a propietats/activitats biològiques similars”.

En Química, la similitud es refereix a les funcionalitats comunes, estructures, composició, disposició espacial, activitat biològica i propietats fisicoquímiques entre diferents compostos químics, sistemes biològics i complexos macromoleculars, entre d’altres. La similitud s’ha convertit en una pedra angular de la quimioinformàtica, cosa que la fa de gran interès per a químics i farmacèutics, així com apareix en altres dominis diversos (vegeu les seccions següents).

La similitud molecular (també anomenada semblança química o semblança de l’estructura química) és un concepte fonamental en quiminformàtica, jugant un paper important en els mètodes computacionals per predir les propietats dels compostos químics, així com per dissenyar productes químics amb propietats desitjades. El supòsit subjacent en aquests mètodes computacionals és que és probable que les molècules estructuralment similars tinguin propietats biològiques i fisicoquímiques similars (comunament anomenat principi de similitud). La similitud molecular és un concepte senzill i fàcil d’entendre, però no hi ha una definició matemàtica absoluta de semblança molecular en la qual tothom estigui d’acord. Com a resultat, hi ha un nombre pràcticament infinit de mètodes de similitud molecular, que quantifiquen la similitud molecular.

Similar-Structure, Similar-Property Principle

Section titled “Similar-Structure, Similar-Property Principle”

The Similar-Structure, Similar Property Principle is the fundamental assertion that similar molecules will also tend to exhibit similar properties. These properties can either be physical (e.g. boiling points) or biological (e.g. activity).

Example 1: Hexane and heptane should have similar boiling points and water solubility.

Hexane

Heptane

Example 2: Cocaine and procaine are both local anesthetics

Cocaine

Procaine

Quantitative Structure-Property Relationships (QSPR) and Quantitative Structure-Activity Relationships (QSAR) use statistical models to relate a set of predictor values to a response variable. Molecules are described using a set of descriptors, and then mathematical relationships can be developed to explain observed properties. In QSPR and QSAR physico-chemical properties of theoretical descriptors of chemicals are used to predict either a physical property or a biological outcome.

In either case, a set of known molecules is used to create a training set that a statistical model can be derived from. These molecules have known properties or activities. An outside test set is used to validate the model. The test set consists of other molecules with known properties that are excluded from the training set. After the model is validated, it can be used to predict properties or activities of molecules that are outside the previous sets. One caveat- new test molecules cannot be sufficiently different from the ones used in previous sets.

If we want to develop a computational model to predict properties, we need to be able to describe them in ways that can be tied to a biological or physical properties. There are many ways that we can represent organic molecules.


El contingut d'aquest lloc web té llicència CC BY-NC-ND 4.0.

©2022-2025 xtec.dev