Dinámica deprocesosbiológicosnocovalentesanivelmolecular · Losalgoritmos genéticos emulan...

7
REVISTA MEXICANA DE FíSICA 4fJSUPLEMENTO 2,135-141 NOVIEMBRE 2000 Dinámica de procesos biológicos no covalentes a nivel molecular Ramón Garduño Juárel. Centro de Ciencias I:ísicas, Uni\'(~rsidadNacional Autónoma de Aléxico Apartado postal 48-3, 62250 Cuemawlca, More/os, Mexico emai!: HU/[email protected]' Luis B. Morales I"stiluto de Im'esligación en Matemáricas Aplicada.\' yen Sütemas, Uni\'ersidad Nacional Autónoma de México AI'0rtad0l'0stal 70-22/, 0'¡5/0México,IJ.I':, Mexico Pedro Flores-Pérez Deparamelllo de Matemóticas, Unil'ersidad de SOllora Apartado postal 96, 83/90 HemlOsillo, Sonora, Me.rico Recibido el 27 de ahril de 2(X)O; aceptado el 15de agosto de 2000 EstriClamente hahlando, el término "auto-ensamblado" se aplica a los procesos que producen espontáneamente un producto final cuando los componemes correctos son melclados bajo nmdiciones .lpropiadas. El proceso dcbe de ser completamente reversible y el producto debe ser estahle en el equilihrio termodinámico. Además, todos los componenles de la estructura final deben contener toda la información necesaria para que ocurra el ensamblado correcto. Estructuras .litalllcnle organizadas se pueden formar cuando muchas moléculas idénticas se agregan como resultado dírecIOde interacciones no covalentes. Estas intcraccioncs dan lugar a muchas estructuras biológicamente importantes, tales como: a) el auto,ensamblado de la dohle hélice del ADN a partir dc dos cadenas complcmcntnrias de oligonucleótidos; h) la agregación de bicapas lipídicas para formar membranas; c) el pleg<lmiento de las proteínas para adoptnr estnlcturas hiológicamente activas; y d) la estere- m.eleclÍvidad en receptores. En este reporte proporcionamos dos ejemplos de auto-ensamhlado como parámetros que indican la importancia dc estudiar estos fenómenos al nivel molecular, así como de las técnicas actualmcnte empleadas para su estudio. {)escriptort,.c Estnlctura de hiomoléculas; plegado de proteínas; complejos de inclusión; simulaciones por computadora Strictly spcaking. lhe tenn "sclf.assembly" applies lo pathways that give spontancollsly a tlnal product when the correc! components are mixed under appropriale conditions. The pathway must he reversihle amI the prodll(,:tshould be stahle at thermodynamic equilibrium. Mo- reover, Ihe <.:onstituent components ol' the final structure must (:ontain all 01' lhe information necessary l'm correct assembly to occur. Highly organizeJ StrLlclures may be formed when Illany identical molecules aggregale as a dire(:t result 01' noncovalent bonding interactions. These intcractions givc rise to structures hiologic.tlly important sllch as: a) the sclf.assemhly 01' the DNA double helix from two complementary oligofluclcotide chains; b) the formalion 01' lipid hilayers to form llIemhranes; c) thc prolein folding process lhat produce a biologically active protein molcculc; ¡¡ndd) lhe slcreoselectivity prescnl in many receptor l1loleculcs. In Ihis report \Veprovide two examples ol' self-assembly as paramelers of the imporlance lo sllldy Ihese phenol11ena al the molecular Icvcl. as \Vellas the techniques currently employcd for their study. Keywort!.c 13iomolcculc structure; protein folding; inclusion complexcs; <.: omputcr SilllU!alioll PAes: R7.15: R7.15.Aa l. IlltrodllccilÍn La <luto-OIgalllzaclOn y el auto-ensamhlado en sistemas hiológicos son procesos vitales para la evolución y sosteni- miento de la vida. El tipo de especificidad y precisión ejer- cida por los sistemas biológicos son derivados del recono- cimiento Illutuo allamente dirigido por los componentes de las estructuras participantes. Ejemplos de estos procesos son: Úl)el aUIO-ensamblado de las partículas virales que se llevan a cabo por interacciones no covalentes de manera dinámica muy cercana al equilihrio; (h) el auto-ensamblado de la do- hle hélice del ADN a partir de dos cadenas complemcnta- rias de oligonucle6tidos, cuyo proceso es uno de "todo () na- da"; (e) el plegado que llevan a eaoo las proleínas para lle- gar a una estructura compacta biológicamente activa a partir de una estructura desordenada, este proceso es uno donde la molécula de proteína encuentra su conformación de mínima energía termodinámica; y (d) la capacidad que muestran las ciclodcx trinas para fonnar complej(lS de inclusión estables en disolución acuosa con una variedad de huéspedes, estos com- plejos de inclusi6n son favorecidos por su cavidad hidrófoba relativamcn!e rígida y por interacciones del tipo de van der Waals. fuerzas hidrófohas y otras relacionadas con el tipo de huésped usado. La propuesta termodinámica de Anflsen [1}considera que una protcína adoptará su estructura biológicamente activa en el mínimo glohal energélico descrito por las condiciones fi- siológicas. A esta estructura se le conoce como "estructura terciaria" y est:í hccha de varias secciones de "estructura sc- cundaria", donde encontramos o-hélices y hojas ,B-plegada. Cada una de las proteínas está formada por una secuencia de aminoácidos o "estructura primaria" dictada solamente por su código genético. En los libros de texto y en las revistas es- pecializadas est.í ampliamentc documentada la manera en la que las proteínas adoptan una sola conformación de estructu- ra tcrcinr.ia que es activa. y que cada proteína tiene una forma

Transcript of Dinámica deprocesosbiológicosnocovalentesanivelmolecular · Losalgoritmos genéticos emulan...

Page 1: Dinámica deprocesosbiológicosnocovalentesanivelmolecular · Losalgoritmos genéticos emulan elproceso deselección evo. lutivahiológica cuyaprincipal operación surgedelateoríade

REVISTA MEXICANA DE FíSICA 4fJ SUPLEMENTO 2,135-141 NOVIEMBRE 2000

Dinámica de procesos biológicos no covalentes a nivel molecularRamón Garduño Juárel.

Centro de Ciencias I:ísicas, Uni\'(~rsidad Nacional Autónoma de AléxicoApartado postal 48-3, 62250 Cuemawlca, More/os, Mexico

emai!: HU/[email protected]'

Luis B. MoralesI"stiluto de Im'esligación en Matemáricas Aplicada.\' yen Sütemas, Uni\'ersidad Nacional Autónoma de México

AI'0rtad0l'0stal 70-22/, 0'¡5/0México,IJ.I':, Mexico

Pedro Flores-PérezDeparamelllo de Matemóticas, Unil'ersidad de SOlloraApartado postal 96, 83/90 HemlOsillo, Sonora, Me.rico

Recibido el 27 de ahril de 2(X)O; aceptado el 15 de agosto de 2000

EstriClamente hahlando, el término "auto-ensamblado" se aplica a los procesos que producen espontáneamente un producto final cuando loscomponemes correctos son melclados bajo nmdiciones .lpropiadas. El proceso dcbe de ser completamente reversible y el producto debe serestahle en el equilihrio termodinámico. Además, todos los componenles de la estructura final deben contener toda la información necesariapara que ocurra el ensamblado correcto. Estructuras .litalllcnle organizadas se pueden formar cuando muchas moléculas idénticas se agregancomo resultado dí recIO de interacciones no covalentes. Estas intcraccioncs dan lugar a muchas estructuras biológicamente importantes, talescomo: a) el auto,ensamblado de la dohle hélice del ADN a partir dc dos cadenas complcmcntnrias de oligonucleótidos; h) la agregación debicapas lipídicas para formar membranas; c) el pleg<lmiento de las proteínas para adoptnr estnlcturas hiológicamente activas; y d) la estere-m.eleclÍvidad en receptores. En este reporte proporcionamos dos ejemplos de auto-ensamhlado como parámetros que indican la importanciadc estudiar estos fenómenos al nivel molecular, así como de las técnicas actualmcnte empleadas para su estudio.

{)escriptort,.c Estnlctura de hiomoléculas; plegado de proteínas; complejos de inclusión; simulaciones por computadora

Strictly spcaking. lhe tenn "sclf.assembly" applies lo pathways that give spontancollsly a tlnal product when the correc! components aremixed under appropriale conditions. The pathway must he reversihle amI the prodll(,:t should be stahle at thermodynamic equilibrium. Mo-reover, Ihe <.:onstituent components ol' the final structure must (:ontain all 01' lhe information necessary l'm correct assembly to occur. HighlyorganizeJ StrLlclures may be formed when Illany identical molecules aggregale as a dire(:t result 01' noncovalent bonding interactions. Theseintcractions givc rise to structures hiologic.tlly important sllch as: a) the sclf.assemhly 01' the DNA double helix from two complementaryoligofluclcotide chains; b) the formalion 01' lipid hilayers to form llIemhranes; c) thc prolein folding process lhat produce a biologically activeprotein molcculc; ¡¡nd d) lhe slcreoselectivity prescnl in many receptor l1loleculcs. In Ihis report \Veprovide two examples ol' self-assembly asparamelers of the imporlance lo sllldy Ihese phenol11ena al the molecular Icvcl. as \Vell as the techniques currently employcd for their study.

Keywort!.c 13iomolcculc structure; protein folding; inclusion complexcs; <.:omputcr SilllU!alioll

PAes: R7.15: R7.15.Aa

l. IlltrodllccilÍn

La <luto-OIgalllzaclOn y el auto-ensamhlado en sistemashiológicos son procesos vitales para la evolución y sosteni-miento de la vida. El tipo de especificidad y precisión ejer-cida por los sistemas biológicos son derivados del recono-cimiento Illutuo allamente dirigido por los componentes delas estructuras participantes. Ejemplos de estos procesos son:Úl) el aUIO-ensamblado de las partículas virales que se llevana cabo por interacciones no covalentes de manera dinámicamuy cercana al equilihrio; (h) el auto-ensamblado de la do-hle hélice del ADN a partir de dos cadenas complemcnta-rias de oligonucle6tidos, cuyo proceso es uno de "todo () na-da"; (e) el plegado que llevan a eaoo las proleínas para lle-gar a una estructura compacta biológicamente activa a partirde una estructura desordenada, este proceso es uno donde lamolécula de proteína encuentra su conformación de mínimaenergía termodinámica; y (d) la capacidad que muestran las

ciclodcx trinas para fonnar complej(lS de inclusión estables endisolución acuosa con una variedad de huéspedes, estos com-plejos de inclusi6n son favorecidos por su cavidad hidrófobarelativamcn!e rígida y por interacciones del tipo de van derWaals. fuerzas hidrófohas y otras relacionadas con el tipo dehuésped usado.

La propuesta termodinámica de Anflsen [1}considera queuna protcína adoptará su estructura biológicamente activa enel mínimo glohal energélico descrito por las condiciones fi-siológicas. A esta estructura se le conoce como "estructuraterciaria" y est:í hccha de varias secciones de "estructura sc-cundaria", donde encontramos o-hélices y hojas ,B-plegada.Cada una de las proteínas está formada por una secuencia deaminoácidos o "estructura primaria" dictada solamente porsu código genético. En los libros de texto y en las revistas es-pecializadas est.í ampliamentc documentada la manera en laque las proteínas adoptan una sola conformación de estructu-ra tcrcinr.ia que es activa. y que cada proteína tiene una forma

Page 2: Dinámica deprocesosbiológicosnocovalentesanivelmolecular · Losalgoritmos genéticos emulan elproceso deselección evo. lutivahiológica cuyaprincipal operación surgedelateoríade

R. GARDUÑO JUÁREZ. LB. MORAL.ES y 1'.FLORES.I'EREZ

Colapso a L.I"1l'1Jmerode conf()(meroscompa::lados alm_o

n.~i ;~!'~,jo'

Reconfiguración métrica

Reconfiguración por difusión

Trampas cinéticas

I{~.. Molten globul~

"Alambre azaroso

Eslado nalivo

~."

turas conocidas en los hancos de datos. Aun con estos po-tencial~s mínimos. encontrar la estructura con la encrgía máshaja es una tarea tit.ini<.:aya que el espacio de húsqucda estádetl'nninado por el nlÍmero de conformaciones posihles. elcual es del orden de 2s. donde.\' es el nLÍmero de varia-hles indepcndientes de la función del potencial conformacio-nal. Matcm~lticamente. este proceso pertenece a los prohlc-mas NP completos [2. ~I.

Termodinámicamentc hahlando. el plegado de una pro-tdna puede visuali¡,arse como un embudo energético (verFig, 1). Definimos un emhudo de plegado como una colec-ción de estructuras colapsadas geométricamente semejantes.donde liBa de éstas es lennodin,ímicamentc más estahle conrespecto al resto de ellas. Si una secuencia de aminoácidostiene un cmhudo lk plegado que lleva a una conformacióncstah1c única, se dice que ésta es plegahle>. Por el contrario.una secucncia l/O es 1,I('Mah/e si tiene emhudos múltiples queno llevan a un mínimo energético único.

Ohtener por medio dc simulaciones en computadora laconformación activa de una molécula de proteína a partir de

RUTAS DEL PLEGADO

Fl<iURA 2. Algunas forll1a~ caraclcrís(icas del plcgamiento en pro-

teínas.

FIGURA l. Esquema de un embudo de plegado.

••¡;j'"wZw

2. El ¡M::ado de proteínas

En la naturalela. las proteínas se pliegan para llevar a ca-ho sus funciones biológicas y éstas necesitan de milise.gundos a minutos para plegarse a una estructura compactabiológicamcnte activa. Para la mayoría de las proteínas glo-hulares la información codificada en la secuencia de sus allli-no~ícid(lscs suflcil'nte para determinar la conformación de suestado natinl Las proteínas naturales se pliegan a estructurasL'olllpaL.t;¡sL'specílicas a pesar del númcro gigantesco de susposihles conforllwciones. Como las proteínas contienen mi-les dc ¡'¡tomos que interaccionan entre sí. así C01ll0 con otrosmiles de lllolé-culJSde aguJ. no es posihle calcular su funciónde energía lihre por primeros principios: por lo tanto. es ne-cesario adaptar seudopotenciales ohtenidos a partir de cstruc-

diferente a menos que se trate de la misma proteína o de suslIlutanlc:-.. Hoy en día se sahe que muchas enfermedades sonde origen molecular y que cSljn relacionadas con camhios enla estructura de las proteínas. entre ellas tenemos a la cnfcr-llu:-dadde Alzhcimcr. las cataratas y la fihrosis quística. Porlo tanto, el predecir la estructura terciaria de las proteínas apartir dI.:' la información de la secuencia de sus aminoácidostiene muchas implicaciones médicas y tecnológicas; particu-larmente ahora que se ha descifrado el gcnoma humano.

Otro problema biológico químicamente interesante radi.ca en la cnantiosclcl'tividad que los seres vivos tienen so.ore compuestos org¡ínicos. La palahra "cnantiómero" es de-rivada del griego y signifka opuesto; así. los enantiómcrosson estructuras que no se pueden superponer. ya que sonindgenes dc espejo. Los dos "gemelos" poseen propiedadesfísicas idénticas. exccpto por la dire(ción en la que desvíanla luz polarilada. Sin emhargo los enantiómeros pueden tenerun comportamiento químico y hiológico distinto. particular-mentc entre aquellos compuestos empleados como medica-IIIcntos que generalmente se administran como melc1as race-micas (presencia dc los dos cnantióme!"os). A menudo la acti-vidad terapéutica n:side en sólo llllO de los gemelos. mientrasquc el otro pucde dar a lugar a efectos secundarios no desea-dns. La tragedia de la talidomida (un analgésico) es el mejorejcmplo. En la década de 1960. a muchas mujeres cmhara-¡ada" "l' lcs administró la Illclcla racemica de la talidomiday dieron a luz a niilo" deformes. Investigaciones posterioreslIlostraron que sólo la molécula que rota la luz a la derecha(D-talidomida) causaha los mismos defectos en los emhrio-ncs de ratón. Si esta droga sedante huhiera sido administradal'n la forma de L-talidomida. este desastre se huhiera evitado.Por lo tanto, la húsqueda de sistemas moleculares que seancapaces de separar a los dos enantiomeros es de vital impor-t<llH:iamédica y teclH1lógica.

En este proyecto nos hemos propuesto contri huir al enten-dimiento dc los pn1cesos moleculares 110 covalentes presentesen si"temas hiológicos. al estudiar dos fenómenos importan-tL'S:( 1) la predicción de estruclUras ten:iarias hiológicamenteal'¡ivas lle péptidos modelo; y (2) el origen de la enantiose-kctividad que presentan las ciclodextrinas.

Rn'. Me.l. I-","s. 4(, S2 (2000) 135-1'" 1

Page 3: Dinámica deprocesosbiológicosnocovalentesanivelmolecular · Losalgoritmos genéticos emulan elproceso deselección evo. lutivahiológica cuyaprincipal operación surgedelateoríade

DINÁMICA DE PROCESOS BIOLÓGICOS NO COVALENTES A NIVEL MOLECULAR 137

su secuencia de aminoácidos es difícil por dos razones: lacontrihución de la energía libre en la estabilización de la es-tructura plegada está pobremente estudiada, y el espacio desus posihlcs conformaciones es muy grande y complejo: ra-Iones que hacen difícil el huscar el mínimo de energía lihre.Mientras que analizar el primer prohlema requiere de mo-delos detallados de la estructura de la proteína, el segundoprohlema requiere de un modelo simplificado y de diseñarhuenos métodos de húsqueda.

Los métodos para la predicción de la estructura secunda-ria de proteínas han avanzado en las últimas décadas Hl. Hoyen día, con técnicas de hilvanado se puede predecir la estruc-lura secundaria de o-hélices y de /3~plegadas. Sin embargo.las estructuras de vuelta de horquilla, siguen siendo evasi-vas. Nosotros nos hemos propuesto determinar la estructuralerciaria de pequeños péptidos que contengan vueltas de hor-quilla. empleando el acoplamiento de un modelo detalladode la molécula. de un seudopotcncial para evaluar su energíaconformacional. y de un método heurístico para muestrear elespacio cOllfonnacional de manera dpida. En este proyectocmpleamos un seudopolencial conocido como ECEPP3 151, yhelllos cxperimentado con dos heurísticos, la búsqueda lablíy los algoritlllos genéticos. que han dcmostrado ser más cfi-cicntes que otros métodos heurísticos. Para encontrar la es-tructura del mínimo global de péptidos pequeños otros auto-res han cmpleado varias técnicas de búsqueda no estocásticay estocástica. Entre las no estocásticas tenemos a la progra-mación din.ímica. a la ecuación de difusión y la de "branch &bound". Entre las estocásticas tenemos a la técnica de MonteCario y i.'1 recocido simulado.

2.1. ~Iétod()s heurísticos

A diferencia de los algoritmos de búsqueda exhaustiva. co-mo ~1ontc CarIo. la idea básica de una búsqueda heurísticaes quc. más que tratar de explorar todos los pasos posibles deblísl)ueda, se trata de enfocarse en zonas que parecen acer-carse a la soluci6n deseada. Para problemas muy complejoslos heurísticos se acercan lo más posible a la solución, y aun-que paro.ca que se toman mucho tiempo y que los pasos parallegar son complicados, éstos al menos nos dan una muy bue-na aproximaci6n a la solución buscada. Diseñar una técnicahcuríslica que sea rápida y eficiente es siempre un desafío. yaque generalmente depende del tipo de la función de evalua~ciún. el número de variables y la complejidad del problema.Una técnica heurística novedosa que ha probado ser muy efi-ciente para la optimización comhinatoria de problemas com-plejos es la InÍ,\'lflleda tabú [úl. Sin emhargo, entre las técnicasheurísticas que se pueden diseñar para que realicen un mues~treo eficiente del espacio conformacional de estas moléculasest;ín los algoritmos genéticos líJ.

2.1.1. BIÍ.wjueda tabú

La hlísqueda tabú es un procedimiento adaptivo para resolverprohlemas complejos de optimización combinatoria, el cual

guía a un heurístico colina descendente para que continúe laexploración sin ser confundido por la falta de movimientosque mejoren los valores de la función objetivo y sin caer denuevo en mínimos locales previamente localizados. En cadaiteración, un movimiento permitido se aplica a la soluciónactual, transformándola en su vecino con el costo más pe-queño. Las soluciones que aumentaJ1 el costo de la funciónson permitidas, el movimienlO inverso es prohibido por al-gunas iteraciones para evitar el reciclado. Las restriccionesestán basadas en una función de memoria corta que deter-mina por cuanto tiempo una restricción tabú estará activadao. alternativamente, cuáles movimientos serán permitidos encada iteración.

Nosotros helTlos desarrollado e implementado un heurís-tico hasado en la tnísqueda tahú para encontrar la conforma-ción de energía mínima para oligopéptidos. Nuestra moléculaprueba fue la Met-enccfalina. un pentapéptido que ha sidoempicado por mu¡;hos autores como un modelo de valida.ción para muchos optimizadores globales. La función ohjeti-vo que empleamos fue ECEPP3. Nuestra implementación dela búsqueda tabú asigna valores enteros a las variables a seroptimizadas y facilita la diversifkación e intensifkación de lahúsqueda. El resultado lInal de este algoritmo se trata con unminimizador local. y el resultado final se compara en calidadcon otros métodos reportados en la literatura. El tiempo deCPU empleado para llegar a esta solución es mucho menory se demuestra que nuestra implementación es eficiente parala húsqueda conformacional. Así mismo, desarrollamos unaversión para cülculos en paralelo, con lo que se logra dismi-nuir de manera significativa el tiempo requerido para llegar ala soluci6n.

Las siguientes líneas presentan un seudocódigo para laoúsqucda laoú:

1. Crear uflllli\"tlllllhú de longitud L (vacía).

2. Crear u//a .wludó" inicial al azar o cspecífic.a y llenarla lista lahlí.

3. El'(l/twr la .'wl/lciú// actual. Si la solución actual es lamejor hasta ahora. sc registra.

4, ACfllafiZl/r la IiSlll tabú.

if Si la lista tahú no está llena. se añade la soluciónactual a la lista,

el,'1e

Reemplazar al miembro más viejo de la lista tahú conla solución actual

e//d~l

5. Generar y evaluar los N movimientos posibles a partirde la solución actual.

Un 11/m'imh,lIto l'.'Ielcclarmlo ralni, dl'lltm de la listatabú. por WI tiemlJO tabú (memoria corta), evitandoque este paso scallevado a cabo nucwunente ha,'Itnquese Cll1l1l,ftl C/wlquiem ele los pasos ,\.iguil'lI1es:

Rel'. Me.r. !-",:,. 4(, S2 (2(){X) 135-141

Page 4: Dinámica deprocesosbiológicosnocovalentesanivelmolecular · Losalgoritmos genéticos emulan elproceso deselección evo. lutivahiológica cuyaprincipal operación surgedelateoríade

R. GARDUÑO JUÁREZ. LB MORALES Y P. FLORES.PÉREZ

FIGURA 5. Clf<lcterísticasestructurales de las ciclodextrinas.

.'.1''',.

..1

(b)

.....'----- '~~'"

°11~O""""""o./C""""""OH

V L,(a)

0000 0:J000 00 o o o o o 0000000000o o o o o o o o e o o o o o o o o o o o o o 00o JO 000 0°000000000(0 °0° U :>J-.::I c>o01m0o::> o 1} ooo~~ ~0.L.0o. 00°. :/000 61:0:. OC 0•• o' .,' 00,. ...•. o o -. o\t-=Q-l-:tf::,o '0°000 o -; 0000° cti} 0000 ool o o ° ° o o o o 00 o o 00000 o~ono o a cooaoo oocooooooo a

•/OH

.*'CH: ~-o • ',HO OH, ,

FIGURA 4. Representación esquemnticJ de la formación de uncomplejo de inclusióncon eD. Lnmolécula huésped es el p~xileno,y los círculos pequeños representan moléculas de agua [lOJ .

8. Si se llega al límite de las iteraciones, .mUr con la me-jor solución encontrada. Si la mejor solución hasta aho-ra no ha camhiado por un número dado de iteraciones,reiniciar todo el procedimiento (ir a 2). Dc lo contrario,;ra(3).

CICLO DE UN ALGORITMO GENETICO

7. Examinar los movimiemo.'i por jerarquía.(a) Si el movimienlO tuvo una menor energía que lamejor .wlució" ,,;!:eme, aceptar e ir a 8.

(h) Si el movimiento no es tabú, aceptar e ir a 8.

(e) Si 110 se localizan movimientos aceptables. termi-fI(/r el algorilmo.

6. Ordl'f/llr los N mo\'imienrns posibles en orden ascen-dente dc energía conformacional.

FIGURA 3. Diagrama general de un algoritmo genético

2./.2. Algoritmos genéticos

Los algoritmos genéticos emulan el proceso de selección evo.lutiva hiológica cuya principal operación surge de la teoría dela sohrevivencia del individuo más fuerte. Así, en los algorit-mos genéticos se trahaja con un número fijo de individuosque forman una población. la cual se motiva a evolucionar;es decir, se comhinan las mejores características de cada so-lución posible con el afán de que entre la pohlación se en-cuentre la mejor solución.

Tradicionalmente un algoritmo genético está hecho de lossiguientes operadores, Pig. 3: I"dividuo: Identificado por suscromosomas (confonllero). Reproducció,,: Empezar una po-hlación de conformeros de la proteína por medio de la reglade la característica mínima. Selecció,,: Conformaciones de laproteína que tengan una energía inaceptahle. son eliminadas.MIl/(lció,,: Es el procedimiento por el cual un bit de infor-mación es cambiado en un individuo si se cumple una ley deprohahilidad (un confonnero muy parecido al padre). Cmza-1II;(,l1to: Es otro proceso de mutación donde la informaciónentre dos cromosomas se intercamhia para generar a los hi-jos. Esqlle11l(lw: Proceso por el cual se selecciona a los indi-viduos que comparten características similares y cuya evalua-ción es mejor que el promedio. Elitista: Proceso por el cualel individuo mejor evolucionado siempre pasa a la siguientegeneración.

0=0",/I í"O CH,# o

(e)

FIGURA 6. Estructuras de las moléculas huésped, (a) ácido fcnoxi-propiónico. (b) ácido Jicloropropiónico y (e) salitión.

3. Complejos de inclusión

Las ciclodextrinas (CD) son oligosacáridos cíclicos de 6(0'),7({3) Y 8(1) unidades de 0-1 ,4-glueopiranosa, y son capa-ces de formar complejos de inclusión con moléculas huéspedapropiadas (ver Fig. 4). La molécula de CD se asemeja a uncono truncado, cuya hase presenta grupos hidroxilicos pri-marios en los C2 y C3 del residuo de glucopiranosa. Latapa presenta grupos hidroxilicos secundarios en el C6 (verFig. 5). El interior de la en es hidrófobo y el exterior eshidrótllo. La interacción con las CDs imparte modificacio-nes importantes en las propiedades del huésped, por ejemplo.permitiendo la fijación de compuestos volátiles, la proteccióncontra oxidación y foto lisis, modificación de la reactividad ypropiedades biológicas. En especial, las en son capaces deatrapar selectivamente a moléculas quiralcs.

ReI'. Mex. n,. 46 S2 (2(){Xl)135-141

Page 5: Dinámica deprocesosbiológicosnocovalentesanivelmolecular · Losalgoritmos genéticos emulan elproceso deselección evo. lutivahiológica cuyaprincipal operación surgedelateoríade

J)I~ÁMICA DE PROCESOS R10LÓGICOS NO COVALENTES A NIVEL l\.10LECULAR 139

CD2HP

FJ(;URA 7. Cuatro orientaciones para el reconocimiento interno.

Nuestras moléculas huésped fueron el ácido R,S-dicloropropiónico, el ácido R,S-fenoxipropiónico, y el R,S-sa1itíoll (ver Fig. 6). La molécula de ciclodextrina que em-picamos para cste estudio preliminar fue la (3CD cuyas coor-denadas, POBRAZ, fueron tomadas del Camhridge Crysta-llographic Centre. Al modelar la interacción de estos enan-tiómcros esperamos entender los mecanislllos elelllentalespara la separación quiralllevada a cabo por las ciclodextrinas.En este eSlUdio de Illodelado molecular hacemos la suposi-ción dc que los huéspedes se unen principalmente a la cavi-dad de las ciclodextrinas. Este punto puede ser causa de deha-te, ya que algunas separaciones quiralcs ocurren aun cuandola cavidad no está disponihle.

El lllodelado lllolecular se llevó a cabo en una Sili-con Graphics OCTANE usando el campo de fuerza de Ho-ll1ans [8) diseñado para polisac<Íridos en el programa BiosymInsightJDiscover [9]. Las cargas atómicas parcialcs fueroncalculadas con el método semiempírico MOPAC con el ha-mi1toniano AM l. Cada huésped tiene cuatro posihilidades deinteractuar con la cavidad de la ciclodextrina, Fig. 7. En estereporte prel iminar sólo consideramos la orientación CD IHe.

Para la simulación de dinámica molecular se emplearoncondiciones periódicas. Las corridas preliminares se hicicronen la ausencia de disolvente, la celda unidad fue un cubo deJO A por lado. El sistema se equilihró en un ensamble NVTa 29X K durante ISO ps. La configuración final fuc tomadacomo cl punto de partida para una simulación de dinámicaIllolecular con X60 moléculas de agua TIP3P. Las trayectoriaspara cl sistcma solvatado se realizaron en un ensamhle NPTcon P = 1 atln. Cada sistema fue equilihrado a T = 298 Kdurante lOOps, cnfriado a OK durante 50 ps y sucesivamen-te calcntado durante 100 ps a 298 K; una trayectoria final de200 ps fue registrada a la misma tempcratura para el an<ÍlisisIlnal.

4. Resultados

4.1. Ple:,.:ado de proteínas

Búsqueda tabú. La Met-enccfalina tiene 24 ángulos torsio-nales quc, de acuerdo a nuestra dcfinición de espacio deblísqucda, significa un espacio de al menos 224 dimensiones.

FIGURA 8. Vista estercoscópica de la conformación de mínimaenergía glohal del pentapéptido de Met-encefalina. Esta estructurafue encontrada tanto conla búsqueda tabú como con los algoritmosgenéticos empleando la función objetivo ECEPP3.

Los mejores valores para los parámetros de la húsquedatabú fueron encontrados experimentalmente, siendo éstos elnúmero m<Íximode iteraciones = 200, la distancia tahú = 5°,Y el tiempo tabú un entero entre 40 y 60. Una centena decorridas independientes fueron llevadas a cabo, y despuésde haher encontrado las estructura de mínima energía cadauna de ellas fue sometida a una optimización local dando co-mo resultado un promedio de seis de ellas con la estruc-tura conocida del mínimo global para Met-encefalina (verFig. X). En todos los casos la función objetivo fue evaluada170 000 veces en promedio, y esto eorrespoode a 260 s detiempo de CPU cn una SGI Origino Estos resultados han sidopublicados en el Journal 01' ComputationaI Chemistry [10].

Algoritmos genéticos. Nosotros desarrollamos un algo-ritmo híhrido constituido por un algoritmo genético autoa-daptivo acoplado a un procedimiento selectivo de tamiz y aun optimizador local para determinar la estructura de mínimaencrgÍa glohal dc Met-encefalina. El método resulta ser muyefectivo para la detección de las regiones energéticas permi-tidas sin conllictos estéricos. Los genes de los ángulos dihe-dros aparecen en etapas tempranas de la simulación, y estospueden estar delimitados por valores inferiores y superioresde regiones este ricas permitidas. Una vez que estas regio-nes gcnéticas han sido encontradas, nuestro método localizamuy r::ípidamclltc las regiones donde se encuentra el presuntomínimo glohal de la Met-encefalina. Este método y sus resul-tados preliminares han sido presentados en varios congresosnacionales e internacionales [11 J.

La Fig. X muestra la estructura de horquilla correspon-diente al mínimo global encontrado tanto por la húsquedatahú, como con el algoritmo genético con tamizado.

4.2. Complejos de inclusión

Los valores de energía total, promediados sobre 1000 ps, semidieron para los complejos de inclusión de las moléculashuésped con la ¡JeD. El cnanti6mero S aparenta scr más es-tahle que el R con 59, 16 Y 15 kcallmol para el ácido dicloro-propi6nico, el ácido fenoxipropiónico, y salitión respectiva-mente. Instant<Íneas de las contlguraciones de equilibrio de

Nn'. Mex. Fr.,. 46 S2 (2tKKl) 135-14 t

Page 6: Dinámica deprocesosbiológicosnocovalentesanivelmolecular · Losalgoritmos genéticos emulan elproceso deselección evo. lutivahiológica cuyaprincipal operación surgedelateoríade

1411 R, GARI)lJÑOJll/\REZ.I .. H. J\lllRAI.ES y 1', I-U)RES.I'E~REZ

ácido R-didoropropifínú:o úciJ,'/(-;('lIIuipro¡JlúnlnJ R-s"lilián

ácido S-dtdorof/,"opúifllCO ti,'ido S_fcm'.ti¡II"o/,iánlco S-.wlitifín

FIGURA 9. Conformaciones de equilibrio para los complejos de inclusiún con ¡iCD.

r_OIQ.ORPROP

"" - C><"lO

..,

20'

" '" '"

'""lO

JO,

~20'

'"o 00 o

1,"""": I /\r I I \1" ,. \I ,I ,, \

~

' ",--,, \

" '\l' . \

-\ . "-; ~ -'---- --

so 100 1:50

I-PHENOxYP~ICNCACIDOH-C><

"

'DO

2D'

~ 1011

'"'""

f_PHENOXVPROPlONlCACIO

"" - C><

"" ,,,,'"1/,. ,

" ,\,\. •...•'•..,

" ,,-,--..._---'"

JO'

..,

FI(iURA 10. FuncilUlcs de distrihur.:ión radial cnlTl'los ~rupos hidnl,il(l" ¡I...-la ,1(-[) y 111••gn.pll'" ,íl"il!llS (lll do..'1;••...llltlll~culas hlléspcd.

los complejos se muestran en la Fig. 9. Es evidente que lasmoléculas huésped se aproximan al tinillo de la ¡leD con sueje molecular casi paralelo al diámetro de la /JeD.

Las ,"undones de correL,It.:iún radial, g(I"), entre los hidro.x.ilos de la ¡ieD y los grupos .k:idos OH en las moléculashut5sped se mucstran cn la Fig. 10. Estas grálicas ponen en c-

N{'l'. ""{'X, Frs. 46 S2 (2()(X») lJ5~1..J1

Page 7: Dinámica deprocesosbiológicosnocovalentesanivelmolecular · Losalgoritmos genéticos emulan elproceso deselección evo. lutivahiológica cuyaprincipal operación surgedelateoríade

DINÁMICA DE PROCESOS BIOLÓGICOS NO COVALENTES A NIVEL MOLECULAR 141

videncia la formaci6n de puentes de hidrógeno entre el hués.ped y él. Los cnatiomcros R de los ácidos dicloropro y defcnoxipropiónico exhihen la tendencia de formar puentes dehidrógeno preferentemente con los grupos hidroxilos secun-darios de la /-iCD. Esta tendencia es casi opuesta para loscni.lnlio11lcros S, particularmente en el caso del ácido fCllo-

xipropiónico. La mayor interacción de los hidroxilos prima-rios de la ¡jCD sugiere que los cnal1liolllcros S penetran másprofundo en la cavidad de la ,deO. Estos resultados son pre-liminares, y csl;:ín siendo ohjeto de revisi6n exhaustiva pa-ra posteriormente empezar estudios semejantes con algunas1ll()léculas dc inlerés farmacológico,

5. Conclusiones

Nuestro trahajo relacionado con la predicción de estructuraterciaria de proteínas ha demostrado que cluso di.' algoritmoshíhridos es la manera m<Ísefectiva para tener un [.¡pido acce-so a las regiones del espacio conform::H:iollal donde se locali-

1. CR. Antiscn. Scil'llCl' IXI (1973) 223.

:!. \V.E. Hart. <1m.! S. Istrail..I. Comp. lJio/ . .J ([997) 1.

:\. 11.Bcrgcr and T. Lcighlon,.I. COIllI,.lJiol. S (199g) 27.

"1. P. Argos. en Froleill StJ"llcwre, A Practica! AI'pmach. cditcd byT.E. Crcightoll. (IRL Press. Oxrord, 1990) p. 169.

.). N. Nérnethy l't al., 1. Phys. Clll'm. 96 (1l)l)2) 6472.

(¡. F Glover. ORSA 1. COlllpl. 1 (19X9) 190.

(. J.H. Holland. Adal'wriOfl "1 Natural al/(I ArtUicial :'iy.\"{l'III.\',(lJniversity 01'Michigan Press. Anll-Arhor MI. 1(75).

za el mínimo global dc energía. Los resultados que hemos ob-tenido con la molécula prueba compiten en calidad y eficien-cia reportados por otros métodos. En general, la búsquedatabú resulta ser el heurístico más eficiente entre los que sehan empIcado para tralar problemas semejantes.

Nuestro trahajo sobre el estudio de las fuerzas responsa-bles de la cnantiosclcctividad que presentan las moléculas deciclodcxtrina, está todavía en sus fases iniciales. Los resul-tados preliminares. bajo el enfoque de estudios de dinámicamolecular, muestran indicios de que se está trabajando en ladirección correcta."

Agradecimientos

Los autores desean expresar su agradecimiento al ConsejoNacional de Ciencia y Tecnología por los apoyos otorgados ya la Dirección General de Cómputo Académico de la Univer-sidad Nacional Aut6noma de México por el generoso tiempode cómputo que se ha requerido para estos cálculos.

8. S.\Y. Hornans. !Jiochemistry 29 (1990) 9110.

9. InsightJDiscovcr. Biosym Technologics. Ine., 9685 ScrnntollRoad. San Diego. CA 92121-2777.

10. L.B. r••.1oralcs el al .. .I. COlllp. Chl'lIl. 21 (2000) 147.

11. P. Flores.Pércz. R. Gardllño.Ju~írez. L.B. Morales, and M.Valdél-Gonztílcl., en Procl'l'dings (~rfIJe Second SY"'l'osilfln (111

ArrUicialllltelligC'f/cC'. Adll/'Iil'l' 5l)..~/(,III,\", edited by A.A. Ocho;),t\1. Soto, ami R. Santalla. (lntitute of Cybernetics. Mathematil' •..amI Physics. Cuba, 1(99) p. 186.

Re\'. Ml'x. Fú. 46S2(2000) 135-141