IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

238
1 IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA PRESENCIA DE LOS DISRUPTORES ENDOCRINOS EN EL AGUA EMBOTELLADA EN BOGOTÁ ENRÍQUEZ HIDALGO ANDRÉS MAURICIO PONTIFICIA UNIVERSIDAD JAVERIANA FACULTAD DE INGENIERÍA MAESTRIA EN HIDROSISTEMAS BOGOTÁ D.C 2017

Transcript of IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

Page 1: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

1

IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA PRESENCIA

DE LOS DISRUPTORES ENDOCRINOS EN EL AGUA EMBOTELLADA EN

BOGOTÁ

ENRÍQUEZ HIDALGO ANDRÉS MAURICIO

PONTIFICIA UNIVERSIDAD JAVERIANA

FACULTAD DE INGENIERÍA

MAESTRIA EN HIDROSISTEMAS

BOGOTÁ D.C

2017

Page 2: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

2

IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA PRESENCIA

DE LOS DISRUPTORES ENDOCRINOS EN EL AGUA EMBOTELLADA EN

BOGOTÁ

ENRÍQUEZ HIDALGO ANDRÉS MAURICIO

Trabajo de investigación presentado como requisito para optar el título de Magister en

Hidrosistemas

Directores

Jaime A. Lara Borrero. IC, M.Sc, PhD.

Andres Torres. IC, M.Sc, PhD.

PONTIFICIA UNIVERSIDAD JAVERIANA

FACULTAD DE INGENIERÍA

MAESTRIA EN HIDROSISTEMAS

BOGOTÁ D.C

2017

Page 3: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

3

CONTENIDO

1. INTRODUCCION (capitulo1) ...................................................................................10

2. MATERIALES Y METODOS (capitulo 2). .................................................................15

2.1. DISEÑO EXPERIMENTAL. ..................................................................................15

2.2. LABORATORIO. ..................................................................................................16

2.2.1. Preprocesamiento de muestras. ......................................................................17

2.2.2. Análisis cromatográfico. ...............................................................................18

2.3. GRADO DE TOXICIDAD. .................................................................................35

2.4. ANALISIS DE RESULTADOS. ..........................................................................37

2.4.1. Análisis de componentes principales (PCA) .....................................................37

2.4.2. Análisis de Correspondencia Múltiple (MCA) y test de Wilcoxon. .....................40

2.4.3. ANOVA, Multi ANOVA, Kruskal Wallis y Kruskal Wallis Multivariado. ..........41

2.4.4. Análisis de Información Promedio Mutua (AMI). ............................................42

2.4.5. Modelos basados en arboles (Tree based models) .............................................44

2.4.6. Árboles de decisión. .....................................................................................44

2.4.7. Árboles de Regresión (Regression trees). ........................................................45

2.4.8. Bosques Aleatorios (Random Forest) y algoritmo Xgboots ................................45

3. RESULTADOS (capitulo 3) ......................................................................................47

4. DISCUSIÓN DE RESULTADOS (capitulo 4). ............................................................81

5. CONCLUSIONES ....................................................................................................86

6. RECOMENDACIONES............................................................................................88

BIBLIOGRAFIA .............................................................................................................89

Page 4: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

4

LISTA DE TABLAS

Tabla 1. Clasificación Factores Explicativos para el agua embotellada comercializada en Bogotá.

......................................................................................................................................16 Tabla 2. Equipos y reactivos para análisis de muestras. ........................................................17 Tabla 3. Patrones Utilizados en Análisis Cromatográfico. .....................................................19 Tabla 4. Compuestos contenidos en los patrones de calibración para (GC-MS)........................19 Tabla 5. Montaje de curva de mezcla de esteres y ftalatos para cromatografía .........................20 Tabla 6. Ventanas, iones, tiempo y límite de detección de mezcla de esteres y ftalatos .............22 Tabla 7. Montaje de curva de farmacéuticos final para cromatografía. ....................................24 Tabla 8. Ventanas, iones, tiempo y límite de detección de mezcla final de farmacéuticos ..........25 Tabla 9. MCL, RfD’s y DWEL’s para compuestos analizados (MCL: nivel máximo contaminate;

DWEL: nivel equivalente de agua potable; RfD: dosis de referencia). ....................................48 Tabla 10. Porcentaje de muestras con concentraciones de compuestos mayores a MCL (MCL: nivel

máximo contaminante). ....................................................................................................49 Tabla 11. Porcentaje de detección, mínimos y máximos de compuestos analizados por

cromatografía de masas. No muestras = 174. .......................................................................50 Tabla 12. Porcentaje de detección, mínimos y máximos de compuestos analizados por

cromatografía de masas (tablas de dirección bidireccional) (en rojo se muestran compuestos con

una detección mayor al 50%). ...........................................................................................51 Tabla 13. Correlaciones de las muestras respecto a dos componentes principales. ....................53 Tabla 14. P value Wilcolxon test. .......................................................................................62 Tabla 15. p-value test de Bartlett .......................................................................................63 Tabla 16. p-value test de Shapiro .......................................................................................63 Tabla 17. p-value Kruskal-Wallis test & Kruskal-Wallis Multivariado ...................................64 Tabla 18. Kruskal-Wallis Multivariado con envase de vidrio para plastificantes. .....................66 Tabla 19. Kruskal-Wallis Multivariado con muestras sin gas para farmacéuticos y hormonas. ...66

Page 5: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

5

Tabla 20. Kruskal-Wallis Multivariado con muestras de origen internacional para plastificantes.

......................................................................................................................................67 Tabla 21. Entropía conjunta, información mutua y valores de redundancia de factores respecto a

DMP. .............................................................................................................................68 Tabla 22. Entropía conjunta, información mutua y valores de redundancia de factores respecto a

ACE. ..............................................................................................................................68 Tabla 23. Entropía conjunta, información mutua y valores de redundancia de factores respecto a

CAF. ..............................................................................................................................69 Tabla 24. Importancia de factores para DMP con Random Forest ..........................................78 Tabla 25. Resultados relevantes .........................................................................................82

Page 6: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

6

LISTA DE FIGURAS

Figura 1. Estructura química de Dimetilftalato (DMP)..........................................................27 Figura 2. Estructura química de Dietilftalato (DEP) .............................................................28 Figura 3. Estructura química de Di-iso-Butilftalato. .............................................................29 Figura 4. Estructura química de Dibutilftalato. ....................................................................29 Figura 5. Estructura molecular del DEHP. ..........................................................................31 Figura 6. Estructura molecular del DOP. .............................................................................32 Figura 7. Estructura molecular del TER. .............................................................................32 Figura 8. Estructura química de bisfenol A. .........................................................................33 Figura 9. Distancia robusta de Mahanoblis para muestras de agua multivariada. ......................39 Figura 10. Análisis de componentes principales para la matriz de agua de los compuestos. .......52 Figura 11. Separación por clústers de niveles de factores. .....................................................54 Figura 12. MCA para todos los compuestos con factores. .....................................................56 Figura 13. Boxplot de niveles de factores y compuestos........................................................57 Figura 14. Separación por clústers de niveles de factores y compuestos (DEPH Y BPA). .........58 Figura 15. Boxplots de niveles de factores y compuestos (DEPH Y BPA)...............................58 Figura 16. Separación por clústers de niveles de factores y compuestos plastificantes. .............60 Figura 17. Boxplots de niveles de factores y compuestos. .....................................................61 Figura 18. Árbol de decisión como variable de respuesta DMP. .............................................71 Figura 19. Árbol de decisión como variable de respuesta DIBP. ............................................72 Figura 20. Árbol de decisión como variable de respuesta DEPH. ...........................................73 Figura 21. Árbol de Regresión como variable de respuesta DMP. ..........................................74 Figura 22. Importancia factores según algoritmo Xg boots ....................................................80

Page 7: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

7

Figura 23.porcentajes de detección de disruptores endocrinos encontrados en Colombia, España y

México. ..........................................................................................................................83 Figura 24. Concentraciones de disruptores endocrinos encontrados en agua potable distribuida en

Bogotá y agua embotellada comercializada en Bogotá. .........................................................85

Page 8: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

8

LISTA DE ANEXOS

ANEXO A. Código diseño experimental en R. ....................................................................95 ANEXO B. Cromatógrafo de Gases GC _MS 2010 Shimadzu (sistema GC-MS) .....................95 ANEXO C. Cartuchos de silica C18 hiperSept. ...................................................................96 ANEXO D. Filtros de celulosa 0,45um. ..............................................................................97 ANEXO E. Vial de 1 mL. .................................................................................................97 ANEXO F. Retención de minerales (A) y retención de disruptores endocrinos (B) ..................98 ANEXO G. Certificado de análisis del patrón de mezcla de esteres y ftalatos (ver carpeta de

ANEXOS). .....................................................................................................................98 ANEXO H. Carpeta que contiene archivos txt de ftalatos arrojados del análisis cromatográfico (ver

carpeta de ANEXOS). ......................................................................................................98 ANEXO I. Cromatograma de patrón de ftalatos y esteres. ................................................... 100 ANEXO J. Carpeta que contiene archivos txt de ftalatos arrojados del análisis cromatográfico (ver

carpeta de ANEXOS) ..................................................................................................... 101 ANEXO K. Ficha de datos de seguridad de mezcla de esteroides y farmacéuticos (ver carpeta de

ANEXOS) .................................................................................................................... 101 ANEXO L. Certificado de análisis del patrón de mezcla de esteroides y farmacéuticos (ver carpeta

de ANEXOS) ................................................................................................................ 101 ANEXO M. Ficha de datos de seguridad de mezcla de farmacéuticos 1 (ver carpeta de ANEXOS)

.................................................................................................................................... 103 ANEXO N. Certificado de análisis del patrón de mezcla de hormonas y farmacéuticos (ver carpeta

de ANEXOS) ................................................................................................................ 103 ANEXO O. Ficha de datos de seguridad de mezcla de farmacéuticos 2 (ver carpeta de ANEXOS)

.................................................................................................................................... 104 ANEXO P. Certificado de análisis del patrón de mezcla de farmacéuticos 2 (ver carpeta de

ANEXOS) .................................................................................................................... 104 ANEXO Q. Cromatograma específico de mezcla de farmacéuticos final. .............................. 105

Page 9: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

9

ANEXO R. Carpeta que contiene archivos txt de farmacéuticos arrojados del análisis

cromatográfico (ver carpeta de ANEXOS) ........................................................................ 106 ANEXO S. Matriz total de compuestos en Excel (ver carpeta de ANEXOS) ......................... 106 ANEXO T. Código de análisis de componentes principales (PCA) en R. .............................. 106 ANEXO U. Código en R para análisis de Outliers. ............................................................. 108 ANEXO V. Código de análisis de correspondencia múltiple (MCA) en R. ............................ 108 ANEXO W. Código Wilcoxon test .................................................................................. 111 ANEXO X. Código Kruskall Wallis y Kruskall wallis Multivariado en R. ............................ 118 ANEXO Y. Código información mutua promedio (AMI) en R ............................................ 127 ANEXO Z. Código Arboles de decisión y de regresión en R ............................................... 190 ANEXO AA. Codigo Random Forest en R. ...................................................................... 202 ANEXO BB. Numero de familia según 4 grupos de clasificación. ....................................... 216 ANEXO CC. Resultados Diseño experimental con uso de la librería Agricolae del software R.

.................................................................................................................................... 216 ANEXO DD. Muestras de agua según la clasificación de familias del diseño experimental y código

en R ............................................................................................................................. 217 ANEXO EE. Entropía conjunta, información mutua y valores de redundancia de factores respecto

a compuestos. ................................................................................................................ 223 ANEXO FF. Arboles de Regresión para compuestos. ......................................................... 227 ANEXO GG. Tablas de importancia de bosques aleatorios para compuestos. ........................ 235

Page 10: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

10

INTRODUCCION (capitulo1)

Los disruptores endocrinos (DE) son sustancias químicas de síntesis que afectan el equilibrio

hormonal (hormona: mediador químico que conecta un órgano con otro). Cabe destacar que estas

hormonas emiten señales químicas, las cuales pueden ser modificadas por diferentes compuestos

químicos que toman su lugar. Cuando sucede esto se producen consecuencias biológicas en el

sistema hormonal (SH): SH acentuado o SH deficitario (debido a un bloqueo de la actividad

hormonal provocado por los DE) (FundAlborada 2015; Moral 2015). Desde 1991, los científicos

se han preocupado por definir el fenómeno de las alteraciones endocrinas. Los DE pueden definirse

como "Un gran número de productos químicos generados por el hombre que tienen el potencial de

alterar el sistema endocrino de los animales, incluidos el de los seres humanos” (FundAlborada

2015; Moral 2015). Desde entonces, la investigación en este campo multidisciplinario se ha

desarrollado por el interés del conocimiento sobre los DE expandiéndose de forma constante en

muchos aspectos actuales relativos a los efectos de estos, en diferentes vías hormonales, esteroides

de bioquímica y biología molecular (Mustieles et al. 2015).

Dos décadas después, la Sociedad de Endocrinología de Alemania renueva la demanda de realizar

proyecciones de la exposición de estas sustancias como una prioridad de investigación en su

declaración sobre la Ciencia de disruptores endocrinos (Diamanti-Kandarakis et al. 2009). Sin

embargo, la comprensión de la complejidad de la exposición humana a los productos químicos

hechos por el hombre, incluyendo los DE, se ve comprometida por la inmensa cantidad de

compuestos en uso y las limitaciones técnicas en su detección (Wagner and Oehlmann 2011).

Page 11: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

11

En este sentido, los efectos acumulativos de la exposición a largo plazo a dosis bajas de los DE

empiezan desde la alteración del sistema endocrino hasta la aparición de enfermedades tales como

sobrepeso, infertilidad, cáncer etc. Por ende, el consumo diario de agua embotellada puede generar

esta exposición de dosis bajas de DE convirtiéndose en un riesgo para la salud humana (Dhaini and

Nassif 2014). Así, la ciencia de la exposición se ve obligada a concentrarse en unos pocos productos

químicos como indicadores de la exposición total a los DE como por ejemplo el Bisfenol A y los

ftalatos de los cuales se dispone de excelentes datos de biomonitorización (procedimiento analítico

para la identificación y cuantificación de residuos de los disruptores endocrinos) (Navalón Montón

2013; Albouy-Llaty et al. 2016).

Compuestos indicadores como el bisfenol A (BPA: 4, 4'-dihidroxi-2, 2-difenilpropano) y los

ftalatos, son de los químicos de mayor producción en todo el mundo: la producción anual global

de BPA se estima en más de cinco millones de toneladas (Rhomberg and Goodman 2012). Este es

un componente básico de policarbonato (PC) de plástico que es un monómero de resinas epoxi

utilizado en el recubrimiento de latas de aluminio y envolturas de alimentos, papeles y cartones,

recibos de cajas registradoras, y filtros de cigarrillos; teniendo en cuenta que es un aditivo no-

polímero en plásticos, tales como tuberías de agua de cloruro de polivinilo (PVC) (Rubin 2011; Li

et al. 2010; Muhamad et al. 2016). En este mismo orden de ideas el BPA y los ftalatos son utilizados

a menudo en los envases de alimentos y de bebidas, incluyendo botellas de agua potable y biberones

(Jeddi et al. 2015). Teniendo en cuenta que el BPA y los ftalatos son buenos indicadores de la

exposición a DE, son considerados como sustancias de la representación de la toxicidad en el agua.

Dicho esto, se han registrado pérdidas humanas debido a la exposición al BPA (Li et al. 2010), En

efecto, se ha establecido y documentado la exposición al BPA como resultado de la migración de

este compuesto a los alimentos y el agua potable: un análisis de la Unidad Nacional de Salud y

Page 12: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

12

Encuesta de Nutrición (NHANES) de EE.UU, reveló exposición de más de 90% de la población

general a BPA (Li et al. 2010). Vandenberg (2011) reveló que la exposición al BPA se encuentra

en ascenso actualmente a nivel mundial. Estos datos apoyan la hipótesis de que los materiales de

envasado PET son una fuente de generación de DE. Además, cabe mencionar que las botellas de

agua de policarbonato (PC) que están expuestas a altas temperaturas, hacen que el BPA migre del

plástico al agua. Por lo cual, también se han realizado estudios en donde se cuantifica la migración

de este compuesto al agua en función de un aumento de la temperatura, habiendo una rápida

migración del BPA a más de 80°C sin dejar a un lado que el BPA puede liberarse en el agua a

temperatura ambiente. Por otra parte, la ingesta diaria de BPA por bebés es casi 10 veces mayor

que la de los adultos. La ingesta diaria tolerable actual (TDI) establecida por la Agencia Europea

de Seguridad Alimentaria (AESA) para BPA es 50 mg/kg, idéntica a la dosis de referencia (DR)

establecida por la US Environmental Protection (EPA) (Richter et al. 2007). Sin embargo, sobre la

base de esos estudios, la exposición al BPA por el agua potable constituye un riesgo mínimo para

la salud humana (Li et al. 2010; Nam, Seo, and Kim 2010; Cooper, Kendig, and Belcher 2011a;

Wagner and Oehlmann 2011).

Dicho esto, el consumo de agua embotellada contribuye al riesgo de la exposición a DE. Resultados

de ensayos realizados a aguas de las botellas de plástico como de vidrio sugieren que los envases

de plástico no son la única fuente de contaminación de DE y que la fuente y el procesamiento del

agua y embotellado puede jugar un papel importante (Real et al. 2015). Esto hace referencia a que

no hay completa seguridad del origen de los DE en el agua embotellada, en este sentido se han

realizado estudios en España y en México en donde cuantifican los ftalatos y el bisfenol A,

encontrándose mayores porcentajes de detección en aguas de origen Mexicano en ftalatos como

dibutilftalto, benzil-butilftaltao y bis-2-etil-hexilftalato(Vazquez et al. 2017; Guart et al. 2014).

Page 13: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

13

esto da a entender que el origen del agua es un factor importante en la detección de estos

compuestos además Guart (2014) indica que el agua cabonatada en combinación con un envase

de vidrio y tapas metálicas y de plástico incrementan la migración de estos compuestos al agua

embotellada, por lo cual se hace necesario identificar factores que expliquen por qué hay presencia

de DE entre los cuales se escogieron el origen, el gas y el envases en ellas con el fin de descubrir

grados de incidencia de estos factores y sus patrones de exposición. Hasta la fecha, existe poca

información sobre el destino, los comportamientos y las vías de los DE en el medio ambiente. Los

posibles efectos eco-toxicológicos sobre los receptores debido a la exposición de los individuos a

una mezcla de estos productos químicos aún se desconoce, por lo cual se recomienda la

investigación futura centrada en el desarrollo de modelos de riesgo basados en la detección de estos

con el fin de predecir las fuentes, el destino y el comportamiento de los contaminantes emergentes

en el medio ambiente (Tijani et al. 2015).

Actualmente el INVIMA tiene 789 registros vigentes de empresas fabricantes de agua embotellada.

Las ciudades que más empresas de este tipo tienen son: Bogotá con 165 empresas registradas, 30

en Villavicencio, 18 en Cartagena, 14 en Cali, Montería y Neiva, 13 en Barranquilla, 12 en

Medellín y Santa Marta y 10 en Cúcuta, Ibagué, Maicao, Yopal y Riohacha. En Colombia, el 0.4%

de familias colombianas consume agua embotellada, es decir unas 53 mil familias. Cabe mencionar

que el agua del grifo es percibida por el público en general como no apta para el consumo debido

a las prácticas inadecuadas de potabilización, el abuso de fertilizantes y plaguicidas, y la falta

general de vigilancia del medio ambiente en la aplicación de la ley en el país (INVIMA 2017).

En este contexto, el agua embotellada tiene diversas fuentes y tratamientos que dificultan la tarea

de desarrollar modelos de riesgo de los DE por medio de este factor ya que en la ley colombiana

Page 14: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

14

no está reglamentado indicar de donde se obtiene el agua que se envasa para comercializar

(MINISTERIO DE SALUD 1991). Por lo tanto, este estudio propone tratar de identificar los

factores incidentes sobre la presencia de estos compuestos en agua embotellada que se distribuye

en Bogotá en función del tipo de embotellado, país de origen y si tiene gas o no. Lo anterior se

justifica debido a la falta de elementos que permitan predecir el comportamiento de los DE en

función de los factores explicativos que den respuesta a preguntas como: ¿El envase del agua

embotellada influye en la presencia de los DE?, ¿el agua embotellada de importación es mejor que

la nacional?, ¿el gas en el agua embotellada influye en la detección de estos? Que en un fin

engloban el objetivo de identificar factores que tienen mayor grado de influencia sobre la presencia

de disruptores endocrinos en el agua embotellada que se comercializa en Bogotá, destacando que

esun estudio pionero y el primero dedicado los factores explicativos de la presencia de DE en el

agua embotellada comercializada en Bogotá.

Page 15: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

15

2. MATERIALES Y METODOS (capitulo 2).

2.1. DISEÑO EXPERIMENTAL.

Se consiguieron 59 marcas de agua embotellada comercializada en Bogotá y se compraron tres

repeticiones de cada marca teniendo en cuenta que en Bogotá hay 165 empresas comercializadoras

de agua embotellada registradas (INVIMA 2017). Con el fin de conocer si este número de muestras

(173, debido a que de todas las marcas no se consiguieron las tres repeticiones por cuestiones de

mercado) es representativo, se realizó un diseño experimental que dé respuesta a esta incógnita.

Para la elaboración del diseño experimental se hizo uso de la librería “Agricolae” para el software

R Statistical. Este paquete ofrece una amplia funcionalidad de diseños experimentales,

especialmente para experimentos de agricultura, sin embargo, puede ser utilizado con diferentes

propósitos(Mendiburu 2016). El paquete realiza diferentes procedimientos de análisis de datos

experimentales, por ejemplo, la comparación de tratamientos y varias pruebas de comparación no

paramétricas (Mendiburu 2016). Dentro de esta librería se utilizó la función design.bib que crea

diseños de bloques usando métodos de generación de números Randomized Balanced Incomplete

Block Designs (diseño por bloques incompletos balanceados aleatorios) (R Foundation for

Statistical Computing .R. 2016). Se hizo uso de esta libreria del software R, con el fin de obtener

un tamaño de muestra mínimo inicial de agua embotellada comercializada en Bogotá para la

implementación de herramientas estadísticas en el análisis de los datos; esto a través cuatro grupos

globales y dos opciones de respuesta para cada grupo como lo indica la tabla 1.

Page 16: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

16

Tabla 1. Clasificación Factores Explicativos para el agua embotellada comercializada en

Bogotá.

Grupo Nivel Significado Nivel

Origen 1 Nacional

2 Internacional

Gas 1 No

2 Si

Envase 1 Plástico

2 Vidrio

Fuente. Elaboración propia.

El código para el desarrollo de este se indica en el ANEXO A.

2.2. LABORATORIO.

Para la cuantificación de resultados se utilizó el laboratorio de Calidad de Agua del

Departamento de Ingeniería Civil de la Pontificia Universidad Javeriana (PUJ) de Bogotá en donde

se aplicó el método multiresiduo de cromatografía de gases acoplada a espectrometría de masas

permitiendo detectar los compuestos de interés además de la concentración en la que están

presentes. Los análisis fueron realizados utilizando un Cromatógrafo de Gases GC _MS 2010

Shimadzu (sistema GC-MS) en modo de ionización por impacto electrónico (EI, 70eV) (ANEXO

B). Las condiciones experimentales fueron las siguientes: columna capilar MS-5 (5 % fenil, 95 %-

dimetil- polisiloxano) (30 m x0.25 mm d.i., 0.25 μm espesor de fase); gas carrier, He (1,0 mL min-

1); volumen de inyección, 1 μL; modo de inyección, split; radio de split, 1:12. La temperatura del

MS Quadrupolo y de la Fuente fueron 150 y 230°C. El programa de temperatura utilizado fue:

80°C (durante 3 min), luego a 10°C/min hasta 295 °C donde se mantiene 10 minutos (Shimadzu

Page 17: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

17

Corporation 2017; Gómez et al. 2007). Este método se desarrolló en 2 fases y los materiales,

reactivos y equipos necesarios para realizar este procedimiento se indican en la tabla 2.

Tabla 2. Equipos y reactivos para análisis de muestras. Equipos y Reactivos Cantidad Especificaciones

Erlenmeyer 3 unidades 1000 mL

Erlenmeyer tapón horadado 2 unidades 1000 mL

tubo vidrio 2 unidades 1000 mL

Manguera Silicona 1 unidades 1 m

Tubos de Ensayo vidrio 174 unidades >5 mL

Viales vidrio 174 unidades 1,5 mL

Probetas Vidrio 3 unidades 100 mL

Beakers Vidrio 3 unidades 500 mL

Beakers Vidrio 3 unidades 40 mL

Filtro membrana acetato de celulosa 300 unidades 0.45 um x 47 mm diámetro

Cartuchos Hypersep C18 174 unidades 200mg/3 mL

Solución de acetato de etilo (C4H8O2) 5 L unidades Pureza= hight purity (HP).

Solución trifenil fosfato

(C18H15O4P)

5L unidades Pureza=99% marca=Sigma.

Solución hidróxido de amonio

(NH4OH)

500 mL al 25% & 2 L al

0.5%

25 % muestras gas & 0.5% muestras sin

gas

pH - metro digital de mesa lab

850/14p

1 unidades Marca schott ref 28.520.131.

Muestra de agua embotellada 174 500 mL

Fuente. Elaboración propia.

Con los materiales y reactivos necesarios listos para el análisis de las muestras se realizaron los

análisis que se dividen en dos etapas.

2.2.1. Preprocesamiento de muestras.

Consiste en la filtración de las muestras de agua para prepararlas para su posterior

procesamiento. Para la filtración de las muestras de agua embotellada es necesario preparar 500

mL (volumen de saturación de cartuchos C18 (ANEXO C)) de cada una y medir su pH: si este está

por debajo de 8 es necesario ajustarlo con hidróxido de amonio (NH4OH) hasta un rango de 8 a

Page 18: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

18

8.5; este rango, garantiza que se van a retener las especies químicas de interés y que las especies

químicas presentes no cambien debido a procesos químicos que ocurren a pH acido o básico

(Yanina G. Muñoz Reyes 2015; Gómez et al. 2007). Después se filtra el agua a través de filtros de

celulosa de 0,45um (ANEXO D) con el fin de retener sustancias y minerales que afecten el paso

por los cartuchos de silica C18 (cadena de 18 carbonos) de extracción que tiene como fin retener

los DE presentes en el agua embotellada (Gómez et al. 2007).

2.2.2. Análisis cromatográfico.

Se realizó a través cromatografía de gases acoplada a masas (CG-MS). La cromatografía

analiza cinco grupos diferentes de DE: plaguicidas pesticidas órganoclorados, pesticidas

organofosforados, compuestos farmacéuticos, hormonas, esteroides y ftalatos. Para este análisis,

se hace necesario agregar un solvente al cartucho C18 completamente saturado con los 500 mL de

la muestra; en este caso se utiliza un solvente de acetato de etilo (C4H8O2) que filtra los DE

presentes en el cartucho hacia un tubo de ensayo. Después se evapora la muestra contenida en el

tubo de ensayo con el fin de obtener el precipitado de la muestra, (no dejar evaporar

completamente. Posterior a esto, se reconstruye el precipitado de la muestra con 1 mL de trifenil

fosfato (C18H15O4P) para transportarlo a un vial de 1 mL (ANEXO E) que es colocado en el

cromatógrafo a una temperatura de 40 a 350 °C, transportando la muestra a través de una columna

capilar de 30 m BMS (5% de polixiloxano “polaridad baja”) que identifica primero los compuestos

de mayor polaridad a menor polaridad. El ANEXO F indica el montaje para la preparación de las

muestras hacia los viales.

Page 19: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

19

Los compuestos que se encuentran en el agua embotellada y por ende los de prioridad para esta

investigación fueron analizados a partir de unos patrones de calibración de la marca RESKEL

CORPORATION los cuales se dividen en 4 patrones descritos en la tabla 3 y la tabla 4 contiene

los compuestos contenidos en cada uno de estos.

Tabla 3. Patrones Utilizados en Análisis Cromatográfico.

METODO No Catalogo

EPA Method 8061A Phthalate Esters Mixture 33227

EPA Method Steroids and Mixed Pharmaceuticals Mix 31117

EPA Method Pharmaceuticals Mix #1 31116

EPA Method Pharmaceuticals Mix #2 31118

Fuente. Elaboración propia.

Tabla 4. Compuestos contenidos en los patrones de calibración para (GC-MS).

Phthalate Esters Mixture Steroids and Mixed

Pharmaceuticals Mix

Pharmaceuticals Mix

#1

Pharmaceutical

s Mix #2

Benzyl butyl phthalate Bisphenol A Acetaminophen Gemfibrozil

Bis(2-n-butoxyethyl)phthalate Diclofenac sodium salt Caffeine Ibuprofen

Bis(2-ethoxyethyl)phthalate 17-beta-Estradiol Carbamazepine Naproxen

Bis(2-ethylhexyl)phthalate Estrone Ciprofloxacin HCL Triclosan

Bis(2-methoxyethyl)phthalate 17-alpha-Ethynylestradiol Erythromycin USP

Bis(4-methyl-2-pentyl)phthalate 4-para-Nonylphenol Fluoxetine HCl

Di-n-butylphthalate 4-tert-Octylphenol Sulfamethoxazole

Diethylphthalate Primidone Trimethoprim

Di-n-hexyl phthalate Progestrone

Dimethylphthalate Testosterone

Di-nonyl phthalate

Di-n-octyl phthalate (117-84-0)

Dipentylphthalate (131-18-0)

Phthalic acid dicyclohexyl ester (84-61-7)

Phthalic acid diisobutyl ester

Fuente. Elaboración propia.

Conociendo que compuestos contiene cada patrón se analizó primero la mezcla de ftalatos y

esteres. El ANEXO G contiene la ficha de datos de seguridad de este patrón y el ANEXO H

Page 20: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

20

contiene el certificado de análisis en donde se encuentra el cromatograma de este (ANEXO H.1)

que indica el tiempo y la ventana en el cual es identificado determinado compuesto.

Como se puede observar en el ANEXO H.1 se indica un patrón general el cual indica el orden de

tiempo en minutos en el cual son identificados los compuestos contenidos en el patrón de la mezcla

de esteres y ftalatos (ANEXO J) y que fue esencial para identificar los compuestos en el análisis

cromatográfico.

Dicho esto, fue necesario hacer un montaje de una curva en el cromatógrafo para el patrón de

mezcla de esteres y ftalatos teniendo en cuenta la concentración inicial de este que es igual a

1000000 ppb (partes por billón), se diluyo esta concentración en ocho puntos con el fin de obtener

el límite de detección de los compuestos en el patrón por el cromatógrafo. La tabla 5 indica el

montaje de la curva del patrón de mezcla de esteres y ftalatos.

Tabla 5. Montaje de curva de mezcla de esteres y ftalatos para cromatografía

Vial C1 (ppb) C2 (ppb) V1 (mL) V2 (mL) V2 (uL) V acetato de etilo

HPLC (uL)

1 1000000 10000 1 0.010 10 990

2 100000 1000 1 0.010 10 990

3 100000 500 1 0.005 5 995

4 100000 200 1 0.002 2 998

5 100000 100 1 0.001 1 999

6 200 10 1 0.050 50 950

7 10 1 1 0.100 100 900

8 10 0.1 1 0.010 10 990 Fuente. Elaboración propia.

Donde C1 es la concentración inicial de esteres y ftalatos a partir de la cual se prepara el siguiente

punto de la curva, C2 es la concentración final de patrón de esteres y ftalatos contenida en los viales

(de mayor concentración a menor concentración) utilizada en el análisis cromatográfico, V1 es el

Page 21: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

21

volumen de los viales (1 mL), V Acetato de etilo HPLC es el volumen de acetato de etilo necesario

para completar el V2 teniendo en cuenta la cantidad de volumen que se tiene en el V1 (V acetato

de etilo es igual a V2 menos V1) y V2 es el volumen necesario del patrón de la concentración C1

para reducir la concentración a C2 en 1 mL de volumen, que se calcula mediante la ecuación 1:

Ecuación 1. Volumen a utilizar para montaje de curva de mezcla de esteres y ftalatos

V2(ml) =C2 ∗ V1

C1

Con el montaje de esta curva se obtiene un cromatograma mostrado en el ANEXO I; este indica

15 picos de los 17 contenidos en el cromatograma general; esto se debe a diferentes condiciones

que se tiene el análisis cromatográfico, así como los tiempos en los que los compuestos son

detectados, pero no su orden; este análisis sirve para obligar al cromatógrafo a buscar un compuesto

específico en una ventana y un tiempo determinados, dependiendo de donde estén los picos por lo

cual se realizó la tabla 6 que indica estos tiempos, ventanas y iones que sirven como variables

características en el montaje del análisis cromatográfico para correr las muestras de agua

embotellada.

Por otra parte, el límite de detección de cada compuesto fue escogido dependiendo de los resultados

de las curvas de la C2 (tabla 5) para cada compuesto. Esto depende de resultados favorables o

desfavorables para determinados compuestos. Entiéndase por favorable cuando la concentración

de determinado compuesto es menor a medida que se disminuye la C2 y se acopla a los 8 puntos

de la curva de una manera eficiente permitiendo la aplicación de un modelo lineal con un error2 no

menor a 0.85 y además que por lo menos 5 puntos de los 8 tengan este patrón, de lo contrario los

resultados de detección y concentración de un compuesto analizado en particular no serán

Page 22: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

22

representativos debido al nivel de incertidumbre presentado en el análisis cromatográfico, de esta

forma se produce un resultado desfavorable, por ejemplo cuando un punto con una C2 =0.1 ppb

tiene una mayor área que una C2= 100 ppb lo cual físicamente es imposible ya que un compuesto

del patrón de mezcla de esteres y ftalatos a una concentración de 0.1ppb no puede tener mayor

concentración que la de 100 ppb.

Tabla 6. Ventanas, iones, tiempo y límite de detección de mezcla de esteres y ftalatos

Compuesto tiempo (min) ventana (min) Iones límite (ug/L)

1 Dimetil-Ftalato 15.365 15.25 15.50 163 77.0 133 194 0.100

2 Dietil-Ftalato 17.195 17.00 17.50 149 222 177 65.0 0.100

3 Diisobutil-Ftalato 20.400 20.30 20.50 149 278 57.0 104 0.100

4 Dibutil-Ftalato 21.410 21.30 21.50 149 278 41.0 104 0.100

5 Bis-2-Metoxi-Etil-Ftalato 21.812 21.70 21.90 59.0 282 149 45.0 10.00

6 Bis-4-metil-2-Pentil-Ftalato 22.641 22.50 22.75 149 85.0 43.0 69.0 100.0

7 Bis-2-Etoxi-Etil-Ftalato 23.024 22.90 23.10 310 45.0 73.0 149 10.00

8 Dipentil-Ftalato 23.317 23.20 23.50 306 149 43.0 104 100.0

9 Dihexil-Ftalato 25.093 25.00 25.10 149 334 43.0 121 0.100

10 Benzil-Butil-Ftalato 25.830 25.2.0 25.90 149 91.0 206 312 10.00

11 Bis-2-n-Butoxietil-Ftalato 26.217 26.10 26.30 149 57.0 366 85.0 100.0

12 Di-ciclohexil-Ftalato 26.753 26.60 26.70 149 167 55.0 83.0 100.0

13 Bis-2-Etil-Hexyl-Ftalato 26.807 26.70 26.90 149 167 57.0 83.0 0.100

14 Di-n-Octilaftalato 28.297 28.10 28.40 149 207 93.0 167 0.100

15 Dinonyl-Ftalato 29.754 29.60 29.90 149 207 43.0 73.0 10.00

Fuente. Elaboración propia.

Donde Tiempo es el tiempo en el cual un pico determinado alcanza el máximo punto de inflexión,

Ventana se define como el rango en el cual inicia un pico y termina, Iones son los átomos con una

carga neta (+/-), cada compuesto tiene determinados iones que son su “huella dactilar” por lo tanto

en el análisis cromatográfico determinan la diferencia entre los compuestos y Límite es la

concentración mínima de detección del cromatógrafo respecto a un compuesto determinado.

Realizado este procedimiento se analizaron en laboratorio las 174 muestras de agua embotellada

en el cromatógrafo (procedimiento que duró 45 minutos por muestra) y que arroja unos archivos

Page 23: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

23

.txt que contienen la fecha de generación de los archivos, rutas de localización, áreas, y la

concentración de cada compuesto como se indica en el ANEXO J. Después se hizo el análisis de

los patrones de mezcla de esteroides y mezcla de farmacéuticos (ver ANEXO K, ficha de datos de

seguridad y el ANEXO L, certificado de análisis). Esto se repitió para el patrón de mezcla de

farmacéuticos 1 y mezcla de farmacéuticos 2 (ver ANEXOS M & O, fichas de datos de seguridad

de estos patrones respectivamente y los ANEXOS N & P, certificados de análisis para los

compuestos).

En los ANEXOS L.1, N.1 & P.1 se encuentran los cromatogramas de los patrones de mezcla de

esteroides y mezcla de farmacéuticos, mezcla de farmacéuticos 1 y mezcla de farmacéuticos 2

respectivamente con el fin de conocer en qué tiempos y en qué orden los compuestos son

identificados de forma general por el cromatógrafo.

Es de gran importancia resaltar que para ahorro de recursos económicos y de tiempo se hizo una

mezcla de estos tres patrones con la cual fue posible reducir el tiempo de análisis cromatográfico

en una tercera parte de lo que normalmente tardo. Por lo cual se adiciono en un vial de 1 ml, 0.333

ml de cada patrón y posterior a esto se montó la curva de calibración con 8 puntos. Esta mezcla fue

posible hacerla debido a la concentración inicial que tiene cada patrón, la cual es de 200000 ppb y

de la cual se la diluyo para cada caso hasta una concentración de 0.1 ppb con el fin de obtener el

límite de detección de los compuestos.

Para la realización del cromatograma final de la mezcla de los anteriores patrones se montaron las

curvas de cada patrón y de la mezcla con las concentraciones y volúmenes representados en la tabla

7.

Page 24: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

24

Tabla 7. Montaje de curva de farmacéuticos final para cromatografía.

Vial C1 (ppb) C2 (ppb) V1 (mL) V2 (mL) V2 (uL) V acetato de etilo HPLC (uL)

1 200000 10000 1 0.05 50 950

2 10000 1000 1 0.10 100 900

3 10000 500 1 0.05 50 950

4 10000 200 1 0.02 20 980

5 10000 100 1 0.01 10 990

6 200 10 1 0.05 50 950

7 10 1 1 0.10 100 900

8 10 0.1 1 0.01 10 990 Fuente. Elaboración propia.

Con el montaje de esta curva se obtiene un cromatograma indicado en el ANEXO Q, este indica

15 picos de los 22 contenidos en los cromatogramas generales; esto se debe a diferentes

condiciones que tiene el análisis cromatográfico y a la superposición de los picos debido a la mezcla

de los patrones. Se pudo notar que este patrón de mezcla arroja buenos resultados en fármacos, sin

embargo, hormonas presentaron dificultades debido a la inconsistencia de los datos en algunos de

los compuestos, esto permite escoger los tiempos en los que los compuestos son detectados, así el

cromatógrafo busca un compuesto determinado en una ventana y un tiempo específicos

dependiendo de donde estén los picos. En la tabla 8 se indican estos tiempos, ventanas y iones que

son variables características en el montaje del análisis cromatógrafo para correr las muestras de

agua embotellada.

Page 25: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

25

Tabla 8. Ventanas, iones, tiempo y límite de detección de mezcla final de farmacéuticos

orden Compuesto tiempo (min) ventana (min) Iones límite (ug/L)

1 4-tert-Octylphenol

(140-66-9)

13.831 13.75 13.89 135 136 107 57 0.10

2 Ibuprofen (15687-27-1) 13.96 13.9 14.25 161 163 91 119 100

3 Acetaminophen (103-

90-2)

14.751 14.65 14.827 109 151 43 80 10.0

4 Caffeine (58-08-2) 16.555 16.4 16.7 194 109 55 67 0.10

5 Fluoxetine HCl

(56296-78-7)

16.872 16.8 16.95 44 104 42 91 0.10

6 Gemfibrozil (25812-

30-0)

17.325 17.25 17.4 122 107 123 129 1.00

7 Triclosan (3380-34-5) 19.151 19.1 19.25 290 288 218 63 0.10

8 Bisphenol A (80-05-7) 19.707 19.6 19.8 213 228 119 214 100

9 Primidone (125-33-7) 20.636 20.55 20.75 190 146 117 189 0.10

10 Carbamazepine (298-

46-4)

21.417 21.35 21.5 193 192 236 194 10.0

15 Progestrone (57-83-0) 25.3 25.2 25.4 43 124 314 272 0.10

Fuente. Elaboración propia.

Como se puede observar en el ANEXO Q, el segundo pico no está enumerado, sin embargo, el

cromatógrafo automáticamente reconoció un compuesto que no está dentro de los tres patrones de

fármacos; esto se debe a la mezcla que se hizo y que generó un compuesto aparte de los ya

estandarizados; por otra parte hay cuatro compuestos señalados en naranja los cuales al ser

analizados se encontraron niveles de incertidumbre en las concentraciones en más de cuatro de los

ocho puntos establecidos en la tabla 8. Dicho esto Gomez et al. (2007) sugieren que la obtención

de resultados confiables se da cuando por lo menos se tienen 5 puntos buenos en torno a la regresión

lineal para hallar la concentración; por lo cual no se tuvo un nivel de confianza óptimo para la

realización del análisis de estos 4 compuestos; hecho esto se corrieron las 174 muestras en el

cromatógrafo, obteniendo así los archivos .txt que contienen la fecha de generación de los archivos,

rutas de localización, áreas, y la concentración de cada compuesto (ver ANEXO R).

Realizado este proceso se unió en una sola matriz todos los resultados de las concentraciones de

los compuestos donde el ANEXO S (formato xlsx) indica estas concentraciones, en donde la

Page 26: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

26

primera hoja de este archivo denominada “datos crudos: se refiere a la concentración obtenida a

través del área bajo la curva de cada muestra para determinado compuesto con el fin de hallar la

concentración en microgramos por litro (ug/L) en el volumen del vial” por lo cual fue necesario

hacer la corrección de estas concentraciones debido a que el volumen original de las muestras es

de 500 mL en donde la hoja 2 denominada “concentraciones” contiene estos datos corregidos y

las concentraciones no detectadas por el equipo se las tomo como cero.

El primer componente en ser detectado fue el Dimetilftalato (DMP) calificado como un Líquido

blanco-acuoso sin olor significativo utilizado en la fabricación de varios productos (plásticos,

repelentes de insectos, vidrio de seguridad y revestimientos de laca) con una solubilidad

(Capacidad de una sustancia o un cuerpo para disolverse al mezclarse con un líquido) en agua, 4

mg/L a 25 °C; a exposiciones agudas (a corto plazo), en humanos y animales causa irritación de

los ojos, la nariz y la garganta y estudios en animales han reportado efectos leves en el crecimiento

y desarrollo de los riñones (Pubchem 2017d). La figura 1 representa la estructura química del DMP

conformada por un anillo de benceno que en los radicales uno y dos tiene dos esteres unidos a dos

radicales denominados “metil” y que la Unión Internacional de química pura y aplicada (IUPAC)

denomina con el nombre de dimetil benzeno-1,2-dicarboxylato.

Page 27: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

27

Figura 1. Estructura química de Dimetilftalato (DMP)

Fuente. (Pubchem 2017d)

El segundo componente en ser detectado fue el Dietilftalato (DEP), que se caracteriza por ser un

líquido claro e incoloro sin olor significativo, teniendo en cuenta que es un componente altamente

toxico y que su propagación al ambiente debe ser detenida inmediatamente debido a los daños en

los que se pueden destacar la irritación severa de los ojos y ligeramente en la piel, la solubilidad de

este en agua es de 1.080 mg/L a 25 °C, este tiene un sabor amargo y desagradable y es utilizado

como una sustancia sintética que hace los plásticos más flexibles para la fabricación de cepillos de

dientes, partes de automóviles, herramientas, juguetes y envases de alimentos (Pubchem 2017b).

la figura 2 indica la estructura química de DEP con la única diferencia entre DMP en un radical de

más por lo cual son denominados ftalatos de bajo peso molecular.

Page 28: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

28

Figura 2. Estructura química de Dietilftalato (DEP)

Fuente. (Pubchem 2017b)

El tercer compuesto en ser detectado fue el Di-iso-butilftalato (DIBP), este se caracateriza por ser

un líquido aceitoso incoloro con un ligero olor a éster, representa una baja toxicidad en el ambiente

y su solubilidad en agua es de 6.2 mg/L a 25 °C, respecto a la toxicidad en los seres humanos en

considerado como un compuesto mitogénico (factor que estimula la separación de las células) en

células de cáncer de mama humano causando un daño ADN teniendo en cuenta que los efectos de

este compuesto son más pronunciados que los de Di-butliftalato (DBP) que fue el cuarto compuesto

detectado las figuras 3 y 4 indican la estructura molecular de DIBP y DBP respectivamente.

Esta diferencia radica principalmente en las dos esquinas de los radicales en donde en DIBP se

puede observar una estructura diferente a la de DBP en donde la cadena que conforma el butil es

lineal (ver estructura dentro de cirulos rojos).

Page 29: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

29

Figura 3. Estructura química de Di-iso-Butilftalato.

Fuente.(National Center for Biotechnology Information 2017).

Figura 4. Estructura química de Dibutilftalato.

Fuente.(National Center for Biotechnology Information 2017c).

Esta diferencia de estructura genera cambios en las propiedades, como lo es la solubilidad en el

agua que en DIBP es 6.2 y en DBP 11.2 mg/L; respecto a la toxicidad de estos en el medio ambiente

se identifica a DIBP como un compuesto de baja toxicidad respecto a DBP en donde su propagación

debe ser detenida inmediatamente así como sus propiedades de plastificantes al hacer los Plásticos

Page 30: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

30

blandos y flexibles, cortinas de ducha, impermeables, envolturas de alimentos, interiores de

automóviles y tejidos de vinilo(Benson 2009; National Center for Biotechnology Information

2017c; Pubchem 2017c)

El quinto compuesto en ser detectado fue el Bis-2-etil-hexilftalato (DEHP), rescatando los aspectos

más importantes, este compuesto en su forma pura es líquido, aceitoso e incoloro a amarillo pálido.

Casi sin olor y su propagación al medio ambiente debe ser detenida inmediatamente, respecto a su

toxicidad es considerado como un peroxisoma proliferador (familia de receptores esteroideos

encargados de las oxidasas y catalasas (enzimas) correspondientes a el funcionamiento del sistema

endocrino) y probablemente cancerígeno en humanos, además su solubilidad es de 0.27 mg/L a 25

°C en el agua (National Center for Biotechnology Information 2017b; Alemán, Torres, and Tovar

2004).

Respecto a su relación con Polietileno de Tereftalato (botella plástica) se define como una sustancia

sintética denominada plastificante que actúa en el polietileno de tereftalato incrustándose entre las

cadenas de sus polímeros, espaciándolas (incrementando el "volumen libre") y por ende

incrementando la flexibilidad y la durabilidad del plástico, además este aditivo común de cloruro

de polivinilo debido a su alto peso molecular se caracteriza en base a la inhibición de la síntesis de

la testosterona y por ende causando efectos adversos en el sistema reproductivo masculino en

ensayos con roedores (Rudel et al. 2011). La figura 5 representa la estructura molecular del DEHP.

Page 31: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

31

Figura 5. Estructura molecular del DEHP.

Fuente.(National Center for Biotechnology Information 2017b).

Como se puede observar en su forma molecular el DEHP es la unión de un anillo de benceno en su

radical 1 y 6, unidos a dos esteres que a su vez están unidos a dos radicales de hexil que en su

segundo radical tienen un etil y un átomo de hidrogeno dando como resultado el denominado

nombre de la IUPAC (Union Internacional de Química Pura y Aplicada) bis (2-etilhexil) benceno-

1,2-dicarboxilato de metilo).

El sexto compuesto en ser detectado fue el Di-n-octilftalato (DOP), que tiene la característica de

ser un líquido claro y aceitoso que irrita las membranas mucosas con una solubilidad en agua de

0.022 mg/L at 25 °C además de representar 5-60% del peso total de los plásticos y resinas; tiene

efectos adversos en la reproducción y el desarrollo bajo y es considerado como una sustancia

sintética que hace los plásticos más flexibles (Pubchem 2017e). la figura 6 indica la estructura

química de DOP en donde se puede observar el número de metil igual a ocho por lo cual es el

ftalato de mayor peso molecular detectado en el agua embotellada.

Page 32: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

32

Figura 6. Estructura molecular del DOP.

Fuente. (Pubchem 2017e).

El séptimo compuesto en ser detectado fue el 4-terc-octilfenol (TER), sus características

principales es que es una sustancia biodegradable no toxica para humanos pero ha causado

problemas de despigmentación en la piel, aunque es extremadamente tóxico para los organismos

acuáticos es utilizado en ayudas tecnológicas específicas para la producción de petróleo y agentes

de superficie se usa en un 98% para la preparación de resinas de octilfenol-formaldehído para

caucho de neumáticos, pintura aislante, tintas de impresión, etc.(Pubchem 2017a). la figura 7 indica

la estructura química de TER.

Figura 7. Estructura molecular del TER.

Fuente.(Pubchem 2017a)

Page 33: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

33

En este orden de ideas también se detectó el Bisfenol A (BPA), es de aclarar que este compuesto

es uno de los más utilizados por la industria químico-farmacéutica (Cooper, Kendig, and Belcher

2011a). La estructura molecular del bisfenol A se define en la figura 8.

Figura 8. Estructura química de bisfenol A.

Fuente. (National Center for Biotechnology Information 2017a)

El nombre dado por la IUPAC es 4- [2-(4-hidroxifenil) propan-2-il] fenol esto debido los dos

bencenos unidos en el primer radical y en el cuarto, al oxigeno que a su vez está unido por 2

moléculas de hidrogeno. La unión de los bencenos está dada por un propil, sus características

físicas están asociadas a un color blanco a marrón claro con escamas o polvo. Tiene un olor débil

a fármaco y su solubilidad en agua es de 300 mg/L at 25 °C; mucho mayor a la del DEPH por lo

cual se puede pensar que las concentraciones de este compuesto son mayores; en la industria este

compuesto es utilizado en la fabricación de adhesivos y selladores, productos eléctricos y

electrónicos, envasado de alimentos, productos de tinta, tóner y colorantes, pinturas

recubrimientos, juguetes, juegos infantiles y equipo deportivo (National Center for Biotechnology

Information 2017a).

Page 34: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

34

Los efectos adversos se dan a exposición prolongada y los informes del comportamiento

estrogénico del BPA sugieren que se puede considerar como un disruptor endocrino en

concentraciones ambientales muy por debajo de los niveles extremadamente tóxicos causando

fecundidad disminuida, alteraciones en el desarrollo de embriones e impactos en la carcinogénesis

(Nam, Seo, and Kim 2010). La relación existente entre el BPA y el Polietileno de Tereftalato es

que el BPA es el principal componente denominado “monómero del policarbonato plástico”

dándole la propiedad de plastificante, estabilizador y aditivo que da forma, dureza y durabilidad a

la botella producida (Cooper, Kendig, and Belcher 2011b).

En este sentido también se detectaron medicamentos y hormonas como el acetaminofén (ACE) que

es unanalgésico y antipirético, cafeína (CAF) que es una sustancia psicoactiva (acta sobre el

sistema nervioso central), fluoxetina (FLU) que es utilizado como un antidepresivo de la clase

inhibidores selectivos de la recaptación de serotonina y hormonas, gemfibrozil (GEM) que controla

el nivel de colesterol en la sangre, triclosán (TRI) que es un antiséptico utilizado en productos

hospitalarios (soluciones para lavado de manos quirúrgico, jabones para lavado de pacientes) y

productos de consumo (desodorantes, dentífricos), primidona (PRI) que es un antiepiléptico,

profármaco de fenobarbital que disminuye la excitabilidad neuronal, elevando el umbral de las

convulsiones en los seres humanos, carbamazepina (CAR) que es un antiepiléptico (destinada a

combatir, prevenir o interrumpir las convulsiones o los ataques epilépticos) y la progesterona

(PRO) que es una hormona sexual que segrega el ovario femenino y la placenta, y que tiene la

función de preparar el útero para la recepción del huevo fecundado(Richter et al. 2007; Li et al.

2010; Pubchem 2017g, 2017f).

Page 35: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

35

En este contexto se evaluó la toxicidad de todos estos respecto a sus concentraciones encontradas

en el agua embotellada; por lo cual se hizo necesario la aplicación de una metodología de toxicidad

que identifique los compuestos de mayor peligro para la salud humana.

2.3. GRADO DE TOXICIDAD.

Para determinar el grado de toxicidad de cada compuesto se utilizó la metodología de

comparación de niveles que sobrepasen un índice de toxicidad proporcionado por el Programa de

Asesoramiento en Salud (HA: Health Advisory Program), patrocinado por la Oficina de Agua

(OW: EPA’s Office of Water) de la EPA que da las concentraciones de contaminantes del agua

potable en el nivel de riesgo específico de cáncer (10-4 Riesgo de cáncer) y concentraciones de

contaminantes del agua potable en los que no se prevé que los efectos adversos no cancerosos sobre

la salud se produzcan sobre una exposición de por vida en los Estándares de Agua Potable y Salud

(DWSHA: Drinking Water Standards and Health Advisories)(2015).

La HA de por vida parametrizó, para un adulto de 70 kg que toma una cantidad de agua de 2 L /

día que el Nivel Máximo de Contaminante de por vida (MCL) para un compuesto en el agua potable

se calcula a partir de su nivel equivalente de agua potable (DWEL: Drinking Water Equivalent

Level), obtenido de su dosis de referencia (RfD: reference dose) definida como una estimación

(con incertidumbre que abarca un orden de magnitud) de una exposición oral diaria a la población

humana (incluidos subgrupos sensibles) que es probable que no presente riesgo apreciable de

efectos deletéreos durante la vida)(EPA 2015). La ecuación 2 describe la forma de calcular el

DWEL.

Page 36: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

36

Ecuación 2. Formula drinking water equivalent level.

𝐷𝑊𝐸𝐿 =𝑅𝑓𝐷 ∗ 𝑊

𝑄

En donde DWEL es el nivel equivalente de agua potable (ug/L). Representa una exposición de por

vida de un individuo en el agua potable, suponiendo una exposición al 100% de ese medio, en el

que la salud adversa no carcinogénica, no presente efectos, RfD es la dosis de referencia de

determinado compuesto (ug/(kg.día)), W es el peso promedio de un humano adulto (70 kg) y Q

es la cantidad de agua promedio de consumo diario de un humano adulto (2 L/día).

Cabe destacar que esta metodología incorpora una fuente de contribución relativa de agua potable

(RSC: Relative Source Contribution) contenida de datos específicos de contaminantes o en su

defecto del 20% de la exposición total de todas las fuentes (US EPA 2015) que fue la que se tomó

por defecto debido a la particularidad de cada componente analizado en el análisis cromatográfico.

Hecho esto se calculan los denominados Niveles Máximos de Contaminantes (MCLs: Maximum

Contaminant Levels) que, para algunos compuestos, si están regulados por la EPA, pero para otros

contaminantes se los calcula a través de la siguiente expresión descrita en la ecuación 3.

Ecuación 3. Fórmula de Niveles máximos de contaminantes

𝑀𝐶𝐿′𝑠 = 𝐷𝑊𝐸𝐿 ∗ 𝑅𝑆𝐶

En donde, MCL’s(ug/L) es el nivel más alto de un contaminante permitido en agua potable.

despues los MCL se establecen lo más cerca posible del MCLG, utilizando los mejores métodos

analíticos disponibles. Y las tecnologías de tratamiento y teniendo en cuenta el costo. Los MCL

Page 37: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

37

son estándares exigibles y RSC (%) es el factor de contribución relativa del agua potable en los

humanos (20%).

Las HA’s sirven como guía técnica informal para contaminantes no regulados del agua potable

para ayudar a los funcionarios federales, estatales y locales y administradores de sistemas de agua

públicos o proteger la salud pública según sea necesario. No deben ser interpretados legalmente

como normas. OW de la EPA proporciona las anteriores variables (MCL, RfD’s, DWEL’s) de

toda la vida (US EPA 2015).

2.4. ANALISIS DE RESULTADOS.

En este capítulo se describen los análisis que se realizaron para encontrar que factor incide más

sobre los compuestos, por lo cual se hicieron análisis de componentes principales (PCA), análisis

de correspondencia múltiple (MCA), test de Will-Coxon, Kruskal Wallis & Kruskal Wallis

multivariado; no sin antes aplicar pruebas de normalidad y homoestacidad de variancias ( test de

Barthel y Shapiro), con el fin de determinar las relaciones lineales entre los compuestos y factores

y se realizaron análisis de información promedio mutua (AMI), arboles de decisión, arboles de

regresión y bosques aleatorios con el fin de encontrar resultados no lineales que los análisis clásicos

no pueden inferir.

2.4.1. Análisis de componentes principales (PCA)

El análisis de componentes principales (PCA: Principal Component Analysis) es una técnica

estadística de síntesis de la información, o reducción de la dimensión (número de variables). Es

decir, ante un banco de datos con muchas variables (compuestos), el objetivo fue reducirlas a un

Page 38: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

38

menor número perdiendo la menor cantidad de información posible. En donde los nuevos

componentes principales o factores son una combinación lineal de las variables originales, y

además son independientes entre sí (Terrádez 2017).

Para la realización de este análisis estadístico se utilizó la librería “ade4” que ofrece diversas

herramientas para el análisis de datos multivariado utilizando la función “dudi.pca” (Dray and

Dufour 2007; Chessel and Dufour 2017). El código, la base de datos utilizados y los resultados

para el desarrollo de esta herramienta se encuentran indicados en el ANEXO T.

Este análisis sirvió para inferir que el entendimiento de la matriz de compuestos tiene que ser

analizado desde otra perspectiva, por lo cual se hizo el PCA teniendo en cuenta 4 casos:

I. Separando de la matriz de agua la familia de los ftalatos y la familia los farmacéuticos &

hormonas ya que el PCA respecto a los 2 componentes separó bien estas dos familias.

II. Solo con los compuestos de mayor preocupación respecto a toxicidad (>MCL) que son el

DEPH y el BPA; dependiendo de esto, se aplicó un filtro en el cual, en las muestras que se

tenían unas concentraciones inferiores a la del MCL respecto a estos dos compuestos, se

excluyeron de la matriz con el fin de ver cómo es la variancia del sistema que en total quedó

con 143 muestras de agua.

III. Excluyendo un nivel de cada factor (plástico, vidrio, origen nacional e internacional y aguas

con gas y sin gas) a través de un filtro que para cada caso excluyo las muestras del nivel

escogido (6 casos) y separando las familias como en el primer caso.

Page 39: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

39

IV. Realizando un análisis de “outliers” definidos como técnicas estadísticas de algoritmos

rápidos para identificar datos anormales multivariados en matrices de grandes dimensiones.

El ANEXO U contiene el código para este análisis en donde se utilizó la función pcout de

la librería “mvoutlier” que sirve para detectar datos atípicos en matrices de gran tamaño

(Gschwandtner 2017). En este sentido se modificó un argumento de esta técnica llamada la

Distancia Robusta de Mahanoblis “x.dist1” que está representado como un vector

numérico con distancias para localizar los datos anormales; en otras palabras los métodos

basados en esta distancia, apuntan a detectar valores atípicos calculando una medida de

cuán lejos está un punto particular del centro de los datos (Filzmoser, Maronna, and Werner

2008). la figura 9 muestra los datos que están contenidos dentro del rango de este argumento

que en un fin encontró 39 datos atípicos multivariados.

Teniendo en cuenta esto se modificó esta distancia con cuatro casos diferentes;> 100,> 75,

>50, >10 con el fin de minimizar el número de datos atípicos encontrados que fueron 12,

14, 16, 19 datos atípicos multivariados respectivamente.

Figura 9. Distancia robusta de Mahanoblis para muestras de agua multivariada.

Fuente. Elaboración propia.

Page 40: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

40

2.4.2. Análisis de Correspondencia Múltiple (MCA) y test de Wilcoxon.

Debido a que el PCA hace el análisis de la variabilidad de los compuestos respecto a los factores

individualmente, se realizó una extensión de esta herramienta denominada la MCA la cual es una

técnica de análisis de datos para variables categóricas nominales, que se utiliza para detectar y

representar estructuras subyacentes en un conjunto de datos (factores que influyen). Lo hace

representando los datos como puntos en un espacio euclidiano de baja dimensión (Siberchicot

2017).

En este sentido, para la aplicación de esta herramienta se hizo necesario la transformación de las

concentraciones (variables continuas) a variables categóricas; se realizó este proceso con la ayuda

del conocimiento experto de la metodología de la evaluación del grado de toxicidad desarrollada,

teniendo en cuenta 3 categorías:

0 ug/L = NO DETECTADO

Concentración de compuesto < MCL = BAJO

Concentración de compuesto > MCL = ALTO

Realizado este proceso de conversión, se desarrolló el código de MCA descrito en el ANEXO V

en donde se utilizaron dos funciones “dudi.acm” dentro de la librería ade4 y la función

“s1d.boxplot” dentro de la librería adegraphics con el fin de dar una interpretación de los

componentes (Siberchicot 2017).

Page 41: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

41

Con el fin de conocer si existe diferencia estadística significativa entre estos porcentajes se

desarrolló el test no paramétrico de Wilcoxon definido como una prueba no paramétrica para

comparar el rango medio de dos muestras relacionadas y determinar si existen diferencias entre

ellas. Se utiliza como alternativa a la prueba t de Student ya que no se puede suponer la normalidad

de las muestras dentro de la matriz de agua (Whitley and Ball 2002). el desarrollo de este test se

encuentra descrito en el ANEXO W en donde se utilizó la función “pairwise.wilcox.test” dentro

del paquete Stats (Marroni’s 2017).

2.4.3. ANOVA, Multi ANOVA, Kruskal Wallis y Kruskal Wallis Multivariado.

El análisis de la varianza permite contrastar la hipótesis nula de que las medias de dos niveles

(K >2) (son iguales), frente a la hipótesis alternativa de que por lo menos uno de los niveles difiere

de los demás en cuanto a su valor esperado (Kim 2017). Esto en relación a una “p-value” en donde

si esta es mayor a 0,05 se acepta la hipótesis nula y si en menor a este se acepta la hipótesis dos, es

necesario aclarar que para aplicar este análisis de varianza se hace necesario cumplir con la

condición de homogeneidad de variancias de los datos (Test de Bartlett) y normalidad de datos

(Test de Shapiro), de lo contrario se utiliza una prueba estadística no paramétrica llamada

“kruskall-wallis” que sirve para contrastar la hipótesis de que k niveles cuantitativos han sido

obtenidos de la misma población pero no hace referencia a ninguna de las otras condiciones

adicionales de homocedasticidad y normalidad necesarias para la aplicación del test paramétrico

ANOVA (Theodorsson-Norheim 1986). El código para el desarrollo de este análisis se describe en

ANEXO X.

Page 42: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

42

2.4.4. Análisis de Información Promedio Mutua (AMI).

Para el desarrollo de AMI se convirtieron los valores de concentración de cada compuesto en

variables categóricas teniendo en cuenta la “Detección” cuando el valor de la concentración es

mayor a cero y la “No Detección” cuando esta concentración es cero. A esta nueva matriz de

compuestos se aplicó el concepto de la entropía de la información y de información mutua (mi)

con el fin de encontrar la influencia de los factores de tipo categórico respecto a la detección y no

detección de los compuestos analizados. En este sentido la Entropía Conjunta es la representación

de la incertidumbre e información de todas las posibles combinaciones de las variables analizadas

(entre mayor sea este valor mayor incertidumbre de los factores respecto al compuesto y entre

menor sea este número, mayor información comparte un factor respecto a el compuesto analizado)

(Hernández, Obregón, and Torres 2016) y se calcula a través de la ecuación 4.

Ecuación 4. Entropía Conjunta.

𝐻(𝑋|𝐴) = ∑ 𝑃(𝑋 = 𝑎𝑘|𝐴)𝑙𝑛𝑃(𝑋 = 𝑎𝑘|𝑎)

𝑚

𝑘=1

En donde X es la variable aleatoria sobre un espacio de probabilidad en la que esta A (evento) “X

dado A”, En este sentido también se utilizó el concepto de la Información Mutua por pares de

variables; esta indica la cantidad de información que contiene una variable aleatoria con respecto

a otra (Hernández, Obregón, and Torres 2016). Lo anterior da una idea de la independencia o

dependencia de los factores con respecto a los compuestos por separado en donde la ecuación 5

define este concepto.

Page 43: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

43

Ecuación 5. Información Mutua (MI).

𝑀𝐼(𝑋|𝐴) = 𝐻𝑋 + 𝐻𝐴 − 𝐻𝑋|𝐴

En donde HX es la entropía de la variable aleatoria X, HA es la entropía del factor y HX|A es la

entropía conjunta de las dos variables. También se calculó el coeficiente de redundancia de los

factores respecto a compuestos (capacidad predictiva con el cual se aplica en concepto e

redundancia máxima con el fin de obtener un porcentaje de esta con el fin de observar la

independencia o asociación de los factores respecto al compuesto (Hernández, Obregón, and Torres

2016) en donde la ecuación 6 indica el coeficiente de redundancia y la ecuación 7 la redundancia

máxima.

Ecuación 6. Redundancia (R(X|A)).

𝑅(𝑋|𝐴) = 𝑀𝐼(𝑋|𝐴)/(𝐸𝑋|𝐴 + 𝐸𝑋)

Ecuación 7. Redundancia máxima (Redundancia maxima).

𝑆𝐼 (𝐸𝑋 > 𝐸𝐴)

𝑅𝑀𝐴𝑋 (𝑋|𝐴) =𝐸𝐴

𝐸𝑋 + 𝐸𝐴

𝑆𝐼 𝑁𝑂

𝑅𝑀𝐴𝑋 (𝑋|𝐴) =𝐸𝑋

𝐸𝑋 + 𝐸𝐴

Por último se halla el porcentaje de esta redundancia que consiste en un redondeo entre redundancia

y redundancia máxima con el fin de observar independencia o asociación de los factores respecto

a los compuestos (Hernández, Obregón, and Torres 2016). El código para la realización de AMI se

encuentra descrito en el ANEXO Y.

Page 44: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

44

2.4.5. Modelos basados en arboles (Tree based models)

Los algoritmos de aprendizaje basados en árboles son métodos de aprendizaje supervisado y a

diferencia de los modelos lineales, mapean bastante bien las relaciones no lineales y pueden ser

adaptados para resolver cualquier tipo de problema (clasificación o regresión) (Analytics Vidhya

2016). Entre los métodos de estos modelos están los árboles de decisión (decision tres), bosques

aleatorios (random forest), potenciación de gradiente (gradient boosting) son utilizados popularmente

en todo tipo de problemas de ciencia de datos desarrollando la partición recursiva considerada

como una herramienta fundamental en la minería de datos que ayuda a explorar la estructura de las

variables (Kabacoff 2017).

2.4.6. Árboles de decisión.

Los árboles de decisión son un tipo de algoritmo de aprendizaje supervisado (tienen una variable

de destino predefinida) que se utiliza principalmente en problemas de clasificación. Funciona tanto

para variables de entrada y salida categóricas y continuas. En esta técnica, se dividieron las

concentraciones de las muestras en tres conjuntos (o subpoblaciones) homogéneos basados en el

divisor / diferenciador más significativo en las variables de salida que fueron envase, vidrio y gas.

Realizado este proceso se desarrolló el minado de datos teniendo en cuenta que factor influye más

sobre determinado compuesto; por lo cual se tomó como variable de respuesta a los 16 compuestos

evaluados de forma categórica e independientemente en base al MCL en la determinación del grado

de toxicidad (CAPITULO 2.3).

Page 45: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

45

2.4.7. Árboles de Regresión (Regression trees).

En un árbol de regresión la variable objetivo o de respuesta no tiene clases, por lo cual se ajustó

un modelo de regresión a la variable objetivo utilizando cada una de las variables independientes.

luego, para cada variable independiente (Factores), los datos se dividieron en varios puntos de

división. En cada punto de división, el "error" entre el valor predicho y los valores reales se cuadran

para obtener una "Suma de errores al cuadrado (SSE)". Los errores de punto de división en las

variables se comparan y la variable / punto que arroja la SSE más baja se elige como nodo raíz /

punto de división. Este proceso se continúa de manera recursiva y a diferencia del árbol de decisión

utiliza la desviación estándar de los datos para escoger el nodo raíz en lugar de la ganancia de

información (Deshpande 2011). el código para el desarrollo de los árboles de decisión como de

regresión se indican en el ANEXO Z.

2.4.8. Bosques Aleatorios (Random Forest) y algoritmo Xgboots

Como se puede observar los árboles de decisión y regresión son una herramienta útil a la hora

de encontrar las reglas ocultas utilizando el minado de datos; pero estos también tienen un error

asociado y son denominados como clasificadores débiles debido a sus altos errores en los nodos

principales ; en este sentido se optó por realizar un bosque aleatorio que es un conjunto de estos

“clasificadores débiles independientes” con el fin de combinarlos todos en un clasificador fuerte;

en este sentido se utilizó el 50% de las concentraciones de las muestras como datos de calibración

y el 50% restante como datos de validación evadiendo las correlaciones entre ellos (bagging), este

proceso se realiza mediante la generación de un primer árbol de decisión de la matriz de calibración

y a partir de este, genera un nuevo árbol promediado aproximadamente con el 62.3% de las

muestras originales hasta generar un clasificador fuerte denominado el bosque aleatorio, para

Page 46: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

46

realizar este modelo se utilizó la librería “randomForest” que arroja los resultados de la

importancia de los factores generando 500 árboles aleatorios para cada compuesto categorizado en

detectado y no detectado por otra parte se aplicó el algoritmo Xgboots que a diferencia del bosque

aleatorio utiliza el % de error de variables independientes que clasifico erróneamente en el primer

árbol y utiliza estas variables ara generar el siguiente árbol con el fin de disminuir el error de la

importancia de cada variable en torno a la variable de respuesta; el código para la realización de

este modelo se describe en el ANEXO AA (Christian 2014; Walia 2017).

Page 47: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

47

3. RESULTADOS (capitulo 3)

Se obtuvieron 8 posibles combinaciones de respuesta, clasificados en Familias o “Tratamientos”

cada una con características diferentes de agua embotellada como se puede ver en detalle en el

ANEXO BB. Con este dato de entrada y mediante el método ensayo y error, se disminuye el

número de botellas de agua que se deben comprar, según la capacidad del laboratorio de calidad

de aguas del Departamento de Ingeniería Civil, se puede medir cuatro muestras por día (“tamaño

del bloque: k”) hasta obtener el número de repeticiones de las combinaciones denominadas “origen,

gas, envase” (Replication) realista para la adquisición de datos. Los resultados de este diseño

experimental arrojaron que se debe realizar al menos siete repeticiones de cada familia, siendo

necesarias mínimo 56 muestras de agua embotellada en total para poder desarrollar los métodos

estadísticos. El diseño experimental arrojó un parámetro lambda de tres, lo cual significa que un

par de factores está junto en tres oportunidades (ANEXO CC) y un factor de eficiencia igual a 0.86

que está definido como la relación existente entre la eficiencia del diseño de bloques incompletos

frente al diseño de bloques completos. Dicho esto, las 173 muestras son tres veces superiores a las

sugeridas por el diseño experimental, por lo cual se tiene la certeza de que se trabajó con un número

de muestras representativo para el conocimiento de los factores explicativos que se quieren evaluar.

El ANEXO DD muestra las aguas compradas en función de cada familia con lo que se evidencia

la certeza que se tienen las repeticiones necesarias para llevar a cabo el proyecto.

En este sentido es necesario explicar las características principales en torno a la toxicidad de los

compuestos analizados con el fin de saber cuáles son los que están por encima de este factor. La

tabla 9 indica los valores del grado de toxicidad para los compuestos analizados.

Page 48: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

48

Tabla 9. MCL, RfD’s y DWEL’s para compuestos analizados (MCL: nivel máximo

contaminate; DWEL: nivel equivalente de agua potable; RfD: dosis de referencia).

Compuesto MCL (ug/L) DWEL (ug/L) RDF (ug/(kg.día))

Dimethylphthalate 7000 35000 1000

Diethylphthalate 5600 28000 800

Diisobutylphatalate 700 3500 100

Di-n-butylphthalate 700 3500 100

Bis(2-ethylhexyl)phthtalate 0 700 20

Di-n-Octylphthalate 280 1400 40

4-tert-Octylphenol 1190 5950 170

Ibuprofen 121739.1304 608695.6522 17391

Acetaminophen 304347.8261 1521739.13 43478

Caffeine 21000 105000 3000

Fluoxetine HCl 58100 290500 8300

Gemfibrozil 91301 456505 13043

Triclosan 42000000 210000000 6000000

Bisphenol A 35 175 5

Primidone 114128 570640 16304

Carbamazepine 105000 525000 15000

Progestrone 15218 76090 2174

Fuente. Adaptado de (Gonzales, Lopera, and Arango 2014; US EPA 2015; Katsikantami et al. 2016).

Se tuvo en cuenta que solo para bis-2-etil-hexilftalato (DEPH) la MCL estaba definida por defecto

en la EPA por lo cual no fue necesario aplicar la ecuación 3 debido a que este valor (0 ug/L) es

mucho más restrictivo que el obtenido por la formula. Realizado este proceso se cuantifico el

porcentaje de la magnitud de las concentraciones de los compuestos respecto a los MCL’s

respectivos, con el fin de conocer que compuestos son los que pueden presentar efectos adversos a

la salud de un individuo y en qué porcentaje se dan (tabla 10).

Page 49: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

49

Tabla 10. Porcentaje de muestras con concentraciones de compuestos mayores a MCL

(MCL: nivel máximo contaminante).

Compuesto %>MCL (ug/L) %<MCL (ug/L)

Bis-2-etil-hexilftalato (DEPH) 45.4 54.6 Bisfenol A (BPA)

8.7 91.3 Fuente. Elaboración propia.

Como se puede observar solo dos compuestos de los 16 presentan en algunas muestras de agua,

niveles mayores a los MCL lo cual es preocupante en especial por DEPH que está en

concentraciones mayores en un 45.4% del total de las muestras. La presencia de estos dos

compuestos da una clara señal de la migración de estos al agua esto en especial por las propiedades

que poseen (Li et al. 2010). Además, la tabla 11 indica el porcentaje de detección para cada

compuesto, así como el mínimo valor que se cuantifico y el máximo que alcanzaron.

Con el fin de tener una idea de que porcentaje de compuestos está asociado a un factor específico

se realizó una tabla de contingencia bidireccional (tabla 12) en donde se clasificaron los factores

escogidos de la siguiente manera:

ENVASE= A cuando es botella plástica y es igual a B cuando es botella de vidrio.

ORIGEN= A cuando es producida en Colombia (Nacional) a B cuando es de otro país

GAS= A cuando no tiene gas y es igual a B cuando tiene gas.

0 = cuando no se detectó determinado compuesto (0ug/L)

Page 50: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

50

1= cuando se detectó determinado compuesto (mayor al límite de detección).

Tabla 11. Porcentaje de detección, mínimos y máximos de compuestos analizados por

cromatografía de masas. No muestras = 174.

Compuesto Detectado (%) No detectado (%) min (ug/L) max(ug/L)

Dimetilftalato 66.1 33.9 0.00023664 0.01160782

Dietilftalato 97.1 2.9 0.00021192 0.00068642

Diisobutilftalato 57.5 42.5 0.0002178 0.03375914

Dibutilftalato 85.1 14.9 0.00020534 0.00147666

Bis 2 etil hexy ftalato 54.6 45.4 0.000338 0.03203382

Di n octilftalato 96.6 3.4 0.0003405 0.00109816

4tercoctilfenol 5.7 94.3 0.00037342 0.17998534

Acetaminofén 32.2 67.8 0.02070412 1.91676554

Cafeina 0.6 99.4 0.00040412 0.24529934

Fluoxetina 16.7 83.3 0.0005824 0.1648178

Gemfibrozil 26.4 73.6 0.00343538 2.46856034

Triclosan 14.9 85.1 0.00171386 0.44503364

Bisfenol A 30.5 69.5 0.20626514 221.1457024

Primidona 4.0 96.0 0.00221278 0.51004412

Carbamazepina 73.0 27.0 0.02088696 479.7635469

Progesterona 4.0 96.0 0.00189012 1.7899449

Fuente. Elaboración propia.

Page 51: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

51

Tabla 12. Porcentaje de detección, mínimos y máximos de compuestos analizados por

cromatografía de masas (tablas de dirección bidireccional) (en rojo se muestran compuestos

con una detección mayor al 50%).

Compuesto DETECTADO =1 NO

DETECTADO = 0

ENVASE ORIGEN GAS

A B A B A B

Dimetil ftalato 0 94 21 84 31 73 42

1 51 8 41 18 40 19

Dietil ftalato 0 141 28 122 47 110 59

1 4 1 3 2 3 2

Diisobutil ftalato 0 81 19 77 23 61 39

1 64 10 48 26 52 22

Dibutil ftalato 0 124 24 108 40 95 53

1 21 5 17 9 18 8

Bis-2 etil-hexy ftalato 0 76 19 71 24 58 37

1 69 10 54 25 55 24

Di-n-octilaftalato 0 139 29 122 46 110 58

1 6 0 3 3 3 3

4-terc-octilfenol 0 136 28 7 3 5 5

1 9 1 118 46 108 56

Acetaminofén 0 48 8 40 16 39 17

1 97 21 85 33 74 44

Cafeína 0 1 0 1 0 1 0

1 144 29 124 49 112 61

Fluoxetina 0 25 4 20 9 18 11

1 120 25 105 40 95 50

Gemfibrozil 0 38 8 33 13 30 16

1 107 21 92 36 83 45

Triclosán 0 21 5 18 8 20 6

1 124 24 107 41 93 55

Bisfenol A 0 45 8 37 16 35 18

1 100 21 88 33 78 43

Primidona 0 5 2 4 3 3 4

1 140 27 121 46 110 57

Carbamazepina 0 105 22 94 33 83 44

1 40 7 31 16 30 17

Progesterona 0 7 0 7 0 4 3

1 138 29 118 49 109 58

Fuente. Elaboración propia.

Page 52: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

52

La suma de cada tabla de contingencia bidireccional es igual al total de numero de muestras y lo

que se destaca de esta, son los compuestos con un porcentaje mayor al 50% (color rojo). Además,

para el caso del factor envase en su nivel A (botella de plástico) acetaminofén, cafeína, fluoxetina,

gemfibrozil, triclosán, bisfenol A, primidona y progesterona los números de muestras en detección

son mayores que los factores gas y origen, exceptuando el 4-terc-octilfenol en donde hay una

prevalencia del factor gas y el factor del origen sobre el plástico.

En el PCA se escogieron dos componentes de las 16 posibles que representaron el 58% de la

variancia del sistema y se graficó esto en función de las muestras en donde la figura 10 indica que

componente representa la mayor variabilidad del sistema y la tabla 13 indica la las correlaciones

de cada componente principal con cada variable.

Figura 10. Análisis de componentes principales para la matriz de agua de los compuestos.

Fuente. Elaboración propia.

Page 53: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

53

Tabla 13. Correlaciones de las muestras respecto a dos componentes principales.

COMPUESTO ABREVIACION Comp1 Comp2

Dimetil ftalato DMP 0.12648506 -0.699684746

Dietil ftalato DEP 0.14193249 -0.832129071

Diisobutil ftalato DIBP 0.20919096 -0.899968657

Dibutil ftalato DBP 0.139812 -0.403383134

Bis-2 etil-hexy ftalato DEPH 0.17650603 -0.952661709

Di-n-octilaftalato DOP 0.1149339 -0.650171886

4-tercoctilfenol TER -0.06766601 -0.023248112

Acetaminofén ACE 0.02254904 -0.008822314

Cafeína CAF -0.83491675 -0.144834831

Fluoxetina FLU -0.95119487 -0.127473344

Gemfibrozil GEM -0.91442591 -0.103477376

Triclosán TRI -0.9136867 -0.148172374

Bisfenol A BPA -0.96221271 -0.109622709

Primidona PRI -0.86106074 -0.110668993

Carbamazepina CAR 0.0108843 0.046159013

Progesterona PRO -0.74348596 -0.02597769

Fuente. Elaboracion propia.

Respecto al componente uno los compuestos que recogen la mayor proporción de variabilidad

original negativamente (color rojo en tabla 13) es el BPA, FLU, GEM, TRI, PRI CAF y PRO, por

lo cual es de notar que los compuestos farmacéuticos y hormonas tienen alguna similitud entre los

datos encontrados; por otra parte el componente dos recoge la máxima variabilidad negativa

posible que no fue recogida por el primero en donde se puede notar los valores de color rojo de la

familia de los ftalatos exceptuando el DBP que está en una proporción entre la familia de los ftalatos

y farmacéuticos similar respecto a las correlaciones. Realizado este proceso se verifico si hay

alguna separación por clúster de cada factor dependiendo de los resultados de cada compuesto; se

pudo notar que no hay separación y que se genera el traslapo entre cada nivel de los factores como

lo indica la figura 11.

Page 54: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

54

Figura 11. Separación por clústers de niveles de factores.

Fuente. Elaboración propia.

Esto dio a entender que no hay diferencias según la variancia de la matriz de los compuestos si se

tiene un agua que este en vidrio u otra en plástico o si tiene gas o no o si es de origen colombiano

o importadas. Este análisis sirvió para inferir que el entendimiento de la matriz de compuestos tiene

que ser analizado desde otra perspectiva, por lo cual se hizo el PCA teniendo en cuenta los cuatro

casos descritos en el capítulo 2.4.1.

Respecto al 1er caso la familia de fármacos & hormonas obtuvo una mayor ganancia de variancia

del teroctilfenol respecto al componente dos en el caso de los fármacos, y en el caso de los

plastificantes en donde se incluyeron los ftalatos y el BPA se encontró que los primeros representan

mejor la variancia total de la matriz de plastificantes y el bisfenol A representa la variancia máxima

no explicada por el componente uno por lo cual a pesar de que los ftalatos y el BPA son

Page 55: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

55

plastificantes, hay diferencias entre estas dos clases y esto se debe a la magnitud de las

concentraciones en las que se encuentran y por supuesto en la cantidad.

Para el 3er caso, de la combinación de los factores excluyendo un nivel de cada uno; se encontró

repetitivamente el traslapo de los factores, incluso cuando se separaron las familias de los

compuestos (caso dos).

Respecto al cuarto caso, desde un total de muestras de 162, 160, 158, 155 y 135 (muestras

multivariadas que no son consideradas como valores atípicos) y separando las familias (caso dos);

se generó como en todos los anteriores casos, el traslapo de los factores.

En el MCA los resultados están indicados en la figura 12. Esta figura indica la correlación existente

entre los factores de la matriz de agua y los compuestos presentes; como se puede observar en los

niveles de los factores se genera el mismo traslapo que en el análisis de PCA, por lo cual se

aplicaron los mismos 4 casos anteriores al MCA.

Page 56: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

56

Figura 12. MCA para todos los compuestos con factores.

Fuente. Elaboración propia.

En este sentido se dibujaron los boxplots en el sistema coordenado del MCA, con el fin de observar

el traslapo de las muestras y confirmar si estas son iguales o no (Figura 13).

Page 57: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

57

Figura 13. Boxplot de niveles de factores y compuestos.

Fuente. Elaboración propia.

Como en el PCA, para el MCA también se evaluaron los cuatro casos anteriores donde en el I caso

de la separación de las familias, no se encontraron diferencias entre los factores respecto a la

concentración categórica de los compuestos. Para la aplicación del II caso la figura 14 indica la

separación por clusters de niveles de los factores dependiendo del DEPH y el BPA en donde se

puede observar una separación similar de los niveles del origen y el BPA, en este sentido también

se puede observar una separación de los niveles de envase lo cual permite en primera instancia

inferir que el agua nacional y envase de plástico presenta concentraciones altas de BPA, lo cual no

se puede ver bien en el DEPH; por lo cual se realizó una proyección de los boxplot, con el fin de

validar si estas separaciones existen o no (figura 15) .

Page 58: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

58

Figura 14. Separación por clústers de niveles de factores y compuestos (DEPH Y BPA).

Fuente. Elaboración propia.

Figura 15. Boxplots de niveles de factores y compuestos (DEPH Y BPA).

Fuente. Elaboración propia.

Page 59: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

59

Cómo se puede observar en el boxplot del factor origen, no se encuentran diferencias en los

cuartiles de origen nacional e internacional; a diferencia del factor envase en donde al menos el

25% de las muestras del envase A (plástico) son diferentes al envase B (Vidrio). Respecto a los

compuestos el DEPH presenta una separación de los boxplot en el sistema coordenado en

concentraciones altas de al menos el 75% pero se puede observar que de este 75% solo el 25% de

las muestras de DEPH apoya la idea de que el 25% de las muestras que tienen envase plástico

presentan concentraciones altas de DEPH.

Por otra parte, el BPA presenta una separación en concentraciones altas casi del 100 % esto indica

que la no detección del BPA en menos del 75% de las muestras de agua depende del 25% de que

las muestras tengan un envase de plástico.

El p value del test de Wilcoxon para este caso es de 0.26 por lo cual no se considera como una

diferencia significativa y esto se debe al porcentaje en el cual se logró diferenciarlos que solo fue

el 25% (1 quartil); en este sentido el p value del test de Wilcoxon para el BPA es de 0.87, por lo

cual tampoco se considera que esta diferencia sea significativa respecto al envase de plástico en la

no detección del BPA.

Para el tercer caso se encontraron diferencias entre muestras de la familia de los plastificantes que

solo son de origen nacional con una combinación del factor envase en el nivel plástico respecto al

DEP, como se indica en la figura 16. En este mismo sentido, la figura 17 representa los boxplots

que señalan la diferencia de DEP respecto al factor envase que indica que al menos el 75% de las

muestras del envase A son diferentes a las del envase B y además de este 75%, al menos el 60 %

Page 60: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

60

está relacionado con el 75% de la no detección de DEP. Y por último para el IV caso no se

encontraron diferencias de los compuestos respecto a los factores.

Figura 16. Separación por clústers de niveles de factores y compuestos plastificantes.

Fuente. Elaboración propia.

Page 61: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

61

Figura 17. Boxplots de niveles de factores y compuestos.

Fuente. Elaboración propia.

El caso número I en la familia de los plastificantes tuvo una combinación de los factores de

muestras de origen nacional con envase de plástico respecto a la no detección del DEP, se obtuvo

un p value del test de Wilcoxon de 0.19, por lo cual a pesar de que el MCA indico diferencias en

un % considerable de las muestras de agua, este porcentaje no es significativamente importante

entorno a las diferencias que hay en los compuestos respecto a los factores de la matriz de agua.

Con el fin identificar diferencias significativas también se realizó este test para cada

compuesto respecto a cada factor, la tabla 14 indica los p-value para este test teniendo en cuenta

la matriz en general.

Page 62: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

62

Tabla 14. P value Wilcolxon test.

Wilcoxon test

Compuesto ENVASE ORIGEN GAS

Dimetilftalato 0.505 0.597 0.733

Dietilftalato 0.845 0.547 0.802

Diisobutilftalato 0.405 0.181 0.334

Dibutilftalato 0.754 0.440 0.727

Bis(2-etilhexyftalato) 0.223 0.553 0.353

Dinoctilftalato 0.269 0.223 0.413

4-terc Tercoctilfenol 0.792 0.873 0.083

Acetaminofen 0.321 0.759 0.755

Cafeina 0.889 0.224 0.104

Fluoxetina 0.949 0.953 0.529

Gemfibrozil 0.923 0.614 0.330

Triclosan 0.212 0.609 0.930

BisfenolA 0.978 0.745 0.454

Primidona 0.768 0.393 0.153

Carbamazepina 0.706 0.205 0.710

Progesterona 0.345 0.269 0.698

Fuente. Elaboración propia.

Como se puede observar los p value del test de Wilcoxon en toda la matriz de agua mayores a 0.05

por lo cual se acepta la hipótesis de que no hay diferencias significativas de la concentración de los

compuestos respecto a los tres factores escogidos; en este sentido se aplicó este test en los 4 casos

evaluados anteriormente en donde no se obtuvieron diferencias.

Hecho esto, se realizaron los test de Bartlett y de Shapiro de los cuales la tabla 15 contiene los p-

value del test de Bartlett en donde si mayores a 0.05 se acepta la homogeneidad de variancias y en

la tabla 16 se indican los p-valué del test de Shapiro en donde si son mayores a 0.05 se acepta la

normalidad de los datos permitiendo aplicar el ANOVA, de lo contrario se utiliza una prueba

estadística no paramétrica llamada “kruskal-wallis” que sirve para contrastar la hipótesis de que k

niveles cuantitativos han sido obtenidos de la misma población pero no hace referencia a ninguna

Page 63: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

63

de las otras condiciones adicionales de homocedasticidad y normalidad necesarias para la

aplicación del test paramétrico ANOVA (Theodorsson-Norheim 1986).

Tabla 15. p-value test de Bartlett

BARTLETT TEST (HOMOGENEIDAD DE VARIANCIAS) (En rojo relaciones que no tienen homogeneidad de variancias)

Compuesto ENVASE ORIGEN GAS

Dimetilftalato 0.0440 0.0001 0.0920

Dietilftalato 0.0387 1.96E-06 0.0003

Diisobutilftalato 0.1010 0.0044 2.76E-06

Dibutilftalato 0.2090 0.4569 0.1403

Bis(2-etilhexyftalato) 0.0610 1.05E-05 5.72E-08

Dinoctilftalato 0.0000 1.21E-08 1.39E-19

4-terc-octilfenol 0.0002 6.13E-05 0.3801

Acetaminofen 3.40E-08 1.01E-25 3.30E-11

Cafeina 0.2656 0.0339 0.5573

Fluoxetina 0.0089 0.0008 0.0051

Gemfibrozil 7.78E-06 3.48E-05 9.14E-10

Triclosan 0.0636 0.0024 0.0439

BisfenolA 0.0990 0.0010 0.0895

Primidona 0.3590 0.0255 0.0165

Carbamazepina 1.40E-78 3.57E-85 5.90E-222

Progesterona 0.1776 0.1241 0.0066 Fuente. Elaboración propia.

Tabla 16. p-value test de Shapiro

Shapiro test (Normalidad)

Compuesto Plástico Vidrio Nacional Internacional Sin Gas Con Gas

Dimetilftalato 6.63E-21 1.68E-19 2.36E-19 2.34E-10 1.22E-12 1.47E-13

Dietilftalato 2.03E-25 6.34E-24 9.26E-23 1.31E-11 6.13E-15 7.48E-17

Diisobutilftalato 8.22E-22 1.11E-19 3.51E-19 4.45E-09 3.75E-13 5.75E-14

Dibutilftalato 5.61E-22 6.11E-21 1.64E-19 9.56E-10 4.54E-12 1.80E-14

Bis(2-etilhexyftalato) 5.10E-23 2.49E-20 2.88E-20 4.32E-09 5.91E-14 1.45E-14

Dinoctilftalato 5.10E-23 6.26E-24 1.18E-22 4.32E-09 2.47E-14 2.95E-16

4-terc-octilfenol 1.35E-17 1.31E-14 6.92E-17 5.94E-06 4.26E-11 5.01E-09

Acetaminofen 2.50E-23 1.99E-21 2.26E-20 5.00E-08 2.74E-07 3.15E-15

Cafeina 1.66E-19 2.56E-18 9.68E-18 8.95E-09 3.13E-11 2.67E-12

Fluoxetina 4.88E-22 2.97E-20 3.32E-20 8.95E-09 3.13E-11 2.67E-12

Gemfibrozil 1.96E-23 9.51E-22 6.93E-21 1.31E-09 7.70E-14 1.71E-14

Triclosan 9.39E-19 9.04E-17 2.97E-17 6.73E-07 1.07E-10 4.34E-10

BisfenolA 6.79E-23 1.88E-21 7.20E-21 6.50E-10 4.31E-13 3.75E-14

Primidona 1.22E-22 1.18E-21 1.90E-20 7.92E-10 2.09E-12 9.93E-14

Carbamazepina 2.31E-26 1.25E-24 1.51E-21 1.92E-08 3.39E-13 2.41E-17

Progesterona 2.06E-18 1.10E-17 2.27E-16 9.81E-08 1.67E-09 4.29E-11 Fuente. Elaboración propia.

Page 64: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

64

Los datos señalados en rojo en la tabla 15 indican específicamente los compuestos que presentan

homogeneidad de variancias en un respectivo compuesto, pero este supuesto no es suficiente para

la aplicación del ANOVA, por lo cual se aplicó el Kruskal Wallis que sostuvo un p-value mayor a

0.05 en cada uno de los análisis; apoyando la hipótesis nula que indica que las medias de los datos

son iguales. Además, la tabla 17 indica los p-value para cada compuesto en combinación con cada

factor y el p-value de todos los compuestos en combinación con cada factor (Kruskal-Wallis

Multivariado) apoyando la hipótesis de que no hay diferencias en la magnitud y detección de los

compuestos si se tienen diferencias entre el envase el origen y el gas.

Tabla 17. p-value Kruskal-Wallis test & Kruskal-Wallis Multivariado

Kruskal-Wallis test

Compuesto ENVASE ORIGEN GAS

Dimetilftalato 0.504 0.596 0.732

Dietilftalato 0.839 0.543 0.797

Diisobutilftalato 0.404 0.180 0.333

Dibutilftalato 0.752 0.438 0.725

Bis(2-etilhexyftalato) 0.222 0.552 0.352

Dinoctilftalato 0.266 0.221 0.410

4-Terc-octilfenol 0.791 0.872 0.083

Acetaminofen 0.320 0.758 0.754

Cafeina 0.887 0.223 0.103

Fluoxetina 0.948 0.951 0.528

Gemfibrozil 0.922 0.613 0.329

Triclosan 0.211 0.608 0.929

BisfenolA 0.977 0.744 0.454

Primidona 0.766 0.392 0.153

Carbamazepina 0.704 0.204 0.709

Progesterona 0.344 0.268 0.696

KRUSKAL-WALLIS MULTIVARIADO

0.964 0.794 0.275

Fuente. Elaboración propia.

Page 65: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

65

Como en el análisis del PCA y el MCA también se realizaron estos análisis para los cuatro casos

evaluados en donde en el I caso separando los plastificantes de los medicamentos el p-value para

cada uno de los casos fue mayor a 0.05 por lo cual tampoco se encontró diferencias entre los

niveles. Kruskal-Wallis y Kruskal-Wallis multivariado, arrojaron los mismos resultados para el II

caso de los compuestos de mayor preocupación respecto a toxicidad.

Respecto a los niveles de cada factor por separado (plástico, vidrio, origen nacional e internacional

y aguas con gas y sin gas) “caso III” y aplicándolo a los niveles opuestos. Por parte del nivel

plástico se obtuvo que no existen diferencias estadísticas entre las medias de los datos al presentar

una combinación de plástico con un origen nacional o internacional o si tienen gas o no, en los

resultados de las anteriores pruebas. Realizando esta misma combinación dejando como un único

nivel el vidrio se obtuvieron diferencias significativas respecto al nivel GAS en DMP en el cual la

p-value de Kruskal-Wallis = 0.00317<0.05. De lo anterior se deduce que cuando se tiene un envase

de vidrio, hay diferencias entre los resultados cuando una muestra tiene gas o no.

Realizado el mismo procedimiento con un único nivel (muestras que solo tienen gas); el Kruskal-

Wallis arroja una p-value igual a 0.012 respecto al nivel envase lo cual quiere decir que las muestras

que son de vidrio o plástico y tienen gas son diferentes respecto a los otros tratamientos o

combinaciones existentes de los factores para DMP. Otro compuesto que arrojo la misma hipótesis

planteada por el test de Kruskal-Wallis fue la Cafeína (CAF) con un p-value de 0.0168 pero para

el caso de las muestras que no tienen gas.

En este sentido se aplicó el Kruskal-Wallis Multivariado teniendo en cuenta el envase vidrio y

además separando los compuestos plastificantes de los medicamentos, indica diferencias entre la

Page 66: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

66

detección y no detección de los compuestos de acuerdo al tipo de origen y gas en la matriz de agua

de los plastificantes como lo indica la tabla 18.

Tabla 18. Kruskal-Wallis Multivariado con envase de vidrio para plastificantes.

PLASTIFICANTES

FACTORES ORIGEN GAS

KRUSKAL-WALLIS MUTIVARIADO 0.0055 0.0086

Fuente. Elaboración propia.

El Kruskal-Wallis Multivariado, con las muestras que no tienen gas y además separando los

compuestos plastificantes de los medicamentos, arrojó diferencias entre la detección y no detección

de los compuestos de acuerdo al tipo de origen en la matriz de agua de los farmacéuticos y

hormonas como lo indica la tabla 19.

Tabla 19. Kruskal-Wallis Multivariado con muestras sin gas para farmacéuticos y hormonas.

FARMACEUTICOS Y HORMONAS

FACTORES ENVASE ORIGEN

MKRUSKAL 0.962 0.035

Fuente. Elaboración propia.

En este orden de ideas se realizaron estas pruebas teniendo en cuenta las muestras de origen

internacional, dando como resultado diferencias de acuerdo al tipo de muestras que tienen gas y las

que no respecto a los plastificantes como lo indica la tabla 20. Por último, cuando se tienen muestras

de origen nacional no se encontraron diferencias entre las muestras según las pruebas desarrolladas.

Page 67: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

67

Tabla 20. Kruskal-Wallis Multivariado con muestras de origen internacional para

plastificantes.

PLASTIFICANTES

FACTORES ENVASE GAS

MKRUSKAL 0.962 0.0428

Fuente. Elaboración propia.

Por otra parte se realizó Kruskal Wallis teniendo en cuenta el análisis de outliers (caso IV) con una

x.dist de 100, 75, 50,10 y por defecto; estas van desde una mayor a menor restricción

respectivamente dado a que mientras esta distancia es más pequeña, mayor es el número de datos

atípicos que se encuentran (14, 16, 18, 21 y 41 outliers del total de las 174 muestras).

Para el caso de outliers con una x.dist igual a 100, 75, 50 y 10 se obtuvo un p value menor a 0.05

definiendo diferencias entre las muestras que tienen gas y las que no respecto a TER, para el caso

de esta x.dist por defecto del programa en R stadistical (41 outliers) el p value de Kruskal Wallis

fue menor a 0.05 en dos casos:

• Hay diferencias de las muestras que tiene gas y las que no respecto a DIBP.

• hay diferencias entre las muestras que tiene gas y las que no respecto al DEPH.

Realizados estos análisis clásicos con pocas respuestas de factores que expliquen por qué se da la

presencia de estos compuestos, se investigaron otras herramientas posibles que den explicación a

esta pregunta, en este sentido se realizó un a análisis de información promedio mutua (AMI: mutual

average information) y modelos basados en arboles como lo son los arboles de decisión (Decision

Trees), arboles de regresion (Regression Trees) y bosques aleatorios (Random Forest).

Page 68: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

68

Para el desarrollo de AMI se convirtieron los valores de concentración de cada compuesto en

variables categóricas teniendo en cuenta la “Detección” cuando el valor de la concentración es

mayor a cero y la “No Detección” cuando esta concentración es cero. A esta nueva matriz de

compuestos se aplicó el concepto de la entropía de la información y de información mutua (mi).

En este sentido las tablas de 21,22 y 23 indican los valores de entropía, información mutua y

redundancia para DMP, ACE y CAF.

Tabla 21. Entropía conjunta, información mutua y valores de redundancia de factores

respecto a DMP.

Variables Entropía_Conjunta MI R R_MAX % redundancia

ENVA-DMP 0.998860703 0.00264549

0.12620656 0.19174991 65.82

ENVB- DMP 0.572452273 0.57745213 0.31800916 181.58

ORIA- DMP 0.998584145 0.00100049

0.21167905 0.27060915 78.22

ORIB- DMP 0.781985607 0.45649527 0.35783523 127.57

GASA- DMP 1.013323554 0.00133301

0.23717061 0.30446147 77.9

GASB- DMP 0.843859763 0.41965962 0.36458945 115.1

Fuente. Elaboración propia.

Tabla 22. Entropía conjunta, información mutua y valores de redundancia de factores

respecto a ACE.

Variables Entropia_Conjunta MI R R_MAX % redundancia

ENVA-ACE 0.982511846 0.00142849

0.67943179 0.19474241 348.89

ENVB-ACE 0.572452273 0.10698024 0.32218663 33.2

ORIA-ACE 0.992486113 2.85E-05

0.20547527 0.2744145 74.88

ORIB-ACE 0.771489801 0.45716279 0.36225797 126.2

GASA-ACE 1.008174594 0.00336384

0.23087618 0.30854149 74.83

GASB-ACE 0.829412033 0.42262065 0.3690477 114.52

Fuente. Elaboración propia.

Page 69: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

69

Tabla 23. Entropía conjunta, información mutua y valores de redundancia de factores

respecto a CAF.

Variables Entropia_Conjunta MI R R_MAX % redundancia

ENVA-CAF 0.268721878 0.00151648

0.00561163 0.18888147 2.97

ENVB-CAF 0.430827083 0.10592692 0.10592692 100

ORIA-CAF 0.391078129 0.00275168

0.00698697 0.12960679 5.39

ORIB-CAF 0.514847408 0.09019947 0.09019947 100

GASA-CAF 0.451890022 0.00359203

0.00788622 0.11206373 7.04

GASB-CAF 0.530141239 0.08782588 0.08782588 100

Fuente. Elaboración propia.

En donde Variables se definen como las combinaciones de los niveles de los factores (ENVA=

envase plástico; ENVB= envase vidrio; ORIA= origen nacional; ORIB= origen internacional;

GASA= agua sin gas; GASB= agua con gas) respecto a determinado compuesto, Entropía

Conjunta es la representación de la incertidumbre e información de todas las posibles

combinaciones de las variables analizadas, MI es la información mutua por pares de variables, R

es el coeficiente de redundancia de los factores respecto a compuestos (capacidad predictiva),

R_MAX es la redundancia máxima y % Redundancia es el redondeo entre redundancia y

redundancia máxima las tablas restantes a los otros 13 compuestos están en el ANEXO EE ya que

el resultado de estas fue el mismo que el de DMP.

Se señalaron en rojo los números de menor magnitud de la entropía conjunta esto debido a que,

entre menor es este número las variables relacionadas comparten mayor información, de esto se

pudo destacar que el envase de plástico comparte la mayor información respecto a DEP (ANEXO

EE1), DOP(ANEXO EE5), CAF (tabla 23) y PRI (ANEXO EE11); por el contrario los

compuestos restantes comparten la mayor información respecto a el envase de vidrio, induciendo

así que los factores origen y gas son los que generan mayor incertidumbre.

Page 70: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

70

En este mismo orden de ideas se señalaron los valores más altos de información mutua para cada

tabla con el fin de ver cual factor es el que tiene mayor dependencia a respectivo compuesto; dicho

esto los compuestos que presentan mayor dependencia al envase son DMP (tabla 21), DOP

(ANEXO EE5), FLU (ANEXO EE7) y GEM (ANEXO EE8); los compuestos que presentan

mayor dependencia respecto a el factor gas son DEPH (ANEXO EE4), TER(ANEXO EE6), ACE

(tabla 22), CAF (tabla 23), TRI (ANEXO EE9) y PRI (ANEXO EE11) y los de mayor

dependencia con respecto al origen son DEP (ANEXO EE1), DIBP (ANEXO EE5), DBP

(ANEXO EE3), BPA (ANEXO EE10), PRI (ANEXO EE11), CAR (ANEXO EE12) y PRO

(ANEXO EE13), respecto a esta dependencia se calculó el porcentaje de redundancia, esto con el

fin de conocer la capacidad predictiva de esta variable frente a los compuestos y poder diferenciarla

respecto a los niveles que tienen.

Si el coeficiente de redundancia tiende a cero, no existe redundancia y, por lo tanto, las variables

analizadas en cada par son independientes. A fin de conocer qué tan alta puede ser su redundancia

se halla su máximo valor. Se observa que la capacidad predictiva de la detección de DMP, DEPH,

OCT, FLU y GEM está condicionada por el envase de vidrio con la incertidumbre más baja y la

dependencia más alta; en este mismo sentido DEP y PRI van a estar condicionadas por el envase

de vidrio pero con una incertidumbre mayor que las anteriores, además ISO, BUT, TER, TRI, BPA,

CAR y PRO también están condicionadas por el envase de vidrio pero la dependencia de estas

variables no es tan alta y la incertidumbre sigue siendo la más baja.

Por otra parte, la capacidad predictiva del envase de plástico solo está condicionada por ACE con

una dependencia media e incertidumbre baja, además el único compuesto que presenta la

predicción de la detección respecto a aguas que tienen gas es CAF con la dependencia más alta e

Page 71: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

71

incertidumbre media. Esto quiere decir que el factor origen es el menos importante en la detección

de estos compuestos y que solo ACE tiene mayor capacidad predictiva de aparecer cuando se tiene

un envase de plástico y CAF cuando el agua tiene GAS, del resto de los compuestos se puede decir

que su capacidad predictiva esta condiciona por el envase de Vidrio. Con el fin de poder extraer

mayores y mejores resultados se aplicaron modelos basados en árboles para identificar las reglas

escondidas dentro de la matriz de agua.

Para DMP se puede deducir que, si se tiene una muestra con un envase de vidrio con un agua sin

gas, este se detectara en concentraciones bajas (ver figura 18) con un error relativo de 1 y un error

en el nodo raíz de 0.34 lo cual representa un buen ajuste.

Figura 18. Árbol de decisión como variable de respuesta DMP.

Fuente. Elaboración propia.

Page 72: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

72

Figura 19. Árbol de decisión como variable de respuesta DIBP.

Fuente. Elaboración propia.

la figura 19 indica el árbol de decisión del minado de datos de DIBP, en donde se puede observar

como nodo principal el ORIGEN en donde si es un agua internacional y no tiene gas se presentan

niveles bajos con un error del 0.42 en el nodo raíz y con un error relativo máximo de 1.09. El

ultimo árbol de decisión desarrollado por el minado de datos fue el de DEHP con un error relativo

de 0.9367, en donde la figura 20 indica la estructura de este con un error en el nodo principal del

0.45.

Respecto a la figura 20 se identifica como nodo principal el envase, en donde si este es de vidrio y

no tiene gas se presenta la detección de DEPH. Los arboles de decisión de los demás compuestos

no se indican debido a que no existen reglas que puedan definir los nodos del árbol. Esto se debe a

que en la categorización de las muestras, el % de no detección respecto a los niveles bajo y

Page 73: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

73

detectado es mucho mayor por lo cual no se tienen diferencias en la variable de respuesta; esto es

una desventaja de estos modelos debido a que al categorizar una variable continua se pierde mucha

información de está generando estos problemas (Analytics Vidhya 2016). Para dar solución a este

problema se corrió el modelo de minado de datos dejando las concentraciones de los compuestos

como variables continuas con el fin de aplicar los denominados “regression trees”.

Figura 20. Árbol de decisión como variable de respuesta DEPH.

Fuente. Elaboración propia.

En este orden de ideas se dibujó el árbol de regresión para DMP (ver figura 21) la cual tiene

interpretación similar a la de los arboles categóricos en donde la parte superior de cada nodo indica

la importancia de este (1= nodo raíz) además de la media de los datos para cada nodo; n que es

igual al número de muestras y al final se indica el porcentaje de desviación estándar para cada

nodo. Dicho esto, se puede inferir que al tener un origen nacional y un envase de vidrio la media

de los datos de DMP se verá representada por estos dos factores que tienen los porcentajes más

Page 74: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

74

altos del total de las muestras con un error en el nodo raíz de 2.94e-06. Los 15 árboles de regresión

restantes para cada compuesto se describen en el ANEXO FF (1 A 15)

Figura 21. Árbol de Regresión como variable de respuesta DMP.

Fuente. Elaboración propia.

Si se compara el árbol de regresión con el árbol categórico de este compuesto se puede inferir que

hay diferencias en torno a que mientras en el de decisión, el origen nacional (A) no es importante

respecto a la no detección de DMP; en el árbol de regresión es el nodo principal en el cual la media

de los datos es influyente pero el error del nodo principal en el árbol de clasificación es mucho

mayor que en el categórico por lo cual la clasificación errónea en este árbol es más grande que en

el de regresión.

Page 75: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

75

El ANEXO FF1 indica el árbol de regresión para DEP en donde se puede observar una estructura

similar a DMP (ftalatos de bajo peso molecular) a diferencia que la mayor ganancia de desviación

estándar se la llevan las aguas que tienen gas en este caso se presentó un error relativo de uno y un

error en el nodo principal de 5e-09 que representa una buena elección de este en donde si se tiene

un origen nacional y un envase de vidrio se detecta DEP. En este orden de ideas se puede deducir

que los ftalatos que tiene bajo peso molecular están condicionados en la detección cuando tienen

un origen nacional y un envase de vidrio.

Después se definió como variable de respuesta el compuesto DIBP en donde el ANEXO FF2

representa la estructura del árbol de regresión. En donde se puede observar el nodo principal como

el gas en a la media; cabe destacar que al comparar este árbol de regresión con el árbol de decisión

se puede observar la misma regla, pero invertidos los nodos raíces y un error en el nodo raíz del

1.7e-05 que es menor al del árbol categórico infiriendo así que este es un buen clasificador de

DIBP.

En este contexto se desarrolló el árbol de regresión del DBP en donde se indica como nodo raíz el

envase de vidrio, el cual combinado con un origen internacional lleva el mayor porcentaje de

detección con un error en el nodo raíz de 4e-08 ver ANEXO FF3.

Los arboles correspondientes a los ANEXOS FF2 y FF3, DIBP (di-iso-butilftlato) y DBP

(dibutilftalato) respectivamente, da a entender que a pesar de que ambos compuestos tienen el

mismo peso molecular; la estructura en la cual tienen ubicados los radicales; es suficientemente

significante como para indicar que la detección de estos compuestos depende de diferentes factores

en el agua envasada.

Page 76: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

76

Respecto al DEPH el ANEXO FF4 indica el árbol de regresión de este; en donde se indica el nodo

raíz en agua con gas la cual en combinación con un origen nacional representa detección de las

muestras con una media de 0.0027 ug/L. esto es muy diferente respecto a el árbol de decisión en

donde el nodo principal es el envase y el que menos información tiene es el factor gas, destacando

que el error en el nodo raíz es menor que en el categórico (1.25e-05). Repitiendo el procedimiento

el ANEXO FF5 indica el árbol de regresión para el Di-n-Octilftalato (DOP) el cual sigue teniendo

como nodo raíz el agua con gas combinándose con un origen internacional representa la detección

de DOP con un error en el nodo raíz de 1,7e-8.

En resumen, los árboles de regresión para la familia de los ftalatos presentan un nodo raíz de origen

nacional seguido de un envase de plástico representado en la detección de los ftalatos de bajo peso

molecular (DMP, DEP) de al menos del 72% de las muestras. Por otra parte, los ftalatos de alto

peso molecular excluyendo DBP; tienen como factor más influyente aguas sin gas y DBP tiene

como factor más influyente en la detección como aguas en envase de plástico.

Respecto al 4-tert-octilfenol (TER) se mantuvo como nodo principal aguas con gas con una

combinación de origen internacional que representa la detección de TER en torno a la media que

es congruente con la del nodo principal este árbol presenta un error muy grande respecto al nodo

principal el cual fue de 0.005 y un error relativo de 1 (ver ANEXO FF6).

El ANEXO FF7 indica el árbol de regresión para el acetaminofen (ACE), en la cual el factor más

importante es el origen internacional que al asociarse con un envase de vidrio, representa la

detección de ACE con un error en el nodo principal de 0.035 y un error relativo máximo de uno.

Page 77: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

77

En este sentido el ANEXO FF8 representa el árbol de regresión para CAF, este indica la regla de

tener como nodo principal un agua sin gas con una combinación del factor de vidrio que representa

la detección CAF con un error de 0.0097 en el nodo raíz y un error absoluto de uno. El ANEXO

FF9 indica el árbol de regresión para FLU en donde un agua de origen nacional y un envase de

vidrio representan la detección de FLU con un error en el nodo raíz de 0.00042 y un error absoluto

de 1. Además, el ANEXO FF10 representa el árbol de regresión para GEM en donde se tiene como

nodo principal el factor de un agua con gas con una combinación de un envase de vidrio que

presenta la detección de GEM con un error en el nodo raíz de 0.08 un error absoluto de uno.

Dicho esto, el ANEXO FF11 representa el árbol de regresión para el compuesto PRI en donde el

origen nacional con una combinación de un envase de vidrio presenta la detección de este con un

error en el nodo raíz de 0.004 y une error absoluto de uno. El ANEXO FF12 indica el árbol de

regresión para el BPA en donde se encontró como nodo principal al origen en donde las aguas

nacionales son las causantes de la detección por debajo de los valores de MCL; en este sentido si

se tiene un envase de vidrio estas concentraciones son menores respecto a la media del envase de

plástico en donde las concentraciones son mucho mayores; además de esto combinando el factor

gas en donde se tiene agua sin gas se puede inferir que estas concentraciones se mantendrán por

debajo de la media del nodo principal el error en el nodo raíz esta alrededor de 924.9 con un error

relativo de uno.

El ANEXO FF13 indica el árbol de regresión para la primidona (PRI) en la cual el nodo raíz es el

origen nacional que condiciona la combinación de los nodos envase de vidrio presenta la detección

de PRI con un error en el nodo principal de 0.00288 y un error relativo máximo de uno; el ANEXO

Page 78: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

78

FF14 indica el árbol de regresión para la carbamazepina (CAR) en donde se puede observar un

nodo raíz condicionado por las muestras que no tienen gas en combinación con aguas nacionales

presentan la detección de CAR con un error en el nodo raíz de 1314 y un error relativo de uno y

por último, el ANEXO FF15 indica el minado de datos de la progesterona (PRO) en el cual se

indica como nodo raíz el origen nacional respecto a una combinación de envase de vidrio representa

la detección de PRO respecto a la media que es similar en todos los nodos de 158 ug/L con un error

en el nodo raíz de 0.07.

Por último, se realizó el análisis de bosques aleatorios y Xgboots en donde se hicieron unas tablas

para cada bosque de decisión que contienen la importancia de los factores respecto a cada

compuesto en donde la tabla 24 indica la importancia de los factores para DMP y el ANEXO GG

(1 a 15) indica las tablas para los compuestos restantes.

Tabla 24. Importancia de factores para DMP con Random Forest

Factor I detectado MeanDecreaseAccuracy obb ENVASE 15.20 21.95

28.74% ORIGEN 15.26 14.53 GAS 12.27 16.60

Fuente. Elaboración propia.

En donde I detectado es la importancia de un factor a ser detectado (el número mayor es el más

importante, Mean Decrease Accuary (disminución media en la precisión) es la cantidad o

proporción de observaciones que se clasifican incorrectamente, y OBB estimate (out-of-bag) es

el porcentaje de error del modelo de las muestras definido como el promedio de la exactitud del

modelo prediciendo la variable de respuesta (entre mayor sea este porcentaje menos exacto es el

bosque aleatorio).

Page 79: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

79

Para los compuestos DEP (ANEXO GG1), DOP (ANEXO GG5), FLU (ANEXO GG9) Y CAF

(ANEXO GG8) no se puede notar una diferencia de la importancia de los factores ya que estas son

todas igual a cero; para DEP se puede decir que el nodo de envase tiene una pureza mayor respecto

a los otros dos nodos, pero esto no indica la importancia a diferencia de los otros tres compuestos

en donde el nodo más puro se encuentra en el factor GAS.

Por otra parte, el compuesto TER (ANEXO GG6) presenta una importancia mayor en la detección

cuando se tiene el factor origen con un obb de 2,35% lo cual quiere decir que el bosque aleatorio

es un buen clasificador fuerte de esta regla. En el caso del compuesto DBP (ANEXO GG3) se

tiene un obb de 13,79% mucho mayor al de TER en donde se tiene una importancia mayor en la

no detección de este en el factor gas; y un poco menor en la detección de este cuando se tiene el

factor origen. Este sigue siendo un buen clasificador fuerte ya que obb no es alto.

Respecto al compuesto DMP el OOB sube a 17,24% dando como mayor resultado la importancia

en la detección cuando se tiene el factor envase y en la no detección cuando se tiene el factor gas.

El OBB para TRI (ANEXO GG11), PRI (ANEXO GG13), CAR (ANEXO GG14) y PRO

(ANEXO GG15) fue el mismo que DMP en donde se tiene más importancia de estos respecto a

los factores origen para TRI y envase para CAR , PRO Y PRI además el compuesto GEM (ANEXO

GG10) tiene un OOB igual a 18,39% que sigue siendo un modelo bueno respecto a la clasificación

de los nodos en donde el nodo más importante en la detección de este fue el origen. Respecto a

DIBP (ANEXO GG2), DEHP (ANEXO GG4) , ACE (ANEXO GG7) Y BPA (ANEXO GG12)

se tienen OBBS mayores al 30% lo cual quiere decir que el bosque aleatorio está prediciendo solo

del 50 al 70% de todas las muestras.

Page 80: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

80

Respecto al algoritmo Xgboots la figura 21 describe que compuestos son más importantes en torno

al factor envase, origen y gas en donde se puede observar que el factor gas es mas importante

respecto a la cuantificación de cuatro compuestos que origen y envase, como lo rectifican los

arboles de regresión.

Figura 22. Importancia factores según algoritmo Xg boots

Fuente. Elaboración propia.

Page 81: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

81

4. DISCUSIÓN DE RESULTADOS (capitulo 4).

En este capítulo se describen los más relevantes resultados encontrados con el fin de

compararlos con los resultados encontrados por la literatura científica; por lo cual se desarrolló la

tabla 25 con el fin de clasificar la importancia de estos con las implicaciones que llevan además de

los análisis que fueron congruentes con sus resultados.

Como se puede observar en la tabla 25 el numeral uno indica como factor principal el envase de

vidrio en casi todos los compuestos, en este sentido cabe destacar que se han realizado estudios en

donde se caracteriza la calidad del agua entorno a los ftalatos y al 4-terc-octilfenol teniendo en

cuenta factores como el envase, la forma, agua carbonatada (con gas) y el tiempo de

almacenamiento; en este sentido Guart et al observo que la forma del contenedor no afecta la

calidad del agua. Tampoco el tiempo de almacenamiento, dado que los constituyentes detectados

en las muestras recién embotelladas fueron congruentes en los que fueron almacenados durante un

año (2014).

También concluyo que solo el agua carbonatada puede aumentar ligeramente los procesos de

migración, que en general están relacionados con el tipo de monómero o material plástico utilizado

para fabricar el envase, el análisis de Guart et al también revela que las botellas de plástico de

polietileno tereftalato (PET) con una tapa de polietileno de alta densidad, que son la mayoría de las

botellas de agua en el mercado español y también en el mercado Colombiano, tienen bajos niveles

de plastificantes y que solo el vidrio con tapas metálicas como de plástico, indican un aumento

general en el número de muestras ( 2014).

Page 82: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

82

Tabla 25. Resultados relevantes

# RESULTADO IMPLICACIONES ANALISIS CONGRUENTES

1 14 / 16 compuestos pueden ser detectados si se tiene envase Vidrio

Envase vidrio poca capacidad predictiva respecto a Acetaminofén y Cafeína

AMI, CT- MET, CT-DEPH, RT-ETI, RT-BUT, RF-MET, RF-CAR, RF-PRO, RF-PRI

2

11/16 compuestos están en concentraciones medias si se tiene un agua carbonatada de origen nacional

Agua internacional carbonatada presenta concentraciones mayores si es carbonantada

RT-COMPUESTOS,XGboots

3 Muestras con envase de vidrio se diferencian si tienen gas o no, respecto a plastificantes

Envase de plástico no presenta diferencias respecto a las concentraciones de los plastificantes

KW-MULTIVARIADO

4 Muestras internacionales se diferencian si tienen gas de las que no, respecto a plastificantes

Muestras de Origen Nacional no presentan diferencias respecto a las concentraciones de los plastificantes

KW-MULTIVARIADO

5 Muestras sin gas son diferentes si son nacionales o internacionales respecto a fármacos y hormonas

Muestras con gas no presentan diferencias respecto a las concentraciones de los fármacos y hormonas

KW-MULTIVARIADO

6 Acetaminofén puede ser detectado si se tiene un envase de plástico

No depende de gas ni de origen AMI

7 Cafeína puede ser detectado si se tiene un agua con gas

No depende de envase ni de origen AMI

8 Dimetilftalato depende principalmente muestras con envase vidrio y gas

No detección Dimetilftalato está en muestras vidrio y sin gas

CT-MET, KW-VIDRIO-MET, KW-GAS-MET, KW-MULTIVARIADO, AMI, RF-MET

9 Bis-2-etil-hexil-ftalato y Dibutilftalato dependen principalmente aguas envase vidrio y origen internacional

Factor gas no condiciona detección de Bis-2-etil-hexil-ftalato y Dibutilftalato

CT-DEPH, RT-BUT, AMI, RF-BUT

10 Di-iso-butilftalato depende principalmente aguas envase vidrio, origen internacional y sin gas

Envase no condiciona detección de Di-iso-butilftalato

CT-ISO, KW-ISO, KW-MULTIVARIADO

11

Di-n-octil-ftalato puede ser detectado si se tiene un envase vidrio además las probabilidades de detección aumentan cuando se tiene agua con gas y de origen internacional

Los tres factores son condicionantes de forma significativa cuando se detecta Di-n-octil-ftalato

AMI, RT-OCT, KW-OCT, KW-MULTIVARIADO

AMI= Información promedio mutua (mutual average information), CT-Compuesto= Arbol de decisión para determinado

compuesto (Classification Tree), RT- Compuesto = Arbol de regresión para determinado compuesto (Regression Tree),

RF- Compuesto = Bosque aleatorio para determinado compuesto (Random Forest), KW- Compuesto = Test no

paramétrico de Kruskal Wallis para determinado compuesto, KW-Multivariado= Test no paramétrico de Kruskal Wallis

para todas las variables.

Fuente. Elaboración propia.

Page 83: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

83

También indica los porcentajes de detección de los compuestos en donde la figura 23 indica los

porcentajes de detección respecto a Colombia, España y Mexico.

Figura 23.porcentajes de detección de disruptores endocrinos encontrados en Colombia,

España y México.

Fuente. Elaboración propia.

Esto da a entender que la regulación de estos aditivos a la hora de fabricación y procesamiento del

envase juega un papel muy importante ya que se puede observar un aumento muy grande en los

porcentajes de detección de las aguas colombianas con las aguas Españolas y Mexicanas; en este

sentido el mediante la resolución 683 del 2012 y 12186 del 91 se pueden controlar estas sustancias

siguiendo los procedimientos a la hora del envasado del agua (MINISTERIO DE SALUD 1991;

INVIMA 2012). Una cuestión preocupante fue el valor máximo de concentración de BPA ya que

las botellas comercializadas en España tienen valores mucho más pequeños que los encontrados

este estudio, el valor máximo de concentraciones de BPA encontrados en este estudio fue de 221

ug/L mientras que en el estudio de Guart es de 24,2ug/L valor 9 veces mayor que fue encontrado

en un agua de envase de plástico sin gas y de origen internacional, esto hace pensar que los aditivos

0102030

405060708090

100

% de Deteccion España Guart et al (2014) 724 muestras

% de Deteccion Colombia 174 muestras

% de Deteccion Mexico Vazquez 2(2017) 24 muestras

Page 84: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

84

utilizados en el empaquetamiento de las botellas en Colombia respecto a BPA están bien

controlados en comparación a aguas internacionales en donde se encontraron las concentraciones

más altas de BPA (2014). Cabe mencionar que respecto a la cuantificación de estos resultados un

agua carbonatada e internacionales presentan concentraciones más altas que aguas nacionales y sin

gas, pero estas concentraciones relativamente altas respecto a la media de las 174 muestras de agua

analizadas no son preocupantes según el nivel máximo de contamínate (MCL) encontrado en la

metodología del grado de toxicidad aplicada por lo cual estas concentraciones no generan efectos

adversos a la salud humana.

Por otra parte la asociación de los factores respecto a los contaminantes evaluados concuerdan en

que DEHP se detecta en botellas de vidrio adicionando un factor que es la tapa (metal o plástico)

igualmente ETI, TER se asociaron también con botellas de vidrio con una tapa de metálica; BPA

se detectó principalmente en botellas de policarbonato pero también en botellas de vidrio con una

tapa metálica (Guart et al. 2014) que apoyan los resultados obtenidos en esta investigación en donde

la detección de estos compuestos depende principalmente del envase de vidrio ya sean tapas

metálicas o de plástico.

Además, se comparó los resultados de las concentraciones obtenidas en puntos de monitoreo de

los embalses de Chingaza, Tibitoc, Zumapaz que suministran el agua potable en Bogotá; la figura

24 indica las concentraciones máximas que se hallaron en cada uno de los compuestos encontrados

tanto en el agua embotellada como en el agua potable indicando valores muy altos de DEPH

preocupantes para la salud humana en el agua potable y valores bajos de BPA en esta. Esto genera

preocupación ya que una concentración de 100 ug/L en el agua potable de DEPH se ve asociada a

Page 85: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

85

los efectos adversos a la salud humana que pueden concurrir en enfermedades como bajo desarrollo

en sistemas reproductivos y daño en el ADN(Cooper, Kendig, and Belcher 2011b, 2).

Figura 24. Concentraciones de disruptores endocrinos encontrados en agua potable

distribuida en Bogotá y agua embotellada comercializada en Bogotá.

Fuente. Elaboración propia.

Bis-2-etil-hexilftalato

Dietilftalato

Dipentilftalato

Di-n-hexilftalato

Bis-n-butoxietilftalato

4-tert.octilfenol

Progesterona

bisfenol A

100.7

11.5

13.84

37.26

8.45

0

0.33

64.3

0.03

0.001

0

0

0

0.17

1.78

221.146

CONCENTRACIONES (UG/L)

agua embotellada agua potable

Page 86: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

86

5. CONCLUSIONES

• El factor que tiene mayor grado de influencia sobre la detección los disruptores endocrinos

encontrados es el envase de vidrio

• El factor que tiene mayor grado de influencia sobre la cuantificación de los disruptores

endocrinos encontrados son aguas carbonatadas.

• Los ftalatos de alto peso molecular presentan concentraciones altas si las muestras de agua

son nacionales y carbonatadas.

• Los ftalatos de bajo peso molecular presentan concentraciones altas si las muestras tienen

un origen internacional a pesar de que la detección de estos es mayor en el mercado

colombiano.

• Los medicamentos presentan concentraciones medias si las muestras de agua tienen gas.

• El agua potable distribuida en Bogotá presenta concentraciones mayores respecto a el agua

embotellada en especial por DEHP que representa un riesgo para la salud respecto a el

MCL.

• Las muestras de agua nacionales en plástico y sin gas son las menos influyentes en la

detección y cuantificación de los disruptores endocrinos

• El dimetilftalto está condicionado por el envase de vidrio, pero además del gas; esto quiere

decir que estos factores no son independientes, y al asociarse generan mayor probabilidad

de detección de este compuesto; por otra parte, esto da a entender que las aguas sin gas

están asociadas a la no detección de este y que el que tiene menos importancia en la

detección de este es el origen.

• Bis-2-etil-hexil-ftalato y Dibutilftalato igual que Dimetilftalato están condicionados por el

envase de vidrio, pero a diferencia de este último, también es de gran importancia el origen

Page 87: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

87

internacional; dicho esto cabe decir que los ftalatos de bajo peso molecular como

Dimetilftalato son diferentes de los de alto peso molecular ya que mientras uno depende

del vidrio y el gas los otros no están condicionados por el gas; además que un origen

colombiano no condiciona la detección de este.

• El Di-iso-butilftalato a pesar de tener la misma composición de Dibutilftalato depende

principalmente de aguas de vidrio con origen internacional y que no sean carbonatadas, por

lo cual un cambio en la estructura de los radicales también condicionara un factor más para

la predicción de la detección de este.

• Di-n-octilftalato al igual que Di-iso-butilftalato dependen de los tres factores con la

diferencia de que si se tiene un agua carbonatada de origen internacional las probabilidades

de que aparezca este compuesto serán mayores.

• Los ftalatos en combinación con dos o tres factores indican que un agua internacional en la

mayoría de los casos tiene mayor capacidad predictiva de la detección que un agua nacional;

prueba de esto es el BPA en donde las concentraciones más altas fueron entorno a las de un

origen internacional.

Page 88: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

88

6. RECOMENDACIONES

Se recomienda estudiar los caminos por los cuales acetaminofén está asociado con el envase

plástico, ya que la literatura científica se ha centrado en este, pero en temas de toxicología, medicina

y agua residual pero no en cuales pueden ser los posibles caminos por los cuales llega al agua

embotellada.

En este mismo sentido se recomienda estudiar los caminos de la cafeína y cual es realmente la

asociación que tiene esta con el gas; ya que la literatura científica ha estudiado estas

concentraciones en bebidas gaseosas, te, jugos etc. pero no en el agua con gas como tal.

Identificar los procesamientos de embasamiento que reciben las aguas comercializadas en Bogotá

con el fin de conocer cuáles pueden ser los factores que pueden jugar un papel importante antes del

envasado de estas.

Identificar el grado de influencia que tiene el Polietileno de alta densidad (HDPE) presente en las

tapas de las botellas de agua ya que este está asociado a la migración de los plastificantes

encontrados en las muestras de vidrio.

Page 89: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

89

BIBLIOGRAFIA

Albouy-Llaty, Marion, Frédérike Limousi, Camille Carles, Antoine Dupuis, Sylvie Rabouan, and Virginie

Migeot. 2016. “Association between Exposure to Endocrine Disruptors in Drinking Water and

Preterm Birth, Taking Neighborhood Deprivation into Account: A Historic Cohort Study.”

International Journal Of Environmental Research And Public Health 13 (8).

https://doi.org/10.3390/ijerph13080796.

Alemán, Escondrillas Gabriela, y Torres Nimbe Torres, and Palacio Armando Roberto Tovar. 2004. “Los

receptores activados por proliferadores de peroxisomas (PPARs) en el desarrollo de obesidad y

resistencia a la insulina,” 2004.

Analytics Vidhya. 2016. “A Complete Tutorial on Tree Based Modeling from Scratch (in R & Python).”

April 12, 2016. https://www.analyticsvidhya.com/blog/2016/04/complete-tutorial-tree-based-

modeling-scratch-in-python/.

Benson, Robert. 2009. “Hazard to the Developing Male Reproductive System from Cumulative Exposure

to Phthalate Esters—dibutyl Phthalate, Diisobutyl Phthalate, Butylbenzyl Phthalate, Diethylhexyl

Phthalate, Dipentyl Phthalate, and Diisononyl Phthalate.” Regulatory Toxicology and

Pharmacology 53 (2):90–101. https://doi.org/10.1016/j.yrtph.2008.11.005.

Chessel, Daniel, and Anne-Béatrice Dufour. 2017. “Principal Component Analysis. R Documentation.”

Package ade4 version 1.7-4.

Christian, Diener. 2014. “Bosques Aleatorios (Random Forests).”

Cooper, James E., Eric L. Kendig, and Scott M. Belcher. 2011a. “Assessment of Bisphenol A Released

from Reusable Plastic, Aluminium and Stainless Steel Water Bottles.” Chemosphere 85 (6):943–

47. https://doi.org/10.1016/j.chemosphere.2011.06.060.

———. 2011b. “Assessment of Bisphenol A Released from Reusable Plastic, Aluminium and Stainless

Steel Water Bottles.” Chemosphere 85 (6):943–47.

https://doi.org/10.1016/j.chemosphere.2011.06.060.

Deshpande, Bala. 2011. “2 Main Differences between Classification and Regression Trees.” 2011.

http://www.simafore.com/blog/bid/62482/2-main-differences-between-classification-and-

regression-trees.

Dhaini, Hassan, and Rana Nassif. 2014. “Exposure Assessment of Endocrine Disruptors in Bottled

Drinking Water of Lebanon.” Environmental Monitoring & Assessment 186 (9):5655–62.

https://doi.org/10.1007/s10661-014-3810-x.

Diamanti-Kandarakis, Evanthia, Jean-Pierre Bourguignon, Linda C. Giudice, Russ Hauser, Gail S. Prins,

Ana M. Soto, R. Thomas Zoeller, and Andrea C. Gore. 2009. “Endocrine-Disrupting Chemicals:

An Endocrine Society Scientific Statement.” Endocrine Reviews 30 (4):293–342.

https://doi.org/10.1210/er.2009-0002.

Dray, Stéphane, and Anne-Béatrice Dufour. 2007. “The ade4 Package: Implementing the Duality

Diagram for Ecologists.” Journal of Statistical Software 22 (4).

https://doi.org/10.18637/jss.v022.i04.

Page 90: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

90

EPA, OW. 2015. “How EPA Regulates Drinking Water Contaminants.” Collections and Lists. US EPA.

September 1, 2015. https://www.epa.gov/dwregdev/how-epa-regulates-drinking-water-

contaminants.

Filzmoser, Peter, Ricardo Maronna, and Mark Werner. 2008. “Outlier Identification in High Dimensions.”

Computational Statistics & Data Analysis 52 (3):1694–1711.

https://doi.org/10.1016/j.csda.2007.05.018.

FundAlborada. 2015. Dr. Nicolás Olea. Jornada Sobre Disruptores Endocrinos, 13/10/2015.

https://www.youtube.com/watch?v=G5-ysuKHNL4.

Gómez, M.J., M.J. Martínez Bueno, S. Lacorte, A.R. Fernández-Alba, and A. Agüera. 2007. “Pilot Survey

Monitoring Pharmaceuticals and Related Compounds in a Sewage Treatment Plant Located on the

Mediterranean Coast.” Chemosphere 66 (6):993–1002.

https://doi.org/10.1016/j.chemosphere.2006.07.051.

Gonzales, Agudelo Marco Antonio, Lotero William Dario Lopera, and Villa Alvaro Arango. 2014.

Manual de Terapeutica. 16a edicion. Colombia: CIB Fondo Editorial.

Gschwandtner, Peter Filzmoser and Moritz. 2017. Mvoutlier: Multivariate Outlier Detection Based on

Robust Methods (version 2.0.8). https://cran.r-project.org/web/packages/mvoutlier/index.html.

Guart, Albert, Francisco Bono-Blay, Antonio Borrell, and Silvia Lacorte. 2014. “Effect of Bottling and

Storage on the Migration of Plastic Constituents in Spanish Bottled Waters.” Food Chemistry 156

(August):73–80. https://doi.org/10.1016/j.foodchem.2014.01.075.

Hernández, Nathalie Rodríguez, Nelson Neira Obregón, and Andrés Torres. 2016. “Identificación de

factores de tipo categórico relacionados con la condición estructural de tuberías de alcantarillado

en Bogotá a partir de conceptos de entropía de la información.” s 12 (19):63–71.

https://doi.org/http://dx.doi.org/10.16925/in.v12i19.1194.

INVIMA. 2012. “RESOLUCION 683, reglamento general envases.”

https://www.invima.gov.co/images/pdf/normatividad/alimentos/resoluciones/resoluciones/2012/2

RESOLUCION_683_DE_2012_reglamento_general_envases.pdf.

———. 2017. “Sistema de Tramites En Linea - Consultas Publicas-Agua Potable Envasada.” 2017.

http://farmacovigilancia.invima.gov.co:8082/Consultas/consultas/consreg_encabcum.jsp.

Jeddi, Maryam Zare, Noushin Rastkari, Reza Ahmadkhaniha, and Masud Yunesian. 2015.

“Concentrations of Phthalates in Bottled Water under Common Storage Conditions: Do They

Pose a Health Risk to Children?” Food Research International 69 (March):256–65.

https://doi.org/10.1016/j.foodres.2014.11.057.

Kabacoff, Robert I. 2017. “Quick-R: Tree-Based Models.” 2017.

https://www.statmethods.net/advstats/cart.html.

Katsikantami, Ioanna, Stavros Sifakis, Manolis N. Tzatzarakis, Elena Vakonaki, Olga-Ioanna Kalantzi,

Aristidis M. Tsatsakis, and Apostolos K. Rizos. 2016. “A Global Assessment of Phthalates

Burden and Related Links to Health Effects.” Environment International 97 (December):212–36.

https://doi.org/10.1016/j.envint.2016.09.013.

Page 91: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

91

Kim, Tae Kyun. 2017. “Understanding One-Way ANOVA Using Conceptual Figures.” Korean Journal of

Anesthesiology 70 (1):22–26. https://doi.org/10.4097/kjae.2017.70.1.22.

Li, Xu, Guang-Guo Ying, Hao-Chang Su, Xiao-Bing Yang, and Li Wang. 2010. “Simultaneous

Determination and Assessment of 4-Nonylphenol, Bisphenol A and Triclosan in Tap Water,

Bottled Water and Baby Bottles.” Environment International 36 (6):557–62.

https://doi.org/10.1016/j.envint.2010.04.009.

Marroni’s, Fabio. 2017. “Perform Pairwise Wilcoxon Test, Classify Groups by Significance and Plot

Results.” 2017. https://fabiomarroni.wordpress.com/2017/03/25/perform-pairwise-wilcoxon-test-

classify-groups-by-significance-and-plot-results/.

Mendiburu, Felipe de. 2016. Agricolae: Statistical Procedures for Agricultural Research (version 1.2-4).

https://cran.r-project.org/web/packages/agricolae/index.html.

MINISTERIO DE SALUD. 1991. “RESOLUCION 12186.”

Moral, María Pilar Martínez. 2015. “Métodos Analíticos Para La Determinación de Compuestos

Disruptores Endocrinos.” Http://purl.org/dc/dcmitype/Text, Universidad de La Rioja.

https://dialnet.unirioja.es/servlet/tesis?codigo=44392.

Muhamad, Mimi Suliza, Mohd Razman Salim, Woei Jye Lau, and Zulkifli Yusop. 2016. “A Review on

Bisphenol A Occurrences, Health Effects and Treatment Process via Membrane Technology for

Drinking Water.” Environmental Science and Pollution Research 23 (12):11549–67.

https://doi.org/10.1007/s11356-016-6357-2.

Mustieles, Vicente, Rocío Pérez-Lobato, Nicolás Olea, and Mariana F. Fernández. 2015. “Bisphenol A:

Human Exposure and Neurobehavior.” NeuroToxicology 49 (July):174–84.

https://doi.org/10.1016/j.neuro.2015.06.002.

Nam, Sung-Hyun, Young-Min Seo, and Man-Goo Kim. 2010. “Bisphenol A Migration from

Polycarbonate Baby Bottle with Repeated Use.” Chemosphere 79 (9):949–52.

https://doi.org/10.1016/j.chemosphere.2010.02.049.

National Center for Biotechnology Information. 2017a. “Bisphenol A.” 2017.

https://pubchem.ncbi.nlm.nih.gov/compound/8343.

———. 2017b. “DEHP.” 2017. https://pubchem.ncbi.nlm.nih.gov/compound/8343.

———. 2017c. “DIBUTYL PHTHALATE.” 2017. https://pubchem.ncbi.nlm.nih.gov/compound/3026.

———. 2017d. “DIISOBUTYL PHTHALATE.” 2017.

https://pubchem.ncbi.nlm.nih.gov/compound/6782.

Navalón Montón, Alberto. 2013. “Crean Metodologías Analíticas Para Determinar La Presencia de

Disruptores Endocrinos En Muestras de Tejidos Humanos.” CienciaDirecta (blog). June 4, 2013.

Pubchem. 2017a. “4-Tert-Octylphenol.” 2017. https://pubchem.ncbi.nlm.nih.gov/compound/8814.

Page 92: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

92

———. 2017b. “DIETHYL PHTHALATE National Center for Biotechnology Information.PubChem

Compound Database.” 2017. https://pubchem.ncbi.nlm.nih.gov/compound/6781.

———. 2017c. “DIISOBUTYL PHTHALATE National Center for Biotechnology Information. PubChem

Compound Database.” 2017. https://pubchem.ncbi.nlm.nih.gov/compound/6782.

———. 2017d. “Dimethyl Phthalate National Center for Biotechnology Information.PubChem

Compound Database.” 2017. https://pubchem.ncbi.nlm.nih.gov/compound/8554.

———. 2017e. “Dioctyl Phthalate National Center for Biotechnology Information.PubChem Compound

Database.” 2017. https://pubchem.ncbi.nlm.nih.gov/compound/8346.

———. 2017f. “Ibuprofen.” 2017. https://pubchem.ncbi.nlm.nih.gov/compound/3672.

———. 2017g. “Triclosan.” 2017. https://pubchem.ncbi.nlm.nih.gov/compound/5564.

R Foundation for Statistical Computing .R. 2016. “A Language and Environment for Statistical

Computing R Core .” https://www.R-project.org/.

Real, Macarena, José-Manuel Molina-Molina, Inmaculada Jiménez-Díaz, Juan Pedro Arrebola, José-

María Sáenz, Mariana F. Fernández, and Nicolás Olea. 2015. “Screening of Hormone-like

Activities in Bottled Waters Available in Southern Spain Using Receptor-Specific Bioassays.”

Environment International 74 (January):125–35. https://doi.org/10.1016/j.envint.2014.10.006.

RESTEK CORPORATION. 2016a. “Certificate of Analysis EPA Method 8061A Phthalate Esters

Mixture.”

———. 2016b. “Certificate of Analysis EPA Method Mix Pharmaceuticals 1.”

———. 2016c. “Certificate of Analysis EPA Method Mix Pharmaceuticals 2.”

———. 2016d. “Certificate of Analysis EPA Method Steroids and Mixed Pharmaceuticals Mix.”

Rhomberg, Lorenz R., and Julie E. Goodman. 2012. “Low-Dose Effects and Nonmonotonic Dose–

responses of Endocrine Disrupting Chemicals: Has the Case Been Made?” Regulatory Toxicology

and Pharmacology 64 (1):130–33. https://doi.org/10.1016/j.yrtph.2012.06.015.

Richter, Catherine A., Julia A. Taylor, Rachel L. Ruhlen, Wade V. Welshons, and Frederick S. vom Saal.

2007. “Estradiol and Bisphenol A Stimulate Androgen Receptor and Estrogen Receptor Gene

Expression in Fetal Mouse Prostate Mesenchyme Cells.” Environmental Health Perspectives 115

(6):902–8. https://doi.org/10.1289/ehp.9804.

Rubin, Beverly S. 2011. “Bisphenol A: An Endocrine Disruptor with Widespread Exposure and Multiple

Effects.” The Journal of Steroid Biochemistry and Molecular Biology, Endocrine Disruptors, 127

(1–2):27–34. https://doi.org/10.1016/j.jsbmb.2011.05.002.

Rudel, Ruthann A., Janet M. Gray, Connie L. Engel, Teresa W. Rawsthorne, Robin E. Dodson, Janet M.

Ackerman, Jeanne Rizzo, Janet L. Nudelman, and Julia Green Brody. 2011. “Food Packaging and

Bisphenol A and Bis(2-Ethyhexyl) Phthalate Exposure: Findings from a Dietary Intervention.”

Environmental Health Perspectives 119 (7):914–20. https://doi.org/10.1289/ehp.1003170.

Page 93: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

93

Shimadzu Corporation. 2017. “GCMS-QP2010 SE Standard Gas Chromatograph-Mass Spectrometer :

SHIMADZU.” 2017. http://www.shimadzu.com/an/gcms/qp2010se.html.

Siberchicot, Aurélie. 2017. “Multiple Correspondence Analysis; dudi.acm function |R Documentation.”

https://www.rdocumentation.org/packages/ade4/versions/1.7-8/topics/dudi.acm.

Terrádez, Gurrea Manuel. 2017. “Análisis de componentes principales.”

https://www.uoc.edu/in3/emath/docs/Componentes_principales.pdf.

Theodorsson-Norheim, Elvar. 1986. “Kruskal-Wallis Test: BASIC Computer Program to Perform

Nonparametric One-Way Analysis of Variance and Multiple Comparisons on Ranks of Several

Independent Samples.” Computer Methods and Programs in Biomedicine 23 (1):57–62.

https://doi.org/10.1016/0169-2607(86)90081-7.

Tijani, Jimoh O., Ojo O. Fatoba, Omotola O. Babajide, and Leslie F. Petrik. 2015. “Pharmaceuticals,

Endocrine Disruptors, Personal Care Products, Nanomaterials and Perfluorinated Pollutants: A

Review.” Environmental Chemistry Letters 14 (1):27–49. https://doi.org/10.1007/s10311-015-

0537-z.

US EPA, OW. 2015. “National Primary Drinking Water Regulations.” Overviews and Factsheets. US

EPA. November 30, 2015. https://www.epa.gov/ground-water-and-drinking-water/national-

primary-drinking-water-regulations.

Vandenberg, Laura N. 2011. “Exposure to Bisphenol A in Canada: Invoking the Precautionary Principle.”

CMAJ : Canadian Medical Association Journal 183 (11):1265–70.

https://doi.org/10.1503/cmaj.101408.

Vazquez, Marcela, Rey Gutiérrez, Arturo Escobar, Juan G Rivera, and Salvador Vega. 2017. “Presencia

de ftalatos en agua embotellada comercializada en la ciudad de México y su migración durante el

almacenamiento a diferentes temperaturas.” Tecnología y Ciencias del Agua,.

Wagner, Martin, and Jörg Oehlmann. 2011. “Endocrine Disruptors in Bottled Mineral Water: Estrogenic

Activity in the E-Screen.” The Journal of Steroid Biochemistry and Molecular Biology, Endocrine

Disruptors, 127 (1–2):128–35. https://doi.org/10.1016/j.jsbmb.2010.10.007.

Walia, Anish Singh. 2017. “Random Forests in R.” 2017. https://datascienceplus.com/random-forests-in-

r/.

Whitley, Elise, and Jonathan Ball. 2002. “Statistics Review 6: Nonparametric Methods.” Critical Care 6

(6):509–13.

Yanina G. Muñoz Reyes. 2015. “Influencia Del pH En La Absorción de Los Fármacos.” Ciencias.

https://es.slideshare.net/Yaninin/influencia-del-ph-en-la-absorcin-de-los-frmacos.

Page 94: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

94

ANEXOS

Page 95: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

95

ANEXO A. Código diseño experimental en R.

rm(list=ls(all=TRUE))

library(agricolae)

trt=c(1:8)

k=4

res=design.bib(trt,k)

write.csv(res$book,"resultado.csv",row.names=FALSE)

muestras=res$statistics$treatmeans*res$statistics$r

muestras

ANEXO B. Cromatógrafo de Gases GC _MS 2010 Shimadzu (sistema GC-MS)

Fuente. Elaboración propia

Page 96: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

96

ANEXO C. Cartuchos de silica C18 hiperSept.

Fuente. Elaboración propia

Page 97: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

97

ANEXO D. Filtros de celulosa 0,45um.

Fuente. https://es.aliexpress.com/w/wholesale-cellulose-membrane.html

ANEXO E. Vial de 1 mL.

Fuente. Elaboración propia

.

Page 98: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

98

ANEXO F. Retención de minerales (A) y retención de disruptores endocrinos (B)

Fuente. Esta investigación 2017.

ANEXO G. Certificado de análisis del patrón de mezcla de esteres y ftalatos (ver carpeta de

ANEXOS).

ANEXO H. Carpeta que contiene archivos txt de ftalatos arrojados del análisis

cromatográfico (ver carpeta de ANEXOS).

Page 99: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

99

ANEXO H.1. Cromatograma estándar de patrón de ftalatos y esteres.

Fuente. (RESTEK CORPORATION 2016a)

Page 100: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

100

ANEXO I. Cromatograma de patrón de ftalatos y esteres.

Fuente. Elaboración propia.

Page 101: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

101

ANEXO J. Carpeta que contiene archivos txt de ftalatos arrojados del análisis

cromatográfico (ver carpeta de ANEXOS)

ANEXO K. Ficha de datos de seguridad de mezcla de esteroides y farmacéuticos (ver carpeta

de ANEXOS)

ANEXO L. Certificado de análisis del patrón de mezcla de esteroides y farmacéuticos (ver

carpeta de ANEXOS)

Page 102: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

102

ANEXO L.1. Cromatograma general de mezcla de esteroides y mezcla de farmacéuticos

Fuente.(RESTEK CORPORATION 2016).

Page 103: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

103

ANEXO M. Ficha de datos de seguridad de mezcla de farmacéuticos 1 (ver carpeta de ANEXOS)

ANEXO N. Certificado de análisis del patrón de mezcla de hormonas y farmacéuticos (ver carpeta de ANEXOS)

ANEXO N.1. Cromatograma general de mezcla de farmacéuticos 1.

Fuente. (RESTEK CORPORATION 2016b).

Page 104: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

104

ANEXO O. Ficha de datos de seguridad de mezcla de farmacéuticos 2 (ver carpeta de ANEXOS)

ANEXO P. Certificado de análisis del patrón de mezcla de farmacéuticos 2 (ver carpeta de ANEXOS)

ANEXO P.1. Cromatograma general de mezcla de farmacéuticos 2.

Fuente. (RESTEK CORPORATION 2016c).

Page 105: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

105

ANEXO Q. Cromatograma específico de mezcla de farmacéuticos final.

Fuente. Elaboración propia.

Page 106: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

106

ANEXO R. Carpeta que contiene archivos txt de farmacéuticos arrojados del análisis

cromatográfico (ver carpeta de ANEXOS)

ANEXO S. Matriz total de compuestos en Excel (ver carpeta de ANEXOS)

ANEXO T. Código de análisis de componentes principales (PCA) en R.

rm(list=ls(all=TRUE)) M=read.table("datos.txt",header=TRUE) attach(M) plot(M[,5:20],pch=20) library(ade4) Mpca<-dudi.pca(M[,5:dim(M)[2]]) pve <- 100 * Mpca$eig /sum(Mpca$eig) cumsum(pve) wth=3*580 hth=wth/2^(.5) tiff(filename="A-figura1.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #fig1 s.label(Mpca$li, xax = 1, yax = 2) dev.off() wth=3*580 hth=wth/2^(.5) tiff(filename="B-CLUSTERS.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #fig2 - separacion por clusters cl <- kmeans(M[,5:20], 4) s.class(dfxy=Mpca$li, fac= as.factor(cl$cluster), col=names(table(cl$cluster)),xax=1,yax=2) cluster=cbind(M[,1:4], cl$cluster) dev.off() wth=3*580

Page 107: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

107

hth=wth/2^(.5) tiff(filename="C-ENVASE.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #fig3 - separacion por envase s.class(dfxy=Mpca$li, fac= as.factor(ENVASE), col=c(1:length(ENVASE)),xax=1,yax=2) dev.off() wth=3*580 hth=wth/2^(.5) tiff(filename="D-ORIGEN.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #fig4 - separacion por origen s.class(dfxy=Mpca$li, fac= as.factor(ORIGEN), col=c(1:length(ORIGEN)),xax=1,yax=2) dev.off() wth=3*580 hth=wth/2^(.5) tiff(filename="E-GAS.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #fig5 - separacion por gas s.class(dfxy=Mpca$li, fac= as.factor(GAS), col=c(1:length(GAS)),xax=1,yax=2) dev.off() wth=3*580 hth=wth/2^(.5) tiff(filename="F-VARIABLES.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #fig6 - analisis de variables s.corcircle(Mpca$co, xax = 1, yax = 2) dev.off() wth=3*580 hth=wth/2^(.5) tiff(filename="G-MUESTRASYVARIABLES.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #fig7 - muestras y variables scatter(Mpca) dev.off()

Page 108: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

108

ANEXO U. Código en R para análisis de Outliers.

rm(list=ls(all=TRUE)) library(mvoutlier) M=read.table("datos.txt",header=TRUE) attach(M) Y=M[,5:20] Y2=cbind(Y[,c(7:14,16)]) x.out=pcout(Y2,makeplot=FALSE,explvar =.75) out1=x.out$wfinal01 table(out1) outpropio=matrix(1,174,1) outpropio[which(x.out$x.dist1>100)]=0, table(outpropio) outpropio=matrix(1,174,1) outpropio[which(x.out$x.dist1>75)]=0, table(outpropio) outpropio=matrix(1,174,1) outpropio[which(x.out$x.dist1>50)]=0, table(outpropio) outpropio=matrix(1,174,1) outpropio[which(x.out$x.dist1>10)]=0, table(outpropio) ANEXO V. Código de análisis de correspondencia múltiple (MCA) en R.

rm(list=ls(all=TRUE)) M=read.table("datos.txt",header=TRUE) attach(M) #transforma a factores METf=MET METf[which(MET<=0)]="1-NO-DETECTADO" METf[which(MET>=7000)]="3-ALTO" METf[which(MET<7000 & MET>0)]="2-BAJO" ETIf=ETI ETIf[which(ETI<=0)]="1-NO-DETECTADO" ETIf[which(ETI>=5600)]="3-ALTO" ETIf[which(ETI<5600 & ETI>0)]="2-BAJO"

Page 109: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

109

ISOf=ISO ISOf[which(ISO<=0)]="1-NO-DETECTADO" ISOf[which(ISO>=700)]="3-ALTO" ISOf[which(ISO<700 & ISO>0)]="2-BAJO" BUTf=BUT BUTf[which(BUT<=0)]="1-NO-DETECTADO" BUTf[which(BUT>=700)]="3-ALTO" BUTf[which(BUT<700 & BUT>0)]="2-BAJO" BISf=BIS BISf[which(BIS<=0)]="1-NO-DETECTADO" BISf[which(BIS>=0)]="3-ALTO" BISf[which(BIS<0 & BIS>0)]="2-BAJO" OCTf=OCT OCTf[which(OCT<=0)]="1-NO-DETECTADO" OCTf[which(OCT>=280)]="3-ALTO" OCTf[which(OCT<280 & OCT>0)]="2-BAJO" TERf=TER TERf[which(TER<=0)]="1-NO-DETECTADO" TERf[which(TER>=1190)]="3-ALTO" TERf[which(TER<1190 & TER>0)]="2-BAJO" ACEf=ACE ACEf[which(ACE<=0)]="1-NO-DETECTADO" ACEf[which(ACE>=304377.826)]="3-ALTO" ACEf[which(ACE<304377.826 & ACE>0)]="2-BAJO" CAFf=CAF CAFf[which(CAF<=0)]="1-NO-DETECTADO" CAFf[which(CAF>=21000)]="3-ALTO" CAFf[which(CAF<21000 & CAF>0)]="2-BAJO" FLUf=FLU FLUf[which(FLU<=0)]="1-NO-DETECTADO" FLUf[which(FLU>=58100)]="3-ALTO" FLUf[which(FLU<58100 & FLU>0)]="2-BAJO" GEMf=GEM GEMf[which(GEM<=0)]="1-NO-DETECTADO" GEMf[which(GEM>=91301)]="3-ALTO" GEMf[which(GEM<91301 & GEM>0)]="2-BAJO" TRIf=TRI

Page 110: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

110

TRIf[which(TRI<=0)]="1-NO-DETECTADO" TRIf[which(TRI>=42000000)]="3-ALTO" TRIf[which(TRI<42000000 & TRI>0)]="2-BAJO" BISAf=BISA BISAf[which(BISA<=0)]="1-NO-DETECTADO" BISAf[which(BISA>=35)]="3-ALTO" BISAf[which(BISA<35 & BISA>0)]="2-BAJO" PRIf=PRI PRIf[which(PRI<=0)]="1-NO-DETECTADO" PRIf[which(PRI>=114128)]="3-ALTO" PRIf[which(PRI<114128 & PRI>0)]="2-BAJO" CARf=CAR CARf[which(CAR<=0)]="1-NO-DETECTADO" CARf[which(CAR>=105000)]="3-ALTO" CARf[which(CAR<105000 & CAR>0)]="2-BAJO" PROf=PRO PROf[which(PRO<=0)]="1-NO-DETECTADO" PROf[which(PRO>=15218)]="3-ALTO" PROf[which(PRO<15218 & PRO>0)]="2-BAJO" Mf=cbind(as.character(ENVASE),as.character(ORIGEN),as.character(GAS),METf,ETIf,ISOf,BUTf,BISf,OCTf,TERf,ACEf,CAFf,FLUf,GEMf,TRIf,BISAf,PRIf,CARf,PROf) colnames(Mf)=c(names(M[,2:4]),names(M[,5:length(names(M))])) Mf=as.data.frame(Mf) library(ade4) library(adegraphics) Macm<-dudi.acm(Mf) pve <- 100 * Macm$eig /sum(Macm$eig) cumsum(pve) wth=3*580 hth=wth/2^(.5) tiff(filename="boxplot.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #boxplot g1 <- s1d.boxplot(dudi.acm(Mf, scan = FALSE)$li[, 1],Mf) dev.off()

Page 111: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

111

wth=3*580 hth=wth/2^(.5) tiff(filename="A-Observaciones.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #fig1 - observaciones s.label(Macm$li, xax = 1, yax = 2) dev.off() wth=3*580 hth=wth/2^(.5) tiff(filename="B-clusters.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #fig2 - observaciones+clusters cl <- kmeans(M[,5:20],2) s.class(dfxy=Macm$li, fac= as.factor(cl$cluster), col=c(1:max(cl$cluster)),xax=1,yax=2) dev.off() wth=3*580 hth=wth/2^(.5) tiff(filename="C-MCa.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #fig3 - scatter scatter(Macm) dev.off() ANEXO W. Código Wilcoxon test

rm(list=ls(all=TRUE)) M=read.table("datos.txt",header=TRUE) attach(M) #boxplot boxplot(MET~ENVASE,ylab="MET",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") mete=pairwise.wilcox.test(MET,ENVASE,p.adjust="bonf") #boxplot boxplot(MET~ORIGEN,ylab="MET",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") meto=pairwise.wilcox.test(MET,ORIGEN,p.adjust="bonf") #boxplot

Page 112: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

112

boxplot(MET~GAS,ylab="MET",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") metg=pairwise.wilcox.test(MET,GAS,p.adjust="bonf") #################################ETI################################# #boxplot boxplot(ETI~ENVASE,ylab="ETI",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") etie=pairwise.wilcox.test(ETI,ENVASE,p.adjust="bonf") #boxplot boxplot(ETI~ORIGEN,ylab="ETI",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") etio=pairwise.wilcox.test(ETI,ORIGEN,p.adjust="bonf") #boxplot boxplot(ETI~GAS,ylab="ETI",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") etig=pairwise.wilcox.test(ETI,GAS,p.adjust="bonf") #################################ISO################################# #boxplot boxplot(ISO~ENVASE,ylab="ISO",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") isoe=pairwise.wilcox.test(ISO,ENVASE,p.adjust="bonf") #boxplot boxplot(ISO~ORIGEN,ylab="ISO",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") isoo=pairwise.wilcox.test(ISO,ORIGEN,p.adjust="bonf") #boxplot boxplot(ISO~GAS,ylab="ISO",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") isog=pairwise.wilcox.test(ISO,GAS,p.adjust="bonf") #################################BUT################################# #boxplot boxplot(BUT~ENVASE,ylab="BUT",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") bute=pairwise.wilcox.test(BUT,ENVASE,p.adjust="bonf") #boxplot boxplot(BUT~ORIGEN,ylab="BUT",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf")

Page 113: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

113

buto=pairwise.wilcox.test(BUT,ORIGEN,p.adjust="bonf") #boxplot boxplot(BUT~GAS,ylab="BUT",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") butg=pairwise.wilcox.test(BUT,GAS,p.adjust="bonf") #################################BIS################################# #boxplot boxplot(BIS~ENVASE,ylab="BIS",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") bise=pairwise.wilcox.test(BIS,ENVASE,p.adjust="bonf") #boxplot boxplot(BIS~ORIGEN,ylab="BIS",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") biso=pairwise.wilcox.test(BIS,ORIGEN,p.adjust="bonf") #boxplot boxplot(BIS~GAS,ylab="BIS",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") bisg=pairwise.wilcox.test(BIS,GAS,p.adjust="bonf") #################################OCT################################# #boxplot boxplot(OCT~ENVASE,ylab="OCT",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") octe=pairwise.wilcox.test(OCT,ENVASE,p.adjust="bonf") #boxplot boxplot(OCT~ORIGEN,ylab="OCT",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") octo=pairwise.wilcox.test(OCT,ORIGEN,p.adjust="bonf") #boxplot boxplot(OCT~GAS,ylab="OCT",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") octg=pairwise.wilcox.test(OCT,GAS,p.adjust="bonf") #################################TER################################# #boxplot boxplot(TER~ENVASE,ylab="TER",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") tere=pairwise.wilcox.test(TER,ENVASE,p.adjust="bonf") #boxplot

Page 114: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

114

boxplot(TER~ORIGEN,ylab="TER",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") tero=pairwise.wilcox.test(TER,ORIGEN,p.adjust="bonf") #boxplot boxplot(TER~GAS,ylab="TER",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") terg=pairwise.wilcox.test(TER,GAS,p.adjust="bonf") #################################ACE################################# #boxplot boxplot(ACE~ENVASE,ylab="ACE",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") acee=pairwise.wilcox.test(ACE,ENVASE,p.adjust="bonf") #boxplot boxplot(ACE~ORIGEN,ylab="ACE",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") aceo=pairwise.wilcox.test(ACE,ORIGEN,p.adjust="bonf") #boxplot boxplot(ACE~GAS,ylab="ACE",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") aceg=pairwise.wilcox.test(ACE,GAS,p.adjust="bonf") #################################CAF################################# #boxplot boxplot(CAF~ENVASE,ylab="CAF",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") cafe=pairwise.wilcox.test(CAF,ENVASE,p.adjust="bonf") #boxplot boxplot(CAF~ORIGEN,ylab="CAF",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") cafo=pairwise.wilcox.test(CAF,ORIGEN,p.adjust="bonf") #boxplot boxplot(CAF~GAS,ylab="CAF",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") cafg=pairwise.wilcox.test(CAF,GAS,p.adjust="bonf") #################################FLU################################# #boxplot boxplot(FLU~ENVASE,ylab="FLU",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") flue=pairwise.wilcox.test(FLU,ENVASE,p.adjust="bonf")

Page 115: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

115

#boxplot boxplot(FLU~ORIGEN,ylab="FLU",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") fluo=pairwise.wilcox.test(FLU,ORIGEN,p.adjust="bonf") #boxplot boxplot(FLU~GAS,ylab="FLU",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") flug=pairwise.wilcox.test(FLU,GAS,p.adjust="bonf") #################################GEM################################# #boxplot boxplot(GEM~ENVASE,ylab="GEM",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") geme=pairwise.wilcox.test(GEM,ENVASE,p.adjust="bonf") #boxplot boxplot(GEM~ORIGEN,ylab="GEM",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") gemo=pairwise.wilcox.test(GEM,ORIGEN,p.adjust="bonf") #boxplot boxplot(GEM~GAS,ylab="GEM",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") gemg=pairwise.wilcox.test(GEM,GAS,p.adjust="bonf") #################################TRI################################# #boxplot boxplot(TRI~ENVASE,ylab="TRI",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") trie=pairwise.wilcox.test(TRI,ENVASE,p.adjust="bonf") #boxplot boxplot(TRI~ORIGEN,ylab="TRI",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") trio=pairwise.wilcox.test(TRI,ORIGEN,p.adjust="bonf") #boxplot boxplot(TRI~GAS,ylab="TRI",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") trig=pairwise.wilcox.test(TRI,GAS,p.adjust="bonf") #################################BISA################################# #boxplot boxplot(BISA~ENVASE,ylab="BISA",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf")

Page 116: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

116

bpae=pairwise.wilcox.test(BISA,ENVASE,p.adjust="bonf") #boxplot boxplot(BISA~ORIGEN,ylab="BISA",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") bpao=pairwise.wilcox.test(BISA,ORIGEN,p.adjust="bonf") #boxplot boxplot(BISA~GAS,ylab="BISA",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") bpag=pairwise.wilcox.test(BISA,GAS,p.adjust="bonf") #################################PRI################################# #boxplot boxplot(PRI~ENVASE,ylab="PRI",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") prie=pairwise.wilcox.test(PRI,ENVASE,p.adjust="bonf") #boxplot boxplot(PRI~ORIGEN,ylab="PRI",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") prio=pairwise.wilcox.test(PRI,ORIGEN,p.adjust="bonf") #boxplot boxplot(PRI~GAS,ylab="PRI",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") prig=pairwise.wilcox.test(PRI,GAS,p.adjust="bonf") #################################CAR################################# #boxplotCAR boxplot(CAR~ENVASE,ylab="CAR",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") care=pairwise.wilcox.test(CAR,ENVASE,p.adjust="bonf") #boxplotCAR boxplot(CAR~ORIGEN,ylab="CAR",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") caro=pairwise.wilcox.test(CAR,ORIGEN,p.adjust="bonf") #boxplotCAR boxplot(CAR~GAS,ylab="CAR",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") carg=pairwise.wilcox.test(CAR,GAS,p.adjust="bonf") #################################PRO#################################

Page 117: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

117

#boxplot boxplot(PRO~ENVASE,ylab="PRO",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") proe=pairwise.wilcox.test(PRO,ENVASE,p.adjust="bonf") boxplot(PRO~ORIGEN,ylab="PRO",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") proo=pairwise.wilcox.test(PRO,ORIGEN,p.adjust="bonf") boxplot(PRO~GAS,ylab="PRO",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") prog=pairwise.wilcox.test(PRO,GAS,p.adjust="bonf") N=rbind(mete$p.value,etie$p.value,isoe$p.value,bute$p.value,bise$p.value, octe$p.value,tere$p.value,acee$p.value,cafe$p.value,flue$p.value, geme$p.value,trie$p.value,bpae$p.value,prie$p.value,care$p.value, proe$p.value) N1=rbind(meto$p.value,etio$p.value,isoo$p.value,buto$p.value,biso$p.value, octo$p.value,tero$p.value,aceo$p.value,cafo$p.value,fluo$p.value, gemo$p.value,trio$p.value,bpao$p.value,prio$p.value,caro$p.value, proo$p.value) N2=rbind(metg$p.value,etig$p.value,isog$p.value,butg$p.value,bisg$p.value, octg$p.value,terg$p.value,aceg$p.value,cafg$p.value,flug$p.value, gemg$p.value,trig$p.value,bpag$p.value,prig$p.value,carg$p.value, prog$p.value) NT=cbind(N,N1,N2) NTT<- as.data.frame(NT)

Page 118: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

118

ANEXO X. Código Kruskall Wallis y Kruskall wallis Multivariado en R.

rm(list=ls(all=TRUE)) M=read.table("datos.txt",header=TRUE) M <- M[M$ENVASE=="B",] M <- M[,-c(10)]#PORQUE OCT SOLO TIENE 0 attach(M) ###################MET################################ bt2=bartlett.test(MET,ORIGEN) bt3=bartlett.test(MET,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(MET,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(MET,ORIGEN,shapiro.test) sh3=by(MET,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh anova=anova(lm(MET~ORIGEN+GAS)) #se puede utilizar aov print(anova) kruskal1=kruskal.test(MET~ORIGEN) kruskal2=kruskal.test(MET~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################ETI################################ bt2=bartlett.test(ETI,ORIGEN) bt3=bartlett.test(ETI,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(ETI,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(ETI,ORIGEN,shapiro.test) sh3=by(ETI,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh

Page 119: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

119

anova=anova(lm(ETI~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(ETI~ORIGEN) kruskal2=kruskal.test(ETI~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################ISO################################ bt2=bartlett.test(ISO,ORIGEN) bt3=bartlett.test(ISO,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(ISO,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(ISO,ORIGEN,shapiro.test) sh3=by(ISO,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh anova=anova(lm(ISO~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(ISO~ORIGEN) kruskal2=kruskal.test(ISO~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ##################BUT################################ bt2=bartlett.test(BUT,ORIGEN) bt3=bartlett.test(BUT,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(BUT,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(BUT,ORIGEN,shapiro.test) sh3=by(BUT,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh

Page 120: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

120

anova=anova(lm(BUT~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(BUT~ORIGEN) kruskal2=kruskal.test(BUT~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################BIS################################ bt2=bartlett.test(BIS,ORIGEN) bt3=bartlett.test(BIS,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(BIS,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(BIS,ORIGEN,shapiro.test) sh3=by(BIS,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh anova=anova(lm(BIS~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(BIS~ORIGEN) kruskal2=kruskal.test(BIS~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################TER################################ bt2=bartlett.test(TER,ORIGEN) bt3=bartlett.test(TER,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(TER,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(TER,ORIGEN,shapiro.test) sh3=by(TER,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB)

Page 121: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

121

sh anova=anova(lm(TER~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(TER~ORIGEN) kruskal2=kruskal.test(TER~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################ACE################################ bt2=bartlett.test(ACE,ORIGEN) bt3=bartlett.test(ACE,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(ACE,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(ACE,ORIGEN,shapiro.test) sh3=by(ACE,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh anova=anova(lm(ACE~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(ACE~ORIGEN) kruskal2=kruskal.test(ACE~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################CAF################################ bt2=bartlett.test(CAF,ORIGEN) bt3=bartlett.test(CAF,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(CAF,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(CAF,ORIGEN,shapiro.test) sh3=by(CAF,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB)

Page 122: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

122

sh anova=anova(lm(CAF~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(CAF~ORIGEN) kruskal2=kruskal.test(CAF~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################FLU################################ bt2=bartlett.test(FLU,ORIGEN) bt3=bartlett.test(FLU,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(FLU,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(FLU,ORIGEN,shapiro.test) sh3=by(FLU,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh anova=anova(lm(FLU~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(FLU~ORIGEN) kruskal2=kruskal.test(FLU~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################GEM################################ bt2=bartlett.test(GEM,ORIGEN) bt3=bartlett.test(GEM,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(GEM,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(GEM,ORIGEN,shapiro.test) sh3=by(GEM,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh

Page 123: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

123

anova=anova(lm(GEM~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(GEM~ORIGEN) kruskal2=kruskal.test(GEM~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################TRI################################ bt2=bartlett.test(TRI,ORIGEN) bt3=bartlett.test(TRI,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(TRI,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(TRI,ORIGEN,shapiro.test) sh3=by(TRI,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh anova=anova(lm(TRI~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(TRI~ORIGEN) kruskal2=kruskal.test(TRI~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################BISA################################ bt2=bartlett.test(BISA,ORIGEN) bt3=bartlett.test(BISA,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(BISA,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(BISA,ORIGEN,shapiro.test) sh3=by(BISA,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB)

Page 124: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

124

sh anova=anova(lm(BISA~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(BISA~ORIGEN) kruskal2=kruskal.test(BISA~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################PRI################################ bt2=bartlett.test(PRI,ORIGEN) bt3=bartlett.test(PRI,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(PRI,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(PRI,ORIGEN,shapiro.test) sh3=by(PRI,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh anova=anova(lm(PRI~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(PRI~ORIGEN) kruskal2=kruskal.test(PRI~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################CAR################################ bt2=bartlett.test(CAR,ORIGEN) bt3=bartlett.test(CAR,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(CAR,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(CAR,ORIGEN,shapiro.test) sh3=by(CAR,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB)

Page 125: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

125

sh anova=anova(lm(CAR~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(CAR~ORIGEN) kruskal2=kruskal.test(CAR~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################PRO################################ bt2=bartlett.test(PRO,ORIGEN) bt3=bartlett.test(PRO,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(PRO,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(PRO,ORIGEN,shapiro.test) sh3=by(PRO,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh anova=anova(lm(PRO~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(PRO~ORIGEN) kruskal2=kruskal.test(PRO~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) #MULTIANOVA todos los compuestos Y=as.matrix(M[,5:19]) manova=manova(Y~GAS+ORIGEN) summary(manova) #MULTIANOVA plastificantes YP=as.matrix(cbind(M[,5:9],M[16])) manova=manova(YP~GAS+ORIGEN) summary(manova) #MULTIANOVA farmaceuticos y hormonas

Page 126: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

126

YF=as.matrix(cbind(M[,10:15],M[17:19])) manova=manova(YF~GAS+ORIGEN) summary(manova) #KRUSKAL-WALLIS MULTIVARIADO library(ade4) pcaY=dudi.pca(Y,scannf=FALSE,nf=dim(Y)[2]) kruskalM1=randtest(discrimin(pcaY, factor(ORIGEN),scannf=FALSE,nf=dim(Y)[2]),nrep=9999) kruskalM1 kruskalM2=randtest(discrimin(pcaY, factor(GAS),scannf=FALSE,nf=dim(Y)[2]),nrep=9999) kruskalM2 #KRUSKAL-WALLIS MULTIVARIADO PLASTIFICANTES library(ade4) pcaYP=dudi.pca(YP,scannf=FALSE,nf=dim(YP)[2]) kruskalM1=randtest(discrimin(pcaYP, factor(ORIGEN),scannf=FALSE,nf=dim(YP)[2]),nrep=9999) kruskalM1 kruskalM2=randtest(discrimin(pcaYP, factor(GAS),scannf=FALSE,nf=dim(YP)[2]),nrep=9999) kruskalM2 #KRUSKAL-WALLIS MULTIVARIADO FARMACEUTICOS Y HORMONAS library(ade4) pcaYF=dudi.pca(YF,scannf=FALSE,nf=dim(YF)[2]) kruskalM1=randtest(discrimin(pcaYF, factor(ORIGEN),scannf=FALSE,nf=dim(YF)[2]),nrep=9999) kruskalM1 kruskalM2=randtest(discrimin(pcaYF, factor(GAS),scannf=FALSE,nf=dim(YF)[2]),nrep=9999) kruskalM2

Page 127: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

127

ANEXO Y. Código información mutua promedio (AMI) en R

rm(list=ls(all=TRUE)) M=read.table("datos.txt",header=TRUE) attach(M) #M <- M[-c(1,2,3,4)] #transforma a factores #cuando tengo condiciones iguales puedo aplicar un ciclo i=5 Mf=matrix(data=NA,nrow=174,ncol=1) while (i<=length(names(M))) { f=M[,i] f[which(M[,i] <= 0)]="No detectado" f[which(M[,i] > 0)]="detectado" Mf=cbind(Mf,f) i=i+1 } Mf=as.data.frame(Mf) Mf <- Mf[-c(1)] colnames(Mf)=names(M[,5:length(names(M))]) Mf=cbind(M[2:4],Mf) Mf=as.data.frame(Mf) attach(Mf) ##FACTORES METC=as.factor(MET) ETIC=as.factor(ETI) ISOC=as.factor(ISO) BUTC=as.factor(BUT) BISC=as.factor(BIS) OCTC=as.factor(OCT) TERC=as.factor(TER) ACEC=as.factor(ACE) CAFC=as.factor(CAF) FLUC=as.factor(FLU) GEMC=as.factor(GEM) TRIC=as.factor(TRI) BISAC=as.factor(BISA) PRIC=as.factor(PRI) CARC=as.factor(CAR) PROC=as.factor(PRO)

Page 128: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

128

ENVC=as.factor(ENVASE) ORIC=as.factor(ORIGEN) GASC=as.factor(GAS) #############probabilidades###################### P10=length(which(METC=="No detectado"))/dim(M)[1] P11=length(which(METC=="detectado"))/dim(M)[1] E1=-((P10*log2(P10))+(P11*log2(P11)))# Entropia P20=length(which(ETIC=="No detectado"))/dim(M)[1] P21=length(which(ETIC=="detectado"))/dim(M)[1] E2=-((P20*log2(P20))+(P21*log2(P21)))# Entropia P30=length(which(ISOC=="No detectado"))/dim(M)[1] P31=length(which(ISOC=="detectado"))/dim(M)[1] E3=-((P30*log2(P30))+(P31*log2(P31)))# Entropia P40=length(which(BUTC=="No detectado"))/dim(M)[1] P41=length(which(BUTC=="detectado"))/dim(M)[1] E4=-((P40*log2(P40))+(P41*log2(P41)))# Entropia P50=length(which(BISC=="No detectado"))/dim(M)[1] P51=length(which(BISC=="detectado"))/dim(M)[1] E5=-((P50*log2(P50))+(P51*log2(P51)))# Entropia P60=length(which(OCTC=="No detectado"))/dim(M)[1] P61=length(which(OCTC=="detectado"))/dim(M)[1] E6=-((P60*log2(P60))+(P61*log2(P61)))# Entropia P70=length(which(TERC=="No detectado"))/dim(M)[1] P71=length(which(TERC=="detectado"))/dim(M)[1] E7=-((P70*log2(P70))+(P71*log2(P71)))# Entropia P80=length(which(ACEC=="No detectado"))/dim(M)[1] P81=length(which(ACEC=="detectado"))/dim(M)[1] E8=-((P80*log2(P80))+(P81*log2(P81)))# Entropia P90=length(which(CAFC=="No detectado"))/dim(M)[1] P91=length(which(CAFC=="detectado"))/dim(M)[1] E9=-((P90*log2(P90))+(P91*log2(P91)))# Entropia P100=length(which(FLUC=="No detectado"))/dim(M)[1] P101=length(which(FLUC=="detectado"))/dim(M)[1] E10=-((P100*log2(P100))+(P101*log2(P101)))# Entropia P110=length(which(GEMC=="No detectado"))/dim(M)[1] P111=length(which(GEMC=="detectado"))/dim(M)[1]

Page 129: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

129

E11=-((P110*log2(P110))+(P111*log2(P111)))# Entropia P120=length(which(TRIC=="No detectado"))/dim(M)[1] P121=length(which(TRIC=="detectado"))/dim(M)[1] E12=-((P120*log2(P120))+(P121*log2(P121)))# Entropia P130=length(which(BISAC=="No detectado"))/dim(M)[1] P131=length(which(BISAC=="detectado"))/dim(M)[1] E13=-((P130*log2(P130))+(P131*log2(P131)))# Entropia P140=length(which(PRIC=="No detectado"))/dim(M)[1] P141=length(which(PRIC=="detectado"))/dim(M)[1] E14=-((P140*log2(P140))+(P141*log2(P141)))# Entropia P150=length(which(CARC=="No detectado"))/dim(M)[1] P151=length(which(CARC=="detectado"))/dim(M)[1] E15=-((P150*log2(P150))+(P151*log2(P151)))# Entropia P160=length(which(PROC=="No detectado"))/dim(M)[1] P161=length(which(PROC=="detectado"))/dim(M)[1] E16=-((P160*log2(P160))+(P161*log2(P161)))# Entropia ################FACTORES######################## PEA=length(which(ENVC=="A"))/dim(M)[1] PEB=length(which(ENVC=="B"))/dim(M)[1] EEA=-((PEA*log2(PEA))) EEB=-((PEB*log2(PEB))) EE=-((PEA*log2(PEA))+(PEB*log2(PEB)))# Entropia POA=length(which(ORIC=="A"))/dim(M)[1] POB=length(which(ORIC=="B"))/dim(M)[1] EOA=-((POA*log2(POA))) EOB=-((POB*log2(POB))) EO=-((POA*log2(POA))+(POB*log2(POB)))# Entropia PGA=length(which(GASC=="A"))/dim(M)[1] PGB=length(which(GASC=="B"))/dim(M)[1] EGA=-((PGA*log2(PGA))) EGB=-((PGB*log2(PGB))) EG=-((PGA*log2(PGA))+(PGB*log2(PGB)))# Entropia #Entropia Conjunta envasse···············································

Page 130: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

130

###Entropia conjunta ENVASE CON MET #COM1_ENV-MET=A-no detectado Penv_met1=(length(which(ENVC=="A"& METC=="No detectado")))/ dim(M)[1] #COM2_ENV-MET=A-detectado Penv_met2=(length(which(ENVC=="A"& METC=="detectado")))/ dim(M)[1] #COM3_ENV-MET= B- no detectado Penv_met3=(length(which(ENVC=="B"& METC=="No detectado")))/ dim(M)[1] #COM4_ENV-MET= B-detectado Penv_met4=(length(which(ENVC=="B"& METC=="detectado")))/ dim(M)[1] E_ENVA_MET=-(Penv_met1*log2(Penv_met1)+Penv_met2*log2(Penv_met2)) E_ENVB_MET=-(Penv_met3*log2(Penv_met3)+Penv_met4*log2(Penv_met4)) E_ENV_MET=-(Penv_met1*log2(Penv_met1)+Penv_met2*log2(Penv_met2)+Penv_met3*log2(Penv_met3)+Penv_met4*log2(Penv_met4)) ###Entropia conjunta ENVASE CON ETI #COM1_ENV-ETI=A-no detectado Penv_eti1=(length(which(ENVC=="A"& ETIC=="No detectado")))/ dim(M)[1] #COM2_ENV-ETI=A-detectado Penv_eti2=(length(which(ENVC=="A"& ETIC=="detectado")))/ dim(M)[1] #COM3_ENV-ETI= B- no detectado Penv_eti3=(length(which(ENVC=="B"& ETIC=="No detectado")))/ dim(M)[1] #COM4_ENV-ETI= B-detectado Penv_eti4=(length(which(ENVC=="B"& ETIC=="detectado")))/ dim(M)[1] E_ENVA_ETI=-(Penv_eti1*log2(Penv_eti1)+Penv_eti2*log2(Penv_eti2)) E_ENVB_ETI=-(Penv_eti3*log2(Penv_eti3)+Penv_eti4*log2(Penv_eti4)) E_ENV_ETI=-(Penv_eti1*log2(Penv_eti1)+Penv_eti2*log2(Penv_eti2)+Penv_eti3*log2(Penv_eti3)+Penv_eti4*log2(Penv_eti4)) ###Entropia conjunta ENVASE CON ISO #COM1_ENV-ISO=A-no detectado Penv_iso1=(length(which(ENVC=="A"& ISOC=="No detectado")))/ dim(M)[1]

Page 131: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

131

#COM2_ENV-ISO=A-detectado Penv_iso2=(length(which(ENVC=="A"& ISOC=="detectado")))/ dim(M)[1] #COM3_ENV-ISO= B- no detectado Penv_iso3=(length(which(ENVC=="B"& ISOC=="No detectado")))/ dim(M)[1] #COM4_ENV-ISO= B-detectado Penv_iso4=(length(which(ENVC=="B"& ISOC=="detectado")))/ dim(M)[1] E_ENVA_ISO=-(Penv_iso1*log2(Penv_iso1)+Penv_iso2*log2(Penv_iso2)) E_ENVB_ISO=-(Penv_iso3*log2(Penv_iso3)+Penv_iso4*log2(Penv_iso4)) E_ENV_ISO=-(Penv_iso1*log2(Penv_iso1)+Penv_iso2*log2(Penv_iso2)+Penv_iso3*log2(Penv_iso3)+Penv_iso4*log2(Penv_iso4)) ###Entropia conjunta ENVASE CON BUT #COM1_ENV-BUT=A-no detectado Penv_but1=(length(which(ENVC=="A"& BUTC=="No detectado")))/ dim(M)[1] #COM2_ENV-BUT=A-detectado Penv_but2=(length(which(ENVC=="A"& BUTC=="detectado")))/ dim(M)[1] #COM3_ENV-BUT= B- no detectado Penv_but3=(length(which(ENVC=="B"& BUTC=="No detectado")))/ dim(M)[1] #COM4_ENV-BUT= B-detectado Penv_but4=(length(which(ENVC=="B"& BUTC=="detectado")))/ dim(M)[1] E_ENVA_BUT=-(Penv_but1*log2(Penv_but1)+Penv_but2*log2(Penv_but2)) E_ENVB_BUT=-(Penv_but3*log2(Penv_but3)+Penv_but4*log2(Penv_but4)) E_ENV_BUT=-(Penv_but1*log2(Penv_but1)+Penv_but2*log2(Penv_but2)+Penv_but3*log2(Penv_but3)+Penv_but4*log2(Penv_but4)) ###Entropia conjunta ENVASE CON DEPH #COM1_ENV-DEPH=A-no detectado Penv_deph1=(length(which(ENVC=="A"& BISC=="No detectado")))/ dim(M)[1] #COM2_ENV-DEPH=A-detectado Penv_deph2=(length(which(ENVC=="A"& BISC=="detectado")))/ dim(M)[1] #COM3_ENV-DEPH= B- no detectado Penv_deph3=(length(which(ENVC=="B"& BISC=="No detectado")))/ dim(M)[1]

Page 132: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

132

#COM4_ENV-DEPH= B-detectado Penv_deph4=(length(which(ENVC=="B"& BISC=="detectado")))/ dim(M)[1] E_ENVA_DEPH=-(Penv_deph1*log2(Penv_deph1)+Penv_deph2*log2(Penv_deph2)) E_ENVB_DEPH=-(Penv_deph3*log2(Penv_deph3)+Penv_deph4*log2(Penv_deph4)) E_ENV_DEPH=-(Penv_deph1*log2(Penv_deph1)+Penv_deph2*log2(Penv_deph2)+Penv_deph3*log2(Penv_deph3)+Penv_deph4*log2(Penv_deph4)) ###Entropia conjunta ENVASE CON OCT #COM1_ENV-OCT=A-no detectado Penv_oct1=(length(which(ENVC=="A"& OCTC=="No detectado")))/ dim(M)[1] #COM2_ENV-OCT=A-detectado Penv_oct2=(length(which(ENVC=="A"& OCTC=="detectado")))/ dim(M)[1] #COM3_ENV-OCT= B- no detectado Penv_oct3=(length(which(ENVC=="B"& OCTC=="No detectado")))/ dim(M)[1] #COM4_ENV-OCT= B-detectado Penv_oct4=(length(which(ENVC=="B"& OCTC=="detectado")))/ dim(M)[1] E_ENVA_OCT=-(Penv_oct1*log2(Penv_oct1)+Penv_oct2*log2(Penv_oct2)) E_ENVB_OCT=-(Penv_oct3*log2(Penv_oct3)) E_ENV_OCT=-(Penv_oct1*log2(Penv_oct1)+Penv_oct2*log2(Penv_oct2)+Penv_oct3*log2(Penv_oct3)) ###Entropia conjunta ENVASE CON TER #COM1_ENV-TER=A-no detectado Penv_ter1=(length(which(ENVC=="A"& TERC=="No detectado")))/ dim(M)[1] #COM2_ENV-TER=A-detectado Penv_ter2=(length(which(ENVC=="A"& TERC=="detectado")))/ dim(M)[1] #COM3_ENV-TER= B- no detectado Penv_ter3=(length(which(ENVC=="B"& TERC=="No detectado")))/ dim(M)[1] #COM4_ENV-TER= B-detectado Penv_ter4=(length(which(ENVC=="B"& TERC=="detectado")))/ dim(M)[1] E_ENVA_TER=-(Penv_ter1*log2(Penv_ter1)+Penv_ter2*log2(Penv_ter2)) E_ENVB_TER=-(Penv_ter3*log2(Penv_ter3)+Penv_ter4*log2(Penv_ter4))

Page 133: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

133

E_ENV_TER=-(Penv_ter1*log2(Penv_ter1)+Penv_ter2*log2(Penv_ter2)+Penv_ter3*log2(Penv_ter3)+Penv_ter4*log2(Penv_ter4)) ###Entropia conjunta ENVASE CON ACE #COM1_ENV-ACE=A-no detectado Penv_ace1=(length(which(ENVC=="A"& ACEC=="No detectado")))/ dim(M)[1] #COM2_ENV-ACE=A-detectado Penv_ace2=(length(which(ENVC=="A"& ACEC=="detectado")))/ dim(M)[1] #COM3_ENV-ACE= B- no detectado Penv_ace3=(length(which(ENVC=="B"& ACEC=="No detectado")))/ dim(M)[1] #COM4_ENV-ACE= B-detectado Penv_ace4=(length(which(ENVC=="B"& ACEC=="detectado")))/ dim(M)[1] E_ENVA_ACE=-(Penv_ace1*log2(Penv_ace1)+Penv_ace2*log2(Penv_ace2)) E_ENVB_ACE=-(Penv_ace3*log2(Penv_ace3)+Penv_ace4*log2(Penv_ace4)) E_ENV_ACE=-(Penv_ace1*log2(Penv_ace1)+Penv_ace2*log2(Penv_ace2)+Penv_ace3*log2(Penv_ace3)+Penv_ace4*log2(Penv_ace4)) ###Entropia conjunta ENVASE CON CAF #COM1_ENV-CAF=A-no detectado Penv_caf1=(length(which(ENVC=="A"& CAFC=="No detectado")))/ dim(M)[1] #COM2_ENV-CAF=A-detectado Penv_caf2=(length(which(ENVC=="A"& CAFC=="detectado")))/ dim(M)[1] #COM3_ENV-CAF= B- no detectado Penv_caf3=(length(which(ENVC=="B"& CAFC=="No detectado")))/ dim(M)[1] #COM4_ENV-CAF= B-detectado Penv_caf4=(length(which(ENVC=="B"& CAFC=="detectado")))/ dim(M)[1] E_ENVA_CAF=-(Penv_caf1*log2(Penv_caf1)+Penv_caf2*log2(Penv_caf2)) E_ENVB_CAF=-(Penv_caf4*log2(Penv_caf4)) E_ENV_CAF=-(Penv_caf1*log2(Penv_caf1)+Penv_caf2*log2(Penv_caf2)+Penv_caf4*log2(Penv_caf4))

Page 134: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

134

###Entropia conjunta ENVASE CON FLU #COM1_ENV-FLU=A-no detectado Penv_flu1=(length(which(ENVC=="A"& FLUC=="No detectado")))/ dim(M)[1] #COM2_ENV-FLU=A-detectado Penv_flu2=(length(which(ENVC=="A"& FLUC=="detectado")))/ dim(M)[1] #COM3_ENV-FLU= B- no detectado Penv_flu3=(length(which(ENVC=="B"& FLUC=="No detectado")))/ dim(M)[1] #COM4_ENV-FLU= B-detectado Penv_flu4=(length(which(ENVC=="B"& FLUC=="detectado")))/ dim(M)[1] E_ENVA_FLU=-(Penv_flu1*log2(Penv_flu1)+Penv_flu2*log2(Penv_flu2)) E_ENVB_FLU=-(Penv_flu3*log2(Penv_flu3)+Penv_flu4*log2(Penv_flu4)) E_ENV_FLU=-(Penv_flu1*log2(Penv_flu1)+Penv_flu2*log2(Penv_flu2)+Penv_flu3*log2(Penv_flu3)+Penv_flu4*log2(Penv_flu4)) ###Entropia conjunta ENVASE CON GEM #COM1_ENV-GEM=A-no detectado Penv_gem1=(length(which(ENVC=="A"& GEMC=="No detectado")))/ dim(M)[1] #COM2_ENV-GEM=A-detectado Penv_gem2=(length(which(ENVC=="A"& GEMC=="detectado")))/ dim(M)[1] #COM3_ENV-GEM= B- no detectado Penv_gem3=(length(which(ENVC=="B"& GEMC=="No detectado")))/ dim(M)[1] #COM4_ENV-GEM= B-detectado Penv_gem4=(length(which(ENVC=="B"& GEMC=="detectado")))/ dim(M)[1] E_ENVA_GEM=-(Penv_gem1*log2(Penv_gem1)+Penv_gem2*log2(Penv_gem2)) E_ENVB_GEM=-(Penv_gem3*log2(Penv_gem3)+Penv_gem4*log2(Penv_gem4)) E_ENV_GEM=-(Penv_gem1*log2(Penv_gem1)+Penv_gem2*log2(Penv_gem2)+Penv_gem3*log2(Penv_gem3)+Penv_gem4*log2(Penv_gem4)) ###Entropia conjunta ENVASE CON TRI

Page 135: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

135

#COM1_ENV-TRI=A-no detectado Penv_tri1=(length(which(ENVC=="A"& TRIC=="No detectado")))/ dim(M)[1] #COM2_ENV-TRI=A-detectado Penv_tri2=(length(which(ENVC=="A"& TRIC=="detectado")))/ dim(M)[1] #COM3_ENV-TRI= B- no detectado Penv_tri3=(length(which(ENVC=="B"& TRIC=="No detectado")))/ dim(M)[1] #COM4_ENV-TRI= B-detectado Penv_tri4=(length(which(ENVC=="B"& TRIC=="detectado")))/ dim(M)[1] E_ENVA_TRI=-(Penv_tri1*log2(Penv_tri1)+Penv_tri2*log2(Penv_tri2)) E_ENVB_TRI=-(Penv_tri3*log2(Penv_tri3)+Penv_tri4*log2(Penv_tri4)) E_ENV_TRI=-(Penv_tri1*log2(Penv_tri1)+Penv_tri2*log2(Penv_tri2)+Penv_tri3*log2(Penv_tri3)+Penv_tri4*log2(Penv_tri4)) ###Entropia conjunta ENVASE CON BPA #COM1_ENV-BPA=A-no detectado Penv_bpa1=(length(which(ENVC=="A"& BISAC=="No detectado")))/ dim(M)[1] #COM2_ENV-BPA=A-detectado Penv_bpa2=(length(which(ENVC=="A"& BISAC=="detectado")))/ dim(M)[1] #COM3_ENV-BPA= B- no detectado Penv_bpa3=(length(which(ENVC=="B"& BISAC=="No detectado")))/ dim(M)[1] #COM4_ENV-BPA= B-detectado Penv_bpa4=(length(which(ENVC=="B"& BISAC=="detectado")))/ dim(M)[1] E_ENVA_BPA=-(Penv_bpa1*log2(Penv_bpa1)+Penv_bpa2*log2(Penv_bpa2)) E_ENVB_BPA=-(Penv_bpa3*log2(Penv_bpa3)+Penv_bpa4*log2(Penv_bpa4)) E_ENV_BPA=-(Penv_bpa1*log2(Penv_bpa1)+Penv_bpa2*log2(Penv_bpa2)+Penv_bpa3*log2(Penv_bpa3)+Penv_bpa4*log2(Penv_bpa4)) ###Entropia conjunta ENVASE CON PRI #COM1_ENV-PRI=A-no detectado Penv_pri1=(length(which(ENVC=="A"& PRIC=="No detectado")))/ dim(M)[1]

Page 136: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

136

#COM2_ENV-PRI=A-detectado Penv_pri2=(length(which(ENVC=="A"& PRIC=="detectado")))/ dim(M)[1] #COM3_ENV-PRI= B- no detectado Penv_pri3=(length(which(ENVC=="B"& PRIC=="No detectado")))/ dim(M)[1] #COM4_ENV-PRI= B-detectado Penv_pri4=(length(which(ENVC=="B"& PRIC=="detectado")))/ dim(M)[1] E_ENVA_PRI=-(Penv_pri1*log2(Penv_pri1)+Penv_pri2*log2(Penv_pri2)) E_ENVB_PRI=-(Penv_pri3*log2(Penv_pri3)+Penv_pri4*log2(Penv_pri4)) E_ENV_PRI=-(Penv_pri1*log2(Penv_pri1)+Penv_pri2*log2(Penv_pri2)+Penv_pri3*log2(Penv_pri3)+Penv_pri4*log2(Penv_pri4)) ###Entropia conjunta ENVASE CON CAR #COM1_ENV-CAR=A-no detectado Penv_car1=(length(which(ENVC=="A"& CARC=="No detectado")))/ dim(M)[1] #COM2_ENV-CAR=A-detectado Penv_car2=(length(which(ENVC=="A"& CARC=="detectado")))/ dim(M)[1] #COM3_ENV-CAR= B- no detectado Penv_car3=(length(which(ENVC=="B"& CARC=="No detectado")))/ dim(M)[1] #COM4_ENV-CAR= B-detectado Penv_car4=(length(which(ENVC=="B"& CARC=="detectado")))/ dim(M)[1] E_ENVA_CAR=-(Penv_car1*log2(Penv_car1)+Penv_car2*log2(Penv_car2)) E_ENVB_CAR=-(Penv_car3*log2(Penv_car3)+Penv_car4*log2(Penv_car4)) E_ENV_CAR=-(Penv_car1*log2(Penv_car1)+Penv_car2*log2(Penv_car2)+Penv_car3*log2(Penv_car3)+Penv_car4*log2(Penv_car4)) ###Entropia conjunta ENVASE CON PRO #COM1_ENV-PRO=A-no detectado Penv_pro1=(length(which(ENVC=="A"& PROC=="No detectado")))/ dim(M)[1] #COM2_ENV-PRO=A-detectado Penv_pro2=(length(which(ENVC=="A"& PROC=="detectado")))/ dim(M)[1] #COM3_ENV-PRO= B- no detectado

Page 137: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

137

Penv_pro3=(length(which(ENVC=="B"& PROC=="No detectado")))/ dim(M)[1] #COM4_ENV-PRO= B-detectado Penv_pro4=(length(which(ENVC=="B"& PROC=="detectado")))/ dim(M)[1] E_ENVA_PRO=-(Penv_pro1*log2(Penv_pro1)+Penv_pro2*log2(Penv_pro2)) E_ENVB_PRO=-(Penv_pro4*log2(Penv_pro4)) E_ENV_PRO=-(Penv_pro1*log2(Penv_pro1)+Penv_pro2*log2(Penv_pro2)+Penv_pro4*log2(Penv_pro4)) #Entropia Conjunta origen··············································· ###Entropia conjunta ORI CON MET #COM1_ORI-MET=A-no detectado Pori_met1=(length(which(ORIC=="A"& METC=="No detectado")))/ dim(M)[1] #COM2_ORI-MET=A-detectado Pori_met2=(length(which(ORIC=="A"& METC=="detectado")))/ dim(M)[1] #COM3_ORI-MET= B- no detectado Pori_met3=(length(which(ORIC=="B"& METC=="No detectado")))/ dim(M)[1] #COM4_ORI-MET= B-detectado Pori_met4=(length(which(ORIC=="B"& METC=="detectado")))/ dim(M)[1] E_ORIA_MET=-(Pori_met1*log2(Pori_met1)+Pori_met2*log2(Pori_met2)) E_ORIB_MET=-(Pori_met3*log2(Pori_met3)+Pori_met4*log2(Pori_met4)) E_ORI_MET=-(Pori_met1*log2(Pori_met1)+Pori_met2*log2(Pori_met2)+Pori_met3*log2(Pori_met3)+Pori_met4*log2(Pori_met4)) ###Entropia conjunta ORI CON ETI #COM1_ORI-ETI=A-no detectado Pori_eti1=(length(which(ORIC=="A"& ETIC=="No detectado")))/ dim(M)[1] #COM2_ORI-ETI=A-detectado Pori_eti2=(length(which(ORIC=="A"& ETIC=="detectado")))/ dim(M)[1] #COM3_ORI-ETI= B- no detectado Pori_eti3=(length(which(ORIC=="B"& ETIC=="No detectado")))/ dim(M)[1] #COM4_ORI-ETI= B-detectado

Page 138: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

138

Pori_eti4=(length(which(ORIC=="B"& ETIC=="detectado")))/ dim(M)[1] E_ORIA_ETI=-(Pori_eti1*log2(Pori_eti1)+Pori_eti2*log2(Pori_eti2)) E_ORIB_ETI=-(Pori_eti3*log2(Pori_eti3)+Pori_eti4*log2(Pori_eti4)) E_ORI_ETI=-(Pori_eti1*log2(Pori_eti1)+Pori_eti2*log2(Pori_eti2)+Pori_eti3*log2(Pori_eti3)+Pori_eti4*log2(Pori_eti4)) ###Entropia conjunta ORI CON ISO #COM1_ORI-ISO=A-no detectado Pori_iso1=(length(which(ORIC=="A"& ISOC=="No detectado")))/ dim(M)[1] #COM2_ORI-ISO=A-detectado Pori_iso2=(length(which(ORIC=="A"& ISOC=="detectado")))/ dim(M)[1] #COM3_ORI-ISO= B- no detectado Pori_iso3=(length(which(ORIC=="B"& ISOC=="No detectado")))/ dim(M)[1] #COM4_ORI-ISO= B-detectado Pori_iso4=(length(which(ORIC=="B"& ISOC=="detectado")))/ dim(M)[1] E_ORIA_ISO=-(Pori_iso1*log2(Pori_iso1)+Pori_iso2*log2(Pori_iso2)) E_ORIB_ISO=-(Pori_iso3*log2(Pori_iso3)+Pori_iso4*log2(Pori_iso4)) E_ORI_ISO=-(Pori_iso1*log2(Pori_iso1)+Pori_iso2*log2(Pori_iso2)+Pori_iso3*log2(Pori_iso3)+Pori_iso4*log2(Pori_iso4)) ###Entropia conjunta ORI CON BUT #COM1_ORI-BUT=A-no detectado Pori_but1=(length(which(ORIC=="A"& BUTC=="No detectado")))/ dim(M)[1] #COM2_ORI-BUT=A-detectado Pori_but2=(length(which(ORIC=="A"& BUTC=="detectado")))/ dim(M)[1] #COM3_ORI-BUT= B- no detectado Pori_but3=(length(which(ORIC=="B"& BUTC=="No detectado")))/ dim(M)[1] #COM4_ORI-BUT= B-detectado Pori_but4=(length(which(ORIC=="B"& BUTC=="detectado")))/ dim(M)[1] E_ORIA_BUT=-(Pori_but1*log2(Pori_but1)+Pori_but2*log2(Pori_but2)) E_ORIB_BUT=-(Pori_but3*log2(Pori_but3)+Pori_but4*log2(Pori_but4))

Page 139: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

139

E_ORI_BUT=-(Pori_but1*log2(Pori_but1)+Pori_but2*log2(Pori_but2)+Pori_but3*log2(Pori_but3)+Pori_but4*log2(Pori_but4)) ###Entropia conjunta ORI CON DEPH #COM1_ORI-DEPH=A-no detectado Pori_deph1=(length(which(ORIC=="A"& BISC=="No detectado")))/ dim(M)[1] #COM2_ORI-DEPH=A-detectado Pori_deph2=(length(which(ORIC=="A"& BISC=="detectado")))/ dim(M)[1] #COM3_ORI-DEPH= B- no detectado Pori_deph3=(length(which(ORIC=="B"& BISC=="No detectado")))/ dim(M)[1] #COM4_ORI-DEPH= B-detectado Pori_deph4=(length(which(ORIC=="B"& BISC=="detectado")))/ dim(M)[1] E_ORIA_DEPH=-(Pori_deph1*log2(Pori_deph1)+Pori_deph2*log2(Pori_deph2)) E_ORIB_DEPH=-(Pori_deph3*log2(Pori_deph3)+Pori_deph4*log2(Pori_deph4)) E_ORI_DEPH=-(Pori_deph1*log2(Pori_deph1)+Pori_deph2*log2(Pori_deph2)+Pori_deph3*log2(Pori_deph3)+Pori_deph4*log2(Pori_deph4)) ###Entropia conjunta ORI CON OCT #COM1_ORI-OCT=A-no detectado Pori_oct1=(length(which(ORIC=="A"& OCTC=="No detectado")))/ dim(M)[1] #COM2_ORI-OCT=A-detectado Pori_oct2=(length(which(ORIC=="A"& OCTC=="detectado")))/ dim(M)[1] #COM3_ORI-OCT= B- no detectado Pori_oct3=(length(which(ORIC=="B"& OCTC=="No detectado")))/ dim(M)[1] #COM4_ORI-OCT= B-detectado Pori_oct4=(length(which(ORIC=="B"& OCTC=="detectado")))/ dim(M)[1] E_ORIA_OCT=-(Pori_oct1*log2(Pori_oct1)+Pori_oct2*log2(Pori_oct2)) E_ORIB_OCT=-(Pori_oct3*log2(Pori_oct3)+Pori_oct4*log2(Pori_oct4)) E_ORI_OCT=-(Pori_oct1*log2(Pori_oct1)+Pori_oct2*log2(Pori_oct2)+Pori_oct3*log2(Pori_oct3)+Pori_oct4*log2(Pori_oct4))

Page 140: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

140

###Entropia conjunta ORI CON TER #COM1_ORI-TER=A-no detectado Pori_ter1=(length(which(ORIC=="A"& TERC=="No detectado")))/ dim(M)[1] #COM2_ORI-TER=A-detectado Pori_ter2=(length(which(ORIC=="A"& TERC=="detectado")))/ dim(M)[1] #COM3_ORI-TER= B- no detectado Pori_ter3=(length(which(ORIC=="B"& TERC=="No detectado")))/ dim(M)[1] #COM4_ORI-TER= B-detectado Pori_ter4=(length(which(ORIC=="B"& TERC=="detectado")))/ dim(M)[1] E_ORIA_TER=-(Pori_ter1*log2(Pori_ter1)+Pori_ter2*log2(Pori_ter2)) E_ORIB_TER=-(Pori_ter3*log2(Pori_ter3)+Pori_ter4*log2(Pori_ter4)) E_ORI_TER=-(Pori_ter1*log2(Pori_ter1)+Pori_ter2*log2(Pori_ter2)+Pori_ter3*log2(Pori_ter3)+Pori_ter4*log2(Pori_ter4)) ###Entropia conjunta ORI CON ACE #COM1_ORI-ACE=A-no detectado Pori_ace1=(length(which(ORIC=="A"& ACEC=="No detectado")))/ dim(M)[1] #COM2_ORI-ACE=A-detectado Pori_ace2=(length(which(ORIC=="A"& ACEC=="detectado")))/ dim(M)[1] #COM3_ORI-ACE= B- no detectado Pori_ace3=(length(which(ORIC=="B"& ACEC=="No detectado")))/ dim(M)[1] #COM4_ORI-ACE= B-detectado Pori_ace4=(length(which(ORIC=="B"& ACEC=="detectado")))/ dim(M)[1] E_ORIA_ACE=-(Pori_ace1*log2(Pori_ace1)+Pori_ace2*log2(Pori_ace2)) E_ORIB_ACE=-(Pori_ace3*log2(Pori_ace3)+Pori_ace4*log2(Pori_ace4)) E_ORI_ACE=-(Pori_ace1*log2(Pori_ace1)+Pori_ace2*log2(Pori_ace2)+Pori_ace3*log2(Pori_ace3)+Pori_ace4*log2(Pori_ace4)) ###Entropia conjunta ORI CON CAF

Page 141: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

141

#COM1_ORI-CAF=A-no detectado Pori_caf1=(length(which(ORIC=="A"& CAFC=="No detectado")))/ dim(M)[1] #COM2_ORI-CAF=A-detectado Pori_caf2=(length(which(ORIC=="A"& CAFC=="detectado")))/ dim(M)[1] #COM3_ORI-CAF= B- no detectado Pori_caf3=(length(which(ORIC=="B"& CAFC=="No detectado")))/ dim(M)[1] #COM4_ORI-CAF= B-detectado Pori_caf4=(length(which(ORIC=="B"& CAFC=="detectado")))/ dim(M)[1] E_ORIA_CAF=-(Pori_caf1*log2(Pori_caf1)+Pori_caf2*log2(Pori_caf2)) E_ORIB_CAF=-(Pori_caf4*log2(Pori_caf4)) E_ORI_CAF=-(Pori_caf1*log2(Pori_caf1)+Pori_caf2*log2(Pori_caf2)+Pori_caf4*log2(Pori_caf4)) ###Entropia conjunta ORI CON FLU #COM1_ORI-FLU=A-no detectado Pori_flu1=(length(which(ORIC=="A"& FLUC=="No detectado")))/ dim(M)[1] #COM2_ORI-FLU=A-detectado Pori_flu2=(length(which(ORIC=="A"& FLUC=="detectado")))/ dim(M)[1] #COM3_ORI-FLU= B- no detectado Pori_flu3=(length(which(ORIC=="B"& FLUC=="No detectado")))/ dim(M)[1] #COM4_ORI-FLU= B-detectado Pori_flu4=(length(which(ORIC=="B"& FLUC=="detectado")))/ dim(M)[1] E_ORIA_FLU=-(Pori_flu1*log2(Pori_flu1)+Pori_flu2*log2(Pori_flu2)) E_ORIB_FLU=-(Pori_flu3*log2(Pori_flu3)+Pori_flu4*log2(Pori_flu4)) E_ORI_FLU=-(Pori_flu1*log2(Pori_flu1)+Pori_flu2*log2(Pori_flu2)+Pori_flu3*log2(Pori_flu3)+Pori_flu4*log2(Pori_flu4)) ###Entropia conjunta ORI CON GEM #COM1_ORI-GEM=A-no detectado Pori_gem1=(length(which(ORIC=="A"& GEMC=="No detectado")))/ dim(M)[1] #COM2_ORI-GEM=A-detectado

Page 142: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

142

Pori_gem2=(length(which(ORIC=="A"& GEMC=="detectado")))/ dim(M)[1] #COM3_ORI-GEM= B- no detectado Pori_gem3=(length(which(ORIC=="B"& GEMC=="No detectado")))/ dim(M)[1] #COM4_ORI-GEM= B-detectado Pori_gem4=(length(which(ORIC=="B"& GEMC=="detectado")))/ dim(M)[1] E_ORIA_GEM=-(Pori_gem1*log2(Pori_gem1)+Pori_gem2*log2(Pori_gem2)) E_ORIB_GEM=-(Pori_gem3*log2(Pori_gem3)+Pori_gem4*log2(Pori_gem4)) E_ORI_GEM=-(Pori_gem1*log2(Pori_gem1)+Pori_gem2*log2(Pori_gem2)+Pori_gem3*log2(Pori_gem3)+Pori_gem4*log2(Pori_gem4)) ###Entropia conjunta ORI CON TRI #COM1_ORI-TRI=A-no detectado Pori_tri1=(length(which(ORIC=="A"& TRIC=="No detectado")))/ dim(M)[1] #COM2_ORI-TRI=A-detectado Pori_tri2=(length(which(ORIC=="A"& TRIC=="detectado")))/ dim(M)[1] #COM3_ORI-TRI= B- no detectado Pori_tri3=(length(which(ORIC=="B"& TRIC=="No detectado")))/ dim(M)[1] #COM4_ORI-TRI= B-detectado Pori_tri4=(length(which(ORIC=="B"& TRIC=="detectado")))/ dim(M)[1] E_ORIA_TRI=-(Pori_tri1*log2(Pori_tri1)+Pori_tri2*log2(Pori_tri2)) E_ORIB_TRI=-(Pori_tri3*log2(Pori_tri3)+Pori_tri4*log2(Pori_tri4)) E_ORI_TRI=-(Pori_tri1*log2(Pori_tri1)+Pori_tri2*log2(Pori_tri2)+Pori_tri3*log2(Pori_tri3)+Pori_tri4*log2(Pori_tri4)) ###Entropia conjunta ORI CON BPA #COM1_ORI-BPA=A-no detectado Pori_bpa1=(length(which(ORIC=="A"& BISAC=="No detectado")))/ dim(M)[1] #COM2_ORI-BPA=A-detectado Pori_bpa2=(length(which(ORIC=="A"& BISAC=="detectado")))/ dim(M)[1] #COM3ORI-BPA= B- no detectado Pori_bpa3=(length(which(ORIC=="B"& BISAC=="No detectado")))/ dim(M)[1]

Page 143: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

143

#COM4_ORI-BPA= B-detectado Pori_bpa4=(length(which(ORIC=="B"& BISAC=="detectado")))/ dim(M)[1] E_ORIA_BPA=-(Pori_bpa1*log2(Pori_bpa1)+Pori_bpa2*log2(Pori_bpa2)) E_ORIB_BPA=-(Pori_bpa3*log2(Pori_bpa3)+Pori_bpa4*log2(Pori_bpa4)) E_ORI_BPA=-(Pori_bpa1*log2(Pori_bpa1)+Pori_bpa2*log2(Pori_bpa2)+Pori_bpa3*log2(Pori_bpa3)+Pori_bpa4*log2(Pori_bpa4)) ###Entropia conjunta ORI CON PRI #COM1_ORI-PRI=A-no detectado Pori_pri1=(length(which(ORIC=="A"& PRIC=="No detectado")))/ dim(M)[1] #COM2_ORI-PRI=A-detectado Pori_pri2=(length(which(ORIC=="A"& PRIC=="detectado")))/ dim(M)[1] #COM3_ORI-PRI= B- no detectado Pori_pri3=(length(which(ORIC=="B"& PRIC=="No detectado")))/ dim(M)[1] #COM4_ORI-PRI= B-detectado Pori_pri4=(length(which(ORIC=="B"& PRIC=="detectado")))/ dim(M)[1] E_ORIA_PRI=-(Pori_pri1*log2(Pori_pri1)+Pori_pri2*log2(Pori_pri2)) E_ORIB_PRI=-(Pori_pri3*log2(Pori_pri3)+Pori_pri4*log2(Pori_pri4)) E_ORI_PRI=-(Pori_pri1*log2(Pori_pri1)+Pori_pri2*log2(Pori_pri2)+Pori_pri3*log2(Pori_pri3)+Pori_pri4*log2(Pori_pri4)) ###Entropia conjunta ORI CON CAR #COM1_ORI-CAR=A-no detectado Pori_car1=(length(which(ORIC=="A"& CARC=="No detectado")))/ dim(M)[1] #COM2_ORI-CAR=A-detectado Pori_car2=(length(which(ORIC=="A"& CARC=="detectado")))/ dim(M)[1] #COM3_ORI-CAR= B- no detectado Pori_car3=(length(which(ORIC=="B"& CARC=="No detectado")))/ dim(M)[1] #COM4_ORI-CAR= B-detectado Pori_car4=(length(which(ORIC=="B"& CARC=="detectado")))/ dim(M)[1]

Page 144: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

144

E_ORIA_CAR=-(Pori_car1*log2(Pori_car1)+Pori_car2*log2(Pori_car2)) E_ORIB_CAR=-(Pori_car3*log2(Pori_car3)+Pori_car4*log2(Pori_car4)) E_ORI_CAR=-(Pori_car1*log2(Pori_car1)+Pori_car2*log2(Pori_car2)+Pori_car3*log2(Pori_car3)+Pori_car4*log2(Pori_car4)) ###Entropia conjunta ORI CON PRO #COM1_ORI-PRO=A-no detectado Pori_pro1=(length(which(ORIC=="A"& PROC=="No detectado")))/ dim(M)[1] #COM2_ORI-PRO=A-detectado Pori_pro2=(length(which(ORIC=="A"& PROC=="detectado")))/ dim(M)[1] #COM3_ORI-PRO= B- no detectado Pori_pro3=(length(which(ORIC=="B"& PROC=="No detectado")))/ dim(M)[1] #COM4_ORI-PRO= B-detectado Pori_pro4=(length(which(ORIC=="B"& PROC=="detectado")))/ dim(M)[1] E_ORIA_PRO=-(Pori_pro1*log2(Pori_pro1)+Pori_pro2*log2(Pori_pro2)) E_ORIB_PRO=-(Pori_pro4*log2(Pori_pro4)) E_ORI_PRO=-(Pori_pro1*log2(Pori_pro1)+Pori_pro2*log2(Pori_pro2)+Pori_pro4*log2(Pori_pro4)) #Entropia Conjunta GAS··············································· ###Entropia conjunta GAS CON MET #COM1_GAS-MET=A-no detectado Pgas_met1=(length(which(GASC=="A"& METC=="No detectado")))/ dim(M)[1] #COM2_GAS-MET=A-detectado Pgas_met2=(length(which(GASC=="A"& METC=="detectado")))/ dim(M)[1] #COM3_GAS-MET= B- no detectado Pgas_met3=(length(which(GASC=="B"& METC=="No detectado")))/ dim(M)[1] #COM4_GAS-MET= B-detectado Pgas_met4=(length(which(GASC=="B"& METC=="detectado")))/ dim(M)[1] E_GASA_MET=-(Pgas_met1*log2(Pgas_met1)+Pgas_met2*log2(Pgas_met2)) E_GASB_MET=-(Pgas_met3*log2(Pgas_met3)+Pgas_met4*log2(Pgas_met4))

Page 145: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

145

E_GAS_MET=-(Pgas_met1*log2(Pgas_met1)+Pgas_met2*log2(Pgas_met2)+Pgas_met3*log2(Pgas_met3)+Pgas_met4*log2(Pgas_met4)) ###Entropia conjunta ENVASE CON ETI #COM1_GAS-ETI=A-no detectado Pgas_eti1=(length(which(GASC=="A"& ETIC=="No detectado")))/ dim(M)[1] #COM2_GAS-ETI=A-detectado Pgas_eti2=(length(which(GASC=="A"& ETIC=="detectado")))/ dim(M)[1] #COM3_GAS-ETI= B- no detectado Pgas_eti3=(length(which(GASC=="B"& ETIC=="No detectado")))/ dim(M)[1] #COM4_GAS-ETI= B-detectado Pgas_eti4=(length(which(GASC=="B"& ETIC=="detectado")))/ dim(M)[1] E_GASA_ETI=-(Pgas_eti1*log2(Pgas_eti1)+Pgas_eti2*log2(Pgas_eti2)) E_GASB_ETI=-(Pgas_eti3*log2(Pgas_eti3)+Pgas_eti4*log2(Pgas_eti4)) E_GAS_ETI=-(Pgas_eti1*log2(Pgas_eti1)+Pgas_eti2*log2(Pgas_eti2)+Pgas_eti3*log2(Pgas_eti3)+Pgas_eti4*log2(Pgas_eti4)) ###Entropia conjunta GAS CON ISO #COM1_GAS-ISO=A-no detectado Pgas_iso1=(length(which(GASC=="A"& ISOC=="No detectado")))/ dim(M)[1] #COM2_GAS-ISO=A-detectado Pgas_iso2=(length(which(GASC=="A"& ISOC=="detectado")))/ dim(M)[1] #COM3_GAS-ISO= B- no detectado Pgas_iso3=(length(which(GASC=="B"& ISOC=="No detectado")))/ dim(M)[1] #COM4_GAS-ISO= B-detectado Pgas_iso4=(length(which(GASC=="B"& ISOC=="detectado")))/ dim(M)[1] E_GASA_ISO=-(Pgas_iso1*log2(Pgas_iso1)+Pgas_iso2*log2(Pgas_iso2)) E_GASB_ISO=-(Pgas_iso3*log2(Pgas_iso3)+Pgas_iso4*log2(Pgas_iso4)) E_GAS_ISO=-(Pgas_iso1*log2(Pgas_iso1)+Pgas_iso2*log2(Pgas_iso2)+Pgas_iso3*log2(Pgas_iso3)+Pgas_iso4*log2(Pgas_iso4)) ###Entropia conjunta GAS CON BUT

Page 146: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

146

#COM1_GAS-BUT=A-no detectado Pgas_but1=(length(which(GASC=="A"& BUTC=="No detectado")))/ dim(M)[1] #COM2_GAS-BUT=A-detectado Pgas_but2=(length(which(GASC=="A"& BUTC=="detectado")))/ dim(M)[1] #COM3_GAS-BUT= B- no detectado Pgas_but3=(length(which(GASC=="B"& BUTC=="No detectado")))/ dim(M)[1] #COM4_GAS-BUT= B-detectado Pgas_but4=(length(which(GASC=="B"& BUTC=="detectado")))/ dim(M)[1] E_GASA_BUT=-(Pgas_but1*log2(Pgas_but1)+Pgas_but2*log2(Pgas_but2)) E_GASB_BUT=-(Pgas_but3*log2(Pgas_but3)+Pgas_but4*log2(Pgas_but4)) E_GAS_BUT=-(Pgas_but1*log2(Pgas_but1)+Pgas_but2*log2(Pgas_but2)+Pgas_but3*log2(Pgas_but3)+Pgas_but4*log2(Pgas_but4)) ###Entropia conjunta GAS CON DEPH #COM1_GAS-DEPH=A-no detectado Pgas_deph1=(length(which(GASC=="A"& BISC=="No detectado")))/ dim(M)[1] #COM2_GAS-DEPH=A-detectado Pgas_deph2=(length(which(GASC=="A"& BISC=="detectado")))/ dim(M)[1] #COM3_GAS-DEPH= B- no detectado Pgas_deph3=(length(which(GASC=="B"& BISC=="No detectado")))/ dim(M)[1] #COM4_GAS-DEPH= B-detectado Pgas_deph4=(length(which(GASC=="B"& BISC=="detectado")))/ dim(M)[1] E_GASA_DEPH=-(Pgas_deph1*log2(Pgas_deph1)+Pgas_deph2*log2(Pgas_deph2)) E_GASB_DEPH=-(Pgas_deph3*log2(Pgas_deph3)+Pgas_deph4*log2(Pgas_deph4)) E_GAS_DEPH=-(Pgas_deph1*log2(Pgas_deph1)+Pgas_deph2*log2(Pgas_deph2)+Pgas_deph3*log2(Pgas_deph3)+Pgas_deph4*log2(Pgas_deph4)) ###Entropia conjunta GAS CON OCT #COM1_GAS-OCT=A-no detectado Pgas_oct1=(length(which(GASC=="A"& OCTC=="No detectado")))/ dim(M)[1] #COM2_GAS-OCT=A-detectado

Page 147: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

147

Pgas_oct2=(length(which(GASC=="A"& OCTC=="detectado")))/ dim(M)[1] #COM3_GAS-OCT= B- no detectado Pgas_oct3=(length(which(GASC=="B"& OCTC=="No detectado")))/ dim(M)[1] #COM4_GAS-OCT= B-detectado Pgas_oct4=(length(which(GASC=="B"& OCTC=="detectado")))/ dim(M)[1] E_GASA_OCT=-(Pgas_oct1*log2(Pgas_oct1)+Pgas_oct2*log2(Pgas_oct2)) E_GASB_OCT=-(Pgas_oct3*log2(Pgas_oct3)+Pgas_oct4*log2(Pgas_oct4)) E_GAS_OCT=-(Pgas_oct1*log2(Pgas_oct1)+Pgas_oct2*log2(Pgas_oct2)+Pgas_oct3*log2(Pgas_oct3)+Pgas_oct4*log2(Pgas_oct4)) ###Entropia conjunta GAS CON TER #COM1_GAS-TER=A-no detectado Pgas_ter1=(length(which(GASC=="A"& TERC=="No detectado")))/ dim(M)[1] #COM2_GAS-TER=A-detectado Pgas_ter2=(length(which(GASC=="A"& TERC=="detectado")))/ dim(M)[1] #COM3_GAS-TER= B- no detectado Pgas_ter3=(length(which(GASC=="B"& TERC=="No detectado")))/ dim(M)[1] #COM4_GAS-TER= B-detectado Pgas_ter4=(length(which(GASC=="B"& TERC=="detectado")))/ dim(M)[1] E_GASA_TER=-(Pgas_ter1*log2(Pgas_ter1)+Pgas_ter2*log2(Pgas_ter2)) E_GASB_TER=-(Pgas_ter3*log2(Pgas_ter3)+Pgas_ter4*log2(Pgas_ter4)) E_GAS_TER=-(Pgas_ter1*log2(Pgas_ter1)+Pgas_ter2*log2(Pgas_ter2)+Pgas_ter3*log2(Pgas_ter3)+Pgas_ter4*log2(Pgas_ter4)) ###Entropia conjunta GAS CON ACE #COM1_GAS-ACE=A-no detectado Pgas_ace1=(length(which(GASC=="A"& ACEC=="No detectado")))/ dim(M)[1] #COM2_GAS-ACE=A-detectado Pgas_ace2=(length(which(GASC=="A"& ACEC=="detectado")))/ dim(M)[1] #COM3_GAS-ACE= B- no detectado

Page 148: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

148

Pgas_ace3=(length(which(GASC=="B"& ACEC=="No detectado")))/ dim(M)[1] #COM4_GAS-ACE= B-detectado Pgas_ace4=(length(which(GASC=="B"& ACEC=="detectado")))/ dim(M)[1] E_GASA_ACE=-(Pgas_ace1*log2(Pgas_ace1)+Pgas_ace2*log2(Pgas_ace2)) E_GASB_ACE=-(Pgas_ace3*log2(Pgas_ace3)+Pgas_ace4*log2(Pgas_ace4)) E_GAS_ACE=-(Pgas_ace1*log2(Pgas_ace1)+Pgas_ace2*log2(Pgas_ace2)+Pgas_ace3*log2(Pgas_ace3)+Pgas_ace4*log2(Pgas_ace4)) ###Entropia conjunta GAS CON CAF #COM1_GAS-CAF=A-no detectado Pgas_caf1=(length(which(GASC=="A"& CAFC=="No detectado")))/ dim(M)[1] #COM2_GAS-CAF=A-detectado Pgas_caf2=(length(which(GASC=="A"& CAFC=="detectado")))/ dim(M)[1] #COM3_GAS-CAF= B- no detectado Pgas_caf3=(length(which(GASC=="B"& CAFC=="No detectado")))/ dim(M)[1] #COM4_GAS-CAF= B-detectado Pgas_caf4=(length(which(GASC=="B"& CAFC=="detectado")))/ dim(M)[1] E_GASA_CAF=-(Pgas_caf1*log2(Pgas_caf1)+Pgas_caf2*log2(Pgas_caf2)) E_GASB_CAF=-(Pgas_caf4*log2(Pgas_caf4)) E_GAS_CAF=-(Pgas_caf1*log2(Pgas_caf1)+Pgas_caf2*log2(Pgas_caf2)+Pgas_caf4*log2(Pgas_caf4)) ###Entropia conjunta GAS CON FLU #COM1_GAS-FLU=A-no detectado Pgas_flu1=(length(which(GASC=="A"& FLUC=="No detectado")))/ dim(M)[1] #COM2_GAS-FLU=A-detectado Pgas_flu2=(length(which(GASC=="A"& FLUC=="detectado")))/ dim(M)[1] #COM3_GAS-FLU= B- no detectado Pgas_flu3=(length(which(GASC=="B"& FLUC=="No detectado")))/ dim(M)[1] #COM4_GAS-FLU= B-detectado Pgas_flu4=(length(which(GASC=="B"& FLUC=="detectado")))/ dim(M)[1]

Page 149: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

149

E_GASA_FLU=-(Pgas_flu1*log2(Pgas_flu1)+Pgas_flu2*log2(Pgas_flu2)) E_GASB_FLU=-(Pgas_flu3*log2(Pgas_flu3)+Pgas_flu4*log2(Pgas_flu4)) E_GAS_FLU=-(Pgas_flu1*log2(Pgas_flu1)+Pgas_flu2*log2(Pgas_flu2)+Pgas_flu3*log2(Pgas_flu3)+Pgas_flu4*log2(Pgas_flu4)) ###Entropia conjunta GAS CON GEM #COM1_GAS-GEM=A-no detectado Pgas_gem1=(length(which(GASC=="A"& GEMC=="No detectado")))/ dim(M)[1] #COM2_GAS-GEM=A-detectado Pgas_gem2=(length(which(GASC=="A"& GEMC=="detectado")))/ dim(M)[1] #COM3_GAS-GEM= B- no detectado Pgas_gem3=(length(which(GASC=="B"& GEMC=="No detectado")))/ dim(M)[1] #COM4_GAS-GEM= B-detectado Pgas_gem4=(length(which(GASC=="B"& GEMC=="detectado")))/ dim(M)[1] E_GASA_GEM=-(Pgas_gem1*log2(Pgas_gem1)+Pgas_gem2*log2(Pgas_gem2)) E_GASB_GEM=-(Pgas_gem3*log2(Pgas_gem3)+Pgas_gem4*log2(Pgas_gem4)) E_GAS_GEM=-(Pgas_gem1*log2(Pgas_gem1)+Pgas_gem2*log2(Pgas_gem2)+Pgas_gem3*log2(Pgas_gem3)+Pgas_gem4*log2(Pgas_gem4)) ###Entropia conjunta GAS CON TRI #COM1_GAS-TRI=A-no detectado Pgas_tri1=(length(which(GASC=="A"& TRIC=="No detectado")))/ dim(M)[1] #COM2_GAS-TRI=A-detectado Pgas_tri2=(length(which(GASC=="A"& TRIC=="detectado")))/ dim(M)[1] #COM3_GAS-TRI= B- no detectado Pgas_tri3=(length(which(GASC=="B"& TRIC=="No detectado")))/ dim(M)[1] #COM4_GAS-TRI= B-detectado Pgas_tri4=(length(which(GASC=="B"& TRIC=="detectado")))/ dim(M)[1] E_GASA_TRI=-(Pgas_tri1*log2(Pgas_tri1)+Pgas_tri2*log2(Pgas_tri2)) E_GASB_TRI=-(Pgas_tri3*log2(Pgas_tri3)+Pgas_tri4*log2(Pgas_tri4))

Page 150: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

150

E_GAS_TRI=-(Pgas_tri1*log2(Pgas_tri1)+Pgas_tri2*log2(Pgas_tri2)+Pgas_tri3*log2(Pgas_tri3)+Pgas_tri4*log2(Pgas_tri4)) ###Entropia conjunta GAS CON BPA #COM1_GAS-BPA=A-no detectado Pgas_bpa1=(length(which(GASC=="A"& BISAC=="No detectado")))/ dim(M)[1] #COM2_GAS-BPA=A-detectado Pgas_bpa2=(length(which(GASC=="A"& BISAC=="detectado")))/ dim(M)[1] #COM3_GAS-BPA= B- no detectado Pgas_bpa3=(length(which(GASC=="B"& BISAC=="No detectado")))/ dim(M)[1] #COM4_GAS-BPA= B-detectado Pgas_bpa4=(length(which(GASC=="B"& BISAC=="detectado")))/ dim(M)[1] E_GASA_BPA=-(Pgas_bpa1*log2(Pgas_bpa1)+Pgas_bpa2*log2(Pgas_bpa2)) E_GASB_BPA=-(Pgas_bpa3*log2(Pgas_bpa3)+Pgas_bpa4*log2(Pgas_bpa4)) E_GAS_BPA=-(Pgas_bpa1*log2(Pgas_bpa1)+Pgas_bpa2*log2(Pgas_bpa2)+Pgas_bpa3*log2(Pgas_bpa3)+Pgas_bpa4*log2(Pgas_bpa4)) ###Entropia conjunta GAS CON PRI #COM1_GAS-PRI=A-no detectado Pgas_pri1=(length(which(GASC=="A"& PRIC=="No detectado")))/ dim(M)[1] #COM2_GAS-PRI=A-detectado Pgas_pri2=(length(which(GASC=="A"& PRIC=="detectado")))/ dim(M)[1] #COM3_GAS-PRI= B- no detectado Pgas_pri3=(length(which(GASC=="B"& PRIC=="No detectado")))/ dim(M)[1] #COM4_GAS-PRI= B-detectado Pgas_pri4=(length(which(GASC=="B"& PRIC=="detectado")))/ dim(M)[1] E_GASA_PRI=-(Pgas_pri1*log2(Pgas_pri1)+Pgas_pri2*log2(Pgas_pri2)) E_GASB_PRI=-(Pgas_pri3*log2(Pgas_pri3)+Pgas_pri4*log2(Pgas_pri4)) E_GAS_PRI=-(Pgas_pri1*log2(Pgas_pri1)+Pgas_pri2*log2(Pgas_pri2)+Pgas_pri3*log2(Pgas_pri3)+Pgas_pri4*log2(Pgas_pri4))

Page 151: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

151

###Entropia conjunta GAS CON CAR #COM1_GAS-CAR=A-no detectado Pgas_car1=(length(which(GASC=="A"& CARC=="No detectado")))/ dim(M)[1] #COM2_GAS-CAR=A-detectado Pgas_car2=(length(which(GASC=="A"& CARC=="detectado")))/ dim(M)[1] #COM3_GAS-CAR= B- no detectado Pgas_car3=(length(which(GASC=="B"& CARC=="No detectado")))/ dim(M)[1] #COM4_GAS-CAR= B-detectado Pgas_car4=(length(which(GASC=="B"& CARC=="detectado")))/ dim(M)[1] E_GASA_CAR=-(Pgas_car1*log2(Pgas_car1)+Pgas_car2*log2(Pgas_car2)) E_GASB_CAR=-(Pgas_car3*log2(Pgas_car3)+Pgas_car4*log2(Pgas_car4)) E_GAS_CAR=-(Pgas_car1*log2(Pgas_car1)+Pgas_car2*log2(Pgas_car2)+Pgas_car3*log2(Pgas_car3)+Pgas_car4*log2(Pgas_car4)) ###Entropia conjunta GAS CON PRO #COM1_GAS-PRO=A-no detectado Pgas_pro1=(length(which(GASC=="A"& PROC=="No detectado")))/ dim(M)[1] #COM2_GAS-PRO=A-detectado Pgas_pro2=(length(which(GASC=="A"& PROC=="detectado")))/ dim(M)[1] #COM3_GAS-PRO= B- no detectado Pgas_pro3=(length(which(GASC=="B"& PROC=="No detectado")))/ dim(M)[1] #COM4_GAS-PRO= B-detectado Pgas_pro4=(length(which(GASC=="B"& PROC=="detectado")))/ dim(M)[1] E_GASA_PRO=-(Pgas_pro1*log2(Pgas_pro1)+Pgas_pro2*log2(Pgas_pro2)) E_GASB_PRO=-(Pgas_pro3*log2(Pgas_pro3)+Pgas_pro4*log2(Pgas_pro4)) E_GAS_PRO=-(Pgas_pro1*log2(Pgas_pro1)+Pgas_pro2*log2(Pgas_pro2)+Pgas_pro3*log2(Pgas_pro3)+Pgas_pro4*log2(Pgas_pro4)) #MUTUAL INFORMATION### ################ENVASE######################

Page 152: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

152

#MUTUAL INFORMATION ENV VS MET IenvA_met=EEA+E1-E_ENVA_MET IenvB_met=EEB+E1-E_ENVB_MET Ienv_met=EE+E1-E_ENV_MET #MUTUAL INFORMATION ENV VS ETI IenvA_eti=EEA+E2-E_ENVA_ETI IenvB_eti=EEB+E2-E_ENVB_ETI Ienv_eti=EE+E2-E_ENV_ETI #MUTUAL INFORMATION ENV VS ISO IenvA_iso=EEA+E3-E_ENVA_ISO IenvB_iso=EEB+E3-E_ENVB_ISO Ienv_iso=EE+E3-E_ENV_ISO #MUTUAL INFORMATION ENV VS BUT IenvA_but=EEA+E4-E_ENVA_BUT IenvB_but=EEB+E4-E_ENVB_BUT Ienv_but=EE+E4-E_ENV_BUT #MUTUAL INFORMATION ENV VS DEPH IenvA_deph=EEA+E5-E_ENVA_DEPH IenvB_deph=EEB+E5-E_ENVB_DEPH Ienv_deph=EE+E5-E_ENV_DEPH #MUTUAL INFORMATION ENV VS OCT IenvA_oct=EEA+E6-E_ENVA_OCT IenvB_oct=EEB+E6-E_ENVB_OCT Ienv_oct=EE+E6-E_ENV_OCT #MUTUAL INFORMATION ENV VS TER IenvA_ter=EEA+E7-E_ENVA_TER IenvB_ter=EEB+E7-E_ENVB_TER Ienv_ter=EE+E7-E_ENV_TER #MUTUAL INFORMATION ENV VS ACE IenvB_ace=EEA+E8-E_ENVA_ACE IenvA_ace=EEB+E8-E_ENVB_ACE

Page 153: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

153

Ienv_ace=EE+E8-E_ENV_ACE #MUTUAL INFORMATION ENV VS CAF IenvA_caf=EEA+E9-E_ENVA_CAF IenvB_caf=EEB+E9-E_ENVB_CAF Ienv_caf=EE+E9-E_ENV_CAF #MUTUAL INFORMATION ENV VS FLU IenvA_flu=EEA+E10-E_ENVA_FLU IenvB_flu=EEB+E10-E_ENVB_FLU Ienv_flu=EE+E10-E_ENV_FLU #MUTUAL INFORMATION ENV VS GEM IenvA_gem=EEA+E11-E_ENVA_GEM IenvB_gem=EEB+E11-E_ENVB_GEM Ienv_gem=EE+E11-E_ENV_GEM #MUTUAL INFORMATION ENV VS TRI IenvA_tri=EEA+E12-E_ENVA_TRI IenvB_tri=EEB+E12-E_ENVB_TRI Ienv_tri=EE+E12-E_ENV_TRI #MUTUAL INFORMATION ENV VS BPA IenvA_bpa=EEA+E13-E_ENVA_BPA IenvB_bpa=EEB+E13-E_ENVB_BPA Ienv_bpa=EE+E13-E_ENV_BPA #MUTUAL INFORMATION ENV VS PRI IenvA_pri=EEA+E14-E_ENVA_PRI IenvB_pri=EEB+E14-E_ENVB_PRI Ienv_pri=EE+E14-E_ENV_PRI #MUTUAL INFORMATION ENV VS CAR IenvA_car=EEA+E15-E_ENVA_CAR IenvB_car=EEB+E15-E_ENVB_CAR Ienv_car=EE+E15-E_ENV_CAR #MUTUAL INFORMATION ENV VS PRO IenvA_pro=EEA+E16-E_ENVA_PRO

Page 154: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

154

IenvB_pro=EEB+E16-E_ENVB_PRO Ienv_pro=EE+E16-E_ENV_PRO ############ORIGEN###################### #MUTUAL INFORMATION ORI VS MET IoriA_met=EOA+E1-E_ORIA_MET IoriB_met=EOB+E1-E_ORIB_MET Iori_met=EO+E1-E_ORI_MET #MUTUAL INFORMATION ORI VS ETI IoriA_eti=EOA+E2-E_ORIA_ETI IoriB_eti=EOB+E2-E_ORIB_ETI Iori_eti=EO+E2-E_ORI_ETI #MUTUAL INFORMATION ORI VS ISO IoriA_iso=EOA+E3-E_ORIA_ISO IoriB_iso=EOB+E3-E_ORIB_ISO Iori_iso=EO+E3-E_ORI_ISO #MUTUAL INFORMATION ORI VS BUT IoriA_but=EOA+E4-E_ORIA_BUT IoriB_but=EOB+E4-E_ORIB_BUT Iori_but=EO+E4-E_ORI_BUT #MUTUAL INFORMATION ORI VS BIS IoriA_deph=EOA+E5-E_ORIA_DEPH IoriB_deph=EOB+E5-E_ORIB_DEPH Iori_deph=EO+E5-E_ORI_DEPH #MUTUAL INFORMATION ORI VS OCT IoriA_oct=EOA+E6-E_ORIA_OCT IoriB_oct=EOB+E6-E_ORIB_OCT Iori_oct=EO+E6-E_ORI_OCT #MUTUAL INFORMATION ORI VS TER IoriA_ter=EOA+E7-E_ORIA_TER IoriB_ter=EOB+E7-E_ORIB_TER Iori_ter=EO+E7-E_ORI_TER

Page 155: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

155

#MUTUAL INFORMATION ORI VS ACE IoriA_ace=EOA+E8-E_ORIA_ACE IoriB_ace=EOB+E8-E_ORIB_ACE Iori_ace=EO+E8-E_ORI_ACE #MUTUAL INFORMATION ORI VS CAF IoriA_caf=EOA+E9-E_ORIA_CAF IoriB_caf=EOB+E9-E_ORIB_CAF Iori_caf=EO+E9-E_ORI_CAF #MUTUAL INFORMATION ORI VS FLU IoriA_flu=EOA+E10-E_ORIA_FLU IoriB_flu=EOB+E10-E_ORIB_FLU Iori_flu=EO+E10-E_ORI_FLU #MUTUAL INFORMATION ORI VS GEM IoriA_gem=EOA+E11-E_ORIA_GEM IoriB_gem=EOB+E11-E_ORIB_GEM Iori_gem=EO+E11-E_ORI_GEM #MUTUAL INFORMATION ORI VS TRI IoriA_tri=EOA+E12-E_ORIA_TRI IoriB_tri=EOB+E12-E_ORIB_TRI Iori_tri=EO+E12-E_ORI_TRI #MUTUAL INFORMATION ORI VS BPA IoriA_bpa=EOA+E13-E_ORIA_BPA IoriB_bpa=EOB+E13-E_ORIB_BPA Iori_bpa=EO+E13-E_ORI_BPA #MUTUAL INFORMATION ORI VS PRI IoriA_pri=EOA+E14-E_ORIA_PRI IoriB_pri=EOB+E14-E_ORIB_PRI Iori_pri=EO+E14-E_ORI_PRI #MUTUAL INFORMATION ORI VS CAR IoriA_car=EOA+E15-E_ORIA_CAR IoriB_car=EOB+E15-E_ORIB_CAR Iori_car=EO+E15-E_ORI_CAR

Page 156: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

156

#MUTUAL INFORMATION ORI VS PRO IoriA_pro=EOA+E16-E_ORIA_PRO IoriB_pro=EOB+E16-E_ORIB_PRO Iori_pro=EO+E16-E_ORI_PRO ############GAS###################### #MUTUAL INFORMATION GAS VS MET IgasA_met=EGA+E1-E_GASA_MET IgasB_met=EGB+E1-E_GASB_MET Igas_met=EG+E1-E_GAS_MET #MUTUAL INFORMATION GAS VS ETI IgasA_eti=EGA+E2-E_GASA_ETI IgasB_eti=EGB+E2-E_GASB_ETI Igas_eti=EG+E2-E_GAS_ETI #MUTUAL INFORMATION GAS VS ISO IgasA_iso=EGA+E3-E_GASA_ISO IgasB_iso=EGB+E3-E_GASB_ISO Igas_iso=EG+E3-E_GAS_ISO #MUTUAL INFORMATION GAS VS BUT IgasA_but=EGA+E4-E_GASA_BUT IgasB_but=EGB+E4-E_GASB_BUT Igas_but=EG+E4-E_GAS_BUT #MUTUAL INFORMATION GAS VS BIS IgasA_deph=EGA+E5-E_GASA_DEPH IgasB_deph=EGB+E5-E_GASB_DEPH Igas_deph=EG+E5-E_GAS_DEPH #MUTUAL INFORMATION GAS VS OCT IgasA_oct=EGA+E6-E_GASA_OCT IgasB_oct=EGB+E6-E_GASB_OCT Igas_oct=EG+E6-E_GAS_OCT #MUTUAL INFORMATION GAS VS TER

Page 157: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

157

IgasA_ter=EGA+E7-E_GASA_TER IgasB_ter=EGB+E7-E_GASB_TER Igas_ter=EG+E7-E_GAS_TER #MUTUAL INFORMATION GAS VS ACE IgasA_ace=EGA+E8-E_GASA_ACE IgasB_ace=EGB+E8-E_GASB_ACE Igas_ace=EG+E8-E_GAS_ACE #MUTUAL INFORMATION GAS VS CAF IgasA_caf=EGA+E9-E_GASA_CAF IgasB_caf=EGB+E9-E_GASB_CAF Igas_caf=EG+E9-E_GAS_CAF #MUTUAL INFORMATION GAS VS FLU IgasA_flu=EGA+E10-E_GASA_FLU IgasB_flu=EGB+E10-E_GASB_FLU Igas_flu=EG+E10-E_GAS_FLU #MUTUAL INFORMATION GAS VS GEM IgasA_gem=EGA+E11-E_GASA_GEM IgasB_gem=EGB+E11-E_GASB_GEM Igas_gem=EG+E11-E_GAS_GEM #MUTUAL INFORMATION GAS VS TRI IgasA_tri=EGA+E12-E_GASA_TRI IgasB_tri=EGB+E12-E_GASB_TRI Igas_tri=EG+E12-E_GAS_TRI #MUTUAL INFORMATION GAS VS BPA IgasA_bpa=EGA+E13-E_GASA_BPA IgasB_bpa=EGB+E13-E_GASB_BPA Igas_bpa=EG+E13-E_GAS_BPA #MUTUAL INFORMATION GAS VS PRI IgasA_pri=EGA+E14-E_GASA_PRI IgasB_pri=EGB+E14-E_GASB_PRI Igas_pri=EG+E14-E_GAS_PRI #MUTUAL INFORMATION GAS VS CAR

Page 158: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

158

IgasA_car=EGA+E15-E_GASA_CAR IgasB_car=EGB+E15-E_GASB_CAR Igas_car=EG+E15-E_GAS_CAR #MUTUAL INFORMATION GAS VS PRO IgasA_pro=EGA+E16-E_GASA_PRO IgasB_pro=EGB+E16-E_GASB_PRO Igas_pro=EG+E16-E_GAS_PRO ###########redundancia_ENVASE######### R_envA_met=IenvA_met/(EEA+E1) R_envB_met=IenvB_met/(EEB+E1) R_env_met=Ienv_met/(EE+E1) R_envA_eti=IenvA_eti/(EEA+E2) R_envB_eti=IenvB_eti/(EEB+E2) R_env_eti=Ienv_eti/(EE+E2) R_envA_iso=IenvA_iso/(EEA+E3) R_envB_iso=IenvB_iso/(EEB+E3) R_env_iso=Ienv_iso/(EE+E3) R_envA_but=IenvA_but/(EEA+E4) R_envB_but=IenvB_but/(EEB+E4) R_env_but=Ienv_but/(EE+E4) R_envA_deph=IenvA_deph/(EEA+E5) R_envB_deph=IenvB_deph/(EEB+E5) R_env_deph=Ienv_deph/(EE+E5) R_envA_oct=IenvA_oct/(EEA+E6) R_envB_oct=IenvB_oct/(EEB+E6) R_env_oct=Ienv_oct/(EE+E6) R_envA_ter=IenvA_ter/(EEA+E7) R_envB_ter=IenvB_ter/(EEB+E7) R_env_ter=Ienv_ter/(EE+E7) R_envA_ace=IenvA_ace/(EEA+E8) R_envB_ace=IenvB_ace/(EEB+E8) R_env_ace=Ienv_ace/(EE+E8) R_envA_caf=IenvA_caf/(EEA+E9)

Page 159: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

159

R_envB_caf=IenvB_caf/(EEB+E9) R_env_caf=Ienv_caf/(EE+E9) R_envA_flu=IenvA_flu/(EEA+E10) R_envB_flu=IenvB_flu/(EEB+E10) R_env_flu=Ienv_flu/(EE+E10) R_envA_gem=IenvA_gem/(EEA+E11) R_envB_gem=IenvB_gem/(EEB+E11) R_env_gem=Ienv_gem/(EE+E11) R_envA_tri=IenvA_tri/(EEA+E12) R_envB_tri=IenvB_tri/(EEB+E12) R_env_tri=Ienv_tri/(EE+E12) R_envA_bpa=IenvA_bpa/(EEA+E13) R_envB_bpa=IenvB_bpa/(EEB+E13) R_env_bpa=Ienv_bpa/(EE+E13) R_envA_pri=IenvA_pri/(EEA+E14) R_envB_pri=IenvB_pri/(EEB+E14) R_env_pri=Ienv_pri/(EE+E14) R_envA_car=IenvA_car/(EEA+E15) R_envB_car=IenvB_car/(EEB+E15) R_env_car=Ienv_car/(EE+E15) R_envA_pro=IenvA_pro/(EEA+E16) R_envB_pro=IenvB_pro/(EEB+E16) R_env_pro=Ienv_pro/(EE+E16) ###########redundancia_ORIGEN######### R_oriA_met=IoriA_met/(EOA+E1) R_oriB_met=IoriB_met/(EOB+E1) R_ori_met=Iori_met/(EO+E1) R_oriA_eti=IoriA_eti/(EOA+E2) R_oriB_eti=IoriB_eti/(EOB+E2) R_ori_eti=Iori_eti/(EO+E2) R_oriA_iso=IoriA_iso/(EOA+E3) R_oriB_iso=IoriB_iso/(EOB+E3) R_ori_iso=Iori_iso/(EO+E3) R_oriA_but=IoriA_but/(EOA+E4) R_oriB_but=IoriB_but/(EOB+E4)

Page 160: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

160

R_ori_but=Iori_but/(EO+E4) R_oriA_deph=IoriA_deph/(EOA+E5) R_oriB_deph=IoriB_deph/(EOB+E5) R_ori_deph=Iori_deph/(EO+E5) R_oriA_oct=IoriA_oct/(EOA+E6) R_oriB_oct=IoriB_oct/(EOB+E6) R_ori_oct=Iori_oct/(EO+E6) R_oriA_ter=IoriA_ter/(EOA+E7) R_oriB_ter=IoriB_ter/(EOB+E7) R_ori_ter=Iori_ter/(EO+E7) R_oriA_ace=IoriA_ace/(EOA+E8) R_oriB_ace=IoriB_ace/(EOB+E8) R_ori_ace=Iori_ace/(EO+E8) R_oriA_caf=IoriA_caf/(EOA+E9) R_oriB_caf=IoriB_caf/(EOB+E9) R_ori_caf=Iori_caf/(EO+E9) R_oriA_flu=IoriA_flu/(EOA+E10) R_oriB_flu=IoriB_flu/(EOB+E10) R_ori_flu=Iori_flu/(EO+E10) R_oriA_gem=IoriA_gem/(EOA+E11) R_oriB_gem=IoriB_gem/(EOB+E11) R_ori_gem=Iori_gem/(EO+E11) R_oriA_tri=IoriA_tri/(EOA+E12) R_oriB_tri=IoriB_tri/(EOB+E12) R_ori_tri=Iori_tri/(EO+E12) R_oriA_bpa=IoriA_bpa/(EOA+E13) R_oriB_bpa=IoriB_bpa/(EOB+E13) R_ori_bpa=Iori_bpa/(EO+E13) R_oriA_pri=IoriA_pri/(EOA+E14) R_oriB_pri=IoriB_pri/(EOB+E14) R_ori_pri=Iori_pri/(EO+E14) R_oriA_car=IoriA_car/(EOA+E15) R_oriB_car=IoriB_car/(EOB+E15) R_ori_car=Iori_car/(EO+E15) R_oriA_pro=IoriA_pro/(EOA+E16)

Page 161: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

161

R_oriB_pro=IoriB_pro/(EOB+E16) R_ori_pro=Iori_pro/(EO+E16) ###########redundancia_GAS######### R_gasA_met=IgasA_met/(EGA+E1) R_gasB_met=IgasB_met/(EGB+E1) R_gas_met=Igas_met/(EG+E1) R_gasA_eti=IgasA_eti/(EGA+E2) R_gasB_eti=IgasB_eti/(EGB+E2) R_gas_eti=Igas_eti/(EG+E2) R_gasA_iso=IgasA_iso/(EGA+E3) R_gasB_iso=IgasB_iso/(EGB+E3) R_gas_iso=Igas_iso/(EG+E3) R_gasA_but=IgasA_but/(EGA+E4) R_gasB_but=IgasB_but/(EGB+E4) R_gas_but=Igas_but/(EG+E4) R_gasA_deph=IgasA_deph/(EGA+E5) R_gasB_deph=IgasB_deph/(EGB+E5) R_gas_deph=Igas_deph/(EG+E5) R_gasA_oct=IgasA_oct/(EGA+E6) R_gasB_oct=IgasB_oct/(EGB+E6) R_gas_oct=Igas_oct/(EG+E6) R_gasA_ter=IgasA_ter/(EGA+E7) R_gasB_ter=IgasB_ter/(EGB+E7) R_gas_ter=Igas_ter/(EG+E7) R_gasA_ace=IgasA_ace/(EGA+E8) R_gasB_ace=IgasB_ace/(EGB+E8) R_gas_ace=Igas_ace/(EG+E8) R_gasA_caf=IgasA_caf/(EGA+E9) R_gasB_caf=IgasB_caf/(EGB+E9) R_gas_caf=Igas_caf/(EG+E9) R_gasA_flu=IgasA_flu/(EGA+E10) R_gasB_flu=IgasB_flu/(EGB+E10) R_gas_flu=Igas_flu/(EG+E10) R_gasA_gem=IgasA_gem/(EGA+E11) R_gasB_gem=IgasB_gem/(EGB+E11)

Page 162: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

162

R_gas_gem=Igas_gem/(EG+E11) R_gasA_tri=IgasA_tri/(EGA+E12) R_gasB_tri=IgasB_tri/(EGB+E12) R_gas_tri=Igas_tri/(EG+E12) R_gasA_bpa=IgasA_bpa/(EGA+E13) R_gasB_bpa=IgasB_bpa/(EGB+E13) R_gas_bpa=Igas_bpa/(EG+E13) R_gasA_pri=IgasA_pri/(EGA+E14) R_gasB_pri=IgasB_pri/(EGB+E14) R_gas_pri=Igas_pri/(EG+E14) R_gasA_car=IgasA_car/(EGA+E15) R_gasB_car=IgasB_car/(EGB+E15) R_gas_car=Igas_car/(EG+E15) R_gasA_pro=IgasA_pro/(EGA+E16) R_gasB_pro=IgasB_pro/(EGB+E16) R_gas_pro=Igas_pro/(EG+E16) #############Redundancia maxima envase############### # Redundancia maxima entre ENV vs MET ######################## if (EEA>E1){ Rm_envA_met=E1/(EEA+E1) }else{ Rm_envA_met=EEA/(EEA+E1) } ##################### if (EEB>E1){ Rm_envB_met=E1/(EEB+E1) }else{ Rm_envB_met=EEB/(EEB+E1) } if (EE>E1){ Rm_env_met=E1/(EE+E1) }else{ Rm_env_met=EE/(EE+E1) }

Page 163: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

163

# Redundancia maxima entre ENV vs ETI if (EEA>E2){ Rm_envA_eti=E2/(EEA+E2) }else{ Rm_envA_eti=EEA/(EEA+E2) } if (EEB>E2){ Rm_envB_eti=E2/(EEB+E2) }else{ Rm_envB_eti=EEB/(EEB+E2) } if (EE>E2){ Rm_env_eti=E2/(EE+E2) }else{ Rm_env_eti=EE/(EE+E2) } # Redundancia maxima entre ENV vs ISO if (EEA>E3){ Rm_envA_iso=E3/(EEA+E3) }else{ Rm_envA_iso=EEA/(EEA+E3) } if (EEB>E3){ Rm_envB_iso=E3/(EEB+E3) }else{ Rm_envB_iso=EEB/(EEB+E3) } if (EE>E3){ Rm_env_iso=E3/(EE+E3) }else{ Rm_env_iso=EE/(EE+E3) } # Redundancia maxima entre ENV vs BUT

Page 164: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

164

if (EEA>E4){ Rm_envA_but=E4/(EEA+E4) }else{ Rm_envA_but=EEA/(EEA+E4) } if (EEB>E4){ Rm_envB_but=E4/(EEB+E4) }else{ Rm_envB_but=EEB/(EEB+E4) } if (EE>E4){ Rm_env_but=E4/(EE+E4) }else{ Rm_env_but=EE/(EE+E4) } # Redundancia maxima entre ENV vs DEPH if (EEA>E5){ Rm_envA_deph=E5/(EEA+E5) }else{ Rm_envA_deph=EEA/(EEA+E5) } if (EEB>E5){ Rm_envB_deph=E5/(EEB+E5) }else{ Rm_envB_deph=EEB/(EEB+E5) } if (EE>E5){ Rm_env_deph=E5/(EE+E5) }else{ Rm_env_deph=EE/(EE+E5) } # Redundancia maxima entre ENV vs OCT if (EEA>E6){

Page 165: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

165

Rm_envA_oct=E6/(EEA+E6) }else{ Rm_envA_oct=EEA/(EEA+E6) } if (EEB>E6){ Rm_envB_oct=E6/(EEB+E6) }else{ Rm_envB_oct=EEB/(EEB+E6) } if (EE>E6){ Rm_env_oct=E6/(EE+E6) }else{ Rm_env_oct=EE/(EE+E6) } # Redundancia maxima entre ENV vs TER if (EEA>E7){ Rm_envA_ter=E7/(EEA+E7) }else{ Rm_envA_ter=EEA/(EEA+E7) } if (EEB>E7){ Rm_envB_ter=E7/(EEB+E7) }else{ Rm_envB_ter=EEB/(EEB+E7) } if (EE>E7){ Rm_env_ter=E7/(EE+E7) }else{ Rm_env_ter=EE/(EE+E7) } # Redundancia maxima entre ENV vs ACE if (EEA>E8){ Rm_envA_ace=E8/(EEA+E8) }else{

Page 166: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

166

Rm_envA_ace=EEA/(EEA+E8) } if (EEB>E8){ Rm_envB_ace=E8/(EEB+E8) }else{ Rm_envB_ace=EEB/(EEB+E8) } if (EE>E8){ Rm_env_ace=E8/(EE+E8) }else{ Rm_env_ace=EE/(EE+E8) } # Redundancia maxima entre ENV vs CAF if (EEA>E9){ Rm_envA_caf=E9/(EEA+E9) }else{ Rm_envA_caf=EEA/(EEA+E9) } if (EEB>E9){ Rm_envB_caf=E9/(EEB+E9) }else{ Rm_envB_caf=EEB/(EEB+E9) } if (EE>E9){ Rm_env_caf=E9/(EE+E9) }else{ Rm_env_caf=EE/(EE+E9) } # Redundancia maxima entre ENV vs FLU if (EEA>E10){ Rm_envA_flu=E10/(EEA+E10) }else{

Page 167: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

167

Rm_envA_flu=EEA/(EEA+E10) } if (EEB>E10){ Rm_envB_flu=E10/(EEB+E10) }else{ Rm_envB_flu=EEB/(EEB+E10) } if (EE>E10){ Rm_env_flu=E10/(EE+E10) }else{ Rm_env_flu=EE/(EE+E10) } # Redundancia maxima entre ENV vs GEM if (EEA>E11){ Rm_envA_gem=E11/(EEA+E11) }else{ Rm_envA_gem=EEA/(EEA+E11) } if (EEB>E11){ Rm_envB_gem=E11/(EEB+E11) }else{ Rm_envB_gem=EEB/(EEB+E11) } if (EE>E11){ Rm_env_gem=E11/(EE+E11) }else{ Rm_env_gem=EE/(EE+E11) } # Redundancia maxima entre ENV vs TRI if (EEA>E12){ Rm_envA_tri=E12/(EEA+E12) }else{ Rm_envA_tri=EEA/(EEA+E12) }

Page 168: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

168

if (EEB>E12){ Rm_envB_tri=E12/(EEB+E12) }else{ Rm_envB_tri=EEB/(EEB+E12) } if (EE>E12){ Rm_env_tri=E12/(EE+E12) }else{ Rm_env_tri=EE/(EE+E12) } # Redundancia maxima entre ENV vs BPA if (EEA>E13){ Rm_envA_bpa=E13/(EEA+E13) }else{ Rm_envA_bpa=EEA/(EEA+E13) } if (EEB>E13){ Rm_envB_bpa=E13/(EEB+E13) }else{ Rm_envB_bpa=EEB/(EEB+E13) } if (EE>E13){ Rm_env_bpa=E13/(EE+E13) }else{ Rm_env_bpa=EE/(EE+E13) } # Redundancia maxima entre ENV vs PRI if (EEA>E14){ Rm_envA_pri=E14/(EEA+E14) }else{ Rm_envA_pri=EEA/(EEA+E14) } if (EEB>E14){ Rm_envB_pri=E14/(EEB+E14)

Page 169: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

169

}else{ Rm_envB_pri=EEB/(EEB+E14) } if (EE>E14){ Rm_env_pri=E14/(EE+E14) }else{ Rm_env_pri=EE/(EE+E14) } # Redundancia maxima entre ENV vs CAR if (EEA>E15){ Rm_envA_car=E15/(EEA+E15) }else{ Rm_envA_car=EEA/(EEA+E15) } if (EEB>E15){ Rm_envB_car=E15/(EEB+E15) }else{ Rm_envB_car=EEB/(EEB+E15) } if (EE>E15){ Rm_env_car=E15/(EE+E15) }else{ Rm_env_car=EE/(EE+E15) } # Redundancia maxima entre ENV vs PRO if (EEA>E16){ Rm_envA_pro=E16/(EEA+E16) }else{ Rm_envA_pro=EEA/(EEA+E16) } if (EEB>E16){ Rm_envB_pro=E16/(EEB+E16) }else{ Rm_envB_pro=EEB/(EEB+E16)

Page 170: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

170

} if (EE>E16){ Rm_env_pro=E16/(EE+E16) }else{ Rm_env_pro=EE/(EE+E16) } #######################################ORI########################## # Redundancia maxima entre ORI vs MET if (EOA>E1){ Rm_oriA_met=E1/(EOA+E1) }else{ Rm_oriA_met=EOA/(EOA+E1) } if (EOB>E1){ Rm_oriB_met=E1/(EOB+E1) }else{ Rm_oriB_met=EOB/(EOB+E1) } if (EO>E1){ Rm_ori_met=E1/(EO+E1) }else{ Rm_ori_met=EO/(EO+E1) } # Redundancia maxima entre ORI vs ETI if (EOA>E2){ Rm_oriA_eti=E2/(EOA+E2) }else{ Rm_oriA_eti=EOA/(EOA+E2) } if (EOB>E2){ Rm_oriB_eti=E2/(EOB+E2) }else{ Rm_oriB_eti=EOB/(EOB+E2) }

Page 171: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

171

if (EO>E2){ Rm_ori_eti=E2/(EO+E2) }else{ Rm_ori_eti=EO/(EO+E2) } # Redundancia maxima entre ORI vs ISO if (EOA>E3){ Rm_oriA_iso=E3/(EOA+E3) }else{ Rm_oriA_iso=EOA/(EOA+E3) } if (EOB>E3){ Rm_oriB_iso=E3/(EOB+E3) }else{ Rm_oriB_iso=EOB/(EOB+E3) } if (EO>E3){ Rm_ori_iso=E3/(EO+E3) }else{ Rm_ori_iso=EO/(EO+E3) } # Redundancia maxima entre ORI vs BUT if (EOA>E4){ Rm_oriA_but=E4/(EOA+E4) }else{ Rm_oriA_but=EOA/(EOA+E4) } if (EOB>E4){ Rm_oriB_but=E4/(EOB+E4) }else{ Rm_oriB_but=EOB/(EOB+E4) } if (EO>E4){ Rm_ori_but=E4/(EO+E4)

Page 172: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

172

}else{ Rm_ori_but=EO/(EO+E4) } # Redundancia maxima entre ORI vs DEPH if (EOA>E5){ Rm_oriA_deph=E5/(EOA+E5) }else{ Rm_oriA_deph=EOA/(EOA+E5) } if (EOB>E5){ Rm_oriB_deph=E5/(EOB+E5) }else{ Rm_oriB_deph=EOB/(EOB+E5) } if (EO>E5){ Rm_ori_deph=E5/(EO+E5) }else{ Rm_ori_deph=EO/(EO+E5) } # Redundancia maxima entre ORI vs OCT if (EOA>E6){ Rm_oriA_oct=E6/(EOA+E6) }else{ Rm_oriA_oct=EOA/(EOA+E6) } if (EOB>E6){ Rm_oriB_oct=E6/(EOB+E6) }else{ Rm_oriB_oct=EOB/(EOB+E6) } if (EO>E6){ Rm_ori_oct=E6/(EO+E6) }else{ Rm_ori_oct=EO/(EO+E6)

Page 173: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

173

} # Redundancia maxima entre ORI vs TER if (EOA>E7){ Rm_oriA_ter=E7/(EOA+E7) }else{ Rm_oriA_ter=EOA/(EOA+E7) } if (EOB>E7){ Rm_oriB_ter=E7/(EOB+E7) }else{ Rm_oriB_ter=EOB/(EOB+E7) } if (EO>E7){ Rm_ori_ter=E7/(EO+E7) }else{ Rm_ori_ter=EO/(EO+E7) } # Redundancia maxima entre ORI vs ACE if (EOA>E8){ Rm_oriA_ace=E8/(EOA+E8) }else{ Rm_oriA_ace=EOA/(EOA+E8) } if (EOB>E8){ Rm_oriB_ace=E8/(EOB+E8) }else{ Rm_oriB_ace=EOB/(EOB+E8) } if (EO>E8){ Rm_ori_ace=E8/(EO+E8) }else{ Rm_ori_ace=EO/(EO+E8) } # Redundancia maxima entre ORI vs CAF

Page 174: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

174

if (EOA>E9){ Rm_oriA_caf=E9/(EOA+E9) }else{ Rm_oriA_caf=EOA/(EOA+E9) } if (EOB>E9){ Rm_oriB_caf=E9/(EOB+E9) }else{ Rm_oriB_caf=EOB/(EOB+E9) } if (EO>E9){ Rm_ori_caf=E9/(EO+E9) }else{ Rm_ori_caf=EO/(EO+E9) } # Redundancia maxima entre ORI vs FLU if (EOA>E10){ Rm_oriA_flu=E10/(EOA+E10) }else{ Rm_oriA_flu=EOA/(EOA+E10) } if (EOB>E10){ Rm_oriB_flu=E10/(EOB+E10) }else{ Rm_oriB_flu=EOB/(EOB+E10) } if (EO>E10){ Rm_ori_flu=E10/(EO+E10) }else{ Rm_ori_flu=EO/(EO+E10) } # Redundancia maxima entre ORI vs GEM if (EOA>E11){ Rm_oriA_gem=E11/(EOA+E11) }else{

Page 175: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

175

Rm_oriA_gem=EOA/(EOA+E11) } if (EOB>E11){ Rm_oriB_gem=E11/(EOB+E11) }else{ Rm_oriB_gem=EOB/(EOB+E11) } if (EO>E11){ Rm_ori_gem=E11/(EO+E11) }else{ Rm_ori_gem=EO/(EO+E11) } # Redundancia maxima entre ORI vs TRI if (EOA>E12){ Rm_oriA_tri=E12/(EOA+E12) }else{ Rm_oriA_tri=EOA/(EOA+E12) } if (EOB>E12){ Rm_oriB_tri=E12/(EOB+E12) }else{ Rm_oriB_tri=EOB/(EOB+E12) } if (EO>E12){ Rm_ori_tri=E12/(EO+E12) }else{ Rm_ori_tri=EO/(EO+E12) } # Redundancia maxima entre ORI vs BPA if (EOA>E13){ Rm_oriA_bpa=E13/(EOA+E13) }else{ Rm_oriA_bpa=EOA/(EOA+E13) }

Page 176: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

176

if (EOB>E13){ Rm_oriB_bpa=E13/(EOB+E13) }else{ Rm_oriB_bpa=EOB/(EOB+E13) } if (EO>E13){ Rm_ori_bpa=E13/(EO+E13) }else{ Rm_ori_bpa=EO/(EO+E13) } # Redundancia maxima entre ORI vs PRI if (EOA>E14){ Rm_oriA_pri=E14/(EOA+E14) }else{ Rm_oriA_pri=EOA/(EOA+E14) } if (EOB>E14){ Rm_oriB_pri=E14/(EOB+E14) }else{ Rm_oriB_pri=EOB/(EOB+E14) } if (EO>E14){ Rm_ori_pri=E14/(EO+E14) }else{ Rm_ori_pri=EO/(EO+E14) } # Redundancia maxima entre ORI vs CAR if (EOA>E15){ Rm_oriA_car=E15/(EOA+E15) }else{ Rm_oriA_car=EOA/(EOA+E15) } if (EOB>E15){ Rm_oriB_car=E15/(EOB+E15)

Page 177: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

177

}else{ Rm_oriB_car=EOB/(EOB+E15) } if (EO>E15){ Rm_ori_car=E15/(EO+E15) }else{ Rm_ori_car=EO/(EO+E15) } # Redundancia maxima entre ORI vs PRO if (EOA>E16){ Rm_oriA_pro=E16/(EOA+E16) }else{ Rm_oriA_pro=EOA/(EOA+E16) } if (EOB>E16){ Rm_oriB_pro=E16/(EOB+E16) }else{ Rm_oriB_pro=EOB/(EOB+E16) } if (EO>E16){ Rm_ori_pro=E16/(EO+E16) }else{ Rm_ori_pro=EO/(EO+E16) } #######################################gas########################## # Redundancia maxima entre GAS vs MET if (EGA>E1){ Rm_gas_met=E1/(EGA+E1) }else{ Rm_gasA_met=EGA/(EGA+E1) } if (EGB>E1){ Rm_gasB_met=E1/(EGB+E1)

Page 178: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

178

}else{ Rm_gasB_met=EGB/(EGB+E1) } if (EG>E1){ Rm_gas_met=E1/(EG+E1) }else{ Rm_gas_met=EG/(EG+E1) } # Redundancia maxima entre GAS vs ETI if (EGA>E2){ Rm_gasA_eti=E2/(EGA+E2) }else{ Rm_gasA_eti=EGA/(EGA+E2) } if (EGB>E2){ Rm_gasB_eti=E2/(EGB+E2) }else{ Rm_gasB_eti=EGB/(EGB+E2) } if (EG>E2){ Rm_gas_eti=E2/(EG+E2) }else{ Rm_gas_eti=EG/(EG+E2) } # Redundancia maxima entre GAS vs ISO if (EGA>E3){ Rm_gasA_iso=E3/(EGA+E3) }else{ Rm_gasA_iso=EGA/(EGA+E3) } if (EGB>E3){ Rm_gasB_iso=E3/(EGB+E3) }else{ Rm_gasB_iso=EGB/(EGB+E3)

Page 179: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

179

} if (EG>E3){ Rm_gas_iso=E3/(EG+E3) }else{ Rm_gas_iso=EG/(EG+E3) } # Redundancia maxima entre GAS vs BUT if (EGA>E4){ Rm_gasA_but=E4/(EGA+E4) }else{ Rm_gasA_but=EGA/(EGA+E4) } if (EGB>E4){ Rm_gasB_but=E4/(EGB+E4) }else{ Rm_gasB_but=EGB/(EGB+E4) } if (EG>E4){ Rm_gas_but=E4/(EG+E4) }else{ Rm_gas_but=EG/(EG+E4) } # Redundancia maxima entre GAS vs DEPH if (EGA>E5){ Rm_gasA_deph=E5/(EGA+E5) }else{ Rm_gasA_deph=EGA/(EGA+E5) } if (EGB>E5){ Rm_gasB_deph=E5/(EGB+E5) }else{ Rm_gasB_deph=EGB/(EGB+E5) } if (EG>E5){

Page 180: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

180

Rm_gas_deph=E5/(EG+E5) }else{ Rm_gas_deph=EG/(EG+E5) } # Redundancia maxima entre GAS vs OCT if (EGA>E6){ Rm_gasA_oct=E6/(EGA+E6) }else{ Rm_gasA_oct=EGA/(EGA+E6) } if (EGB>E6){ Rm_gasB_oct=E6/(EGB+E6) }else{ Rm_gasB_oct=EGB/(EGB+E6) } if (EG>E6){ Rm_gas_oct=E6/(EG+E6) }else{ Rm_gas_oct=EG/(EG+E6) } # Redundancia maxima entre GAS vs TER if (EGA>E7){ Rm_gasA_ter=E7/(EGA+E7) }else{ Rm_gasA_ter=EGA/(EGA+E7) } if (EGB>E7){ Rm_gasB_ter=E7/(EGB+E7) }else{ Rm_gasB_ter=EGB/(EGB+E7) } if (EG>E7){ Rm_gas_ter=E7/(EG+E7) }else{

Page 181: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

181

Rm_gas_ter=EG/(EG+E7) } # Redundancia maxima entre GAS vs ACE if (EGA>E8){ Rm_gasA_ace=E8/(EGA+E8) }else{ Rm_gasA_ace=EGA/(EGA+E8) } if (EGB>E8){ Rm_gasB_ace=E8/(EGB+E8) }else{ Rm_gasB_ace=EGB/(EGB+E8) } if (EG>E8){ Rm_gas_ace=E8/(EG+E8) }else{ Rm_gas_ace=EG/(EG+E8) } # Redundancia maxima entre GAS vs CAF if (EGA>E9){ Rm_gasA_caf=E9/(EGA+E9) }else{ Rm_gasA_caf=EGA/(EGA+E9) } if (EGB>E9){ Rm_gasB_caf=E9/(EGB+E9) }else{ Rm_gasB_caf=EGB/(EGB+E9) } if (EG>E9){ Rm_gas_caf=E9/(EG+E9) }else{ Rm_gas_caf=EG/(EG+E9) }

Page 182: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

182

# Redundancia maxima entre GAS vs FLU if (EGA>E10){ Rm_gasA_flu=E10/(EGA+E10) }else{ Rm_gasA_flu=EGA/(EGA+E10) } if (EGB>E10){ Rm_gasB_flu=E10/(EGB+E10) }else{ Rm_gasB_flu=EGB/(EGB+E10) } if (EG>E10){ Rm_gas_flu=E10/(EG+E10) }else{ Rm_gas_flu=EG/(EG+E10) } # Redundancia maxima entre GAS vs GEM if (EGA>E11){ Rm_gasA_gem=E11/(EGA+E11) }else{ Rm_gasA_gem=EGA/(EGA+E11) } if (EGB>E11){ Rm_gasB_gem=E11/(EGB+E11) }else{ Rm_gasB_gem=EGB/(EGB+E11) } if (EG>E11){ Rm_gas_gem=E11/(EG+E11) }else{ Rm_gas_gem=EG/(EG+E11) } # Redundancia maxima entre GAS vs TRI if (EGA>E12){ Rm_gasA_tri=E12/(EGA+E12)

Page 183: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

183

}else{ Rm_gasA_tri=EGA/(EGA+E12) } if (EGB>E12){ Rm_gasB_tri=E12/(EGB+E12) }else{ Rm_gasB_tri=EGB/(EGB+E12) } if (EG>E12){ Rm_gas_tri=E12/(EG+E12) }else{ Rm_gas_tri=EG/(EG+E12) } # Redundancia maxima entre GAS vs BPA if (EGA>E13){ Rm_gasA_bpa=E13/(EGA+E13) }else{ Rm_gasA_bpa=EGA/(EGA+E13) } if (EGB>E13){ Rm_gasB_bpa=E13/(EGB+E13) }else{ Rm_gasB_bpa=EGB/(EGB+E13) } if (EG>E13){ Rm_gas_bpa=E13/(EG+E13) }else{ Rm_gas_bpa=EG/(EG+E13) } # Redundancia maxima entre GAS vs PRI if (EGA>E14){ Rm_gasA_pri=E14/(EGA+E14) }else{ Rm_gasA_pri=EGA/(EGA+E14)

Page 184: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

184

} if (EGB>E14){ Rm_gasB_pri=E14/(EGB+E14) }else{ Rm_gasB_pri=EGB/(EGB+E14) } if (EG>E14){ Rm_gas_pri=E14/(EG+E14) }else{ Rm_gas_pri=EG/(EG+E14) } # Redundancia maxima entre GAS vs CAR if (EGA>E15){ Rm_gasA_car=E15/(EGA+E15) }else{ Rm_gasA_car=EGA/(EGA+E15) } if (EGB>E15){ Rm_gasB_car=E15/(EGB+E15) }else{ Rm_gasB_car=EGB/(EGB+E15) } if (EG>E15){ Rm_gas_car=E15/(EG+E15) }else{ Rm_gas_car=EG/(EG+E15) } # Redundancia maxima entre GAS vs PRO if (EGA>E16){ Rm_gasA_pro=E16/(EGA+E16) }else{ Rm_gasA_pro=EGA/(EGA+E16) } if (EGB>E16){

Page 185: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

185

Rm_gasB_pro=E16/(EGB+E16) }else{ Rm_gasB_pro=EGB/(EGB+E16) } if (EG>E16){ Rm_gas_pro=E16/(EG+E16) }else{ Rm_gas_pro=EG/(EG+E16) } ###########################Entropia ################################## EM=rbind(EE,EO,EG,E1,E2,E3,E4,E5,E6,E7,E8,E9,E10,E11,E12,E13,E14,E15,E16) factor=c("ENVASE","ORIGEN","GAS","MET","ETI","ISO","BUT","BIS","OCT","TER","ACE","CAF", "FLU","GEM","TRI","BISA","PRI","CAR","PRO") Entropia_Marginal=cbind(factor,EM) write.csv(Entropia_Marginal,"Entropia_Marginal.cSV",row.names=TRUE) Entropia_Conjunta=rbind(E_ENVA_MET,E_ENVB_MET,E_ENV_MET,E_ENVA_ETI,E_ENVB_ETI,E_ENV_ETI, E_ENVA_ISO,E_ENVB_ISO,E_ENV_ISO,E_ENVA_BUT,E_ENVB_BUT,E_ENV_BUT, E_ENVA_DEPH,E_ENVB_DEPH,E_ENV_DEPH,E_ENVA_OCT,E_ENVB_OCT,E_ENV_OCT, E_ENVA_TER,E_ENVB_TER,E_ENV_TER,E_ENVA_ACE,E_ENVB_ACE,E_ENV_ACE, E_ENVA_CAF,E_ENVB_CAF,E_ENV_CAF,E_ENVA_FLU,E_ENVB_FLU,E_ENV_FLU, E_ENVA_GEM,E_ENVB_GEM,E_ENV_GEM,E_ENVA_TRI,E_ENVB_TRI,E_ENV_TRI, E_ENVA_BPA,E_ENVB_BPA,E_ENV_BPA,E_ENVA_PRI,E_ENVB_PRI,E_ENV_PRI, E_ENVA_CAR,E_ENVB_CAR,E_ENV_CAR,E_ENVA_PRO,E_ENVB_PRO,E_ENV_PRO, E_ORIA_MET,E_ORIB_MET,E_ORI_MET,E_ORIA_ETI,E_ORIB_ETI,E_ORI_ETI,

Page 186: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

186

E_ORIA_ISO,E_ORIB_ISO,E_ORI_ISO,E_ORIA_BUT,E_ORIB_BUT,E_ORI_BUT, E_ORIA_DEPH,E_ORIB_DEPH,E_ORI_DEPH,E_ORIA_OCT,E_ORIB_OCT,E_ORI_OCT, E_ORIA_TER,E_ORIB_TER,E_ORI_TER,E_ORIA_ACE,E_ORIB_ACE,E_ORI_ACE, E_ORIA_CAF,E_ORIB_CAF,E_ORI_CAF,E_ORIA_FLU,E_ORIB_FLU,E_ORI_FLU, E_ORIA_GEM,E_ORIB_GEM,E_ORI_GEM,E_ORIA_TRI,E_ORIB_TRI,E_ORI_TRI, E_ORIA_BPA,E_ORIB_BPA,E_ORI_BPA,E_ORIA_PRI,E_ORIB_PRI,E_ORI_PRI, E_ORIA_CAR,E_ORIB_CAR,E_ORI_CAR,E_ORIA_PRO,E_ORIB_PRO,E_ORI_PRO, E_GASA_MET,E_GASB_MET,E_GAS_MET,E_GASA_ETI,E_GASB_ETI,E_GAS_ETI, E_GASA_ISO,E_GASB_ISO,E_GAS_ISO,E_GASA_BUT,E_GASB_BUT,E_GAS_BUT, E_GASA_DEPH,E_GASB_DEPH,E_GAS_DEPH,E_GASA_OCT,E_GASB_OCT,E_GAS_OCT, E_GASA_TER,E_GASB_TER,E_GAS_TER,E_GASA_ACE,E_GASB_ACE,E_GAS_ACE, E_GASA_CAF,E_GASB_CAF,E_GAS_CAF,E_GASA_FLU,E_GASB_FLU,E_GAS_FLU, E_GASA_GEM,E_GASB_GEM,E_GAS_GEM,E_GASA_TRI,E_GASB_TRI,E_GAS_TRI, E_GASA_BPA,E_GASB_BPA,E_GAS_BPA,E_GASA_PRI,E_GASB_PRI,E_GAS_PRI, E_GASA_CAR,E_GASB_CAR,E_GAS_CAR,E_GASA_PRO,E_GASB_PRO,E_GAS_PRO) MI=rbind(Ienv_met,Ienv_met,Ienv_met,Ienv_eti,Ienv_eti,Ienv_eti,Ienv_iso,Ienv_iso,Ienv_iso,Ienv_but,Ienv_but,Ienv_but,Ienv_deph,Ienv_deph,Ienv_deph,Ienv_oct,Ienv_oct,Ienv_oct,Ienv_ter,Ienv_ter,Ienv_ter,Ienv_ace,Ienv_ace,Ienv_ace,Ienv_caf,Ienv_caf,Ienv_caf,Ienv_flu,Ienv_flu,Ienv_flu,Ienv_gem,Ienv_gem,Ienv_gem, Ienv_tri,Ienv_tri,Ienv_tri,Ienv_bpa,Ienv_bpa,Ienv_bpa,Ienv_pri,Ienv_car,Ienv_pri,Ienv_car,Ienv_pri,Ienv_car,Ienv_pro,Ienv_pro,Ienv_pro,Iori_met,Iori_met,Iori_met,Iori_eti,Iori_eti,Iori_eti,Iori_iso,Iori_iso,Iori_iso,Iori_but,Iori_but,Iori_but,Iori_deph,Iori_deph,Iori_deph,Io

Page 187: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

187

ri_oct,Iori_oct,Iori_oct,Iori_ter,Iori_ter,Iori_ter,Iori_ace,Iori_ace,Iori_ace,Iori_caf,Iori_caf,Iori_caf,Iori_flu,Iori_flu,Iori_flu,Iori_gem,Iori_gem,Iori_gem, Iori_tri,Iori_tri,Iori_tri,Iori_bpa,Iori_bpa,Iori_bpa,Iori_pri,Iori_pri,Iori_pri,Iori_car,Iori_car,Iori_car,Iori_pro,Iori_pro,Iori_pro,Igas_met,Igas_met,Igas_met,Igas_eti,Igas_eti,Igas_eti,Igas_iso,Igas_iso,Igas_iso,Igas_but,Igas_but,Igas_but,Igas_deph,Igas_deph,Igas_deph,Igas_oct,Igas_oct,Igas_oct,Igas_ter,Igas_ter,Igas_ter,Igas_ace,Igas_ace,Igas_ace,Igas_caf,Igas_caf,Igas_caf,Igas_flu,Igas_flu,Igas_flu,Igas_gem,Igas_gem,Igas_gem, Igas_tri,Igas_tri,Igas_tri,Igas_bpa,Igas_bpa,Igas_bpa,Igas_pri,Igas_pri,Igas_pri,Igas_car,Igas_car,Igas_car,Igas_pro,Igas_pro,Igas_pro) Redundancia=rbind(R_envA_met,R_envB_met,R_env_met,R_envA_eti,R_envB_eti,Rm_env_eti, R_envA_iso,R_envB_iso,R_env_iso,R_envA_but,R_envB_but,Rm_env_but, R_envA_deph,R_envB_deph,R_env_deph,R_envA_oct,R_envB_oct,R_env_oct, R_envA_ter,R_envB_ter,R_env_ter,R_envA_ace,R_envB_ace,R_env_ace, R_envA_caf,R_envB_caf,R_env_caf,R_envA_flu,R_envB_flu,R_env_flu, R_envA_gem,R_envB_gem,R_env_gem,R_envA_tri,R_envB_tri,R_env_tri, R_envA_bpa,R_envB_bpa,R_env_bpa,R_envA_pri,R_envB_pri,R_env_pri, R_envA_car,R_envB_car,R_env_car,R_envA_pro,R_envB_pro,R_env_pro, R_oriA_met,R_oriB_met,R_ori_met,R_oriA_eti,R_oriB_eti,R_ori_eti, R_oriA_iso,R_oriB_iso,R_ori_iso,R_oriA_but,R_oriB_but,R_ori_but, R_oriA_deph,R_oriB_deph,R_ori_deph,R_oriA_oct,R_oriB_oct,R_ori_oct, R_oriA_ter,R_oriB_ter,R_ori_ter,R_oriA_ace,R_oriB_ace,R_ori_ace, R_oriA_caf,R_oriB_caf,R_ori_caf,R_oriA_flu,R_oriB_flu,R_ori_flu, R_oriA_gem,R_oriB_gem,R_ori_gem,R_oriA_tri,R_oriB_tri,R_ori_tri, R_oriA_bpa,R_oriB_bpa,R_ori_bpa,R_oriA_pri,R_oriB_pri,R_ori_pri, R_oriA_car,R_oriB_car,R_ori_car,R_oriA_pro,R_oriB_pro,R_ori_pro, R_gasA_met,R_gasB_met,R_gas_met,R_gasA_eti,R_gasB_eti,R_gas_eti, R_gasA_iso,R_gasB_iso,R_gas_iso,R_gasA_but,R_gasB_but,R_gas_but, R_gasA_deph,R_gasB_deph,R_gas_deph,R_gasA_oct,R_gasB_oct,R_gas_oct, R_gasA_ter,R_gasB_ter,R_gas_ter,R_gasA_ace,R_gasB_ace,R_gas_ace, R_gasA_caf,R_gasB_caf,R_gas_caf,R_gasA_flu,R_gasB_flu,R_gas_flu, R_gasA_gem,R_gasB_gem,R_gas_gem,R_gasA_tri,R_gasB_tri,R_gas_tri, R_gasA_bpa,R_gasB_bpa,R_gas_bpa,R_gasA_pri,R_gasB_pri,R_gas_pri, R_gasA_car,R_gasB_car,R_gas_car,R_gasA_pro,R_gasB_pro,R_gas_pro) Redundancia_Max=rbind(Rm_envA_met,Rm_envB_met,Rm_env_met,Rm_envA_eti,Rm_envB_eti,Rm_env_eti, Rm_envA_iso,Rm_envB_iso,Rm_env_iso,Rm_envA_but,Rm_envB_but,Rm_env_but, Rm_envA_deph,Rm_envB_deph,Rm_env_deph,Rm_envA_oct,Rm_envB_oct,Rm_env_oct,

Page 188: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

188

Rm_envA_ter,Rm_envB_ter,Rm_env_ter,Rm_envA_ace,Rm_envB_ace,Rm_env_ace, Rm_envA_caf,Rm_envB_caf,Rm_env_caf,Rm_envA_flu,Rm_envB_flu,Rm_env_flu, Rm_envA_gem,Rm_envB_gem,Rm_env_gem,Rm_envA_tri,Rm_envB_tri,Rm_env_tri, Rm_envA_bpa,Rm_envB_bpa,Rm_env_bpa,Rm_envA_pri,Rm_envB_pri,Rm_env_pri, Rm_envA_car,Rm_envB_car,Rm_env_car,Rm_envA_pro,Rm_envB_pro,Rm_env_pro, Rm_oriA_met,Rm_oriB_met,Rm_ori_met,Rm_oriA_eti,Rm_oriB_eti,Rm_ori_eti, Rm_oriA_iso,Rm_oriB_iso,Rm_ori_iso,Rm_oriA_but,Rm_oriB_but,Rm_ori_but, Rm_oriA_deph,Rm_oriB_deph,Rm_ori_deph,Rm_oriA_oct,Rm_oriB_oct,Rm_ori_oct, Rm_oriA_ter,Rm_oriB_ter,Rm_ori_ter,Rm_oriA_ace,Rm_oriB_ace,Rm_ori_ace, Rm_oriA_caf,Rm_oriB_caf,Rm_ori_caf,Rm_oriA_flu,Rm_oriB_flu,Rm_ori_flu, Rm_oriA_gem,Rm_oriB_gem,Rm_ori_gem,Rm_oriA_tri,Rm_oriB_tri,Rm_ori_tri, Rm_oriA_bpa,Rm_oriB_bpa,Rm_ori_bpa,Rm_oriA_pri,Rm_oriB_pri,Rm_ori_pri, Rm_oriA_car,Rm_oriB_car,Rm_ori_car,Rm_oriA_pro,Rm_oriB_pro,Rm_ori_pro, Rm_gasA_met,Rm_gasB_met,Rm_gas_met,Rm_gasA_eti,Rm_gasB_eti,Rm_gas_eti, Rm_gasA_iso,Rm_gasB_iso,Rm_gas_iso,Rm_gasA_but,Rm_gasB_but,Rm_gas_but, Rm_gasA_deph,Rm_gasB_deph,Rm_gas_deph,Rm_gasA_oct,Rm_gasB_oct,Rm_gas_oct, Rm_gasA_ter,Rm_gasB_ter,Rm_gas_ter,Rm_gasA_ace,Rm_gasB_ace,Rm_gas_ace, Rm_gasA_caf,Rm_gasB_caf,Rm_gas_caf,Rm_gasA_flu,Rm_gasB_flu,Rm_gas_flu, Rm_gasA_gem,Rm_gasB_gem,Rm_gas_gem,Rm_gasA_tri,Rm_gasB_tri,Rm_gas_tri, Rm_gasA_bpa,Rm_gasB_bpa,Rm_gas_bpa,Rm_gasA_pri,Rm_gasB_pri,Rm_gas_pri, Rm_gasA_car,Rm_gasB_car,Rm_gas_car,Rm_gasA_pro,Rm_gasB_pro,Rm_gas_pro) factor1=rbind("ENVA-MET","ENVB-MET","ENV-MET","ENVA-ETI","ENVB-ETI","ENV-ETI", "ENVA-ISO","ENVB-ISO","ENV-ISO","ENVA-BUT","ENVB-BUT","ENV-BUT",

Page 189: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

189

"ENVA-DEPH","ENVB-DEPH","ENV-DEPH","ENVA-OCT","ENVB-OCT","ENV-OCT", "ENVA-TER","ENVB-TER","ENV-TER","ENVA-ACE","ENVB-ACE","ENV-ACE", "ENVA-CAF","ENVB-CAF","ENV-CAF","ENVA-FLU","ENVB-FLU","ENV-FLU", "ENVA-GEM","ENVB-GEM","ENV-GEM","ENVA-TRI","ENVB-TRI","ENV-TRI", "ENVA-BPA","ENVB-BPA","ENV-BPA","ENVA-PRI","ENVB-PRI","ENV-PRI", "ENVA-CAR","ENVB-CAR","ENV-CAR","ENVA-PRO","ENVB-PRO","ENV-PRO", "ORIA-MET","ORIB-MET","ORI-MET","ORIA-ETI","ORIB-ETI","ORI-ETI", "ORIA-ISO","ORIB-ISO","ORI-ISO","ORIA-BUT","ORIB-BUT","ORI-BUT", "ORIA-DEPH","ORIB-DEPH","ORI-DEPH","ORIA-OCT","ORIB-OCT","ORI-OCT", "ORIA-TER","ORIB-TER","ORI-TER","ORIA-ACE","ORIB-ACE","ORI-ACE", "ORIA-CAF","ORIB-CAF","ORI-CAF","ORIA-FLU","ORIB-FLU","ORI-FLU", "ORIA-GEM","ORIB-GEM","ORI-GEM","ORIA-TRI","ORIB-TRI","ORI-TRI", "ORIA-BPA","ORIB-BPA","ORI-BPA","ORIA-PRI","ORIB-PRI","ORI-PRI", "ORIA-CAR","ORIB-CAR","ORI-CAR","ORIA-PRO","ORIB-PRO","ORI-PRO", "GASA-MET","GASB-MET","GAS-MET","GASA-ETI","GASB-ETI","GAS-ETI", "GASA-ISO","GASB-ISO","GAS-ISO","GASA-BUT","GASB-BUT","GAS-BUT", "GASA-DEPH","GASB-DEPH","GAS-DEPH","GASA-OCT","GASB-OCT","GAS-OCT", "GASA-TER","GASB-TER","GAS-TER","GASA-ACE","GASB-ACE","GAS-ACE", "GASA-CAF","GASB-CAF","GAS-CAF","GASA-FLU","GASB-FLU","GAS-FLU", "GASA-GEM","GASB-GEM","GAS-GEM","GASA-TRI","GASB-TRI","GAS-TRI", "GASA-BPA","GASB-BPA","GAS-BPA","GASA-PRI","GASB-PRI","GAS-PRI", "GASB-CAR","GASA-CAR","GAS-CAR","GASA-PRO","GASB-PRO","GAS-PRO") Resultados=cbind(factor1,Entropia_Conjunta,MI,Redundancia,Redundancia_Max) Resultados=as.data.frame(Resultados) colnames(Resultados)=c("Variables","Entropia_Conjunta","MI","R","R_MAX") write.csv(Resultados,"Resultados.csv",row.names = FALSE)

Page 190: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

190

ANEXO Z. Código Arboles de decisión y de regresión en R

rm(list=ls(all=TRUE)) M=read.table("datos.txt",header=TRUE) attach(M) library(rpart) # Popular decision tree algorithm library(rattle) # Fancy tree plot library(rpart.plot) # Enhanced tree plots library(RColorBrewer) # Color selection for fancy tree plot library(party) # Alternative decision tree algorithm library(partykit) # Convert rpart object to BinaryTree library(caret) #transforma a factores METf=MET METf[which(MET<=0)]="NODETECTADO" METf[which(MET>=7000)]="ALTO" METf[which(MET<7000 & MET>0)]="BAJO" ETIf=ETI ETIf[which(ETI<=0)]="NODETECTADO" ETIf[which(ETI>=5600)]="ALTO" ETIf[which(ETI<5600 & ETI>0)]="BAJO" ISOf=ISO ISOf[which(ISO<=0)]="NODETECTADO" ISOf[which(ISO>=700)]="ALTO" ISOf[which(ISO<700 & ISO>0)]="BAJO" BUTf=BUT BUTf[which(BUT<=0)]="NODETECTADO" BUTf[which(BUT>=700)]="ALTO" BUTf[which(BUT<700 & BUT>0)]="BAJO" BISf=BIS BISf[which(BIS<=0)]="NO-DETECTADO" BISf[which(BIS>0)]="ALTO" OCTf=OCT OCTf[which(OCT<=0)]="NODETECTADO" OCTf[which(OCT>=280)]="ALTO" OCTf[which(OCT<280 & OCT>0)]="BAJO" TERf=TER

Page 191: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

191

TERf[which(TER<=0)]="NODETECTADO" TERf[which(TER>=1190)]="ALTO" TERf[which(TER<1190 & TER>0)]="BAJO" ACEf=ACE ACEf[which(ACE<=0)]="NODETECTADO" ACEf[which(ACE>=304377.826)]="ALTO" ACEf[which(ACE<304377.826 & ACE>0)]="BAJO" CAFf=CAF CAFf[which(CAF<=0)]="NODETECTADO" CAFf[which(CAF>=21000)]="ALTO" CAFf[which(CAF<21000 & CAF>0)]="BAJO" FLUf=FLU FLUf[which(FLU<=0)]="NODETECTADO" FLUf[which(FLU>=58100)]="ALTO" FLUf[which(FLU<58100 & FLU>0)]="BAJO" GEMf=GEM GEMf[which(GEM<=0)]="NODETECTADO" GEMf[which(GEM>=91301)]="ALTO" GEMf[which(GEM<91301 & GEM>0)]="BAJO" TRIf=TRI TRIf[which(TRI<=0)]="NODETECTADO" TRIf[which(TRI>=42000000)]="ALTO" TRIf[which(TRI<42000000 & TRI>0)]="BAJO" BISAf=BISA BISAf[which(BISA<=0)]="NODETECTADO" BISAf[which(BISA>=35)]="ALTO" BISAf[which(BISA<35 & BISA>0)]="BAJO" PRIf=PRI PRIf[which(PRI<=0)]="NODETECTADO" PRIf[which(PRI>=114128)]="ALTO" PRIf[which(PRI<114128 & PRI>0)]="BAJO" CARf=CAR CARf[which(CAR<=0)]="NODETECTADO" CARf[which(CAR>=105000)]="ALTO" CARf[which(CAR<105000 & CAR>0)]="BAJO" PROf=PRO PROf[which(PRO<=0)]="NODETECTADO" PROf[which(PRO>=15218)]="ALTO"

Page 192: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

192

PROf[which(PRO<15218 & PRO>0)]="BAJO" Mf=cbind(as.character(ENVASE),as.character(ORIGEN),as.character(GAS),METf,ETIf,ISOf,BUTf,BISf,OCTf,TERf,ACEf,CAFf,FLUf,GEMf,TRIf,BISAf,PRIf,CARf,PROf) colnames(Mf)=c(names(M[,2:4]),names(M[,5:length(names(M))])) Mf=as.data.frame(Mf) ########MET categorico#################### #######tre.1## Mfp <- Mf[,c(1:4)] form <- as.formula(MET ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_met_categorico.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="BAJO & NO DETECTADO", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########MET continuo#################### #######tre.1## Mfp <- M[,c(2:5)] form <- as.formula(MET ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5)

Page 193: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

193

tiff(filename="classification_tree_met_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########ETI continuo#################### #######tre.1## Mfp <- M[,c(2:6)] Mfp <- Mfp[,-c(4)] form <- as.formula(ETI ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_eti_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########ISO cAtegorico#################### #######tre.1## Mfp <- Mf[,c(1:6)] Mfp <- Mfp[,-c(4,5)] form <- as.formula(ISO ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580

Page 194: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

194

hth=wth/2^(.5) tiff(filename="classification_tree_iso_categorico.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########iso continuo#################### #######tre.1## Mfp <- M[,c(2:7)] Mfp <- Mfp[,-c(4,5)] form <- as.formula(ISO ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_iso_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########BUT continuo#################### #######tre.1## Mfp <- M[,c(2:8)] Mfp <- Mfp[,-c(4,5,6)] form <- as.formula(BUT ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580

Page 195: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

195

hth=wth/2^(.5) tiff(filename="classification_tree_BUT_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########DEPH cAtegorico#################### #######tre.1## Mfp <- Mf[,c(1:8)] Mfp <- Mfp[,-c(4,5,6,7)] form <- as.formula(BIS ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_DEPH_categorico.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########DEPH continuo#################### #######tre.1## Mfp <- M[,c(2:9)] Mfp <- Mfp[,-c(4,5,6,7)] form <- as.formula(BIS ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names

Page 196: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

196

wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_DEPH_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########OCT continuo#################### #######tre.1## Mfp <- M[,c(2:9)] Mfp <- Mfp[,-c(4,5,6,7,8)] form <- as.formula(OCT ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_oct_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########TER continuo#################### #######tre.1## Mfp <- M[,c(2:11)] Mfp <- Mfp[,-c(4,5,6,7,8,9)] form <- as.formula(TER ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits

Page 197: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

197

prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_TER_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########ACE continuo#################### #######tre.1## Mfp <- M[,c(2:12)] Mfp <- Mfp[,-c(4,5,6,7,8,9,10)] form <- as.formula(ACE ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_ACE_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########CAF continuo#################### #######tre.1## Mfp <- M[,c(2:13)] Mfp <- Mfp[,-c(4,5,6,7,8,9,10,11)] form <- as.formula(CAF ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits

Page 198: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

198

prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_CAF_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########FLU continuo#################### #######tre.1## Mfp <- M[,c(2:14)] Mfp <- Mfp[,-c(4,5,6,7,8,9,10,11,12)] form <- as.formula(FLU ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_FLU_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########GEM continuo#################### #######tre.1## Mfp <- M[,c(2:15)] Mfp <- Mfp[,-c(4,5,6,7,8,9,10,11,12,13)] form <- as.formula(GEM ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits

Page 199: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

199

prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_GEM_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########TRI continuo#################### #######tre.1## Mfp <- M[,c(2:16)] Mfp <- Mfp[,-c(4,5,6,7,8,9,10,11,12,13,14)] form <- as.formula(TRI ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_TRI_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########BPA continuo#################### #######tre.1## Mfp <- M[,c(2:17)] Mfp <- Mfp[,-c(4,5,6,7,8,9,10,11,12,13,14,15)] form <- as.formula(BISA ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results

Page 200: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

200

summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_BPA_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########PRI continuo#################### #######tre.1## Mfp <- M[,c(2:18)] Mfp <- Mfp[,-c(4,5,6,7,8,9,10,11,12,13,14,15,16)] form <- as.formula(PRI ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_PRI_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########CAR continuo#################### #######tre.1## Mfp <- M[,c(2:19)] Mfp <- Mfp[,-c(4,5,6,7,8,9,10,11,12,13,14,15,16,17)] form <- as.formula(CAR ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results

Page 201: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

201

plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_CAR_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########PRO continuo#################### #######tre.1## Mfp <- M[,c(2:20)] Mfp <- Mfp[,-c(4,5,6,7,8,9,10,11,12,13,14,15,16,17,18)] form <- as.formula(PRO ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_PRO_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off()

Page 202: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

202

ANEXO AA. Codigo Random Forest en R.

rm(list=ls(all=TRUE)) MC= read.csv("Calibración.csv", header = TRUE) MV= read.csv("Validación.csv", header = TRUE) FACTORESC <- MC[-c(1,2,3,4)] FACTORESV <- MV[-c(1,2,3,4)] PREDICTORES_C <- MC[2:4] PREDICTORES_V <- MV[2:4] ####### compuestos############# DMPC<-FACTORESC$DMP DMPV<-FACTORESV$DMP # DEPC<-FACTORESC$DEP DEPV<-FACTORESV$DEP DIBPC<-FACTORESC$DIBP DIBPV<-FACTORESV$DIBP # DBPC<-FACTORESC$DBP DBPV<-FACTORESV$DBP DEHPC<-FACTORESC$DEPH DEHPV<-FACTORESV$DEPH DOPC<-FACTORESC$DOP DOPV<-FACTORESV$DOP TERC<-FACTORESC$TER TERV<-FACTORESV$TER ACEC<-FACTORESC$ACE ACEV<-FACTORESV$ACE CAFC<-FACTORESC$CAF CAFV<-FACTORESV$CAF FLUC<-FACTORESC$FLU FLUV<-FACTORESV$FLU GEMC<-FACTORESC$GEM GEMV<-FACTORESV$GEM

Page 203: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

203

TRIC<-FACTORESC$TRI TRIV<-FACTORESV$TRI BPAC<-FACTORESC$BPA BPAV<-FACTORESV$BPA PRIC<-FACTORESC$PRI PRIV<-FACTORESV$PRI CARC<-FACTORESC$CAR CARV<-FACTORESV$CAR PROC<-FACTORESC$PRO PROV<-FACTORESV$PRO #Se llama la librería library(randomForest) library(rfUtilities) #se realiza el modelo función randomForest ###MET Model1 <- randomForest(as.factor(DMPC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv1 <- rf.crossValidation(Model1, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model1, PREDICTORES_C, type = "prob") prob_val <- predict(Model1, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model1, PREDICTORES_C) pred_val <- predict(Model1, PREDICTORES_V) #Matrices de Confusión table(pred_cal,DMPC) table(pred_val,DMPV) Model1 model_cv1 importance(Model1) #####DEP######################

Page 204: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

204

Model2 <- randomForest(as.factor(DEPC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) #model_cv2 <- rf.crossValidation(Model2, PREDICTORES_C, p=0.10, n=80, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model2, PREDICTORES_C, type = "prob") prob_val <- predict(Model2, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model2, PREDICTORES_C) pred_val <- predict(Model2, PREDICTORES_V) #Matrices de Confusión table(pred_cal,DEPC) table(pred_val,DEPV) Model2 importance(Model2) #######DIBP######### Model3 <- randomForest(as.factor(DIBPC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv3 <- rf.crossValidation(Model3, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model3, PREDICTORES_C, type = "prob") prob_val <- predict(Model3, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model3, PREDICTORES_C) pred_val <- predict(Model3, PREDICTORES_V) #Matrices de Confusión table(pred_cal,DIBPC) table(pred_val,DIBPV) Model3 model_cv3 importance(Model3) ####DBP#######

Page 205: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

205

Model4 <- randomForest(as.factor(DBPC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv4 <- rf.crossValidation(Model3, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model3, PREDICTORES_C, type = "prob") prob_val <- predict(Model3, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model3, PREDICTORES_C) pred_val <- predict(Model3, PREDICTORES_V) #Matrices de Confusión table(pred_cal,DBPC) table(pred_val,DBPV) Model3 model_cv3 importance(Model3) ########DEHP######### Model4 <- randomForest(as.factor(DEHPC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv4 <- rf.crossValidation(Model4, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model4, PREDICTORES_C, type = "prob") prob_val <- predict(Model4, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model4, PREDICTORES_C) pred_val <- predict(Model4, PREDICTORES_V) #Matrices de Confusión table(pred_cal,DEHPC) table(pred_val,DEHPV) Model4 model_cv4 importance(Model4)

Page 206: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

206

######DOP#################### Model5 <- randomForest(as.factor(DOPC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv5 <- rf.crossValidation(Model5, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model5, PREDICTORES_C, type = "prob") prob_val <- predict(Model5, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model5, PREDICTORES_C) pred_val <- predict(Model5, PREDICTORES_V) #Matrices de Confusión table(pred_cal,DOPC) table(pred_val,DOPV) Model5 model_cv5 importance(Model5) ######TER#################### Model6 <- randomForest(as.factor(TERC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv6 <- rf.crossValidation(Model6, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model6, PREDICTORES_C, type = "prob") prob_val <- predict(Model6, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model6, PREDICTORES_C) pred_val <- predict(Model6, PREDICTORES_V) #Matrices de Confusión table(pred_cal,TERC) table(pred_val,TERV) Model6 model_cv6 importance(Model6)

Page 207: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

207

######ACE#################### Model7 <- randomForest(as.factor(ACEC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv7 <- rf.crossValidation(Model7, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model7, PREDICTORES_C, type = "prob") prob_val <- predict(Model7, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model7, PREDICTORES_C) pred_val <- predict(Model7, PREDICTORES_V) #Matrices de Confusión table(pred_cal,ACEC) table(pred_val,ACEV) Model7 model_cv7 importance(Model7) ######CAF#################### Model8 <- randomForest(as.factor(CAFV) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv8 <- rf.crossValidation(Model8, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model8, PREDICTORES_C, type = "prob") prob_val <- predict(Model8, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model8, PREDICTORES_C) pred_val <- predict(Model8, PREDICTORES_V) #Matrices de Confusión table(pred_cal,CAFC) table(pred_val,CAFV) Model8 model_cv8

Page 208: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

208

importance(Model8) ######FLU#################### Model9 <- randomForest(as.factor(FLUC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv9 <- rf.crossValidation(Model9, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model9, PREDICTORES_C, type = "prob") prob_val <- predict(Model9, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model9, PREDICTORES_C) pred_val <- predict(Model9, PREDICTORES_V) #Matrices de Confusión table(pred_cal,FLUC) table(pred_val,FLUV) Model9 model_cv9 importance(Model9) ######GEM#################### Model10 <- randomForest(as.factor(GEMC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv10 <- rf.crossValidation(Model10, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model10, PREDICTORES_C, type = "prob") prob_val <- predict(Model10, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model10, PREDICTORES_C) pred_val <- predict(Model10, PREDICTORES_V) #Matrices de Confusión table(pred_cal,GEMC) table(pred_val,GEMV) Model10

Page 209: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

209

model_cv10 importance(Model10) ######TRI#################### Model11 <- randomForest(as.factor(TRIC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv11 <- rf.crossValidation(Model11, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model11, PREDICTORES_C, type = "prob") prob_val <- predict(Model11, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model11, PREDICTORES_C) pred_val <- predict(Model11, PREDICTORES_V) #Matrices de Confusión table(pred_cal,TRIC) table(pred_val,TRIV) Model11 model_cv11 importance(Model11) ######BPA#################### Model12 <- randomForest(as.factor(BPAC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv12 <- rf.crossValidation(Model12, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model12, PREDICTORES_C, type = "prob") prob_val <- predict(Model12, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model12, PREDICTORES_C) pred_val <- predict(Model12, PREDICTORES_V) #Matrices de Confusión table(pred_cal,BPAC)

Page 210: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

210

table(pred_val,BPAV) Model12 model_cv12 importance(Model12) ######PRI#################### Model13 <- randomForest(as.factor(PRIC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv13 <- rf.crossValidation(Model13, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model13, PREDICTORES_C, type = "prob") prob_val <- predict(Model13, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model13, PREDICTORES_C) pred_val <- predict(Model13, PREDICTORES_V) #Matrices de Confusión table(pred_cal,PRIC) table(pred_val,PRIV) Model13 model_cv13 importance(Model13) ######CAR#################### Model14 <- randomForest(as.factor(CARC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv14 <- rf.crossValidation(Model14, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model14, PREDICTORES_C, type = "prob") prob_val <- predict(Model14, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model14, PREDICTORES_C)

Page 211: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

211

pred_val <- predict(Model14, PREDICTORES_V) #Matrices de Confusión table(pred_cal,CARC) table(pred_val,CARV) Model14 model_cv14 importance(Model14) ######PRO#################### Model15 <- randomForest(as.factor(PROC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv15 <- rf.crossValidation(Model15, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model15, PREDICTORES_C, type = "prob") prob_val <- predict(Model15, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model15, PREDICTORES_C) pred_val <- predict(Model15, PREDICTORES_V) #Matrices de Confusión table(pred_cal,PROC) table(pred_val,PROV) Model15 model_cv15 importance(Model15) ######BPA#################### Model16 <- randomForest(as.factor(DEHPC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv16 <- rf.crossValidation(Model16, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model16, PREDICTORES_C, type = "prob")

Page 212: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

212

prob_val <- predict(Model16, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model16, PREDICTORES_C) pred_val <- predict(Model16, PREDICTORES_V) #Matrices de Confusión table(pred_cal,DEHPC) table(pred_val,DEHPV) Model16 model_cv16 importance(Model16) Algoritmo xgboots

rm(list=ls(all=TRUE))

MC= read.csv("Calibración.csv", header = TRUE)

MC <- MC[-c(1)]

MV= read.csv("Validación.csv", header = TRUE)

MV <- MV[-c(1)]

library(Matrix)

library(xgboost)

MC_ENVASE <-MC[-c(2,3)]

MV_ENVASE <-MV[-c(2,3)]

train <- MC_ENVASE

train.y <- train$ENVASE

sparse.train <- sparse.model.matrix(ENVASE ~ ., data = train)

dtrain <- xgb.DMatrix(data = sparse.train, label = train.y)

test <- MV_ENVASE

test.y <- test$ENVASE

sparse.test <- sparse.model.matrix(ENVASE ~ ., data = test)

dtest <- xgb.DMatrix(data = sparse.test, label = test.y)

# 2. XGB TRAIN ----

xgb <- xgb.train( # TREE BUILDER

objective = "binary:logistic",

eval_metric = "auc",

Page 213: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

213

data = dtrain,

max_depth = 16,

colsample_bytree = 0.5,

min_child_weight = 5,

eta = 0.015,

nrounds = 500,

watchlist = list(train = dtrain, test = dtest)

)

# 4. POST-BUILD. MANUAL MODEL EXPLORATION ----

library (DiagrammeR)

xgb.plot.tree( # PLOT 100 TREES... TODOS = CRASH!

model = xgb,

feature_names = colnames(sparse.train),

n_first_tree = 100,

plot_width = 1920,

plot_height = 1080

)

importance <- xgb.importance( # GET IMPORTANCE MATRIX

feature_names = colnames(sparse.train),

model = xgb

)

xgb.plot.importance( # ALL VARS

importance_matrix = importance,

rel_to_first = T

)

evalerror <- function(preds, dtrain) {

labels <- getinfo(dtrain, "label")

err <- as.numeric(sum(labels != (preds > 0)))/length(labels)

return(list(metric = "error", value = err))

}

#######ORIGEN#########

MC_ORIGEN <-MC[-c(1,3)]

MV_ORIGEN <-MV[-c(1,3)]

train <- MC_ORIGEN

train.y <- train$ORIGEN

Page 214: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

214

sparse.train <- sparse.model.matrix(ORIGEN ~ ., data = train)

dtrain <- xgb.DMatrix(data = sparse.train, label = train.y)

test <- MV_ORIGEN

test.y <- test$ORIGEN

sparse.test <- sparse.model.matrix(ORIGEN ~ ., data = test)

dtest <- xgb.DMatrix(data = sparse.test, label = test.y)

# 2. XGB TRAIN ----

xgb <- xgb.train( # TREE BUILDER

objective = "binary:logistic",

eval_metric = "auc",

data = dtrain,

max_depth = 16,

colsample_bytree = 0.5,

min_child_weight = 5,

eta = 0.015,

nrounds = 500,

watchlist = list(train = dtrain, test = dtest)

)

# 4. POST-BUILD. MANUAL MODEL EXPLORATION ----

library (DiagrammeR)

xgb.plot.tree( # PLOT 100 TREES... TODOS = CRASH!

model = xgb,

feature_names = colnames(sparse.train),

n_first_tree = 100,

plot_width = 1920,

plot_height = 1080

)

importance <- xgb.importance( # GET IMPORTANCE MATRIX

feature_names = colnames(sparse.train),

model = xgb

)

xgb.plot.importance( # ALL VARS

importance_matrix = importance,

rel_to_first = T

)

#######GAS#########

Page 215: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

215

MC_GAS <-MC[-c(1,2)]

MV_GAS <-MV[-c(1,2)]

train <- MC_GAS

train.y <- train$GAS

sparse.train <- sparse.model.matrix(GAS ~ ., data = train)

dtrain <- xgb.DMatrix(data = sparse.train, label = train.y)

test <- MV_GAS

test.y <- test$GAS

sparse.test <- sparse.model.matrix(GAS ~ ., data = test)

dtest <- xgb.DMatrix(data = sparse.test, label = test.y)

# 2. XGB TRAIN ----

xgb <- xgb.train( # TREE BUILDER

objective = "binary:logistic",

eval_metric = "auc",

data = dtrain,

max_depth = 16,

colsample_bytree = 0.5,

min_child_weight = 5,

eta = 0.015,

nrounds = 500,

watchlist = list(train = dtrain, test = dtest)

)

# 4. POST-BUILD. MANUAL MODEL EXPLORATION ----

library (DiagrammeR)

xgb.plot.tree( # PLOT 100 TREES... TODOS = CRASH!

model = xgb,

feature_names = colnames(sparse.train),

n_first_tree = 100,

plot_width = 1920,

plot_height = 1080

)

importance <- xgb.importance( # GET IMPORTANCE MATRIX

feature_names = colnames(sparse.train),

model = xgb

)

Page 216: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

216

xgb.plot.importance( # ALL VARS

importance_matrix = importance,

rel_to_first = T

)

ANEXO BB. Numero de familia según 4 grupos de clasificación.

Origen Gas Envase # de familias

(Tratamientos)

1 1 1 1

1 1 2 2

1 2 1 3

1 2 2 4

2 1 1 5

2 1 2 6

2 2 1 7

2 2 2 8

Fuente. Elaboración propia.

ANEXO CC. Resultados Diseño experimental con uso de la librería Agricolae del software

R.

Parameters BIB

Lambda 3

treatmeans (tratamientos) 8

Block size (k) 4

Blocks (número de bloques) 14

Replication (Repeticiones) 7

Page 217: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

217

Efficiency factor 0.86

# De muestras 56

Fuente. Elaboración propia.

ANEXO DD. Muestras de agua según la clasificación de familias del diseño experimental y

código en R

CODIGO PAIS DE ORIGEN GAS TIPO DE EMBASE FAMILIA

AP-EMP-01-01 Internacional NO Plástico 5

AP-EMP-01-02 Internacional NO Plástico 5

AP-EMP-01-03 Internacional NO Plástico 5

AP-EMP-02-01 Internacional NO Plástico 5

AP-EMP-02-02 Internacional NO Plástico 5

AP-EMP-02-03 Internacional NO Plástico 5

AP-EMP-03-01 Nacional SI Plástico 3

AP-EMP-03-02 Nacional SI Plástico 3

AP-EMP-03-03 Nacional SI Plástico 3

AP-EMP-04-01 Nacional NO vidrio 2

AP-EMP-04-02 Nacional NO vidrio 2

AP-EMP-04-03 Nacional NO vidrio 2

AP-EMP-05-01 Internacional SI vidrio 8

AP-EMP-05-02 Internacional SI vidrio 8

AP-EMP-05-03 Internacional SI vidrio 8

AP-EMP-06-01 Internacional NO plástico 5

AP-EMP-06-02 Internacional NO plástico 5

AP-EMP-06-03 Internacional NO plástico 5

AP-EMP-07-01 Nacional NO plástico 1

AP-EMP-07-02 Nacional NO plástico 1

AP-EMP-07-03 Nacional NO plástico 1

AP-EMP-08-01 Nacional NO plástico 1

AP-EMP-08-02 Nacional NO plástico 1

Page 218: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

218

AP-EMP-08-03 Nacional NO plástico 1

AP-EMP-09-01 Internacional SI vidrio 8

AP-EMP-09-02 Internacional SI vidrio 8

AP-EMP-09-03 Internacional SI vidrio 8

AP-EMP-10-01 Nacional NO Plástico 1

AP-EMP-10-02 Nacional NO Plástico 1

AP-EMP-10-03 Nacional NO Plástico 1

AP-EMP-11-01 Nacional NO Plástico 1

AP-EMP-11-02 Nacional NO Plástico 1

AP-EMP-11-03 Nacional NO Plástico 1

AP-EMP-12-01 Nacional SI Plástico 3

AP-EMP-12-02 Nacional SI Plástico 3

AP-EMP-12-03 Nacional SI Plástico 3

AP-EMP-13-01 Nacional SI Plástico 3

AP-EMP-13-02 Nacional SI Plástico 3

AP-EMP-13-03 Nacional SI Plástico 3

AP-EMP-14-01 Internacional NO Plástico 5

AP-EMP-14-02 Internacional NO Plástico 5

AP-EMP-14-03 Internacional NO Plástico 5

AP-EMP-15-01 Internacional SI vidrio 8

AP-EMP-15-02 Internacional SI vidrio 8

AP-EMP-15-03 Internacional SI vidrio 8

AP-EMP-16-01 Internacional NO Plástico 5

AP-EMP-16-02 Internacional NO Plástico 5

AP-EMP-16-03 Internacional NO Plástico 5

AP-EMP-17-01 Nacional NO vidrio 2

AP-EMP-17-02 Nacional NO vidrio 2

AP-EMP-17-03 Nacional NO vidrio 2

AP-EMP-18-01 Nacional NO Plástico 1

AP-EMP-18-02 Nacional NO Plástico 1

Page 219: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

219

AP-EMP-18-03 Nacional NO Plástico 1

AP-EMP-19-01 Internacional NO Plástico 5

AP-EMP-19-02 Internacional NO Plástico 5

AP-EMP-19-03 Internacional NO Plástico 5

AP-EMP-20-01 Nacional NO Plástico 1

AP-EMP-20-02 Nacional NO Plástico 1

AP-EMP-20-03 Nacional NO Plástico 1

AP-EMP-21-01 Nacional SI Plástico 3

AP-EMP-21-02 Nacional SI Plástico 3

AP-EMP-21-03 Nacional SI Plástico 3

AP-EMP-22-01 Nacional SI Plástico 3

AP-EMP-22-02 Nacional SI Plástico 3

AP-EMP-22-03 Nacional SI Plástico 3

AP-EMP-23-01 Internacional NO vidrio 6

AP-EMP-23-02 Internacional NO vidrio 6

AP-EMP-23-03 Internacional NO vidrio 6

AP-EMP-23-04 Internacional NO vidrio 6

AP-EMP-23-05 Internacional NO vidrio 6

AP-EMP-23-06 Internacional NO vidrio 6

AP-EMP-23-07 Internacional NO vidrio 6

AP-EMP-24-01 Nacional NO Plástico 1

AP-EMP-24-02 Nacional NO Plástico 1

AP-EMP-24-03 Nacional NO Plástico 1

AP-EMP-25-01 Nacional NO Plástico 1

AP-EMP-25-02 Nacional NO Plástico 1

AP-EMP-25-03 Nacional NO Plástico 1

AP-EMP-26-01 Nacional NO Plástico 1

AP-EMP-26-02 Nacional NO Plástico 1

AP-EMP-26-03 Nacional NO Plástico 1

AP-EMP-27-01 Nacional NO Plástico 1

Page 220: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

220

AP-EMP-27-02 Nacional NO Plástico 1

AP-EMP-27-03 Nacional NO Plástico 1

AP-EMP-28-01 Internacional NO Plástico 5

AP-EMP-28-02 Internacional NO Plástico 5

AP-EMP-28-03 Internacional NO Plástico 5

AP-EMP-29-01 Nacional NO Plástico 1

AP-EMP-29-02 Nacional NO Plástico 1

AP-EMP-29-03 Nacional NO Plástico 1

AP-EMP-30-01 Nacional SI Plástico 3

AP-EMP-30-02 Nacional SI Plástico 3

AP-EMP-30-03 Nacional SI Plástico 3

AP-EMP-31-01 Nacional NO Plástico 1

AP-EMP-31-02 Nacional NO Plástico 1

AP-EMP-31-03 Nacional NO Plástico 1

AP-EMP-32-01 Nacional SI Plástico 3

AP-EMP-32-02 Nacional SI Plástico 3

AP-EMP-32-03 Nacional SI Plástico 3

AP-EMP-33-01 Nacional NO Plástico 1

AP-EMP-33-02 Nacional NO Plástico 1

AP-EMP-33-03 Nacional NO Plástico 1

AP-EMP-34-01 Nacional NO Plástico 1

AP-EMP-34-02 Nacional NO Plástico 1

AP-EMP-34-03 Nacional NO Plástico 1

AP-EMP-35-01 Internacional SI Plástico 7

AP-EMP-35-02 Internacional SI Plástico 7

AP-EMP-35-03 Internacional SI Plástico 7

AP-EMP-35-04 Internacional SI Plástico 7

AP-EMP-35-05 Internacional SI Plástico 7

AP-EMP-35-06 Internacional SI Plástico 7

AP-EMP-36-01 Nacional SI vidrio 4

Page 221: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

221

AP-EMP-36-02 Nacional SI vidrio 4

AP-EMP-36-03 Nacional SI vidrio 4

AP-EMP-36-04 Nacional SI vidrio 4

AP-EMP-36-05 Nacional SI vidrio 4

AP-EMP-36-06 Nacional SI vidrio 4

AP-EMP-36-07 Nacional SI vidrio 4

AP-EMP-37-01 Nacional NO Plástico 1

AP-EMP-37-02 Nacional NO Plástico 1

AP-EMP-37-03 Nacional NO Plástico 1

AP-EMP-38-01 Nacional SI Plástico 3

AP-EMP-38-02 Nacional SI Plástico 3

AP-EMP-38-03 Nacional SI Plástico 3

AP-EMP-39-01 Nacional NO Plástico 1

AP-EMP-39-02 Nacional NO Plástico 1

AP-EMP-39-03 Nacional NO Plástico 1

AP-EMP-40-01 Nacional SI Plástico 3

AP-EMP-40-02 Nacional SI Plástico 3

AP-EMP-40-03 Nacional SI Plástico 3

AP-EMP-41-01 Nacional NO vidrio 2

AP-EMP-41-02 Nacional NO vidrio 2

AP-EMP-41-03 Nacional NO vidrio 2

AP-EMP-42-01 Nacional NO Plástico 1

AP-EMP-43-01 Nacional SI Plástico 3

AP-EMP-43-02 Nacional SI Plástico 3

AP-EMP-43-03 Nacional SI Plástico 3

AP-EMP-44-01 Nacional NO Plástico 1

AP-EMP-44-02 Nacional NO Plástico 1

AP-EMP-44-03 Nacional NO Plástico 1

AP-EMP-45-01 Nacional SI Plástico 3

AP-EMP-45-02 Nacional SI Plástico 3

Page 222: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

222

AP-EMP-45-03 Nacional SI Plástico 3

AP-EMP-46-01 Nacional NO Plástico 1

AP-EMP-46-02 Nacional NO Plástico 1

AP-EMP-46-03 Nacional NO Plástico 1

AP-EMP-47-01 Nacional NO Plástico 1

AP-EMP-47-02 Nacional NO Plástico 1

AP-EMP-47-03 Nacional NO Plástico 1

AP-EMP-48-01 Nacional NO Plástico 1

AP-EMP-48-02 Nacional NO Plástico 1

AP-EMP-48-03 Nacional NO Plástico 1

AP-EMP-49-01 Internacional NO Plástico 5

AP-EMP-49-02 Internacional NO Plástico 5

AP-EMP-49-03 Internacional NO Plástico 5

AP-EMP-50-01 Nacional NO Plástico 1

AP-EMP-50-02 Nacional NO Plástico 1

AP-EMP-50-03 Nacional NO Plástico 1

AP-EMP-51-01 Nacional NO Plástico 1

AP-EMP-51-02 Nacional NO Plástico 1

AP-EMP-51-03 Nacional NO Plástico 1

AP-EMP-52-01 Nacional NO Plástico 1

AP-EMP-52-02 Nacional NO Plástico 1

AP-EMP-52-03 Nacional NO Plástico 1

AP-EMP-53-01 Nacional NO Plástico 1

AP-EMP-54-01 Nacional SI Plástico 3

AP-EMP-55-01 Nacional NO Plástico 1

AP-EMP-56-01 Nacional NO Plástico 1

AP-EMP-57-01 Nacional NO Plástico 1

AP-EMP-58-02 Nacional SI Plástico 3

AP-EMP-59-01 Internacional SI Plástico 7

Fuente. Elaboración propia.

Page 223: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

223

ANEXO EE. Entropía conjunta, información mutua y valores de redundancia de factores

respecto a compuestos.

ANEXO EE1. Entropía conjunta, información mutua y valores de redundancia de factores

respecto a DEP. Variables Entropia_Conjunta MI R R_MAX % redundancia

ENVA-DEP 0.370977392 0.00016273

0.08896936 0.46170933 19.27

ENVB- DEP 0.466893239 0.2455324 0.30381284 80.82

ORIA- DEP 0.460132726 0.00138278

0.13312981 0.35420449 37.59

ORIB- DEP 0.584129628 0.16892268 0.26749478 63.15

GASA- DEP 0.519242293 0.0002247

0.1235677 0.31734483 38.94

GASB- DEP 0.603124215 0.16017213 0.26179819 61.18

Fuente. Elaboración propia.

ANEXO EE2. Entropía conjunta, información mutua y valores de redundancia de factores

respecto a DIBP.

Variables Entropia_Conjunta MI R R_MAX % redundancia

ENVA-DIBP 1.044246877 0.00388786

0.13198505 0.18220292 72.44

ENVB- DIBP 0.585721021 0.58596352 0.30454452 192.41

ORIA- DIBP 1.033029732 0.01274312

0.22130705 0.25839107 85.65

ORIB- DIBP 0.795694676 0.46906993 0.34353374 136.54

GASA- DIBP 1.050889495 0.00671164

0.24302355 0.29132542 83.42

GASB- DIBP 0.860812478 0.4314221 0.35016522 123.21

Fuente. Elaboración propia.

ANEXO EE3. Entropía conjunta, información mutua y valores de redundancia de factores

respecto a DBP.

Variables Entropia_Conjunta MI R R_MAX % redundancia

ENVA-DBP 0.716481601 0.00058115

0.13426118 0.26485804 50.69

ENVB- DBP 0.54135989 0.47907461 0.41456483 115.56

ORIA- DBP 0.754903554 0.00252291

0.20635632 0.36037791 57.26

ORIB- DBP 0.708607945 0.36914361 0.45835611 80.54

GASA- DBP 0.815274036 0.00104112

0.19506078 0.39931217 48.85

GASB- DBP 0.72666534 0.36175768 0.46563192 77.69

Fuente. Elaboración propia.

ANEXO EE4. Entropía conjunta, información mutua y valores de redundancia de factores

respecto a DEHP.

Page 224: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

224

Variables Entropia_Conjunta MI R R_MAX % redundancia

ENVA-DEHP 1.051127174 0.00706622

0.13351071 0.18069213 73.89

ENVB-DEHP 0.585721021 0.58888666 0.30239441 194.74

ORIA-DEHP 1.051563025 0.00359117

0.21330162 0.25644665 83.18

ORIB-DEHP 0.796371992 0.47216067 0.34124343 138.36

GASA-DEHP 1.053534098 0.00579634

0.24657747 0.28922982 85.25

GASB-DEHP 0.869141832 0.4297094 0.34785412 123.53

Fuente. Elaboración propia.

ANEXO EE5. Entropía conjunta, información mutua y valores de redundancia de factores

respecto a DOP.

Variables Entropia_Conjunta MI R R_MAX % redundancia

ENVA-DOP 0.426346108 0.00924616

0.02122665 0.49678782 4.27

ENVB- DOP 0.430827083 0.33434627 0.33434627 100

ORIA- DOP 0.460132726 0.00547603

0.17713498 0.38698718 45.77

ORIB- DOP 0.608422378 0.16796296 0.29592972 56.76

GASA- DOP 0.519242293 0.00241441

0.16364012 0.34855734 46.95

GASB- DOP 0.629320506 0.15701497 0.2898672 54.17

Fuente. Elaboración propia.

ANEXO EE6. Entropía conjunta, información mutua y valores de redundancia de factores

respecto a TER.

Variables Entropia_Conjunta MI R R_MAX % redundancia

ENVA-TER 0.498865146 0.00158794

0.07018218 0.40855075 17.18

ENVB-TER 0.466893239 0.37593714 0.4241442 88.63

ORIA-TER 0.566463062 7.27E-05

0.14186655 0.48071317 29.51

ORIB-TER 0.608422378 0.26887364 0.3813204 70.51

GASA-TER 0.574224852 0.00412739

0.20441349 0.43965114 46.49

GASB-TER 0.673551938 0.20521576 0.37443888 54.81

Fuente. Elaboración propia.

ANEXO EE7. Entropía conjunta, información mutua y valores de redundancia de factores

respecto a FLU.

Page 225: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

225

Variables Entropia_Conjunta MI R R_MAX % redundancia

ENVA-FLU 0.771859372 0.00089262

0.1120069 0.2521754 44.42

ENVB-FLU 0.527292854 0.51214961 0.39860044 128.49

ORIA-FLU 0.798468941 0.00057973

0.19574785 0.34526955 56.69

ORIB-FLU 0.708607945 0.39168487 0.44197849 88.62

GASA-FLU 0.815274036 0.00051834

0.22683373 0.38355033 59.14

GASB-FLU 0.768810322 0.34855618 0.44920993 77.59

Fuente. Elaboración propia.

ANEXO EE8. Entropía conjunta, información mutua y valores de redundancia de factores

respecto a GEM.

Variables Entropia_Conjunta MI R R_MAX % redundancia

ENVA-GEM 0.910739045 9.73E-05

0.13465812 0.20826922 64.66

ENVB-GEM 0.572452273 0.54714396 0.34081906 160.54

ORIA-GEM 0.941007075 1.28E-06

0.19985997 0.29147223 68.57

ORIB-GEM 0.74989204 0.44374715 0.38190209 116.19

GASA-GEM 0.946653014 8.61E-06

0.23515471 0.32676523 71.96

GASB-GEM 0.82118485 0.39769666 0.38883552 102.28

Fuente. Elaboración propia.

ANEXO EE9. Entropía conjunta, información mutua y valores de redundancia de factores

respecto a TRI.

Variables Entropia_Conjunta MI R R_MAX % redundancia

ENVA-TRI 0.716481601 0.00058115

0.13426118 0.26485804 50.69

ENVB-TRI 0.54135989 0.47907461 0.41456483 115.56

ORIA-TRI 0.769955859 0.00041994

0.19053156 0.36037791 52.87

ORIB-TRI 0.695658616 0.38067208 0.45835611 83.05

GASA-TRI 0.841794734 0.00845591

0.16887627 0.39931217 42.29

GASB-TRI 0.692729851 0.39156379 0.46563192 84.09

Fuente. Elaboración propia.

ANEXO EE10. Entropía conjunta, información mutua y valores de redundancia de factores

respecto a BPA.

Variables Entropia_Conjunta MI R R_MAX % redundancia

Page 226: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

226

ENVA-BPA 0.963837923 0.00057092

0.12856395 0.19818137 64.87

ENVB-BPA 0.572452273 0.56555579 0.32696234 172.97

ORIA-BPA 0.972345862 0.00063723

0.20923413 0.27877333 75.06

ORIB-BPA 0.771489801 0.44959874 0.36730578 122.4

GASA-BPA 0.984289289 0.00016693

0.23774006 0.3132084 75.9

GASB-BPA 0.836962752 0.40933338 0.37413461 109.41

Fuente. Elaboración propia.

ANEXO EE11. Entropía conjunta, información mutua y valores de redundancia de factores

respecto a PRI.

Variables Entropia_Conjunta MI R R_MAX % redundancia

ENVA-PRI 0.399526115 0.00267256

0.13623548 0.47389432 28.75

ENVB-PRI 0.491168959 0.27144891 0.36095404 75.2

ORIA-PRI 0.489571754 0.00298528

0.16474147 0.41517135 39.68

ORIB-PRI 0.608422378 0.19753587 0.32095434 61.55

GASA-PRI 0.519242293 0.00612674

0.19843328 0.37565781 52.82

GASB-PRI 0.652556451 0.15634405 0.31460824 49.69

Fuente. Elaboración propia.

ANEXO EE12. Entropía conjunta, información mutua y valores de redundancia de factores

respecto a CAR.

Variables Entropia_Conjunta MI R R_MAX % redundancia

ENVA-CAR 0.927321286 0.00267256

0.12584884 0.20662726 60.91

ENVB-CAR 0.563714835 0.55698699 0.338579 164.51

ORIA-CAR 0.923313214 0.00446071

0.22044875 0.28941411 76.17

ORIB-CAR 0.771489801 0.43125476 0.37954749 113.62

GASB-CAR 0.946653014 0.00014475

0.24028818 0.32457206 74.03

GASA-CAR 0.829412033 0.39537126 0.38646489 102.3

Fuente. Elaboración propia.

ANEXO EE13. Entropía conjunta, información mutua y valores de redundancia de factores

respecto a PRO.

Variables Entropia_Conjunta MI R R_MAX % redundancia

ENVA-PRO 0.451718089 0.01082246

0.02339787 0.47389432 4.94

ENVB-PRO 0.430827083 0.36095404 0.36095404 100

Page 227: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

227

ORIA-PRO 0.566463062 0.01966894

0.03355719 0.41517135 8.08

ORIB-PRO 0.514847408 0.32095434 0.32095434 100

GASA-PRO 0.547819101 0.00078588

0.15431858 0.37565781 41.08

GASB-PRO 0.629320506 0.18638458 0.31460824 59.24

Fuente. Elaboración propia.

ANEXO FF. Arboles de Regresión para compuestos.

ANEXO FF1. Árbol de Regresión como variable de respuesta DEP.

Page 228: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

228

Fuente. Elaboración propia. ANEXO FF2. Árbol de Regresión como variable de respuesta DIBP.

Fuente. Elaboración propia.

ANEXO FF3. Árbol de Regresión como variable de respuesta DBP.

Page 229: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

229

Fuente. Elaboración propia.

ANEXO FF4. Árbol de Regresión como variable de respuesta DEPH.

Fuente. Elaboración propia.

ANEXO FF5. Árbol de Regresión como variable de respuesta DOP.

Page 230: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

230

Fuente. Elaboración propia.

ANEXO FF6. Árbol de Regresión como variable de respuesta TER.

Fuente. Elaboración propia.

ANEXO FF7. Árbol de Regresión como variable de respuesta ACE.

Page 231: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

231

Fuente. Elaboración propia.

ANEXO FF8. Árbol de Regresión como variable de respuesta CAF.

Fuente. Elaboración propia.

ANEXO FF9. Árbol de Regresión como variable de respuesta FLU.

Page 232: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

232

Fuente. Elaboración propia.

ANEXO FF10. Árbol de Regresión como variable de respuesta GEM.

Fuente. Elaboración propia.

ANEXO FF11. Árbol de Regresión como variable de respuesta TRI.

Page 233: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

233

Fuente. Elaboración propia.

ANEXO FF12. Árbol de Regresión como variable de respuesta BPA.

Fuente. Elaboración propia.

Page 234: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

234

ANEXO FF13.Árbol de Regresión como variable de respuesta PRI.

Fuente. Elaboración propia.

ANEXO FF14.Árbol de Regresión como variable de respuesta CAR.

Fuente. Elaboración propia.

ANEXO FF15.Árbol de Regresión como variable de respuesta PRO.

Page 235: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

235

Fuente. Elaboración propia.

ANEXO GG. Tablas de importancia de bosques aleatorios para compuestos.

ANEXO GG1. Importancia de factores para DEP con Random Forest

FACTOR I detectado MeanDecreaseAccuracy obb estimate

ENVASE 1.38 1.37

2.3% ORIGEN -1.27 -1.28

GAS -3.07 -3.07

Fuente. Elaboración propia.

ANEXO GG2. Importancia de factores para DIBP con Random Forest

FACTOR I detectado MeanDecreaseAccuracy obb estimate

ENVASE 3.97 12.68

31% ORIGEN 16.98 21.94

GAS 4.39 9.52

Fuente. Elaboración propia.

ANEXO GG3. Importancia de factores para DBP con Random Forest

Page 236: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

236

FACTOR I detectado MeanDecreaseAccuracy obb estimate

ENVASE 10.71 13.9

42.5% ORIGEN 9.78 10.2

GAS 5.42 8.1

Fuente. Elaboración propia.

ANEXO GG4. Importancia de factores para DEHP con Random Forest

FACTOR I detectado MeanDecreaseAccuracy obb estimate

ENVASE 9.28 14.03

39% ORIGEN 8.51 11.00

GAS 4.7 7.38

Fuente. Elaboración propia.

ANEXO GG5. Importancia de factores para DOP con Random Forest

FACTOR I detectado MeanDecreaseAccuracy obb estimate

ENVASE 1.67 5.28

3.45% ORIGEN 1.34 2.37

GAS 3.58 0.21

Fuente. Elaboración propia.

ANEXO GG6. Importancia de factores para TER con Random Forest

FACTOR I detectado MeanDecreaseAccuracy obb estimate

ENVASE 0 0

8.% ORIGEN 0 0

GAS 0 0

Fuente. Elaboración propia.

ANEXO GG7. Importancia de factores para ACE con Random Forest

FACTOR I detectado MeanDecreaseAccuracy obb estimate

ENVASE 6.47 1.44

32.18% ORIGEN 5.7 1.33

GAS -7.89 -8.64

Fuente. Elaboración propia.

ANEXO GG8. Importancia de factores para CAF con Random Forest

FACTOR I detectado MeanDecreaseAccuracy obb estimate

ENVASE 0 0

0.00% ORIGEN 0 0

GAS 0 0

Fuente. Elaboración propia.

ANEXO GG9. Importancia de factores para FLU con Random Forest

Page 237: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

237

FACTOR I detectado MeanDecreaseAccuracy obb estimate

ENVASE 11.10 7.75

16% ORIGEN 13.69 12.94

GAS -4.26 -7.37

Fuente. Elaboración propia.

ANEXO GG10. Importancia de factores para GEM con Random Forest

FACTOR I detectado MeanDecreaseAccuracy obb estimate

ENVASE 16.5 14.84

26.4% ORIGEN 4.9 0.63

GAS 8.4 12.04

Fuente. Elaboración propia.

ANEXO GG11. Importancia de factores para TRI con Random Forest

FACTOR I detectado MeanDecreaseAccuracy obb estimate

ENVASE 10.17 6.19

19.5% ORIGEN 10.18 7.22

GAS -2.68 -6.12

Fuente. Elaboración propia.

ANEXO GG12. Importancia de factores para BPA con Random Forest

FACTOR I detectado MeanDecreaseAccuracy obb estimate

ENVASE 13.99 8.71

27.5% ORIGEN 10.45 4.06

GAS -2.37 -4.82

Fuente. Elaboración propia.

ANEXO GG13. Importancia de factores para PRI con Random Forest

FACTOR I detectado MeanDecreaseAccuracy obb estimate

ENVASE -5.30 -5.29

2.3% ORIGEN -6.02 -6.28

GAS 0.08 0.08

Fuente. Elaboración propia.

ANEXO GG14. Importancia de factores para CAR con Random Forest

FACTOR I detectado MeanDecreaseAccuracy obb estimate

ENVASE -4.97 1.35

25.29% ORIGEN -1.41 1.78

GAS 1.59 1.85

Fuente. Elaboración propia.

ANEXO GG15. Importancia de factores para PRO con Random Forest

Page 238: IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...

238

FACTOR I detectado MeanDecreaseAccuracy obb estimate

ENVASE 0 0

3.45% ORIGEN 0 0

GAS 0 0

Fuente. Elaboración propia.