IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...
Transcript of IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA ...
1
IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA PRESENCIA
DE LOS DISRUPTORES ENDOCRINOS EN EL AGUA EMBOTELLADA EN
BOGOTÁ
ENRÍQUEZ HIDALGO ANDRÉS MAURICIO
PONTIFICIA UNIVERSIDAD JAVERIANA
FACULTAD DE INGENIERÍA
MAESTRIA EN HIDROSISTEMAS
BOGOTÁ D.C
2017
2
IDENTIFICACIÓN DE LOS FACTORES EXPLICATIVOS DE LA PRESENCIA
DE LOS DISRUPTORES ENDOCRINOS EN EL AGUA EMBOTELLADA EN
BOGOTÁ
ENRÍQUEZ HIDALGO ANDRÉS MAURICIO
Trabajo de investigación presentado como requisito para optar el título de Magister en
Hidrosistemas
Directores
Jaime A. Lara Borrero. IC, M.Sc, PhD.
Andres Torres. IC, M.Sc, PhD.
PONTIFICIA UNIVERSIDAD JAVERIANA
FACULTAD DE INGENIERÍA
MAESTRIA EN HIDROSISTEMAS
BOGOTÁ D.C
2017
3
CONTENIDO
1. INTRODUCCION (capitulo1) ...................................................................................10
2. MATERIALES Y METODOS (capitulo 2). .................................................................15
2.1. DISEÑO EXPERIMENTAL. ..................................................................................15
2.2. LABORATORIO. ..................................................................................................16
2.2.1. Preprocesamiento de muestras. ......................................................................17
2.2.2. Análisis cromatográfico. ...............................................................................18
2.3. GRADO DE TOXICIDAD. .................................................................................35
2.4. ANALISIS DE RESULTADOS. ..........................................................................37
2.4.1. Análisis de componentes principales (PCA) .....................................................37
2.4.2. Análisis de Correspondencia Múltiple (MCA) y test de Wilcoxon. .....................40
2.4.3. ANOVA, Multi ANOVA, Kruskal Wallis y Kruskal Wallis Multivariado. ..........41
2.4.4. Análisis de Información Promedio Mutua (AMI). ............................................42
2.4.5. Modelos basados en arboles (Tree based models) .............................................44
2.4.6. Árboles de decisión. .....................................................................................44
2.4.7. Árboles de Regresión (Regression trees). ........................................................45
2.4.8. Bosques Aleatorios (Random Forest) y algoritmo Xgboots ................................45
3. RESULTADOS (capitulo 3) ......................................................................................47
4. DISCUSIÓN DE RESULTADOS (capitulo 4). ............................................................81
5. CONCLUSIONES ....................................................................................................86
6. RECOMENDACIONES............................................................................................88
BIBLIOGRAFIA .............................................................................................................89
4
LISTA DE TABLAS
Tabla 1. Clasificación Factores Explicativos para el agua embotellada comercializada en Bogotá.
......................................................................................................................................16 Tabla 2. Equipos y reactivos para análisis de muestras. ........................................................17 Tabla 3. Patrones Utilizados en Análisis Cromatográfico. .....................................................19 Tabla 4. Compuestos contenidos en los patrones de calibración para (GC-MS)........................19 Tabla 5. Montaje de curva de mezcla de esteres y ftalatos para cromatografía .........................20 Tabla 6. Ventanas, iones, tiempo y límite de detección de mezcla de esteres y ftalatos .............22 Tabla 7. Montaje de curva de farmacéuticos final para cromatografía. ....................................24 Tabla 8. Ventanas, iones, tiempo y límite de detección de mezcla final de farmacéuticos ..........25 Tabla 9. MCL, RfD’s y DWEL’s para compuestos analizados (MCL: nivel máximo contaminate;
DWEL: nivel equivalente de agua potable; RfD: dosis de referencia). ....................................48 Tabla 10. Porcentaje de muestras con concentraciones de compuestos mayores a MCL (MCL: nivel
máximo contaminante). ....................................................................................................49 Tabla 11. Porcentaje de detección, mínimos y máximos de compuestos analizados por
cromatografía de masas. No muestras = 174. .......................................................................50 Tabla 12. Porcentaje de detección, mínimos y máximos de compuestos analizados por
cromatografía de masas (tablas de dirección bidireccional) (en rojo se muestran compuestos con
una detección mayor al 50%). ...........................................................................................51 Tabla 13. Correlaciones de las muestras respecto a dos componentes principales. ....................53 Tabla 14. P value Wilcolxon test. .......................................................................................62 Tabla 15. p-value test de Bartlett .......................................................................................63 Tabla 16. p-value test de Shapiro .......................................................................................63 Tabla 17. p-value Kruskal-Wallis test & Kruskal-Wallis Multivariado ...................................64 Tabla 18. Kruskal-Wallis Multivariado con envase de vidrio para plastificantes. .....................66 Tabla 19. Kruskal-Wallis Multivariado con muestras sin gas para farmacéuticos y hormonas. ...66
5
Tabla 20. Kruskal-Wallis Multivariado con muestras de origen internacional para plastificantes.
......................................................................................................................................67 Tabla 21. Entropía conjunta, información mutua y valores de redundancia de factores respecto a
DMP. .............................................................................................................................68 Tabla 22. Entropía conjunta, información mutua y valores de redundancia de factores respecto a
ACE. ..............................................................................................................................68 Tabla 23. Entropía conjunta, información mutua y valores de redundancia de factores respecto a
CAF. ..............................................................................................................................69 Tabla 24. Importancia de factores para DMP con Random Forest ..........................................78 Tabla 25. Resultados relevantes .........................................................................................82
6
LISTA DE FIGURAS
Figura 1. Estructura química de Dimetilftalato (DMP)..........................................................27 Figura 2. Estructura química de Dietilftalato (DEP) .............................................................28 Figura 3. Estructura química de Di-iso-Butilftalato. .............................................................29 Figura 4. Estructura química de Dibutilftalato. ....................................................................29 Figura 5. Estructura molecular del DEHP. ..........................................................................31 Figura 6. Estructura molecular del DOP. .............................................................................32 Figura 7. Estructura molecular del TER. .............................................................................32 Figura 8. Estructura química de bisfenol A. .........................................................................33 Figura 9. Distancia robusta de Mahanoblis para muestras de agua multivariada. ......................39 Figura 10. Análisis de componentes principales para la matriz de agua de los compuestos. .......52 Figura 11. Separación por clústers de niveles de factores. .....................................................54 Figura 12. MCA para todos los compuestos con factores. .....................................................56 Figura 13. Boxplot de niveles de factores y compuestos........................................................57 Figura 14. Separación por clústers de niveles de factores y compuestos (DEPH Y BPA). .........58 Figura 15. Boxplots de niveles de factores y compuestos (DEPH Y BPA)...............................58 Figura 16. Separación por clústers de niveles de factores y compuestos plastificantes. .............60 Figura 17. Boxplots de niveles de factores y compuestos. .....................................................61 Figura 18. Árbol de decisión como variable de respuesta DMP. .............................................71 Figura 19. Árbol de decisión como variable de respuesta DIBP. ............................................72 Figura 20. Árbol de decisión como variable de respuesta DEPH. ...........................................73 Figura 21. Árbol de Regresión como variable de respuesta DMP. ..........................................74 Figura 22. Importancia factores según algoritmo Xg boots ....................................................80
7
Figura 23.porcentajes de detección de disruptores endocrinos encontrados en Colombia, España y
México. ..........................................................................................................................83 Figura 24. Concentraciones de disruptores endocrinos encontrados en agua potable distribuida en
Bogotá y agua embotellada comercializada en Bogotá. .........................................................85
8
LISTA DE ANEXOS
ANEXO A. Código diseño experimental en R. ....................................................................95 ANEXO B. Cromatógrafo de Gases GC _MS 2010 Shimadzu (sistema GC-MS) .....................95 ANEXO C. Cartuchos de silica C18 hiperSept. ...................................................................96 ANEXO D. Filtros de celulosa 0,45um. ..............................................................................97 ANEXO E. Vial de 1 mL. .................................................................................................97 ANEXO F. Retención de minerales (A) y retención de disruptores endocrinos (B) ..................98 ANEXO G. Certificado de análisis del patrón de mezcla de esteres y ftalatos (ver carpeta de
ANEXOS). .....................................................................................................................98 ANEXO H. Carpeta que contiene archivos txt de ftalatos arrojados del análisis cromatográfico (ver
carpeta de ANEXOS). ......................................................................................................98 ANEXO I. Cromatograma de patrón de ftalatos y esteres. ................................................... 100 ANEXO J. Carpeta que contiene archivos txt de ftalatos arrojados del análisis cromatográfico (ver
carpeta de ANEXOS) ..................................................................................................... 101 ANEXO K. Ficha de datos de seguridad de mezcla de esteroides y farmacéuticos (ver carpeta de
ANEXOS) .................................................................................................................... 101 ANEXO L. Certificado de análisis del patrón de mezcla de esteroides y farmacéuticos (ver carpeta
de ANEXOS) ................................................................................................................ 101 ANEXO M. Ficha de datos de seguridad de mezcla de farmacéuticos 1 (ver carpeta de ANEXOS)
.................................................................................................................................... 103 ANEXO N. Certificado de análisis del patrón de mezcla de hormonas y farmacéuticos (ver carpeta
de ANEXOS) ................................................................................................................ 103 ANEXO O. Ficha de datos de seguridad de mezcla de farmacéuticos 2 (ver carpeta de ANEXOS)
.................................................................................................................................... 104 ANEXO P. Certificado de análisis del patrón de mezcla de farmacéuticos 2 (ver carpeta de
ANEXOS) .................................................................................................................... 104 ANEXO Q. Cromatograma específico de mezcla de farmacéuticos final. .............................. 105
9
ANEXO R. Carpeta que contiene archivos txt de farmacéuticos arrojados del análisis
cromatográfico (ver carpeta de ANEXOS) ........................................................................ 106 ANEXO S. Matriz total de compuestos en Excel (ver carpeta de ANEXOS) ......................... 106 ANEXO T. Código de análisis de componentes principales (PCA) en R. .............................. 106 ANEXO U. Código en R para análisis de Outliers. ............................................................. 108 ANEXO V. Código de análisis de correspondencia múltiple (MCA) en R. ............................ 108 ANEXO W. Código Wilcoxon test .................................................................................. 111 ANEXO X. Código Kruskall Wallis y Kruskall wallis Multivariado en R. ............................ 118 ANEXO Y. Código información mutua promedio (AMI) en R ............................................ 127 ANEXO Z. Código Arboles de decisión y de regresión en R ............................................... 190 ANEXO AA. Codigo Random Forest en R. ...................................................................... 202 ANEXO BB. Numero de familia según 4 grupos de clasificación. ....................................... 216 ANEXO CC. Resultados Diseño experimental con uso de la librería Agricolae del software R.
.................................................................................................................................... 216 ANEXO DD. Muestras de agua según la clasificación de familias del diseño experimental y código
en R ............................................................................................................................. 217 ANEXO EE. Entropía conjunta, información mutua y valores de redundancia de factores respecto
a compuestos. ................................................................................................................ 223 ANEXO FF. Arboles de Regresión para compuestos. ......................................................... 227 ANEXO GG. Tablas de importancia de bosques aleatorios para compuestos. ........................ 235
10
INTRODUCCION (capitulo1)
Los disruptores endocrinos (DE) son sustancias químicas de síntesis que afectan el equilibrio
hormonal (hormona: mediador químico que conecta un órgano con otro). Cabe destacar que estas
hormonas emiten señales químicas, las cuales pueden ser modificadas por diferentes compuestos
químicos que toman su lugar. Cuando sucede esto se producen consecuencias biológicas en el
sistema hormonal (SH): SH acentuado o SH deficitario (debido a un bloqueo de la actividad
hormonal provocado por los DE) (FundAlborada 2015; Moral 2015). Desde 1991, los científicos
se han preocupado por definir el fenómeno de las alteraciones endocrinas. Los DE pueden definirse
como "Un gran número de productos químicos generados por el hombre que tienen el potencial de
alterar el sistema endocrino de los animales, incluidos el de los seres humanos” (FundAlborada
2015; Moral 2015). Desde entonces, la investigación en este campo multidisciplinario se ha
desarrollado por el interés del conocimiento sobre los DE expandiéndose de forma constante en
muchos aspectos actuales relativos a los efectos de estos, en diferentes vías hormonales, esteroides
de bioquímica y biología molecular (Mustieles et al. 2015).
Dos décadas después, la Sociedad de Endocrinología de Alemania renueva la demanda de realizar
proyecciones de la exposición de estas sustancias como una prioridad de investigación en su
declaración sobre la Ciencia de disruptores endocrinos (Diamanti-Kandarakis et al. 2009). Sin
embargo, la comprensión de la complejidad de la exposición humana a los productos químicos
hechos por el hombre, incluyendo los DE, se ve comprometida por la inmensa cantidad de
compuestos en uso y las limitaciones técnicas en su detección (Wagner and Oehlmann 2011).
11
En este sentido, los efectos acumulativos de la exposición a largo plazo a dosis bajas de los DE
empiezan desde la alteración del sistema endocrino hasta la aparición de enfermedades tales como
sobrepeso, infertilidad, cáncer etc. Por ende, el consumo diario de agua embotellada puede generar
esta exposición de dosis bajas de DE convirtiéndose en un riesgo para la salud humana (Dhaini and
Nassif 2014). Así, la ciencia de la exposición se ve obligada a concentrarse en unos pocos productos
químicos como indicadores de la exposición total a los DE como por ejemplo el Bisfenol A y los
ftalatos de los cuales se dispone de excelentes datos de biomonitorización (procedimiento analítico
para la identificación y cuantificación de residuos de los disruptores endocrinos) (Navalón Montón
2013; Albouy-Llaty et al. 2016).
Compuestos indicadores como el bisfenol A (BPA: 4, 4'-dihidroxi-2, 2-difenilpropano) y los
ftalatos, son de los químicos de mayor producción en todo el mundo: la producción anual global
de BPA se estima en más de cinco millones de toneladas (Rhomberg and Goodman 2012). Este es
un componente básico de policarbonato (PC) de plástico que es un monómero de resinas epoxi
utilizado en el recubrimiento de latas de aluminio y envolturas de alimentos, papeles y cartones,
recibos de cajas registradoras, y filtros de cigarrillos; teniendo en cuenta que es un aditivo no-
polímero en plásticos, tales como tuberías de agua de cloruro de polivinilo (PVC) (Rubin 2011; Li
et al. 2010; Muhamad et al. 2016). En este mismo orden de ideas el BPA y los ftalatos son utilizados
a menudo en los envases de alimentos y de bebidas, incluyendo botellas de agua potable y biberones
(Jeddi et al. 2015). Teniendo en cuenta que el BPA y los ftalatos son buenos indicadores de la
exposición a DE, son considerados como sustancias de la representación de la toxicidad en el agua.
Dicho esto, se han registrado pérdidas humanas debido a la exposición al BPA (Li et al. 2010), En
efecto, se ha establecido y documentado la exposición al BPA como resultado de la migración de
este compuesto a los alimentos y el agua potable: un análisis de la Unidad Nacional de Salud y
12
Encuesta de Nutrición (NHANES) de EE.UU, reveló exposición de más de 90% de la población
general a BPA (Li et al. 2010). Vandenberg (2011) reveló que la exposición al BPA se encuentra
en ascenso actualmente a nivel mundial. Estos datos apoyan la hipótesis de que los materiales de
envasado PET son una fuente de generación de DE. Además, cabe mencionar que las botellas de
agua de policarbonato (PC) que están expuestas a altas temperaturas, hacen que el BPA migre del
plástico al agua. Por lo cual, también se han realizado estudios en donde se cuantifica la migración
de este compuesto al agua en función de un aumento de la temperatura, habiendo una rápida
migración del BPA a más de 80°C sin dejar a un lado que el BPA puede liberarse en el agua a
temperatura ambiente. Por otra parte, la ingesta diaria de BPA por bebés es casi 10 veces mayor
que la de los adultos. La ingesta diaria tolerable actual (TDI) establecida por la Agencia Europea
de Seguridad Alimentaria (AESA) para BPA es 50 mg/kg, idéntica a la dosis de referencia (DR)
establecida por la US Environmental Protection (EPA) (Richter et al. 2007). Sin embargo, sobre la
base de esos estudios, la exposición al BPA por el agua potable constituye un riesgo mínimo para
la salud humana (Li et al. 2010; Nam, Seo, and Kim 2010; Cooper, Kendig, and Belcher 2011a;
Wagner and Oehlmann 2011).
Dicho esto, el consumo de agua embotellada contribuye al riesgo de la exposición a DE. Resultados
de ensayos realizados a aguas de las botellas de plástico como de vidrio sugieren que los envases
de plástico no son la única fuente de contaminación de DE y que la fuente y el procesamiento del
agua y embotellado puede jugar un papel importante (Real et al. 2015). Esto hace referencia a que
no hay completa seguridad del origen de los DE en el agua embotellada, en este sentido se han
realizado estudios en España y en México en donde cuantifican los ftalatos y el bisfenol A,
encontrándose mayores porcentajes de detección en aguas de origen Mexicano en ftalatos como
dibutilftalto, benzil-butilftaltao y bis-2-etil-hexilftalato(Vazquez et al. 2017; Guart et al. 2014).
13
esto da a entender que el origen del agua es un factor importante en la detección de estos
compuestos además Guart (2014) indica que el agua cabonatada en combinación con un envase
de vidrio y tapas metálicas y de plástico incrementan la migración de estos compuestos al agua
embotellada, por lo cual se hace necesario identificar factores que expliquen por qué hay presencia
de DE entre los cuales se escogieron el origen, el gas y el envases en ellas con el fin de descubrir
grados de incidencia de estos factores y sus patrones de exposición. Hasta la fecha, existe poca
información sobre el destino, los comportamientos y las vías de los DE en el medio ambiente. Los
posibles efectos eco-toxicológicos sobre los receptores debido a la exposición de los individuos a
una mezcla de estos productos químicos aún se desconoce, por lo cual se recomienda la
investigación futura centrada en el desarrollo de modelos de riesgo basados en la detección de estos
con el fin de predecir las fuentes, el destino y el comportamiento de los contaminantes emergentes
en el medio ambiente (Tijani et al. 2015).
Actualmente el INVIMA tiene 789 registros vigentes de empresas fabricantes de agua embotellada.
Las ciudades que más empresas de este tipo tienen son: Bogotá con 165 empresas registradas, 30
en Villavicencio, 18 en Cartagena, 14 en Cali, Montería y Neiva, 13 en Barranquilla, 12 en
Medellín y Santa Marta y 10 en Cúcuta, Ibagué, Maicao, Yopal y Riohacha. En Colombia, el 0.4%
de familias colombianas consume agua embotellada, es decir unas 53 mil familias. Cabe mencionar
que el agua del grifo es percibida por el público en general como no apta para el consumo debido
a las prácticas inadecuadas de potabilización, el abuso de fertilizantes y plaguicidas, y la falta
general de vigilancia del medio ambiente en la aplicación de la ley en el país (INVIMA 2017).
En este contexto, el agua embotellada tiene diversas fuentes y tratamientos que dificultan la tarea
de desarrollar modelos de riesgo de los DE por medio de este factor ya que en la ley colombiana
14
no está reglamentado indicar de donde se obtiene el agua que se envasa para comercializar
(MINISTERIO DE SALUD 1991). Por lo tanto, este estudio propone tratar de identificar los
factores incidentes sobre la presencia de estos compuestos en agua embotellada que se distribuye
en Bogotá en función del tipo de embotellado, país de origen y si tiene gas o no. Lo anterior se
justifica debido a la falta de elementos que permitan predecir el comportamiento de los DE en
función de los factores explicativos que den respuesta a preguntas como: ¿El envase del agua
embotellada influye en la presencia de los DE?, ¿el agua embotellada de importación es mejor que
la nacional?, ¿el gas en el agua embotellada influye en la detección de estos? Que en un fin
engloban el objetivo de identificar factores que tienen mayor grado de influencia sobre la presencia
de disruptores endocrinos en el agua embotellada que se comercializa en Bogotá, destacando que
esun estudio pionero y el primero dedicado los factores explicativos de la presencia de DE en el
agua embotellada comercializada en Bogotá.
15
2. MATERIALES Y METODOS (capitulo 2).
2.1. DISEÑO EXPERIMENTAL.
Se consiguieron 59 marcas de agua embotellada comercializada en Bogotá y se compraron tres
repeticiones de cada marca teniendo en cuenta que en Bogotá hay 165 empresas comercializadoras
de agua embotellada registradas (INVIMA 2017). Con el fin de conocer si este número de muestras
(173, debido a que de todas las marcas no se consiguieron las tres repeticiones por cuestiones de
mercado) es representativo, se realizó un diseño experimental que dé respuesta a esta incógnita.
Para la elaboración del diseño experimental se hizo uso de la librería “Agricolae” para el software
R Statistical. Este paquete ofrece una amplia funcionalidad de diseños experimentales,
especialmente para experimentos de agricultura, sin embargo, puede ser utilizado con diferentes
propósitos(Mendiburu 2016). El paquete realiza diferentes procedimientos de análisis de datos
experimentales, por ejemplo, la comparación de tratamientos y varias pruebas de comparación no
paramétricas (Mendiburu 2016). Dentro de esta librería se utilizó la función design.bib que crea
diseños de bloques usando métodos de generación de números Randomized Balanced Incomplete
Block Designs (diseño por bloques incompletos balanceados aleatorios) (R Foundation for
Statistical Computing .R. 2016). Se hizo uso de esta libreria del software R, con el fin de obtener
un tamaño de muestra mínimo inicial de agua embotellada comercializada en Bogotá para la
implementación de herramientas estadísticas en el análisis de los datos; esto a través cuatro grupos
globales y dos opciones de respuesta para cada grupo como lo indica la tabla 1.
16
Tabla 1. Clasificación Factores Explicativos para el agua embotellada comercializada en
Bogotá.
Grupo Nivel Significado Nivel
Origen 1 Nacional
2 Internacional
Gas 1 No
2 Si
Envase 1 Plástico
2 Vidrio
Fuente. Elaboración propia.
El código para el desarrollo de este se indica en el ANEXO A.
2.2. LABORATORIO.
Para la cuantificación de resultados se utilizó el laboratorio de Calidad de Agua del
Departamento de Ingeniería Civil de la Pontificia Universidad Javeriana (PUJ) de Bogotá en donde
se aplicó el método multiresiduo de cromatografía de gases acoplada a espectrometría de masas
permitiendo detectar los compuestos de interés además de la concentración en la que están
presentes. Los análisis fueron realizados utilizando un Cromatógrafo de Gases GC _MS 2010
Shimadzu (sistema GC-MS) en modo de ionización por impacto electrónico (EI, 70eV) (ANEXO
B). Las condiciones experimentales fueron las siguientes: columna capilar MS-5 (5 % fenil, 95 %-
dimetil- polisiloxano) (30 m x0.25 mm d.i., 0.25 μm espesor de fase); gas carrier, He (1,0 mL min-
1); volumen de inyección, 1 μL; modo de inyección, split; radio de split, 1:12. La temperatura del
MS Quadrupolo y de la Fuente fueron 150 y 230°C. El programa de temperatura utilizado fue:
80°C (durante 3 min), luego a 10°C/min hasta 295 °C donde se mantiene 10 minutos (Shimadzu
17
Corporation 2017; Gómez et al. 2007). Este método se desarrolló en 2 fases y los materiales,
reactivos y equipos necesarios para realizar este procedimiento se indican en la tabla 2.
Tabla 2. Equipos y reactivos para análisis de muestras. Equipos y Reactivos Cantidad Especificaciones
Erlenmeyer 3 unidades 1000 mL
Erlenmeyer tapón horadado 2 unidades 1000 mL
tubo vidrio 2 unidades 1000 mL
Manguera Silicona 1 unidades 1 m
Tubos de Ensayo vidrio 174 unidades >5 mL
Viales vidrio 174 unidades 1,5 mL
Probetas Vidrio 3 unidades 100 mL
Beakers Vidrio 3 unidades 500 mL
Beakers Vidrio 3 unidades 40 mL
Filtro membrana acetato de celulosa 300 unidades 0.45 um x 47 mm diámetro
Cartuchos Hypersep C18 174 unidades 200mg/3 mL
Solución de acetato de etilo (C4H8O2) 5 L unidades Pureza= hight purity (HP).
Solución trifenil fosfato
(C18H15O4P)
5L unidades Pureza=99% marca=Sigma.
Solución hidróxido de amonio
(NH4OH)
500 mL al 25% & 2 L al
0.5%
25 % muestras gas & 0.5% muestras sin
gas
pH - metro digital de mesa lab
850/14p
1 unidades Marca schott ref 28.520.131.
Muestra de agua embotellada 174 500 mL
Fuente. Elaboración propia.
Con los materiales y reactivos necesarios listos para el análisis de las muestras se realizaron los
análisis que se dividen en dos etapas.
2.2.1. Preprocesamiento de muestras.
Consiste en la filtración de las muestras de agua para prepararlas para su posterior
procesamiento. Para la filtración de las muestras de agua embotellada es necesario preparar 500
mL (volumen de saturación de cartuchos C18 (ANEXO C)) de cada una y medir su pH: si este está
por debajo de 8 es necesario ajustarlo con hidróxido de amonio (NH4OH) hasta un rango de 8 a
18
8.5; este rango, garantiza que se van a retener las especies químicas de interés y que las especies
químicas presentes no cambien debido a procesos químicos que ocurren a pH acido o básico
(Yanina G. Muñoz Reyes 2015; Gómez et al. 2007). Después se filtra el agua a través de filtros de
celulosa de 0,45um (ANEXO D) con el fin de retener sustancias y minerales que afecten el paso
por los cartuchos de silica C18 (cadena de 18 carbonos) de extracción que tiene como fin retener
los DE presentes en el agua embotellada (Gómez et al. 2007).
2.2.2. Análisis cromatográfico.
Se realizó a través cromatografía de gases acoplada a masas (CG-MS). La cromatografía
analiza cinco grupos diferentes de DE: plaguicidas pesticidas órganoclorados, pesticidas
organofosforados, compuestos farmacéuticos, hormonas, esteroides y ftalatos. Para este análisis,
se hace necesario agregar un solvente al cartucho C18 completamente saturado con los 500 mL de
la muestra; en este caso se utiliza un solvente de acetato de etilo (C4H8O2) que filtra los DE
presentes en el cartucho hacia un tubo de ensayo. Después se evapora la muestra contenida en el
tubo de ensayo con el fin de obtener el precipitado de la muestra, (no dejar evaporar
completamente. Posterior a esto, se reconstruye el precipitado de la muestra con 1 mL de trifenil
fosfato (C18H15O4P) para transportarlo a un vial de 1 mL (ANEXO E) que es colocado en el
cromatógrafo a una temperatura de 40 a 350 °C, transportando la muestra a través de una columna
capilar de 30 m BMS (5% de polixiloxano “polaridad baja”) que identifica primero los compuestos
de mayor polaridad a menor polaridad. El ANEXO F indica el montaje para la preparación de las
muestras hacia los viales.
19
Los compuestos que se encuentran en el agua embotellada y por ende los de prioridad para esta
investigación fueron analizados a partir de unos patrones de calibración de la marca RESKEL
CORPORATION los cuales se dividen en 4 patrones descritos en la tabla 3 y la tabla 4 contiene
los compuestos contenidos en cada uno de estos.
Tabla 3. Patrones Utilizados en Análisis Cromatográfico.
METODO No Catalogo
EPA Method 8061A Phthalate Esters Mixture 33227
EPA Method Steroids and Mixed Pharmaceuticals Mix 31117
EPA Method Pharmaceuticals Mix #1 31116
EPA Method Pharmaceuticals Mix #2 31118
Fuente. Elaboración propia.
Tabla 4. Compuestos contenidos en los patrones de calibración para (GC-MS).
Phthalate Esters Mixture Steroids and Mixed
Pharmaceuticals Mix
Pharmaceuticals Mix
#1
Pharmaceutical
s Mix #2
Benzyl butyl phthalate Bisphenol A Acetaminophen Gemfibrozil
Bis(2-n-butoxyethyl)phthalate Diclofenac sodium salt Caffeine Ibuprofen
Bis(2-ethoxyethyl)phthalate 17-beta-Estradiol Carbamazepine Naproxen
Bis(2-ethylhexyl)phthalate Estrone Ciprofloxacin HCL Triclosan
Bis(2-methoxyethyl)phthalate 17-alpha-Ethynylestradiol Erythromycin USP
Bis(4-methyl-2-pentyl)phthalate 4-para-Nonylphenol Fluoxetine HCl
Di-n-butylphthalate 4-tert-Octylphenol Sulfamethoxazole
Diethylphthalate Primidone Trimethoprim
Di-n-hexyl phthalate Progestrone
Dimethylphthalate Testosterone
Di-nonyl phthalate
Di-n-octyl phthalate (117-84-0)
Dipentylphthalate (131-18-0)
Phthalic acid dicyclohexyl ester (84-61-7)
Phthalic acid diisobutyl ester
Fuente. Elaboración propia.
Conociendo que compuestos contiene cada patrón se analizó primero la mezcla de ftalatos y
esteres. El ANEXO G contiene la ficha de datos de seguridad de este patrón y el ANEXO H
20
contiene el certificado de análisis en donde se encuentra el cromatograma de este (ANEXO H.1)
que indica el tiempo y la ventana en el cual es identificado determinado compuesto.
Como se puede observar en el ANEXO H.1 se indica un patrón general el cual indica el orden de
tiempo en minutos en el cual son identificados los compuestos contenidos en el patrón de la mezcla
de esteres y ftalatos (ANEXO J) y que fue esencial para identificar los compuestos en el análisis
cromatográfico.
Dicho esto, fue necesario hacer un montaje de una curva en el cromatógrafo para el patrón de
mezcla de esteres y ftalatos teniendo en cuenta la concentración inicial de este que es igual a
1000000 ppb (partes por billón), se diluyo esta concentración en ocho puntos con el fin de obtener
el límite de detección de los compuestos en el patrón por el cromatógrafo. La tabla 5 indica el
montaje de la curva del patrón de mezcla de esteres y ftalatos.
Tabla 5. Montaje de curva de mezcla de esteres y ftalatos para cromatografía
Vial C1 (ppb) C2 (ppb) V1 (mL) V2 (mL) V2 (uL) V acetato de etilo
HPLC (uL)
1 1000000 10000 1 0.010 10 990
2 100000 1000 1 0.010 10 990
3 100000 500 1 0.005 5 995
4 100000 200 1 0.002 2 998
5 100000 100 1 0.001 1 999
6 200 10 1 0.050 50 950
7 10 1 1 0.100 100 900
8 10 0.1 1 0.010 10 990 Fuente. Elaboración propia.
Donde C1 es la concentración inicial de esteres y ftalatos a partir de la cual se prepara el siguiente
punto de la curva, C2 es la concentración final de patrón de esteres y ftalatos contenida en los viales
(de mayor concentración a menor concentración) utilizada en el análisis cromatográfico, V1 es el
21
volumen de los viales (1 mL), V Acetato de etilo HPLC es el volumen de acetato de etilo necesario
para completar el V2 teniendo en cuenta la cantidad de volumen que se tiene en el V1 (V acetato
de etilo es igual a V2 menos V1) y V2 es el volumen necesario del patrón de la concentración C1
para reducir la concentración a C2 en 1 mL de volumen, que se calcula mediante la ecuación 1:
Ecuación 1. Volumen a utilizar para montaje de curva de mezcla de esteres y ftalatos
V2(ml) =C2 ∗ V1
C1
Con el montaje de esta curva se obtiene un cromatograma mostrado en el ANEXO I; este indica
15 picos de los 17 contenidos en el cromatograma general; esto se debe a diferentes condiciones
que se tiene el análisis cromatográfico, así como los tiempos en los que los compuestos son
detectados, pero no su orden; este análisis sirve para obligar al cromatógrafo a buscar un compuesto
específico en una ventana y un tiempo determinados, dependiendo de donde estén los picos por lo
cual se realizó la tabla 6 que indica estos tiempos, ventanas y iones que sirven como variables
características en el montaje del análisis cromatográfico para correr las muestras de agua
embotellada.
Por otra parte, el límite de detección de cada compuesto fue escogido dependiendo de los resultados
de las curvas de la C2 (tabla 5) para cada compuesto. Esto depende de resultados favorables o
desfavorables para determinados compuestos. Entiéndase por favorable cuando la concentración
de determinado compuesto es menor a medida que se disminuye la C2 y se acopla a los 8 puntos
de la curva de una manera eficiente permitiendo la aplicación de un modelo lineal con un error2 no
menor a 0.85 y además que por lo menos 5 puntos de los 8 tengan este patrón, de lo contrario los
resultados de detección y concentración de un compuesto analizado en particular no serán
22
representativos debido al nivel de incertidumbre presentado en el análisis cromatográfico, de esta
forma se produce un resultado desfavorable, por ejemplo cuando un punto con una C2 =0.1 ppb
tiene una mayor área que una C2= 100 ppb lo cual físicamente es imposible ya que un compuesto
del patrón de mezcla de esteres y ftalatos a una concentración de 0.1ppb no puede tener mayor
concentración que la de 100 ppb.
Tabla 6. Ventanas, iones, tiempo y límite de detección de mezcla de esteres y ftalatos
Compuesto tiempo (min) ventana (min) Iones límite (ug/L)
1 Dimetil-Ftalato 15.365 15.25 15.50 163 77.0 133 194 0.100
2 Dietil-Ftalato 17.195 17.00 17.50 149 222 177 65.0 0.100
3 Diisobutil-Ftalato 20.400 20.30 20.50 149 278 57.0 104 0.100
4 Dibutil-Ftalato 21.410 21.30 21.50 149 278 41.0 104 0.100
5 Bis-2-Metoxi-Etil-Ftalato 21.812 21.70 21.90 59.0 282 149 45.0 10.00
6 Bis-4-metil-2-Pentil-Ftalato 22.641 22.50 22.75 149 85.0 43.0 69.0 100.0
7 Bis-2-Etoxi-Etil-Ftalato 23.024 22.90 23.10 310 45.0 73.0 149 10.00
8 Dipentil-Ftalato 23.317 23.20 23.50 306 149 43.0 104 100.0
9 Dihexil-Ftalato 25.093 25.00 25.10 149 334 43.0 121 0.100
10 Benzil-Butil-Ftalato 25.830 25.2.0 25.90 149 91.0 206 312 10.00
11 Bis-2-n-Butoxietil-Ftalato 26.217 26.10 26.30 149 57.0 366 85.0 100.0
12 Di-ciclohexil-Ftalato 26.753 26.60 26.70 149 167 55.0 83.0 100.0
13 Bis-2-Etil-Hexyl-Ftalato 26.807 26.70 26.90 149 167 57.0 83.0 0.100
14 Di-n-Octilaftalato 28.297 28.10 28.40 149 207 93.0 167 0.100
15 Dinonyl-Ftalato 29.754 29.60 29.90 149 207 43.0 73.0 10.00
Fuente. Elaboración propia.
Donde Tiempo es el tiempo en el cual un pico determinado alcanza el máximo punto de inflexión,
Ventana se define como el rango en el cual inicia un pico y termina, Iones son los átomos con una
carga neta (+/-), cada compuesto tiene determinados iones que son su “huella dactilar” por lo tanto
en el análisis cromatográfico determinan la diferencia entre los compuestos y Límite es la
concentración mínima de detección del cromatógrafo respecto a un compuesto determinado.
Realizado este procedimiento se analizaron en laboratorio las 174 muestras de agua embotellada
en el cromatógrafo (procedimiento que duró 45 minutos por muestra) y que arroja unos archivos
23
.txt que contienen la fecha de generación de los archivos, rutas de localización, áreas, y la
concentración de cada compuesto como se indica en el ANEXO J. Después se hizo el análisis de
los patrones de mezcla de esteroides y mezcla de farmacéuticos (ver ANEXO K, ficha de datos de
seguridad y el ANEXO L, certificado de análisis). Esto se repitió para el patrón de mezcla de
farmacéuticos 1 y mezcla de farmacéuticos 2 (ver ANEXOS M & O, fichas de datos de seguridad
de estos patrones respectivamente y los ANEXOS N & P, certificados de análisis para los
compuestos).
En los ANEXOS L.1, N.1 & P.1 se encuentran los cromatogramas de los patrones de mezcla de
esteroides y mezcla de farmacéuticos, mezcla de farmacéuticos 1 y mezcla de farmacéuticos 2
respectivamente con el fin de conocer en qué tiempos y en qué orden los compuestos son
identificados de forma general por el cromatógrafo.
Es de gran importancia resaltar que para ahorro de recursos económicos y de tiempo se hizo una
mezcla de estos tres patrones con la cual fue posible reducir el tiempo de análisis cromatográfico
en una tercera parte de lo que normalmente tardo. Por lo cual se adiciono en un vial de 1 ml, 0.333
ml de cada patrón y posterior a esto se montó la curva de calibración con 8 puntos. Esta mezcla fue
posible hacerla debido a la concentración inicial que tiene cada patrón, la cual es de 200000 ppb y
de la cual se la diluyo para cada caso hasta una concentración de 0.1 ppb con el fin de obtener el
límite de detección de los compuestos.
Para la realización del cromatograma final de la mezcla de los anteriores patrones se montaron las
curvas de cada patrón y de la mezcla con las concentraciones y volúmenes representados en la tabla
7.
24
Tabla 7. Montaje de curva de farmacéuticos final para cromatografía.
Vial C1 (ppb) C2 (ppb) V1 (mL) V2 (mL) V2 (uL) V acetato de etilo HPLC (uL)
1 200000 10000 1 0.05 50 950
2 10000 1000 1 0.10 100 900
3 10000 500 1 0.05 50 950
4 10000 200 1 0.02 20 980
5 10000 100 1 0.01 10 990
6 200 10 1 0.05 50 950
7 10 1 1 0.10 100 900
8 10 0.1 1 0.01 10 990 Fuente. Elaboración propia.
Con el montaje de esta curva se obtiene un cromatograma indicado en el ANEXO Q, este indica
15 picos de los 22 contenidos en los cromatogramas generales; esto se debe a diferentes
condiciones que tiene el análisis cromatográfico y a la superposición de los picos debido a la mezcla
de los patrones. Se pudo notar que este patrón de mezcla arroja buenos resultados en fármacos, sin
embargo, hormonas presentaron dificultades debido a la inconsistencia de los datos en algunos de
los compuestos, esto permite escoger los tiempos en los que los compuestos son detectados, así el
cromatógrafo busca un compuesto determinado en una ventana y un tiempo específicos
dependiendo de donde estén los picos. En la tabla 8 se indican estos tiempos, ventanas y iones que
son variables características en el montaje del análisis cromatógrafo para correr las muestras de
agua embotellada.
25
Tabla 8. Ventanas, iones, tiempo y límite de detección de mezcla final de farmacéuticos
orden Compuesto tiempo (min) ventana (min) Iones límite (ug/L)
1 4-tert-Octylphenol
(140-66-9)
13.831 13.75 13.89 135 136 107 57 0.10
2 Ibuprofen (15687-27-1) 13.96 13.9 14.25 161 163 91 119 100
3 Acetaminophen (103-
90-2)
14.751 14.65 14.827 109 151 43 80 10.0
4 Caffeine (58-08-2) 16.555 16.4 16.7 194 109 55 67 0.10
5 Fluoxetine HCl
(56296-78-7)
16.872 16.8 16.95 44 104 42 91 0.10
6 Gemfibrozil (25812-
30-0)
17.325 17.25 17.4 122 107 123 129 1.00
7 Triclosan (3380-34-5) 19.151 19.1 19.25 290 288 218 63 0.10
8 Bisphenol A (80-05-7) 19.707 19.6 19.8 213 228 119 214 100
9 Primidone (125-33-7) 20.636 20.55 20.75 190 146 117 189 0.10
10 Carbamazepine (298-
46-4)
21.417 21.35 21.5 193 192 236 194 10.0
15 Progestrone (57-83-0) 25.3 25.2 25.4 43 124 314 272 0.10
Fuente. Elaboración propia.
Como se puede observar en el ANEXO Q, el segundo pico no está enumerado, sin embargo, el
cromatógrafo automáticamente reconoció un compuesto que no está dentro de los tres patrones de
fármacos; esto se debe a la mezcla que se hizo y que generó un compuesto aparte de los ya
estandarizados; por otra parte hay cuatro compuestos señalados en naranja los cuales al ser
analizados se encontraron niveles de incertidumbre en las concentraciones en más de cuatro de los
ocho puntos establecidos en la tabla 8. Dicho esto Gomez et al. (2007) sugieren que la obtención
de resultados confiables se da cuando por lo menos se tienen 5 puntos buenos en torno a la regresión
lineal para hallar la concentración; por lo cual no se tuvo un nivel de confianza óptimo para la
realización del análisis de estos 4 compuestos; hecho esto se corrieron las 174 muestras en el
cromatógrafo, obteniendo así los archivos .txt que contienen la fecha de generación de los archivos,
rutas de localización, áreas, y la concentración de cada compuesto (ver ANEXO R).
Realizado este proceso se unió en una sola matriz todos los resultados de las concentraciones de
los compuestos donde el ANEXO S (formato xlsx) indica estas concentraciones, en donde la
26
primera hoja de este archivo denominada “datos crudos: se refiere a la concentración obtenida a
través del área bajo la curva de cada muestra para determinado compuesto con el fin de hallar la
concentración en microgramos por litro (ug/L) en el volumen del vial” por lo cual fue necesario
hacer la corrección de estas concentraciones debido a que el volumen original de las muestras es
de 500 mL en donde la hoja 2 denominada “concentraciones” contiene estos datos corregidos y
las concentraciones no detectadas por el equipo se las tomo como cero.
El primer componente en ser detectado fue el Dimetilftalato (DMP) calificado como un Líquido
blanco-acuoso sin olor significativo utilizado en la fabricación de varios productos (plásticos,
repelentes de insectos, vidrio de seguridad y revestimientos de laca) con una solubilidad
(Capacidad de una sustancia o un cuerpo para disolverse al mezclarse con un líquido) en agua, 4
mg/L a 25 °C; a exposiciones agudas (a corto plazo), en humanos y animales causa irritación de
los ojos, la nariz y la garganta y estudios en animales han reportado efectos leves en el crecimiento
y desarrollo de los riñones (Pubchem 2017d). La figura 1 representa la estructura química del DMP
conformada por un anillo de benceno que en los radicales uno y dos tiene dos esteres unidos a dos
radicales denominados “metil” y que la Unión Internacional de química pura y aplicada (IUPAC)
denomina con el nombre de dimetil benzeno-1,2-dicarboxylato.
27
Figura 1. Estructura química de Dimetilftalato (DMP)
Fuente. (Pubchem 2017d)
El segundo componente en ser detectado fue el Dietilftalato (DEP), que se caracteriza por ser un
líquido claro e incoloro sin olor significativo, teniendo en cuenta que es un componente altamente
toxico y que su propagación al ambiente debe ser detenida inmediatamente debido a los daños en
los que se pueden destacar la irritación severa de los ojos y ligeramente en la piel, la solubilidad de
este en agua es de 1.080 mg/L a 25 °C, este tiene un sabor amargo y desagradable y es utilizado
como una sustancia sintética que hace los plásticos más flexibles para la fabricación de cepillos de
dientes, partes de automóviles, herramientas, juguetes y envases de alimentos (Pubchem 2017b).
la figura 2 indica la estructura química de DEP con la única diferencia entre DMP en un radical de
más por lo cual son denominados ftalatos de bajo peso molecular.
28
Figura 2. Estructura química de Dietilftalato (DEP)
Fuente. (Pubchem 2017b)
El tercer compuesto en ser detectado fue el Di-iso-butilftalato (DIBP), este se caracateriza por ser
un líquido aceitoso incoloro con un ligero olor a éster, representa una baja toxicidad en el ambiente
y su solubilidad en agua es de 6.2 mg/L a 25 °C, respecto a la toxicidad en los seres humanos en
considerado como un compuesto mitogénico (factor que estimula la separación de las células) en
células de cáncer de mama humano causando un daño ADN teniendo en cuenta que los efectos de
este compuesto son más pronunciados que los de Di-butliftalato (DBP) que fue el cuarto compuesto
detectado las figuras 3 y 4 indican la estructura molecular de DIBP y DBP respectivamente.
Esta diferencia radica principalmente en las dos esquinas de los radicales en donde en DIBP se
puede observar una estructura diferente a la de DBP en donde la cadena que conforma el butil es
lineal (ver estructura dentro de cirulos rojos).
29
Figura 3. Estructura química de Di-iso-Butilftalato.
Fuente.(National Center for Biotechnology Information 2017).
Figura 4. Estructura química de Dibutilftalato.
Fuente.(National Center for Biotechnology Information 2017c).
Esta diferencia de estructura genera cambios en las propiedades, como lo es la solubilidad en el
agua que en DIBP es 6.2 y en DBP 11.2 mg/L; respecto a la toxicidad de estos en el medio ambiente
se identifica a DIBP como un compuesto de baja toxicidad respecto a DBP en donde su propagación
debe ser detenida inmediatamente así como sus propiedades de plastificantes al hacer los Plásticos
30
blandos y flexibles, cortinas de ducha, impermeables, envolturas de alimentos, interiores de
automóviles y tejidos de vinilo(Benson 2009; National Center for Biotechnology Information
2017c; Pubchem 2017c)
El quinto compuesto en ser detectado fue el Bis-2-etil-hexilftalato (DEHP), rescatando los aspectos
más importantes, este compuesto en su forma pura es líquido, aceitoso e incoloro a amarillo pálido.
Casi sin olor y su propagación al medio ambiente debe ser detenida inmediatamente, respecto a su
toxicidad es considerado como un peroxisoma proliferador (familia de receptores esteroideos
encargados de las oxidasas y catalasas (enzimas) correspondientes a el funcionamiento del sistema
endocrino) y probablemente cancerígeno en humanos, además su solubilidad es de 0.27 mg/L a 25
°C en el agua (National Center for Biotechnology Information 2017b; Alemán, Torres, and Tovar
2004).
Respecto a su relación con Polietileno de Tereftalato (botella plástica) se define como una sustancia
sintética denominada plastificante que actúa en el polietileno de tereftalato incrustándose entre las
cadenas de sus polímeros, espaciándolas (incrementando el "volumen libre") y por ende
incrementando la flexibilidad y la durabilidad del plástico, además este aditivo común de cloruro
de polivinilo debido a su alto peso molecular se caracteriza en base a la inhibición de la síntesis de
la testosterona y por ende causando efectos adversos en el sistema reproductivo masculino en
ensayos con roedores (Rudel et al. 2011). La figura 5 representa la estructura molecular del DEHP.
31
Figura 5. Estructura molecular del DEHP.
Fuente.(National Center for Biotechnology Information 2017b).
Como se puede observar en su forma molecular el DEHP es la unión de un anillo de benceno en su
radical 1 y 6, unidos a dos esteres que a su vez están unidos a dos radicales de hexil que en su
segundo radical tienen un etil y un átomo de hidrogeno dando como resultado el denominado
nombre de la IUPAC (Union Internacional de Química Pura y Aplicada) bis (2-etilhexil) benceno-
1,2-dicarboxilato de metilo).
El sexto compuesto en ser detectado fue el Di-n-octilftalato (DOP), que tiene la característica de
ser un líquido claro y aceitoso que irrita las membranas mucosas con una solubilidad en agua de
0.022 mg/L at 25 °C además de representar 5-60% del peso total de los plásticos y resinas; tiene
efectos adversos en la reproducción y el desarrollo bajo y es considerado como una sustancia
sintética que hace los plásticos más flexibles (Pubchem 2017e). la figura 6 indica la estructura
química de DOP en donde se puede observar el número de metil igual a ocho por lo cual es el
ftalato de mayor peso molecular detectado en el agua embotellada.
32
Figura 6. Estructura molecular del DOP.
Fuente. (Pubchem 2017e).
El séptimo compuesto en ser detectado fue el 4-terc-octilfenol (TER), sus características
principales es que es una sustancia biodegradable no toxica para humanos pero ha causado
problemas de despigmentación en la piel, aunque es extremadamente tóxico para los organismos
acuáticos es utilizado en ayudas tecnológicas específicas para la producción de petróleo y agentes
de superficie se usa en un 98% para la preparación de resinas de octilfenol-formaldehído para
caucho de neumáticos, pintura aislante, tintas de impresión, etc.(Pubchem 2017a). la figura 7 indica
la estructura química de TER.
Figura 7. Estructura molecular del TER.
Fuente.(Pubchem 2017a)
33
En este orden de ideas también se detectó el Bisfenol A (BPA), es de aclarar que este compuesto
es uno de los más utilizados por la industria químico-farmacéutica (Cooper, Kendig, and Belcher
2011a). La estructura molecular del bisfenol A se define en la figura 8.
Figura 8. Estructura química de bisfenol A.
Fuente. (National Center for Biotechnology Information 2017a)
El nombre dado por la IUPAC es 4- [2-(4-hidroxifenil) propan-2-il] fenol esto debido los dos
bencenos unidos en el primer radical y en el cuarto, al oxigeno que a su vez está unido por 2
moléculas de hidrogeno. La unión de los bencenos está dada por un propil, sus características
físicas están asociadas a un color blanco a marrón claro con escamas o polvo. Tiene un olor débil
a fármaco y su solubilidad en agua es de 300 mg/L at 25 °C; mucho mayor a la del DEPH por lo
cual se puede pensar que las concentraciones de este compuesto son mayores; en la industria este
compuesto es utilizado en la fabricación de adhesivos y selladores, productos eléctricos y
electrónicos, envasado de alimentos, productos de tinta, tóner y colorantes, pinturas
recubrimientos, juguetes, juegos infantiles y equipo deportivo (National Center for Biotechnology
Information 2017a).
34
Los efectos adversos se dan a exposición prolongada y los informes del comportamiento
estrogénico del BPA sugieren que se puede considerar como un disruptor endocrino en
concentraciones ambientales muy por debajo de los niveles extremadamente tóxicos causando
fecundidad disminuida, alteraciones en el desarrollo de embriones e impactos en la carcinogénesis
(Nam, Seo, and Kim 2010). La relación existente entre el BPA y el Polietileno de Tereftalato es
que el BPA es el principal componente denominado “monómero del policarbonato plástico”
dándole la propiedad de plastificante, estabilizador y aditivo que da forma, dureza y durabilidad a
la botella producida (Cooper, Kendig, and Belcher 2011b).
En este sentido también se detectaron medicamentos y hormonas como el acetaminofén (ACE) que
es unanalgésico y antipirético, cafeína (CAF) que es una sustancia psicoactiva (acta sobre el
sistema nervioso central), fluoxetina (FLU) que es utilizado como un antidepresivo de la clase
inhibidores selectivos de la recaptación de serotonina y hormonas, gemfibrozil (GEM) que controla
el nivel de colesterol en la sangre, triclosán (TRI) que es un antiséptico utilizado en productos
hospitalarios (soluciones para lavado de manos quirúrgico, jabones para lavado de pacientes) y
productos de consumo (desodorantes, dentífricos), primidona (PRI) que es un antiepiléptico,
profármaco de fenobarbital que disminuye la excitabilidad neuronal, elevando el umbral de las
convulsiones en los seres humanos, carbamazepina (CAR) que es un antiepiléptico (destinada a
combatir, prevenir o interrumpir las convulsiones o los ataques epilépticos) y la progesterona
(PRO) que es una hormona sexual que segrega el ovario femenino y la placenta, y que tiene la
función de preparar el útero para la recepción del huevo fecundado(Richter et al. 2007; Li et al.
2010; Pubchem 2017g, 2017f).
35
En este contexto se evaluó la toxicidad de todos estos respecto a sus concentraciones encontradas
en el agua embotellada; por lo cual se hizo necesario la aplicación de una metodología de toxicidad
que identifique los compuestos de mayor peligro para la salud humana.
2.3. GRADO DE TOXICIDAD.
Para determinar el grado de toxicidad de cada compuesto se utilizó la metodología de
comparación de niveles que sobrepasen un índice de toxicidad proporcionado por el Programa de
Asesoramiento en Salud (HA: Health Advisory Program), patrocinado por la Oficina de Agua
(OW: EPA’s Office of Water) de la EPA que da las concentraciones de contaminantes del agua
potable en el nivel de riesgo específico de cáncer (10-4 Riesgo de cáncer) y concentraciones de
contaminantes del agua potable en los que no se prevé que los efectos adversos no cancerosos sobre
la salud se produzcan sobre una exposición de por vida en los Estándares de Agua Potable y Salud
(DWSHA: Drinking Water Standards and Health Advisories)(2015).
La HA de por vida parametrizó, para un adulto de 70 kg que toma una cantidad de agua de 2 L /
día que el Nivel Máximo de Contaminante de por vida (MCL) para un compuesto en el agua potable
se calcula a partir de su nivel equivalente de agua potable (DWEL: Drinking Water Equivalent
Level), obtenido de su dosis de referencia (RfD: reference dose) definida como una estimación
(con incertidumbre que abarca un orden de magnitud) de una exposición oral diaria a la población
humana (incluidos subgrupos sensibles) que es probable que no presente riesgo apreciable de
efectos deletéreos durante la vida)(EPA 2015). La ecuación 2 describe la forma de calcular el
DWEL.
36
Ecuación 2. Formula drinking water equivalent level.
𝐷𝑊𝐸𝐿 =𝑅𝑓𝐷 ∗ 𝑊
𝑄
En donde DWEL es el nivel equivalente de agua potable (ug/L). Representa una exposición de por
vida de un individuo en el agua potable, suponiendo una exposición al 100% de ese medio, en el
que la salud adversa no carcinogénica, no presente efectos, RfD es la dosis de referencia de
determinado compuesto (ug/(kg.día)), W es el peso promedio de un humano adulto (70 kg) y Q
es la cantidad de agua promedio de consumo diario de un humano adulto (2 L/día).
Cabe destacar que esta metodología incorpora una fuente de contribución relativa de agua potable
(RSC: Relative Source Contribution) contenida de datos específicos de contaminantes o en su
defecto del 20% de la exposición total de todas las fuentes (US EPA 2015) que fue la que se tomó
por defecto debido a la particularidad de cada componente analizado en el análisis cromatográfico.
Hecho esto se calculan los denominados Niveles Máximos de Contaminantes (MCLs: Maximum
Contaminant Levels) que, para algunos compuestos, si están regulados por la EPA, pero para otros
contaminantes se los calcula a través de la siguiente expresión descrita en la ecuación 3.
Ecuación 3. Fórmula de Niveles máximos de contaminantes
𝑀𝐶𝐿′𝑠 = 𝐷𝑊𝐸𝐿 ∗ 𝑅𝑆𝐶
En donde, MCL’s(ug/L) es el nivel más alto de un contaminante permitido en agua potable.
despues los MCL se establecen lo más cerca posible del MCLG, utilizando los mejores métodos
analíticos disponibles. Y las tecnologías de tratamiento y teniendo en cuenta el costo. Los MCL
37
son estándares exigibles y RSC (%) es el factor de contribución relativa del agua potable en los
humanos (20%).
Las HA’s sirven como guía técnica informal para contaminantes no regulados del agua potable
para ayudar a los funcionarios federales, estatales y locales y administradores de sistemas de agua
públicos o proteger la salud pública según sea necesario. No deben ser interpretados legalmente
como normas. OW de la EPA proporciona las anteriores variables (MCL, RfD’s, DWEL’s) de
toda la vida (US EPA 2015).
2.4. ANALISIS DE RESULTADOS.
En este capítulo se describen los análisis que se realizaron para encontrar que factor incide más
sobre los compuestos, por lo cual se hicieron análisis de componentes principales (PCA), análisis
de correspondencia múltiple (MCA), test de Will-Coxon, Kruskal Wallis & Kruskal Wallis
multivariado; no sin antes aplicar pruebas de normalidad y homoestacidad de variancias ( test de
Barthel y Shapiro), con el fin de determinar las relaciones lineales entre los compuestos y factores
y se realizaron análisis de información promedio mutua (AMI), arboles de decisión, arboles de
regresión y bosques aleatorios con el fin de encontrar resultados no lineales que los análisis clásicos
no pueden inferir.
2.4.1. Análisis de componentes principales (PCA)
El análisis de componentes principales (PCA: Principal Component Analysis) es una técnica
estadística de síntesis de la información, o reducción de la dimensión (número de variables). Es
decir, ante un banco de datos con muchas variables (compuestos), el objetivo fue reducirlas a un
38
menor número perdiendo la menor cantidad de información posible. En donde los nuevos
componentes principales o factores son una combinación lineal de las variables originales, y
además son independientes entre sí (Terrádez 2017).
Para la realización de este análisis estadístico se utilizó la librería “ade4” que ofrece diversas
herramientas para el análisis de datos multivariado utilizando la función “dudi.pca” (Dray and
Dufour 2007; Chessel and Dufour 2017). El código, la base de datos utilizados y los resultados
para el desarrollo de esta herramienta se encuentran indicados en el ANEXO T.
Este análisis sirvió para inferir que el entendimiento de la matriz de compuestos tiene que ser
analizado desde otra perspectiva, por lo cual se hizo el PCA teniendo en cuenta 4 casos:
I. Separando de la matriz de agua la familia de los ftalatos y la familia los farmacéuticos &
hormonas ya que el PCA respecto a los 2 componentes separó bien estas dos familias.
II. Solo con los compuestos de mayor preocupación respecto a toxicidad (>MCL) que son el
DEPH y el BPA; dependiendo de esto, se aplicó un filtro en el cual, en las muestras que se
tenían unas concentraciones inferiores a la del MCL respecto a estos dos compuestos, se
excluyeron de la matriz con el fin de ver cómo es la variancia del sistema que en total quedó
con 143 muestras de agua.
III. Excluyendo un nivel de cada factor (plástico, vidrio, origen nacional e internacional y aguas
con gas y sin gas) a través de un filtro que para cada caso excluyo las muestras del nivel
escogido (6 casos) y separando las familias como en el primer caso.
39
IV. Realizando un análisis de “outliers” definidos como técnicas estadísticas de algoritmos
rápidos para identificar datos anormales multivariados en matrices de grandes dimensiones.
El ANEXO U contiene el código para este análisis en donde se utilizó la función pcout de
la librería “mvoutlier” que sirve para detectar datos atípicos en matrices de gran tamaño
(Gschwandtner 2017). En este sentido se modificó un argumento de esta técnica llamada la
Distancia Robusta de Mahanoblis “x.dist1” que está representado como un vector
numérico con distancias para localizar los datos anormales; en otras palabras los métodos
basados en esta distancia, apuntan a detectar valores atípicos calculando una medida de
cuán lejos está un punto particular del centro de los datos (Filzmoser, Maronna, and Werner
2008). la figura 9 muestra los datos que están contenidos dentro del rango de este argumento
que en un fin encontró 39 datos atípicos multivariados.
Teniendo en cuenta esto se modificó esta distancia con cuatro casos diferentes;> 100,> 75,
>50, >10 con el fin de minimizar el número de datos atípicos encontrados que fueron 12,
14, 16, 19 datos atípicos multivariados respectivamente.
Figura 9. Distancia robusta de Mahanoblis para muestras de agua multivariada.
Fuente. Elaboración propia.
40
2.4.2. Análisis de Correspondencia Múltiple (MCA) y test de Wilcoxon.
Debido a que el PCA hace el análisis de la variabilidad de los compuestos respecto a los factores
individualmente, se realizó una extensión de esta herramienta denominada la MCA la cual es una
técnica de análisis de datos para variables categóricas nominales, que se utiliza para detectar y
representar estructuras subyacentes en un conjunto de datos (factores que influyen). Lo hace
representando los datos como puntos en un espacio euclidiano de baja dimensión (Siberchicot
2017).
En este sentido, para la aplicación de esta herramienta se hizo necesario la transformación de las
concentraciones (variables continuas) a variables categóricas; se realizó este proceso con la ayuda
del conocimiento experto de la metodología de la evaluación del grado de toxicidad desarrollada,
teniendo en cuenta 3 categorías:
0 ug/L = NO DETECTADO
Concentración de compuesto < MCL = BAJO
Concentración de compuesto > MCL = ALTO
Realizado este proceso de conversión, se desarrolló el código de MCA descrito en el ANEXO V
en donde se utilizaron dos funciones “dudi.acm” dentro de la librería ade4 y la función
“s1d.boxplot” dentro de la librería adegraphics con el fin de dar una interpretación de los
componentes (Siberchicot 2017).
41
Con el fin de conocer si existe diferencia estadística significativa entre estos porcentajes se
desarrolló el test no paramétrico de Wilcoxon definido como una prueba no paramétrica para
comparar el rango medio de dos muestras relacionadas y determinar si existen diferencias entre
ellas. Se utiliza como alternativa a la prueba t de Student ya que no se puede suponer la normalidad
de las muestras dentro de la matriz de agua (Whitley and Ball 2002). el desarrollo de este test se
encuentra descrito en el ANEXO W en donde se utilizó la función “pairwise.wilcox.test” dentro
del paquete Stats (Marroni’s 2017).
2.4.3. ANOVA, Multi ANOVA, Kruskal Wallis y Kruskal Wallis Multivariado.
El análisis de la varianza permite contrastar la hipótesis nula de que las medias de dos niveles
(K >2) (son iguales), frente a la hipótesis alternativa de que por lo menos uno de los niveles difiere
de los demás en cuanto a su valor esperado (Kim 2017). Esto en relación a una “p-value” en donde
si esta es mayor a 0,05 se acepta la hipótesis nula y si en menor a este se acepta la hipótesis dos, es
necesario aclarar que para aplicar este análisis de varianza se hace necesario cumplir con la
condición de homogeneidad de variancias de los datos (Test de Bartlett) y normalidad de datos
(Test de Shapiro), de lo contrario se utiliza una prueba estadística no paramétrica llamada
“kruskall-wallis” que sirve para contrastar la hipótesis de que k niveles cuantitativos han sido
obtenidos de la misma población pero no hace referencia a ninguna de las otras condiciones
adicionales de homocedasticidad y normalidad necesarias para la aplicación del test paramétrico
ANOVA (Theodorsson-Norheim 1986). El código para el desarrollo de este análisis se describe en
ANEXO X.
42
2.4.4. Análisis de Información Promedio Mutua (AMI).
Para el desarrollo de AMI se convirtieron los valores de concentración de cada compuesto en
variables categóricas teniendo en cuenta la “Detección” cuando el valor de la concentración es
mayor a cero y la “No Detección” cuando esta concentración es cero. A esta nueva matriz de
compuestos se aplicó el concepto de la entropía de la información y de información mutua (mi)
con el fin de encontrar la influencia de los factores de tipo categórico respecto a la detección y no
detección de los compuestos analizados. En este sentido la Entropía Conjunta es la representación
de la incertidumbre e información de todas las posibles combinaciones de las variables analizadas
(entre mayor sea este valor mayor incertidumbre de los factores respecto al compuesto y entre
menor sea este número, mayor información comparte un factor respecto a el compuesto analizado)
(Hernández, Obregón, and Torres 2016) y se calcula a través de la ecuación 4.
Ecuación 4. Entropía Conjunta.
𝐻(𝑋|𝐴) = ∑ 𝑃(𝑋 = 𝑎𝑘|𝐴)𝑙𝑛𝑃(𝑋 = 𝑎𝑘|𝑎)
𝑚
𝑘=1
En donde X es la variable aleatoria sobre un espacio de probabilidad en la que esta A (evento) “X
dado A”, En este sentido también se utilizó el concepto de la Información Mutua por pares de
variables; esta indica la cantidad de información que contiene una variable aleatoria con respecto
a otra (Hernández, Obregón, and Torres 2016). Lo anterior da una idea de la independencia o
dependencia de los factores con respecto a los compuestos por separado en donde la ecuación 5
define este concepto.
43
Ecuación 5. Información Mutua (MI).
𝑀𝐼(𝑋|𝐴) = 𝐻𝑋 + 𝐻𝐴 − 𝐻𝑋|𝐴
En donde HX es la entropía de la variable aleatoria X, HA es la entropía del factor y HX|A es la
entropía conjunta de las dos variables. También se calculó el coeficiente de redundancia de los
factores respecto a compuestos (capacidad predictiva con el cual se aplica en concepto e
redundancia máxima con el fin de obtener un porcentaje de esta con el fin de observar la
independencia o asociación de los factores respecto al compuesto (Hernández, Obregón, and Torres
2016) en donde la ecuación 6 indica el coeficiente de redundancia y la ecuación 7 la redundancia
máxima.
Ecuación 6. Redundancia (R(X|A)).
𝑅(𝑋|𝐴) = 𝑀𝐼(𝑋|𝐴)/(𝐸𝑋|𝐴 + 𝐸𝑋)
Ecuación 7. Redundancia máxima (Redundancia maxima).
𝑆𝐼 (𝐸𝑋 > 𝐸𝐴)
𝑅𝑀𝐴𝑋 (𝑋|𝐴) =𝐸𝐴
𝐸𝑋 + 𝐸𝐴
𝑆𝐼 𝑁𝑂
𝑅𝑀𝐴𝑋 (𝑋|𝐴) =𝐸𝑋
𝐸𝑋 + 𝐸𝐴
Por último se halla el porcentaje de esta redundancia que consiste en un redondeo entre redundancia
y redundancia máxima con el fin de observar independencia o asociación de los factores respecto
a los compuestos (Hernández, Obregón, and Torres 2016). El código para la realización de AMI se
encuentra descrito en el ANEXO Y.
44
2.4.5. Modelos basados en arboles (Tree based models)
Los algoritmos de aprendizaje basados en árboles son métodos de aprendizaje supervisado y a
diferencia de los modelos lineales, mapean bastante bien las relaciones no lineales y pueden ser
adaptados para resolver cualquier tipo de problema (clasificación o regresión) (Analytics Vidhya
2016). Entre los métodos de estos modelos están los árboles de decisión (decision tres), bosques
aleatorios (random forest), potenciación de gradiente (gradient boosting) son utilizados popularmente
en todo tipo de problemas de ciencia de datos desarrollando la partición recursiva considerada
como una herramienta fundamental en la minería de datos que ayuda a explorar la estructura de las
variables (Kabacoff 2017).
2.4.6. Árboles de decisión.
Los árboles de decisión son un tipo de algoritmo de aprendizaje supervisado (tienen una variable
de destino predefinida) que se utiliza principalmente en problemas de clasificación. Funciona tanto
para variables de entrada y salida categóricas y continuas. En esta técnica, se dividieron las
concentraciones de las muestras en tres conjuntos (o subpoblaciones) homogéneos basados en el
divisor / diferenciador más significativo en las variables de salida que fueron envase, vidrio y gas.
Realizado este proceso se desarrolló el minado de datos teniendo en cuenta que factor influye más
sobre determinado compuesto; por lo cual se tomó como variable de respuesta a los 16 compuestos
evaluados de forma categórica e independientemente en base al MCL en la determinación del grado
de toxicidad (CAPITULO 2.3).
45
2.4.7. Árboles de Regresión (Regression trees).
En un árbol de regresión la variable objetivo o de respuesta no tiene clases, por lo cual se ajustó
un modelo de regresión a la variable objetivo utilizando cada una de las variables independientes.
luego, para cada variable independiente (Factores), los datos se dividieron en varios puntos de
división. En cada punto de división, el "error" entre el valor predicho y los valores reales se cuadran
para obtener una "Suma de errores al cuadrado (SSE)". Los errores de punto de división en las
variables se comparan y la variable / punto que arroja la SSE más baja se elige como nodo raíz /
punto de división. Este proceso se continúa de manera recursiva y a diferencia del árbol de decisión
utiliza la desviación estándar de los datos para escoger el nodo raíz en lugar de la ganancia de
información (Deshpande 2011). el código para el desarrollo de los árboles de decisión como de
regresión se indican en el ANEXO Z.
2.4.8. Bosques Aleatorios (Random Forest) y algoritmo Xgboots
Como se puede observar los árboles de decisión y regresión son una herramienta útil a la hora
de encontrar las reglas ocultas utilizando el minado de datos; pero estos también tienen un error
asociado y son denominados como clasificadores débiles debido a sus altos errores en los nodos
principales ; en este sentido se optó por realizar un bosque aleatorio que es un conjunto de estos
“clasificadores débiles independientes” con el fin de combinarlos todos en un clasificador fuerte;
en este sentido se utilizó el 50% de las concentraciones de las muestras como datos de calibración
y el 50% restante como datos de validación evadiendo las correlaciones entre ellos (bagging), este
proceso se realiza mediante la generación de un primer árbol de decisión de la matriz de calibración
y a partir de este, genera un nuevo árbol promediado aproximadamente con el 62.3% de las
muestras originales hasta generar un clasificador fuerte denominado el bosque aleatorio, para
46
realizar este modelo se utilizó la librería “randomForest” que arroja los resultados de la
importancia de los factores generando 500 árboles aleatorios para cada compuesto categorizado en
detectado y no detectado por otra parte se aplicó el algoritmo Xgboots que a diferencia del bosque
aleatorio utiliza el % de error de variables independientes que clasifico erróneamente en el primer
árbol y utiliza estas variables ara generar el siguiente árbol con el fin de disminuir el error de la
importancia de cada variable en torno a la variable de respuesta; el código para la realización de
este modelo se describe en el ANEXO AA (Christian 2014; Walia 2017).
47
3. RESULTADOS (capitulo 3)
Se obtuvieron 8 posibles combinaciones de respuesta, clasificados en Familias o “Tratamientos”
cada una con características diferentes de agua embotellada como se puede ver en detalle en el
ANEXO BB. Con este dato de entrada y mediante el método ensayo y error, se disminuye el
número de botellas de agua que se deben comprar, según la capacidad del laboratorio de calidad
de aguas del Departamento de Ingeniería Civil, se puede medir cuatro muestras por día (“tamaño
del bloque: k”) hasta obtener el número de repeticiones de las combinaciones denominadas “origen,
gas, envase” (Replication) realista para la adquisición de datos. Los resultados de este diseño
experimental arrojaron que se debe realizar al menos siete repeticiones de cada familia, siendo
necesarias mínimo 56 muestras de agua embotellada en total para poder desarrollar los métodos
estadísticos. El diseño experimental arrojó un parámetro lambda de tres, lo cual significa que un
par de factores está junto en tres oportunidades (ANEXO CC) y un factor de eficiencia igual a 0.86
que está definido como la relación existente entre la eficiencia del diseño de bloques incompletos
frente al diseño de bloques completos. Dicho esto, las 173 muestras son tres veces superiores a las
sugeridas por el diseño experimental, por lo cual se tiene la certeza de que se trabajó con un número
de muestras representativo para el conocimiento de los factores explicativos que se quieren evaluar.
El ANEXO DD muestra las aguas compradas en función de cada familia con lo que se evidencia
la certeza que se tienen las repeticiones necesarias para llevar a cabo el proyecto.
En este sentido es necesario explicar las características principales en torno a la toxicidad de los
compuestos analizados con el fin de saber cuáles son los que están por encima de este factor. La
tabla 9 indica los valores del grado de toxicidad para los compuestos analizados.
48
Tabla 9. MCL, RfD’s y DWEL’s para compuestos analizados (MCL: nivel máximo
contaminate; DWEL: nivel equivalente de agua potable; RfD: dosis de referencia).
Compuesto MCL (ug/L) DWEL (ug/L) RDF (ug/(kg.día))
Dimethylphthalate 7000 35000 1000
Diethylphthalate 5600 28000 800
Diisobutylphatalate 700 3500 100
Di-n-butylphthalate 700 3500 100
Bis(2-ethylhexyl)phthtalate 0 700 20
Di-n-Octylphthalate 280 1400 40
4-tert-Octylphenol 1190 5950 170
Ibuprofen 121739.1304 608695.6522 17391
Acetaminophen 304347.8261 1521739.13 43478
Caffeine 21000 105000 3000
Fluoxetine HCl 58100 290500 8300
Gemfibrozil 91301 456505 13043
Triclosan 42000000 210000000 6000000
Bisphenol A 35 175 5
Primidone 114128 570640 16304
Carbamazepine 105000 525000 15000
Progestrone 15218 76090 2174
Fuente. Adaptado de (Gonzales, Lopera, and Arango 2014; US EPA 2015; Katsikantami et al. 2016).
Se tuvo en cuenta que solo para bis-2-etil-hexilftalato (DEPH) la MCL estaba definida por defecto
en la EPA por lo cual no fue necesario aplicar la ecuación 3 debido a que este valor (0 ug/L) es
mucho más restrictivo que el obtenido por la formula. Realizado este proceso se cuantifico el
porcentaje de la magnitud de las concentraciones de los compuestos respecto a los MCL’s
respectivos, con el fin de conocer que compuestos son los que pueden presentar efectos adversos a
la salud de un individuo y en qué porcentaje se dan (tabla 10).
49
Tabla 10. Porcentaje de muestras con concentraciones de compuestos mayores a MCL
(MCL: nivel máximo contaminante).
Compuesto %>MCL (ug/L) %<MCL (ug/L)
Bis-2-etil-hexilftalato (DEPH) 45.4 54.6 Bisfenol A (BPA)
8.7 91.3 Fuente. Elaboración propia.
Como se puede observar solo dos compuestos de los 16 presentan en algunas muestras de agua,
niveles mayores a los MCL lo cual es preocupante en especial por DEPH que está en
concentraciones mayores en un 45.4% del total de las muestras. La presencia de estos dos
compuestos da una clara señal de la migración de estos al agua esto en especial por las propiedades
que poseen (Li et al. 2010). Además, la tabla 11 indica el porcentaje de detección para cada
compuesto, así como el mínimo valor que se cuantifico y el máximo que alcanzaron.
Con el fin de tener una idea de que porcentaje de compuestos está asociado a un factor específico
se realizó una tabla de contingencia bidireccional (tabla 12) en donde se clasificaron los factores
escogidos de la siguiente manera:
ENVASE= A cuando es botella plástica y es igual a B cuando es botella de vidrio.
ORIGEN= A cuando es producida en Colombia (Nacional) a B cuando es de otro país
GAS= A cuando no tiene gas y es igual a B cuando tiene gas.
0 = cuando no se detectó determinado compuesto (0ug/L)
50
1= cuando se detectó determinado compuesto (mayor al límite de detección).
Tabla 11. Porcentaje de detección, mínimos y máximos de compuestos analizados por
cromatografía de masas. No muestras = 174.
Compuesto Detectado (%) No detectado (%) min (ug/L) max(ug/L)
Dimetilftalato 66.1 33.9 0.00023664 0.01160782
Dietilftalato 97.1 2.9 0.00021192 0.00068642
Diisobutilftalato 57.5 42.5 0.0002178 0.03375914
Dibutilftalato 85.1 14.9 0.00020534 0.00147666
Bis 2 etil hexy ftalato 54.6 45.4 0.000338 0.03203382
Di n octilftalato 96.6 3.4 0.0003405 0.00109816
4tercoctilfenol 5.7 94.3 0.00037342 0.17998534
Acetaminofén 32.2 67.8 0.02070412 1.91676554
Cafeina 0.6 99.4 0.00040412 0.24529934
Fluoxetina 16.7 83.3 0.0005824 0.1648178
Gemfibrozil 26.4 73.6 0.00343538 2.46856034
Triclosan 14.9 85.1 0.00171386 0.44503364
Bisfenol A 30.5 69.5 0.20626514 221.1457024
Primidona 4.0 96.0 0.00221278 0.51004412
Carbamazepina 73.0 27.0 0.02088696 479.7635469
Progesterona 4.0 96.0 0.00189012 1.7899449
Fuente. Elaboración propia.
51
Tabla 12. Porcentaje de detección, mínimos y máximos de compuestos analizados por
cromatografía de masas (tablas de dirección bidireccional) (en rojo se muestran compuestos
con una detección mayor al 50%).
Compuesto DETECTADO =1 NO
DETECTADO = 0
ENVASE ORIGEN GAS
A B A B A B
Dimetil ftalato 0 94 21 84 31 73 42
1 51 8 41 18 40 19
Dietil ftalato 0 141 28 122 47 110 59
1 4 1 3 2 3 2
Diisobutil ftalato 0 81 19 77 23 61 39
1 64 10 48 26 52 22
Dibutil ftalato 0 124 24 108 40 95 53
1 21 5 17 9 18 8
Bis-2 etil-hexy ftalato 0 76 19 71 24 58 37
1 69 10 54 25 55 24
Di-n-octilaftalato 0 139 29 122 46 110 58
1 6 0 3 3 3 3
4-terc-octilfenol 0 136 28 7 3 5 5
1 9 1 118 46 108 56
Acetaminofén 0 48 8 40 16 39 17
1 97 21 85 33 74 44
Cafeína 0 1 0 1 0 1 0
1 144 29 124 49 112 61
Fluoxetina 0 25 4 20 9 18 11
1 120 25 105 40 95 50
Gemfibrozil 0 38 8 33 13 30 16
1 107 21 92 36 83 45
Triclosán 0 21 5 18 8 20 6
1 124 24 107 41 93 55
Bisfenol A 0 45 8 37 16 35 18
1 100 21 88 33 78 43
Primidona 0 5 2 4 3 3 4
1 140 27 121 46 110 57
Carbamazepina 0 105 22 94 33 83 44
1 40 7 31 16 30 17
Progesterona 0 7 0 7 0 4 3
1 138 29 118 49 109 58
Fuente. Elaboración propia.
52
La suma de cada tabla de contingencia bidireccional es igual al total de numero de muestras y lo
que se destaca de esta, son los compuestos con un porcentaje mayor al 50% (color rojo). Además,
para el caso del factor envase en su nivel A (botella de plástico) acetaminofén, cafeína, fluoxetina,
gemfibrozil, triclosán, bisfenol A, primidona y progesterona los números de muestras en detección
son mayores que los factores gas y origen, exceptuando el 4-terc-octilfenol en donde hay una
prevalencia del factor gas y el factor del origen sobre el plástico.
En el PCA se escogieron dos componentes de las 16 posibles que representaron el 58% de la
variancia del sistema y se graficó esto en función de las muestras en donde la figura 10 indica que
componente representa la mayor variabilidad del sistema y la tabla 13 indica la las correlaciones
de cada componente principal con cada variable.
Figura 10. Análisis de componentes principales para la matriz de agua de los compuestos.
Fuente. Elaboración propia.
53
Tabla 13. Correlaciones de las muestras respecto a dos componentes principales.
COMPUESTO ABREVIACION Comp1 Comp2
Dimetil ftalato DMP 0.12648506 -0.699684746
Dietil ftalato DEP 0.14193249 -0.832129071
Diisobutil ftalato DIBP 0.20919096 -0.899968657
Dibutil ftalato DBP 0.139812 -0.403383134
Bis-2 etil-hexy ftalato DEPH 0.17650603 -0.952661709
Di-n-octilaftalato DOP 0.1149339 -0.650171886
4-tercoctilfenol TER -0.06766601 -0.023248112
Acetaminofén ACE 0.02254904 -0.008822314
Cafeína CAF -0.83491675 -0.144834831
Fluoxetina FLU -0.95119487 -0.127473344
Gemfibrozil GEM -0.91442591 -0.103477376
Triclosán TRI -0.9136867 -0.148172374
Bisfenol A BPA -0.96221271 -0.109622709
Primidona PRI -0.86106074 -0.110668993
Carbamazepina CAR 0.0108843 0.046159013
Progesterona PRO -0.74348596 -0.02597769
Fuente. Elaboracion propia.
Respecto al componente uno los compuestos que recogen la mayor proporción de variabilidad
original negativamente (color rojo en tabla 13) es el BPA, FLU, GEM, TRI, PRI CAF y PRO, por
lo cual es de notar que los compuestos farmacéuticos y hormonas tienen alguna similitud entre los
datos encontrados; por otra parte el componente dos recoge la máxima variabilidad negativa
posible que no fue recogida por el primero en donde se puede notar los valores de color rojo de la
familia de los ftalatos exceptuando el DBP que está en una proporción entre la familia de los ftalatos
y farmacéuticos similar respecto a las correlaciones. Realizado este proceso se verifico si hay
alguna separación por clúster de cada factor dependiendo de los resultados de cada compuesto; se
pudo notar que no hay separación y que se genera el traslapo entre cada nivel de los factores como
lo indica la figura 11.
54
Figura 11. Separación por clústers de niveles de factores.
Fuente. Elaboración propia.
Esto dio a entender que no hay diferencias según la variancia de la matriz de los compuestos si se
tiene un agua que este en vidrio u otra en plástico o si tiene gas o no o si es de origen colombiano
o importadas. Este análisis sirvió para inferir que el entendimiento de la matriz de compuestos tiene
que ser analizado desde otra perspectiva, por lo cual se hizo el PCA teniendo en cuenta los cuatro
casos descritos en el capítulo 2.4.1.
Respecto al 1er caso la familia de fármacos & hormonas obtuvo una mayor ganancia de variancia
del teroctilfenol respecto al componente dos en el caso de los fármacos, y en el caso de los
plastificantes en donde se incluyeron los ftalatos y el BPA se encontró que los primeros representan
mejor la variancia total de la matriz de plastificantes y el bisfenol A representa la variancia máxima
no explicada por el componente uno por lo cual a pesar de que los ftalatos y el BPA son
55
plastificantes, hay diferencias entre estas dos clases y esto se debe a la magnitud de las
concentraciones en las que se encuentran y por supuesto en la cantidad.
Para el 3er caso, de la combinación de los factores excluyendo un nivel de cada uno; se encontró
repetitivamente el traslapo de los factores, incluso cuando se separaron las familias de los
compuestos (caso dos).
Respecto al cuarto caso, desde un total de muestras de 162, 160, 158, 155 y 135 (muestras
multivariadas que no son consideradas como valores atípicos) y separando las familias (caso dos);
se generó como en todos los anteriores casos, el traslapo de los factores.
En el MCA los resultados están indicados en la figura 12. Esta figura indica la correlación existente
entre los factores de la matriz de agua y los compuestos presentes; como se puede observar en los
niveles de los factores se genera el mismo traslapo que en el análisis de PCA, por lo cual se
aplicaron los mismos 4 casos anteriores al MCA.
56
Figura 12. MCA para todos los compuestos con factores.
Fuente. Elaboración propia.
En este sentido se dibujaron los boxplots en el sistema coordenado del MCA, con el fin de observar
el traslapo de las muestras y confirmar si estas son iguales o no (Figura 13).
57
Figura 13. Boxplot de niveles de factores y compuestos.
Fuente. Elaboración propia.
Como en el PCA, para el MCA también se evaluaron los cuatro casos anteriores donde en el I caso
de la separación de las familias, no se encontraron diferencias entre los factores respecto a la
concentración categórica de los compuestos. Para la aplicación del II caso la figura 14 indica la
separación por clusters de niveles de los factores dependiendo del DEPH y el BPA en donde se
puede observar una separación similar de los niveles del origen y el BPA, en este sentido también
se puede observar una separación de los niveles de envase lo cual permite en primera instancia
inferir que el agua nacional y envase de plástico presenta concentraciones altas de BPA, lo cual no
se puede ver bien en el DEPH; por lo cual se realizó una proyección de los boxplot, con el fin de
validar si estas separaciones existen o no (figura 15) .
58
Figura 14. Separación por clústers de niveles de factores y compuestos (DEPH Y BPA).
Fuente. Elaboración propia.
Figura 15. Boxplots de niveles de factores y compuestos (DEPH Y BPA).
Fuente. Elaboración propia.
59
Cómo se puede observar en el boxplot del factor origen, no se encuentran diferencias en los
cuartiles de origen nacional e internacional; a diferencia del factor envase en donde al menos el
25% de las muestras del envase A (plástico) son diferentes al envase B (Vidrio). Respecto a los
compuestos el DEPH presenta una separación de los boxplot en el sistema coordenado en
concentraciones altas de al menos el 75% pero se puede observar que de este 75% solo el 25% de
las muestras de DEPH apoya la idea de que el 25% de las muestras que tienen envase plástico
presentan concentraciones altas de DEPH.
Por otra parte, el BPA presenta una separación en concentraciones altas casi del 100 % esto indica
que la no detección del BPA en menos del 75% de las muestras de agua depende del 25% de que
las muestras tengan un envase de plástico.
El p value del test de Wilcoxon para este caso es de 0.26 por lo cual no se considera como una
diferencia significativa y esto se debe al porcentaje en el cual se logró diferenciarlos que solo fue
el 25% (1 quartil); en este sentido el p value del test de Wilcoxon para el BPA es de 0.87, por lo
cual tampoco se considera que esta diferencia sea significativa respecto al envase de plástico en la
no detección del BPA.
Para el tercer caso se encontraron diferencias entre muestras de la familia de los plastificantes que
solo son de origen nacional con una combinación del factor envase en el nivel plástico respecto al
DEP, como se indica en la figura 16. En este mismo sentido, la figura 17 representa los boxplots
que señalan la diferencia de DEP respecto al factor envase que indica que al menos el 75% de las
muestras del envase A son diferentes a las del envase B y además de este 75%, al menos el 60 %
60
está relacionado con el 75% de la no detección de DEP. Y por último para el IV caso no se
encontraron diferencias de los compuestos respecto a los factores.
Figura 16. Separación por clústers de niveles de factores y compuestos plastificantes.
Fuente. Elaboración propia.
61
Figura 17. Boxplots de niveles de factores y compuestos.
Fuente. Elaboración propia.
El caso número I en la familia de los plastificantes tuvo una combinación de los factores de
muestras de origen nacional con envase de plástico respecto a la no detección del DEP, se obtuvo
un p value del test de Wilcoxon de 0.19, por lo cual a pesar de que el MCA indico diferencias en
un % considerable de las muestras de agua, este porcentaje no es significativamente importante
entorno a las diferencias que hay en los compuestos respecto a los factores de la matriz de agua.
Con el fin identificar diferencias significativas también se realizó este test para cada
compuesto respecto a cada factor, la tabla 14 indica los p-value para este test teniendo en cuenta
la matriz en general.
62
Tabla 14. P value Wilcolxon test.
Wilcoxon test
Compuesto ENVASE ORIGEN GAS
Dimetilftalato 0.505 0.597 0.733
Dietilftalato 0.845 0.547 0.802
Diisobutilftalato 0.405 0.181 0.334
Dibutilftalato 0.754 0.440 0.727
Bis(2-etilhexyftalato) 0.223 0.553 0.353
Dinoctilftalato 0.269 0.223 0.413
4-terc Tercoctilfenol 0.792 0.873 0.083
Acetaminofen 0.321 0.759 0.755
Cafeina 0.889 0.224 0.104
Fluoxetina 0.949 0.953 0.529
Gemfibrozil 0.923 0.614 0.330
Triclosan 0.212 0.609 0.930
BisfenolA 0.978 0.745 0.454
Primidona 0.768 0.393 0.153
Carbamazepina 0.706 0.205 0.710
Progesterona 0.345 0.269 0.698
Fuente. Elaboración propia.
Como se puede observar los p value del test de Wilcoxon en toda la matriz de agua mayores a 0.05
por lo cual se acepta la hipótesis de que no hay diferencias significativas de la concentración de los
compuestos respecto a los tres factores escogidos; en este sentido se aplicó este test en los 4 casos
evaluados anteriormente en donde no se obtuvieron diferencias.
Hecho esto, se realizaron los test de Bartlett y de Shapiro de los cuales la tabla 15 contiene los p-
value del test de Bartlett en donde si mayores a 0.05 se acepta la homogeneidad de variancias y en
la tabla 16 se indican los p-valué del test de Shapiro en donde si son mayores a 0.05 se acepta la
normalidad de los datos permitiendo aplicar el ANOVA, de lo contrario se utiliza una prueba
estadística no paramétrica llamada “kruskal-wallis” que sirve para contrastar la hipótesis de que k
niveles cuantitativos han sido obtenidos de la misma población pero no hace referencia a ninguna
63
de las otras condiciones adicionales de homocedasticidad y normalidad necesarias para la
aplicación del test paramétrico ANOVA (Theodorsson-Norheim 1986).
Tabla 15. p-value test de Bartlett
BARTLETT TEST (HOMOGENEIDAD DE VARIANCIAS) (En rojo relaciones que no tienen homogeneidad de variancias)
Compuesto ENVASE ORIGEN GAS
Dimetilftalato 0.0440 0.0001 0.0920
Dietilftalato 0.0387 1.96E-06 0.0003
Diisobutilftalato 0.1010 0.0044 2.76E-06
Dibutilftalato 0.2090 0.4569 0.1403
Bis(2-etilhexyftalato) 0.0610 1.05E-05 5.72E-08
Dinoctilftalato 0.0000 1.21E-08 1.39E-19
4-terc-octilfenol 0.0002 6.13E-05 0.3801
Acetaminofen 3.40E-08 1.01E-25 3.30E-11
Cafeina 0.2656 0.0339 0.5573
Fluoxetina 0.0089 0.0008 0.0051
Gemfibrozil 7.78E-06 3.48E-05 9.14E-10
Triclosan 0.0636 0.0024 0.0439
BisfenolA 0.0990 0.0010 0.0895
Primidona 0.3590 0.0255 0.0165
Carbamazepina 1.40E-78 3.57E-85 5.90E-222
Progesterona 0.1776 0.1241 0.0066 Fuente. Elaboración propia.
Tabla 16. p-value test de Shapiro
Shapiro test (Normalidad)
Compuesto Plástico Vidrio Nacional Internacional Sin Gas Con Gas
Dimetilftalato 6.63E-21 1.68E-19 2.36E-19 2.34E-10 1.22E-12 1.47E-13
Dietilftalato 2.03E-25 6.34E-24 9.26E-23 1.31E-11 6.13E-15 7.48E-17
Diisobutilftalato 8.22E-22 1.11E-19 3.51E-19 4.45E-09 3.75E-13 5.75E-14
Dibutilftalato 5.61E-22 6.11E-21 1.64E-19 9.56E-10 4.54E-12 1.80E-14
Bis(2-etilhexyftalato) 5.10E-23 2.49E-20 2.88E-20 4.32E-09 5.91E-14 1.45E-14
Dinoctilftalato 5.10E-23 6.26E-24 1.18E-22 4.32E-09 2.47E-14 2.95E-16
4-terc-octilfenol 1.35E-17 1.31E-14 6.92E-17 5.94E-06 4.26E-11 5.01E-09
Acetaminofen 2.50E-23 1.99E-21 2.26E-20 5.00E-08 2.74E-07 3.15E-15
Cafeina 1.66E-19 2.56E-18 9.68E-18 8.95E-09 3.13E-11 2.67E-12
Fluoxetina 4.88E-22 2.97E-20 3.32E-20 8.95E-09 3.13E-11 2.67E-12
Gemfibrozil 1.96E-23 9.51E-22 6.93E-21 1.31E-09 7.70E-14 1.71E-14
Triclosan 9.39E-19 9.04E-17 2.97E-17 6.73E-07 1.07E-10 4.34E-10
BisfenolA 6.79E-23 1.88E-21 7.20E-21 6.50E-10 4.31E-13 3.75E-14
Primidona 1.22E-22 1.18E-21 1.90E-20 7.92E-10 2.09E-12 9.93E-14
Carbamazepina 2.31E-26 1.25E-24 1.51E-21 1.92E-08 3.39E-13 2.41E-17
Progesterona 2.06E-18 1.10E-17 2.27E-16 9.81E-08 1.67E-09 4.29E-11 Fuente. Elaboración propia.
64
Los datos señalados en rojo en la tabla 15 indican específicamente los compuestos que presentan
homogeneidad de variancias en un respectivo compuesto, pero este supuesto no es suficiente para
la aplicación del ANOVA, por lo cual se aplicó el Kruskal Wallis que sostuvo un p-value mayor a
0.05 en cada uno de los análisis; apoyando la hipótesis nula que indica que las medias de los datos
son iguales. Además, la tabla 17 indica los p-value para cada compuesto en combinación con cada
factor y el p-value de todos los compuestos en combinación con cada factor (Kruskal-Wallis
Multivariado) apoyando la hipótesis de que no hay diferencias en la magnitud y detección de los
compuestos si se tienen diferencias entre el envase el origen y el gas.
Tabla 17. p-value Kruskal-Wallis test & Kruskal-Wallis Multivariado
Kruskal-Wallis test
Compuesto ENVASE ORIGEN GAS
Dimetilftalato 0.504 0.596 0.732
Dietilftalato 0.839 0.543 0.797
Diisobutilftalato 0.404 0.180 0.333
Dibutilftalato 0.752 0.438 0.725
Bis(2-etilhexyftalato) 0.222 0.552 0.352
Dinoctilftalato 0.266 0.221 0.410
4-Terc-octilfenol 0.791 0.872 0.083
Acetaminofen 0.320 0.758 0.754
Cafeina 0.887 0.223 0.103
Fluoxetina 0.948 0.951 0.528
Gemfibrozil 0.922 0.613 0.329
Triclosan 0.211 0.608 0.929
BisfenolA 0.977 0.744 0.454
Primidona 0.766 0.392 0.153
Carbamazepina 0.704 0.204 0.709
Progesterona 0.344 0.268 0.696
KRUSKAL-WALLIS MULTIVARIADO
0.964 0.794 0.275
Fuente. Elaboración propia.
65
Como en el análisis del PCA y el MCA también se realizaron estos análisis para los cuatro casos
evaluados en donde en el I caso separando los plastificantes de los medicamentos el p-value para
cada uno de los casos fue mayor a 0.05 por lo cual tampoco se encontró diferencias entre los
niveles. Kruskal-Wallis y Kruskal-Wallis multivariado, arrojaron los mismos resultados para el II
caso de los compuestos de mayor preocupación respecto a toxicidad.
Respecto a los niveles de cada factor por separado (plástico, vidrio, origen nacional e internacional
y aguas con gas y sin gas) “caso III” y aplicándolo a los niveles opuestos. Por parte del nivel
plástico se obtuvo que no existen diferencias estadísticas entre las medias de los datos al presentar
una combinación de plástico con un origen nacional o internacional o si tienen gas o no, en los
resultados de las anteriores pruebas. Realizando esta misma combinación dejando como un único
nivel el vidrio se obtuvieron diferencias significativas respecto al nivel GAS en DMP en el cual la
p-value de Kruskal-Wallis = 0.00317<0.05. De lo anterior se deduce que cuando se tiene un envase
de vidrio, hay diferencias entre los resultados cuando una muestra tiene gas o no.
Realizado el mismo procedimiento con un único nivel (muestras que solo tienen gas); el Kruskal-
Wallis arroja una p-value igual a 0.012 respecto al nivel envase lo cual quiere decir que las muestras
que son de vidrio o plástico y tienen gas son diferentes respecto a los otros tratamientos o
combinaciones existentes de los factores para DMP. Otro compuesto que arrojo la misma hipótesis
planteada por el test de Kruskal-Wallis fue la Cafeína (CAF) con un p-value de 0.0168 pero para
el caso de las muestras que no tienen gas.
En este sentido se aplicó el Kruskal-Wallis Multivariado teniendo en cuenta el envase vidrio y
además separando los compuestos plastificantes de los medicamentos, indica diferencias entre la
66
detección y no detección de los compuestos de acuerdo al tipo de origen y gas en la matriz de agua
de los plastificantes como lo indica la tabla 18.
Tabla 18. Kruskal-Wallis Multivariado con envase de vidrio para plastificantes.
PLASTIFICANTES
FACTORES ORIGEN GAS
KRUSKAL-WALLIS MUTIVARIADO 0.0055 0.0086
Fuente. Elaboración propia.
El Kruskal-Wallis Multivariado, con las muestras que no tienen gas y además separando los
compuestos plastificantes de los medicamentos, arrojó diferencias entre la detección y no detección
de los compuestos de acuerdo al tipo de origen en la matriz de agua de los farmacéuticos y
hormonas como lo indica la tabla 19.
Tabla 19. Kruskal-Wallis Multivariado con muestras sin gas para farmacéuticos y hormonas.
FARMACEUTICOS Y HORMONAS
FACTORES ENVASE ORIGEN
MKRUSKAL 0.962 0.035
Fuente. Elaboración propia.
En este orden de ideas se realizaron estas pruebas teniendo en cuenta las muestras de origen
internacional, dando como resultado diferencias de acuerdo al tipo de muestras que tienen gas y las
que no respecto a los plastificantes como lo indica la tabla 20. Por último, cuando se tienen muestras
de origen nacional no se encontraron diferencias entre las muestras según las pruebas desarrolladas.
67
Tabla 20. Kruskal-Wallis Multivariado con muestras de origen internacional para
plastificantes.
PLASTIFICANTES
FACTORES ENVASE GAS
MKRUSKAL 0.962 0.0428
Fuente. Elaboración propia.
Por otra parte se realizó Kruskal Wallis teniendo en cuenta el análisis de outliers (caso IV) con una
x.dist de 100, 75, 50,10 y por defecto; estas van desde una mayor a menor restricción
respectivamente dado a que mientras esta distancia es más pequeña, mayor es el número de datos
atípicos que se encuentran (14, 16, 18, 21 y 41 outliers del total de las 174 muestras).
Para el caso de outliers con una x.dist igual a 100, 75, 50 y 10 se obtuvo un p value menor a 0.05
definiendo diferencias entre las muestras que tienen gas y las que no respecto a TER, para el caso
de esta x.dist por defecto del programa en R stadistical (41 outliers) el p value de Kruskal Wallis
fue menor a 0.05 en dos casos:
• Hay diferencias de las muestras que tiene gas y las que no respecto a DIBP.
• hay diferencias entre las muestras que tiene gas y las que no respecto al DEPH.
Realizados estos análisis clásicos con pocas respuestas de factores que expliquen por qué se da la
presencia de estos compuestos, se investigaron otras herramientas posibles que den explicación a
esta pregunta, en este sentido se realizó un a análisis de información promedio mutua (AMI: mutual
average information) y modelos basados en arboles como lo son los arboles de decisión (Decision
Trees), arboles de regresion (Regression Trees) y bosques aleatorios (Random Forest).
68
Para el desarrollo de AMI se convirtieron los valores de concentración de cada compuesto en
variables categóricas teniendo en cuenta la “Detección” cuando el valor de la concentración es
mayor a cero y la “No Detección” cuando esta concentración es cero. A esta nueva matriz de
compuestos se aplicó el concepto de la entropía de la información y de información mutua (mi).
En este sentido las tablas de 21,22 y 23 indican los valores de entropía, información mutua y
redundancia para DMP, ACE y CAF.
Tabla 21. Entropía conjunta, información mutua y valores de redundancia de factores
respecto a DMP.
Variables Entropía_Conjunta MI R R_MAX % redundancia
ENVA-DMP 0.998860703 0.00264549
0.12620656 0.19174991 65.82
ENVB- DMP 0.572452273 0.57745213 0.31800916 181.58
ORIA- DMP 0.998584145 0.00100049
0.21167905 0.27060915 78.22
ORIB- DMP 0.781985607 0.45649527 0.35783523 127.57
GASA- DMP 1.013323554 0.00133301
0.23717061 0.30446147 77.9
GASB- DMP 0.843859763 0.41965962 0.36458945 115.1
Fuente. Elaboración propia.
Tabla 22. Entropía conjunta, información mutua y valores de redundancia de factores
respecto a ACE.
Variables Entropia_Conjunta MI R R_MAX % redundancia
ENVA-ACE 0.982511846 0.00142849
0.67943179 0.19474241 348.89
ENVB-ACE 0.572452273 0.10698024 0.32218663 33.2
ORIA-ACE 0.992486113 2.85E-05
0.20547527 0.2744145 74.88
ORIB-ACE 0.771489801 0.45716279 0.36225797 126.2
GASA-ACE 1.008174594 0.00336384
0.23087618 0.30854149 74.83
GASB-ACE 0.829412033 0.42262065 0.3690477 114.52
Fuente. Elaboración propia.
69
Tabla 23. Entropía conjunta, información mutua y valores de redundancia de factores
respecto a CAF.
Variables Entropia_Conjunta MI R R_MAX % redundancia
ENVA-CAF 0.268721878 0.00151648
0.00561163 0.18888147 2.97
ENVB-CAF 0.430827083 0.10592692 0.10592692 100
ORIA-CAF 0.391078129 0.00275168
0.00698697 0.12960679 5.39
ORIB-CAF 0.514847408 0.09019947 0.09019947 100
GASA-CAF 0.451890022 0.00359203
0.00788622 0.11206373 7.04
GASB-CAF 0.530141239 0.08782588 0.08782588 100
Fuente. Elaboración propia.
En donde Variables se definen como las combinaciones de los niveles de los factores (ENVA=
envase plástico; ENVB= envase vidrio; ORIA= origen nacional; ORIB= origen internacional;
GASA= agua sin gas; GASB= agua con gas) respecto a determinado compuesto, Entropía
Conjunta es la representación de la incertidumbre e información de todas las posibles
combinaciones de las variables analizadas, MI es la información mutua por pares de variables, R
es el coeficiente de redundancia de los factores respecto a compuestos (capacidad predictiva),
R_MAX es la redundancia máxima y % Redundancia es el redondeo entre redundancia y
redundancia máxima las tablas restantes a los otros 13 compuestos están en el ANEXO EE ya que
el resultado de estas fue el mismo que el de DMP.
Se señalaron en rojo los números de menor magnitud de la entropía conjunta esto debido a que,
entre menor es este número las variables relacionadas comparten mayor información, de esto se
pudo destacar que el envase de plástico comparte la mayor información respecto a DEP (ANEXO
EE1), DOP(ANEXO EE5), CAF (tabla 23) y PRI (ANEXO EE11); por el contrario los
compuestos restantes comparten la mayor información respecto a el envase de vidrio, induciendo
así que los factores origen y gas son los que generan mayor incertidumbre.
70
En este mismo orden de ideas se señalaron los valores más altos de información mutua para cada
tabla con el fin de ver cual factor es el que tiene mayor dependencia a respectivo compuesto; dicho
esto los compuestos que presentan mayor dependencia al envase son DMP (tabla 21), DOP
(ANEXO EE5), FLU (ANEXO EE7) y GEM (ANEXO EE8); los compuestos que presentan
mayor dependencia respecto a el factor gas son DEPH (ANEXO EE4), TER(ANEXO EE6), ACE
(tabla 22), CAF (tabla 23), TRI (ANEXO EE9) y PRI (ANEXO EE11) y los de mayor
dependencia con respecto al origen son DEP (ANEXO EE1), DIBP (ANEXO EE5), DBP
(ANEXO EE3), BPA (ANEXO EE10), PRI (ANEXO EE11), CAR (ANEXO EE12) y PRO
(ANEXO EE13), respecto a esta dependencia se calculó el porcentaje de redundancia, esto con el
fin de conocer la capacidad predictiva de esta variable frente a los compuestos y poder diferenciarla
respecto a los niveles que tienen.
Si el coeficiente de redundancia tiende a cero, no existe redundancia y, por lo tanto, las variables
analizadas en cada par son independientes. A fin de conocer qué tan alta puede ser su redundancia
se halla su máximo valor. Se observa que la capacidad predictiva de la detección de DMP, DEPH,
OCT, FLU y GEM está condicionada por el envase de vidrio con la incertidumbre más baja y la
dependencia más alta; en este mismo sentido DEP y PRI van a estar condicionadas por el envase
de vidrio pero con una incertidumbre mayor que las anteriores, además ISO, BUT, TER, TRI, BPA,
CAR y PRO también están condicionadas por el envase de vidrio pero la dependencia de estas
variables no es tan alta y la incertidumbre sigue siendo la más baja.
Por otra parte, la capacidad predictiva del envase de plástico solo está condicionada por ACE con
una dependencia media e incertidumbre baja, además el único compuesto que presenta la
predicción de la detección respecto a aguas que tienen gas es CAF con la dependencia más alta e
71
incertidumbre media. Esto quiere decir que el factor origen es el menos importante en la detección
de estos compuestos y que solo ACE tiene mayor capacidad predictiva de aparecer cuando se tiene
un envase de plástico y CAF cuando el agua tiene GAS, del resto de los compuestos se puede decir
que su capacidad predictiva esta condiciona por el envase de Vidrio. Con el fin de poder extraer
mayores y mejores resultados se aplicaron modelos basados en árboles para identificar las reglas
escondidas dentro de la matriz de agua.
Para DMP se puede deducir que, si se tiene una muestra con un envase de vidrio con un agua sin
gas, este se detectara en concentraciones bajas (ver figura 18) con un error relativo de 1 y un error
en el nodo raíz de 0.34 lo cual representa un buen ajuste.
Figura 18. Árbol de decisión como variable de respuesta DMP.
Fuente. Elaboración propia.
72
Figura 19. Árbol de decisión como variable de respuesta DIBP.
Fuente. Elaboración propia.
la figura 19 indica el árbol de decisión del minado de datos de DIBP, en donde se puede observar
como nodo principal el ORIGEN en donde si es un agua internacional y no tiene gas se presentan
niveles bajos con un error del 0.42 en el nodo raíz y con un error relativo máximo de 1.09. El
ultimo árbol de decisión desarrollado por el minado de datos fue el de DEHP con un error relativo
de 0.9367, en donde la figura 20 indica la estructura de este con un error en el nodo principal del
0.45.
Respecto a la figura 20 se identifica como nodo principal el envase, en donde si este es de vidrio y
no tiene gas se presenta la detección de DEPH. Los arboles de decisión de los demás compuestos
no se indican debido a que no existen reglas que puedan definir los nodos del árbol. Esto se debe a
que en la categorización de las muestras, el % de no detección respecto a los niveles bajo y
73
detectado es mucho mayor por lo cual no se tienen diferencias en la variable de respuesta; esto es
una desventaja de estos modelos debido a que al categorizar una variable continua se pierde mucha
información de está generando estos problemas (Analytics Vidhya 2016). Para dar solución a este
problema se corrió el modelo de minado de datos dejando las concentraciones de los compuestos
como variables continuas con el fin de aplicar los denominados “regression trees”.
Figura 20. Árbol de decisión como variable de respuesta DEPH.
Fuente. Elaboración propia.
En este orden de ideas se dibujó el árbol de regresión para DMP (ver figura 21) la cual tiene
interpretación similar a la de los arboles categóricos en donde la parte superior de cada nodo indica
la importancia de este (1= nodo raíz) además de la media de los datos para cada nodo; n que es
igual al número de muestras y al final se indica el porcentaje de desviación estándar para cada
nodo. Dicho esto, se puede inferir que al tener un origen nacional y un envase de vidrio la media
de los datos de DMP se verá representada por estos dos factores que tienen los porcentajes más
74
altos del total de las muestras con un error en el nodo raíz de 2.94e-06. Los 15 árboles de regresión
restantes para cada compuesto se describen en el ANEXO FF (1 A 15)
Figura 21. Árbol de Regresión como variable de respuesta DMP.
Fuente. Elaboración propia.
Si se compara el árbol de regresión con el árbol categórico de este compuesto se puede inferir que
hay diferencias en torno a que mientras en el de decisión, el origen nacional (A) no es importante
respecto a la no detección de DMP; en el árbol de regresión es el nodo principal en el cual la media
de los datos es influyente pero el error del nodo principal en el árbol de clasificación es mucho
mayor que en el categórico por lo cual la clasificación errónea en este árbol es más grande que en
el de regresión.
75
El ANEXO FF1 indica el árbol de regresión para DEP en donde se puede observar una estructura
similar a DMP (ftalatos de bajo peso molecular) a diferencia que la mayor ganancia de desviación
estándar se la llevan las aguas que tienen gas en este caso se presentó un error relativo de uno y un
error en el nodo principal de 5e-09 que representa una buena elección de este en donde si se tiene
un origen nacional y un envase de vidrio se detecta DEP. En este orden de ideas se puede deducir
que los ftalatos que tiene bajo peso molecular están condicionados en la detección cuando tienen
un origen nacional y un envase de vidrio.
Después se definió como variable de respuesta el compuesto DIBP en donde el ANEXO FF2
representa la estructura del árbol de regresión. En donde se puede observar el nodo principal como
el gas en a la media; cabe destacar que al comparar este árbol de regresión con el árbol de decisión
se puede observar la misma regla, pero invertidos los nodos raíces y un error en el nodo raíz del
1.7e-05 que es menor al del árbol categórico infiriendo así que este es un buen clasificador de
DIBP.
En este contexto se desarrolló el árbol de regresión del DBP en donde se indica como nodo raíz el
envase de vidrio, el cual combinado con un origen internacional lleva el mayor porcentaje de
detección con un error en el nodo raíz de 4e-08 ver ANEXO FF3.
Los arboles correspondientes a los ANEXOS FF2 y FF3, DIBP (di-iso-butilftlato) y DBP
(dibutilftalato) respectivamente, da a entender que a pesar de que ambos compuestos tienen el
mismo peso molecular; la estructura en la cual tienen ubicados los radicales; es suficientemente
significante como para indicar que la detección de estos compuestos depende de diferentes factores
en el agua envasada.
76
Respecto al DEPH el ANEXO FF4 indica el árbol de regresión de este; en donde se indica el nodo
raíz en agua con gas la cual en combinación con un origen nacional representa detección de las
muestras con una media de 0.0027 ug/L. esto es muy diferente respecto a el árbol de decisión en
donde el nodo principal es el envase y el que menos información tiene es el factor gas, destacando
que el error en el nodo raíz es menor que en el categórico (1.25e-05). Repitiendo el procedimiento
el ANEXO FF5 indica el árbol de regresión para el Di-n-Octilftalato (DOP) el cual sigue teniendo
como nodo raíz el agua con gas combinándose con un origen internacional representa la detección
de DOP con un error en el nodo raíz de 1,7e-8.
En resumen, los árboles de regresión para la familia de los ftalatos presentan un nodo raíz de origen
nacional seguido de un envase de plástico representado en la detección de los ftalatos de bajo peso
molecular (DMP, DEP) de al menos del 72% de las muestras. Por otra parte, los ftalatos de alto
peso molecular excluyendo DBP; tienen como factor más influyente aguas sin gas y DBP tiene
como factor más influyente en la detección como aguas en envase de plástico.
Respecto al 4-tert-octilfenol (TER) se mantuvo como nodo principal aguas con gas con una
combinación de origen internacional que representa la detección de TER en torno a la media que
es congruente con la del nodo principal este árbol presenta un error muy grande respecto al nodo
principal el cual fue de 0.005 y un error relativo de 1 (ver ANEXO FF6).
El ANEXO FF7 indica el árbol de regresión para el acetaminofen (ACE), en la cual el factor más
importante es el origen internacional que al asociarse con un envase de vidrio, representa la
detección de ACE con un error en el nodo principal de 0.035 y un error relativo máximo de uno.
77
En este sentido el ANEXO FF8 representa el árbol de regresión para CAF, este indica la regla de
tener como nodo principal un agua sin gas con una combinación del factor de vidrio que representa
la detección CAF con un error de 0.0097 en el nodo raíz y un error absoluto de uno. El ANEXO
FF9 indica el árbol de regresión para FLU en donde un agua de origen nacional y un envase de
vidrio representan la detección de FLU con un error en el nodo raíz de 0.00042 y un error absoluto
de 1. Además, el ANEXO FF10 representa el árbol de regresión para GEM en donde se tiene como
nodo principal el factor de un agua con gas con una combinación de un envase de vidrio que
presenta la detección de GEM con un error en el nodo raíz de 0.08 un error absoluto de uno.
Dicho esto, el ANEXO FF11 representa el árbol de regresión para el compuesto PRI en donde el
origen nacional con una combinación de un envase de vidrio presenta la detección de este con un
error en el nodo raíz de 0.004 y une error absoluto de uno. El ANEXO FF12 indica el árbol de
regresión para el BPA en donde se encontró como nodo principal al origen en donde las aguas
nacionales son las causantes de la detección por debajo de los valores de MCL; en este sentido si
se tiene un envase de vidrio estas concentraciones son menores respecto a la media del envase de
plástico en donde las concentraciones son mucho mayores; además de esto combinando el factor
gas en donde se tiene agua sin gas se puede inferir que estas concentraciones se mantendrán por
debajo de la media del nodo principal el error en el nodo raíz esta alrededor de 924.9 con un error
relativo de uno.
El ANEXO FF13 indica el árbol de regresión para la primidona (PRI) en la cual el nodo raíz es el
origen nacional que condiciona la combinación de los nodos envase de vidrio presenta la detección
de PRI con un error en el nodo principal de 0.00288 y un error relativo máximo de uno; el ANEXO
78
FF14 indica el árbol de regresión para la carbamazepina (CAR) en donde se puede observar un
nodo raíz condicionado por las muestras que no tienen gas en combinación con aguas nacionales
presentan la detección de CAR con un error en el nodo raíz de 1314 y un error relativo de uno y
por último, el ANEXO FF15 indica el minado de datos de la progesterona (PRO) en el cual se
indica como nodo raíz el origen nacional respecto a una combinación de envase de vidrio representa
la detección de PRO respecto a la media que es similar en todos los nodos de 158 ug/L con un error
en el nodo raíz de 0.07.
Por último, se realizó el análisis de bosques aleatorios y Xgboots en donde se hicieron unas tablas
para cada bosque de decisión que contienen la importancia de los factores respecto a cada
compuesto en donde la tabla 24 indica la importancia de los factores para DMP y el ANEXO GG
(1 a 15) indica las tablas para los compuestos restantes.
Tabla 24. Importancia de factores para DMP con Random Forest
Factor I detectado MeanDecreaseAccuracy obb ENVASE 15.20 21.95
28.74% ORIGEN 15.26 14.53 GAS 12.27 16.60
Fuente. Elaboración propia.
En donde I detectado es la importancia de un factor a ser detectado (el número mayor es el más
importante, Mean Decrease Accuary (disminución media en la precisión) es la cantidad o
proporción de observaciones que se clasifican incorrectamente, y OBB estimate (out-of-bag) es
el porcentaje de error del modelo de las muestras definido como el promedio de la exactitud del
modelo prediciendo la variable de respuesta (entre mayor sea este porcentaje menos exacto es el
bosque aleatorio).
79
Para los compuestos DEP (ANEXO GG1), DOP (ANEXO GG5), FLU (ANEXO GG9) Y CAF
(ANEXO GG8) no se puede notar una diferencia de la importancia de los factores ya que estas son
todas igual a cero; para DEP se puede decir que el nodo de envase tiene una pureza mayor respecto
a los otros dos nodos, pero esto no indica la importancia a diferencia de los otros tres compuestos
en donde el nodo más puro se encuentra en el factor GAS.
Por otra parte, el compuesto TER (ANEXO GG6) presenta una importancia mayor en la detección
cuando se tiene el factor origen con un obb de 2,35% lo cual quiere decir que el bosque aleatorio
es un buen clasificador fuerte de esta regla. En el caso del compuesto DBP (ANEXO GG3) se
tiene un obb de 13,79% mucho mayor al de TER en donde se tiene una importancia mayor en la
no detección de este en el factor gas; y un poco menor en la detección de este cuando se tiene el
factor origen. Este sigue siendo un buen clasificador fuerte ya que obb no es alto.
Respecto al compuesto DMP el OOB sube a 17,24% dando como mayor resultado la importancia
en la detección cuando se tiene el factor envase y en la no detección cuando se tiene el factor gas.
El OBB para TRI (ANEXO GG11), PRI (ANEXO GG13), CAR (ANEXO GG14) y PRO
(ANEXO GG15) fue el mismo que DMP en donde se tiene más importancia de estos respecto a
los factores origen para TRI y envase para CAR , PRO Y PRI además el compuesto GEM (ANEXO
GG10) tiene un OOB igual a 18,39% que sigue siendo un modelo bueno respecto a la clasificación
de los nodos en donde el nodo más importante en la detección de este fue el origen. Respecto a
DIBP (ANEXO GG2), DEHP (ANEXO GG4) , ACE (ANEXO GG7) Y BPA (ANEXO GG12)
se tienen OBBS mayores al 30% lo cual quiere decir que el bosque aleatorio está prediciendo solo
del 50 al 70% de todas las muestras.
80
Respecto al algoritmo Xgboots la figura 21 describe que compuestos son más importantes en torno
al factor envase, origen y gas en donde se puede observar que el factor gas es mas importante
respecto a la cuantificación de cuatro compuestos que origen y envase, como lo rectifican los
arboles de regresión.
Figura 22. Importancia factores según algoritmo Xg boots
Fuente. Elaboración propia.
81
4. DISCUSIÓN DE RESULTADOS (capitulo 4).
En este capítulo se describen los más relevantes resultados encontrados con el fin de
compararlos con los resultados encontrados por la literatura científica; por lo cual se desarrolló la
tabla 25 con el fin de clasificar la importancia de estos con las implicaciones que llevan además de
los análisis que fueron congruentes con sus resultados.
Como se puede observar en la tabla 25 el numeral uno indica como factor principal el envase de
vidrio en casi todos los compuestos, en este sentido cabe destacar que se han realizado estudios en
donde se caracteriza la calidad del agua entorno a los ftalatos y al 4-terc-octilfenol teniendo en
cuenta factores como el envase, la forma, agua carbonatada (con gas) y el tiempo de
almacenamiento; en este sentido Guart et al observo que la forma del contenedor no afecta la
calidad del agua. Tampoco el tiempo de almacenamiento, dado que los constituyentes detectados
en las muestras recién embotelladas fueron congruentes en los que fueron almacenados durante un
año (2014).
También concluyo que solo el agua carbonatada puede aumentar ligeramente los procesos de
migración, que en general están relacionados con el tipo de monómero o material plástico utilizado
para fabricar el envase, el análisis de Guart et al también revela que las botellas de plástico de
polietileno tereftalato (PET) con una tapa de polietileno de alta densidad, que son la mayoría de las
botellas de agua en el mercado español y también en el mercado Colombiano, tienen bajos niveles
de plastificantes y que solo el vidrio con tapas metálicas como de plástico, indican un aumento
general en el número de muestras ( 2014).
82
Tabla 25. Resultados relevantes
# RESULTADO IMPLICACIONES ANALISIS CONGRUENTES
1 14 / 16 compuestos pueden ser detectados si se tiene envase Vidrio
Envase vidrio poca capacidad predictiva respecto a Acetaminofén y Cafeína
AMI, CT- MET, CT-DEPH, RT-ETI, RT-BUT, RF-MET, RF-CAR, RF-PRO, RF-PRI
2
11/16 compuestos están en concentraciones medias si se tiene un agua carbonatada de origen nacional
Agua internacional carbonatada presenta concentraciones mayores si es carbonantada
RT-COMPUESTOS,XGboots
3 Muestras con envase de vidrio se diferencian si tienen gas o no, respecto a plastificantes
Envase de plástico no presenta diferencias respecto a las concentraciones de los plastificantes
KW-MULTIVARIADO
4 Muestras internacionales se diferencian si tienen gas de las que no, respecto a plastificantes
Muestras de Origen Nacional no presentan diferencias respecto a las concentraciones de los plastificantes
KW-MULTIVARIADO
5 Muestras sin gas son diferentes si son nacionales o internacionales respecto a fármacos y hormonas
Muestras con gas no presentan diferencias respecto a las concentraciones de los fármacos y hormonas
KW-MULTIVARIADO
6 Acetaminofén puede ser detectado si se tiene un envase de plástico
No depende de gas ni de origen AMI
7 Cafeína puede ser detectado si se tiene un agua con gas
No depende de envase ni de origen AMI
8 Dimetilftalato depende principalmente muestras con envase vidrio y gas
No detección Dimetilftalato está en muestras vidrio y sin gas
CT-MET, KW-VIDRIO-MET, KW-GAS-MET, KW-MULTIVARIADO, AMI, RF-MET
9 Bis-2-etil-hexil-ftalato y Dibutilftalato dependen principalmente aguas envase vidrio y origen internacional
Factor gas no condiciona detección de Bis-2-etil-hexil-ftalato y Dibutilftalato
CT-DEPH, RT-BUT, AMI, RF-BUT
10 Di-iso-butilftalato depende principalmente aguas envase vidrio, origen internacional y sin gas
Envase no condiciona detección de Di-iso-butilftalato
CT-ISO, KW-ISO, KW-MULTIVARIADO
11
Di-n-octil-ftalato puede ser detectado si se tiene un envase vidrio además las probabilidades de detección aumentan cuando se tiene agua con gas y de origen internacional
Los tres factores son condicionantes de forma significativa cuando se detecta Di-n-octil-ftalato
AMI, RT-OCT, KW-OCT, KW-MULTIVARIADO
AMI= Información promedio mutua (mutual average information), CT-Compuesto= Arbol de decisión para determinado
compuesto (Classification Tree), RT- Compuesto = Arbol de regresión para determinado compuesto (Regression Tree),
RF- Compuesto = Bosque aleatorio para determinado compuesto (Random Forest), KW- Compuesto = Test no
paramétrico de Kruskal Wallis para determinado compuesto, KW-Multivariado= Test no paramétrico de Kruskal Wallis
para todas las variables.
Fuente. Elaboración propia.
83
También indica los porcentajes de detección de los compuestos en donde la figura 23 indica los
porcentajes de detección respecto a Colombia, España y Mexico.
Figura 23.porcentajes de detección de disruptores endocrinos encontrados en Colombia,
España y México.
Fuente. Elaboración propia.
Esto da a entender que la regulación de estos aditivos a la hora de fabricación y procesamiento del
envase juega un papel muy importante ya que se puede observar un aumento muy grande en los
porcentajes de detección de las aguas colombianas con las aguas Españolas y Mexicanas; en este
sentido el mediante la resolución 683 del 2012 y 12186 del 91 se pueden controlar estas sustancias
siguiendo los procedimientos a la hora del envasado del agua (MINISTERIO DE SALUD 1991;
INVIMA 2012). Una cuestión preocupante fue el valor máximo de concentración de BPA ya que
las botellas comercializadas en España tienen valores mucho más pequeños que los encontrados
este estudio, el valor máximo de concentraciones de BPA encontrados en este estudio fue de 221
ug/L mientras que en el estudio de Guart es de 24,2ug/L valor 9 veces mayor que fue encontrado
en un agua de envase de plástico sin gas y de origen internacional, esto hace pensar que los aditivos
0102030
405060708090
100
% de Deteccion España Guart et al (2014) 724 muestras
% de Deteccion Colombia 174 muestras
% de Deteccion Mexico Vazquez 2(2017) 24 muestras
84
utilizados en el empaquetamiento de las botellas en Colombia respecto a BPA están bien
controlados en comparación a aguas internacionales en donde se encontraron las concentraciones
más altas de BPA (2014). Cabe mencionar que respecto a la cuantificación de estos resultados un
agua carbonatada e internacionales presentan concentraciones más altas que aguas nacionales y sin
gas, pero estas concentraciones relativamente altas respecto a la media de las 174 muestras de agua
analizadas no son preocupantes según el nivel máximo de contamínate (MCL) encontrado en la
metodología del grado de toxicidad aplicada por lo cual estas concentraciones no generan efectos
adversos a la salud humana.
Por otra parte la asociación de los factores respecto a los contaminantes evaluados concuerdan en
que DEHP se detecta en botellas de vidrio adicionando un factor que es la tapa (metal o plástico)
igualmente ETI, TER se asociaron también con botellas de vidrio con una tapa de metálica; BPA
se detectó principalmente en botellas de policarbonato pero también en botellas de vidrio con una
tapa metálica (Guart et al. 2014) que apoyan los resultados obtenidos en esta investigación en donde
la detección de estos compuestos depende principalmente del envase de vidrio ya sean tapas
metálicas o de plástico.
Además, se comparó los resultados de las concentraciones obtenidas en puntos de monitoreo de
los embalses de Chingaza, Tibitoc, Zumapaz que suministran el agua potable en Bogotá; la figura
24 indica las concentraciones máximas que se hallaron en cada uno de los compuestos encontrados
tanto en el agua embotellada como en el agua potable indicando valores muy altos de DEPH
preocupantes para la salud humana en el agua potable y valores bajos de BPA en esta. Esto genera
preocupación ya que una concentración de 100 ug/L en el agua potable de DEPH se ve asociada a
85
los efectos adversos a la salud humana que pueden concurrir en enfermedades como bajo desarrollo
en sistemas reproductivos y daño en el ADN(Cooper, Kendig, and Belcher 2011b, 2).
Figura 24. Concentraciones de disruptores endocrinos encontrados en agua potable
distribuida en Bogotá y agua embotellada comercializada en Bogotá.
Fuente. Elaboración propia.
Bis-2-etil-hexilftalato
Dietilftalato
Dipentilftalato
Di-n-hexilftalato
Bis-n-butoxietilftalato
4-tert.octilfenol
Progesterona
bisfenol A
100.7
11.5
13.84
37.26
8.45
0
0.33
64.3
0.03
0.001
0
0
0
0.17
1.78
221.146
CONCENTRACIONES (UG/L)
agua embotellada agua potable
86
5. CONCLUSIONES
• El factor que tiene mayor grado de influencia sobre la detección los disruptores endocrinos
encontrados es el envase de vidrio
• El factor que tiene mayor grado de influencia sobre la cuantificación de los disruptores
endocrinos encontrados son aguas carbonatadas.
• Los ftalatos de alto peso molecular presentan concentraciones altas si las muestras de agua
son nacionales y carbonatadas.
• Los ftalatos de bajo peso molecular presentan concentraciones altas si las muestras tienen
un origen internacional a pesar de que la detección de estos es mayor en el mercado
colombiano.
• Los medicamentos presentan concentraciones medias si las muestras de agua tienen gas.
• El agua potable distribuida en Bogotá presenta concentraciones mayores respecto a el agua
embotellada en especial por DEHP que representa un riesgo para la salud respecto a el
MCL.
• Las muestras de agua nacionales en plástico y sin gas son las menos influyentes en la
detección y cuantificación de los disruptores endocrinos
• El dimetilftalto está condicionado por el envase de vidrio, pero además del gas; esto quiere
decir que estos factores no son independientes, y al asociarse generan mayor probabilidad
de detección de este compuesto; por otra parte, esto da a entender que las aguas sin gas
están asociadas a la no detección de este y que el que tiene menos importancia en la
detección de este es el origen.
• Bis-2-etil-hexil-ftalato y Dibutilftalato igual que Dimetilftalato están condicionados por el
envase de vidrio, pero a diferencia de este último, también es de gran importancia el origen
87
internacional; dicho esto cabe decir que los ftalatos de bajo peso molecular como
Dimetilftalato son diferentes de los de alto peso molecular ya que mientras uno depende
del vidrio y el gas los otros no están condicionados por el gas; además que un origen
colombiano no condiciona la detección de este.
• El Di-iso-butilftalato a pesar de tener la misma composición de Dibutilftalato depende
principalmente de aguas de vidrio con origen internacional y que no sean carbonatadas, por
lo cual un cambio en la estructura de los radicales también condicionara un factor más para
la predicción de la detección de este.
• Di-n-octilftalato al igual que Di-iso-butilftalato dependen de los tres factores con la
diferencia de que si se tiene un agua carbonatada de origen internacional las probabilidades
de que aparezca este compuesto serán mayores.
• Los ftalatos en combinación con dos o tres factores indican que un agua internacional en la
mayoría de los casos tiene mayor capacidad predictiva de la detección que un agua nacional;
prueba de esto es el BPA en donde las concentraciones más altas fueron entorno a las de un
origen internacional.
88
6. RECOMENDACIONES
Se recomienda estudiar los caminos por los cuales acetaminofén está asociado con el envase
plástico, ya que la literatura científica se ha centrado en este, pero en temas de toxicología, medicina
y agua residual pero no en cuales pueden ser los posibles caminos por los cuales llega al agua
embotellada.
En este mismo sentido se recomienda estudiar los caminos de la cafeína y cual es realmente la
asociación que tiene esta con el gas; ya que la literatura científica ha estudiado estas
concentraciones en bebidas gaseosas, te, jugos etc. pero no en el agua con gas como tal.
Identificar los procesamientos de embasamiento que reciben las aguas comercializadas en Bogotá
con el fin de conocer cuáles pueden ser los factores que pueden jugar un papel importante antes del
envasado de estas.
Identificar el grado de influencia que tiene el Polietileno de alta densidad (HDPE) presente en las
tapas de las botellas de agua ya que este está asociado a la migración de los plastificantes
encontrados en las muestras de vidrio.
89
BIBLIOGRAFIA
Albouy-Llaty, Marion, Frédérike Limousi, Camille Carles, Antoine Dupuis, Sylvie Rabouan, and Virginie
Migeot. 2016. “Association between Exposure to Endocrine Disruptors in Drinking Water and
Preterm Birth, Taking Neighborhood Deprivation into Account: A Historic Cohort Study.”
International Journal Of Environmental Research And Public Health 13 (8).
https://doi.org/10.3390/ijerph13080796.
Alemán, Escondrillas Gabriela, y Torres Nimbe Torres, and Palacio Armando Roberto Tovar. 2004. “Los
receptores activados por proliferadores de peroxisomas (PPARs) en el desarrollo de obesidad y
resistencia a la insulina,” 2004.
Analytics Vidhya. 2016. “A Complete Tutorial on Tree Based Modeling from Scratch (in R & Python).”
April 12, 2016. https://www.analyticsvidhya.com/blog/2016/04/complete-tutorial-tree-based-
modeling-scratch-in-python/.
Benson, Robert. 2009. “Hazard to the Developing Male Reproductive System from Cumulative Exposure
to Phthalate Esters—dibutyl Phthalate, Diisobutyl Phthalate, Butylbenzyl Phthalate, Diethylhexyl
Phthalate, Dipentyl Phthalate, and Diisononyl Phthalate.” Regulatory Toxicology and
Pharmacology 53 (2):90–101. https://doi.org/10.1016/j.yrtph.2008.11.005.
Chessel, Daniel, and Anne-Béatrice Dufour. 2017. “Principal Component Analysis. R Documentation.”
Package ade4 version 1.7-4.
Christian, Diener. 2014. “Bosques Aleatorios (Random Forests).”
Cooper, James E., Eric L. Kendig, and Scott M. Belcher. 2011a. “Assessment of Bisphenol A Released
from Reusable Plastic, Aluminium and Stainless Steel Water Bottles.” Chemosphere 85 (6):943–
47. https://doi.org/10.1016/j.chemosphere.2011.06.060.
———. 2011b. “Assessment of Bisphenol A Released from Reusable Plastic, Aluminium and Stainless
Steel Water Bottles.” Chemosphere 85 (6):943–47.
https://doi.org/10.1016/j.chemosphere.2011.06.060.
Deshpande, Bala. 2011. “2 Main Differences between Classification and Regression Trees.” 2011.
http://www.simafore.com/blog/bid/62482/2-main-differences-between-classification-and-
regression-trees.
Dhaini, Hassan, and Rana Nassif. 2014. “Exposure Assessment of Endocrine Disruptors in Bottled
Drinking Water of Lebanon.” Environmental Monitoring & Assessment 186 (9):5655–62.
https://doi.org/10.1007/s10661-014-3810-x.
Diamanti-Kandarakis, Evanthia, Jean-Pierre Bourguignon, Linda C. Giudice, Russ Hauser, Gail S. Prins,
Ana M. Soto, R. Thomas Zoeller, and Andrea C. Gore. 2009. “Endocrine-Disrupting Chemicals:
An Endocrine Society Scientific Statement.” Endocrine Reviews 30 (4):293–342.
https://doi.org/10.1210/er.2009-0002.
Dray, Stéphane, and Anne-Béatrice Dufour. 2007. “The ade4 Package: Implementing the Duality
Diagram for Ecologists.” Journal of Statistical Software 22 (4).
https://doi.org/10.18637/jss.v022.i04.
90
EPA, OW. 2015. “How EPA Regulates Drinking Water Contaminants.” Collections and Lists. US EPA.
September 1, 2015. https://www.epa.gov/dwregdev/how-epa-regulates-drinking-water-
contaminants.
Filzmoser, Peter, Ricardo Maronna, and Mark Werner. 2008. “Outlier Identification in High Dimensions.”
Computational Statistics & Data Analysis 52 (3):1694–1711.
https://doi.org/10.1016/j.csda.2007.05.018.
FundAlborada. 2015. Dr. Nicolás Olea. Jornada Sobre Disruptores Endocrinos, 13/10/2015.
https://www.youtube.com/watch?v=G5-ysuKHNL4.
Gómez, M.J., M.J. Martínez Bueno, S. Lacorte, A.R. Fernández-Alba, and A. Agüera. 2007. “Pilot Survey
Monitoring Pharmaceuticals and Related Compounds in a Sewage Treatment Plant Located on the
Mediterranean Coast.” Chemosphere 66 (6):993–1002.
https://doi.org/10.1016/j.chemosphere.2006.07.051.
Gonzales, Agudelo Marco Antonio, Lotero William Dario Lopera, and Villa Alvaro Arango. 2014.
Manual de Terapeutica. 16a edicion. Colombia: CIB Fondo Editorial.
Gschwandtner, Peter Filzmoser and Moritz. 2017. Mvoutlier: Multivariate Outlier Detection Based on
Robust Methods (version 2.0.8). https://cran.r-project.org/web/packages/mvoutlier/index.html.
Guart, Albert, Francisco Bono-Blay, Antonio Borrell, and Silvia Lacorte. 2014. “Effect of Bottling and
Storage on the Migration of Plastic Constituents in Spanish Bottled Waters.” Food Chemistry 156
(August):73–80. https://doi.org/10.1016/j.foodchem.2014.01.075.
Hernández, Nathalie Rodríguez, Nelson Neira Obregón, and Andrés Torres. 2016. “Identificación de
factores de tipo categórico relacionados con la condición estructural de tuberías de alcantarillado
en Bogotá a partir de conceptos de entropía de la información.” s 12 (19):63–71.
https://doi.org/http://dx.doi.org/10.16925/in.v12i19.1194.
INVIMA. 2012. “RESOLUCION 683, reglamento general envases.”
https://www.invima.gov.co/images/pdf/normatividad/alimentos/resoluciones/resoluciones/2012/2
RESOLUCION_683_DE_2012_reglamento_general_envases.pdf.
———. 2017. “Sistema de Tramites En Linea - Consultas Publicas-Agua Potable Envasada.” 2017.
http://farmacovigilancia.invima.gov.co:8082/Consultas/consultas/consreg_encabcum.jsp.
Jeddi, Maryam Zare, Noushin Rastkari, Reza Ahmadkhaniha, and Masud Yunesian. 2015.
“Concentrations of Phthalates in Bottled Water under Common Storage Conditions: Do They
Pose a Health Risk to Children?” Food Research International 69 (March):256–65.
https://doi.org/10.1016/j.foodres.2014.11.057.
Kabacoff, Robert I. 2017. “Quick-R: Tree-Based Models.” 2017.
https://www.statmethods.net/advstats/cart.html.
Katsikantami, Ioanna, Stavros Sifakis, Manolis N. Tzatzarakis, Elena Vakonaki, Olga-Ioanna Kalantzi,
Aristidis M. Tsatsakis, and Apostolos K. Rizos. 2016. “A Global Assessment of Phthalates
Burden and Related Links to Health Effects.” Environment International 97 (December):212–36.
https://doi.org/10.1016/j.envint.2016.09.013.
91
Kim, Tae Kyun. 2017. “Understanding One-Way ANOVA Using Conceptual Figures.” Korean Journal of
Anesthesiology 70 (1):22–26. https://doi.org/10.4097/kjae.2017.70.1.22.
Li, Xu, Guang-Guo Ying, Hao-Chang Su, Xiao-Bing Yang, and Li Wang. 2010. “Simultaneous
Determination and Assessment of 4-Nonylphenol, Bisphenol A and Triclosan in Tap Water,
Bottled Water and Baby Bottles.” Environment International 36 (6):557–62.
https://doi.org/10.1016/j.envint.2010.04.009.
Marroni’s, Fabio. 2017. “Perform Pairwise Wilcoxon Test, Classify Groups by Significance and Plot
Results.” 2017. https://fabiomarroni.wordpress.com/2017/03/25/perform-pairwise-wilcoxon-test-
classify-groups-by-significance-and-plot-results/.
Mendiburu, Felipe de. 2016. Agricolae: Statistical Procedures for Agricultural Research (version 1.2-4).
https://cran.r-project.org/web/packages/agricolae/index.html.
MINISTERIO DE SALUD. 1991. “RESOLUCION 12186.”
Moral, María Pilar Martínez. 2015. “Métodos Analíticos Para La Determinación de Compuestos
Disruptores Endocrinos.” Http://purl.org/dc/dcmitype/Text, Universidad de La Rioja.
https://dialnet.unirioja.es/servlet/tesis?codigo=44392.
Muhamad, Mimi Suliza, Mohd Razman Salim, Woei Jye Lau, and Zulkifli Yusop. 2016. “A Review on
Bisphenol A Occurrences, Health Effects and Treatment Process via Membrane Technology for
Drinking Water.” Environmental Science and Pollution Research 23 (12):11549–67.
https://doi.org/10.1007/s11356-016-6357-2.
Mustieles, Vicente, Rocío Pérez-Lobato, Nicolás Olea, and Mariana F. Fernández. 2015. “Bisphenol A:
Human Exposure and Neurobehavior.” NeuroToxicology 49 (July):174–84.
https://doi.org/10.1016/j.neuro.2015.06.002.
Nam, Sung-Hyun, Young-Min Seo, and Man-Goo Kim. 2010. “Bisphenol A Migration from
Polycarbonate Baby Bottle with Repeated Use.” Chemosphere 79 (9):949–52.
https://doi.org/10.1016/j.chemosphere.2010.02.049.
National Center for Biotechnology Information. 2017a. “Bisphenol A.” 2017.
https://pubchem.ncbi.nlm.nih.gov/compound/8343.
———. 2017b. “DEHP.” 2017. https://pubchem.ncbi.nlm.nih.gov/compound/8343.
———. 2017c. “DIBUTYL PHTHALATE.” 2017. https://pubchem.ncbi.nlm.nih.gov/compound/3026.
———. 2017d. “DIISOBUTYL PHTHALATE.” 2017.
https://pubchem.ncbi.nlm.nih.gov/compound/6782.
Navalón Montón, Alberto. 2013. “Crean Metodologías Analíticas Para Determinar La Presencia de
Disruptores Endocrinos En Muestras de Tejidos Humanos.” CienciaDirecta (blog). June 4, 2013.
Pubchem. 2017a. “4-Tert-Octylphenol.” 2017. https://pubchem.ncbi.nlm.nih.gov/compound/8814.
92
———. 2017b. “DIETHYL PHTHALATE National Center for Biotechnology Information.PubChem
Compound Database.” 2017. https://pubchem.ncbi.nlm.nih.gov/compound/6781.
———. 2017c. “DIISOBUTYL PHTHALATE National Center for Biotechnology Information. PubChem
Compound Database.” 2017. https://pubchem.ncbi.nlm.nih.gov/compound/6782.
———. 2017d. “Dimethyl Phthalate National Center for Biotechnology Information.PubChem
Compound Database.” 2017. https://pubchem.ncbi.nlm.nih.gov/compound/8554.
———. 2017e. “Dioctyl Phthalate National Center for Biotechnology Information.PubChem Compound
Database.” 2017. https://pubchem.ncbi.nlm.nih.gov/compound/8346.
———. 2017f. “Ibuprofen.” 2017. https://pubchem.ncbi.nlm.nih.gov/compound/3672.
———. 2017g. “Triclosan.” 2017. https://pubchem.ncbi.nlm.nih.gov/compound/5564.
R Foundation for Statistical Computing .R. 2016. “A Language and Environment for Statistical
Computing R Core .” https://www.R-project.org/.
Real, Macarena, José-Manuel Molina-Molina, Inmaculada Jiménez-Díaz, Juan Pedro Arrebola, José-
María Sáenz, Mariana F. Fernández, and Nicolás Olea. 2015. “Screening of Hormone-like
Activities in Bottled Waters Available in Southern Spain Using Receptor-Specific Bioassays.”
Environment International 74 (January):125–35. https://doi.org/10.1016/j.envint.2014.10.006.
RESTEK CORPORATION. 2016a. “Certificate of Analysis EPA Method 8061A Phthalate Esters
Mixture.”
———. 2016b. “Certificate of Analysis EPA Method Mix Pharmaceuticals 1.”
———. 2016c. “Certificate of Analysis EPA Method Mix Pharmaceuticals 2.”
———. 2016d. “Certificate of Analysis EPA Method Steroids and Mixed Pharmaceuticals Mix.”
Rhomberg, Lorenz R., and Julie E. Goodman. 2012. “Low-Dose Effects and Nonmonotonic Dose–
responses of Endocrine Disrupting Chemicals: Has the Case Been Made?” Regulatory Toxicology
and Pharmacology 64 (1):130–33. https://doi.org/10.1016/j.yrtph.2012.06.015.
Richter, Catherine A., Julia A. Taylor, Rachel L. Ruhlen, Wade V. Welshons, and Frederick S. vom Saal.
2007. “Estradiol and Bisphenol A Stimulate Androgen Receptor and Estrogen Receptor Gene
Expression in Fetal Mouse Prostate Mesenchyme Cells.” Environmental Health Perspectives 115
(6):902–8. https://doi.org/10.1289/ehp.9804.
Rubin, Beverly S. 2011. “Bisphenol A: An Endocrine Disruptor with Widespread Exposure and Multiple
Effects.” The Journal of Steroid Biochemistry and Molecular Biology, Endocrine Disruptors, 127
(1–2):27–34. https://doi.org/10.1016/j.jsbmb.2011.05.002.
Rudel, Ruthann A., Janet M. Gray, Connie L. Engel, Teresa W. Rawsthorne, Robin E. Dodson, Janet M.
Ackerman, Jeanne Rizzo, Janet L. Nudelman, and Julia Green Brody. 2011. “Food Packaging and
Bisphenol A and Bis(2-Ethyhexyl) Phthalate Exposure: Findings from a Dietary Intervention.”
Environmental Health Perspectives 119 (7):914–20. https://doi.org/10.1289/ehp.1003170.
93
Shimadzu Corporation. 2017. “GCMS-QP2010 SE Standard Gas Chromatograph-Mass Spectrometer :
SHIMADZU.” 2017. http://www.shimadzu.com/an/gcms/qp2010se.html.
Siberchicot, Aurélie. 2017. “Multiple Correspondence Analysis; dudi.acm function |R Documentation.”
https://www.rdocumentation.org/packages/ade4/versions/1.7-8/topics/dudi.acm.
Terrádez, Gurrea Manuel. 2017. “Análisis de componentes principales.”
https://www.uoc.edu/in3/emath/docs/Componentes_principales.pdf.
Theodorsson-Norheim, Elvar. 1986. “Kruskal-Wallis Test: BASIC Computer Program to Perform
Nonparametric One-Way Analysis of Variance and Multiple Comparisons on Ranks of Several
Independent Samples.” Computer Methods and Programs in Biomedicine 23 (1):57–62.
https://doi.org/10.1016/0169-2607(86)90081-7.
Tijani, Jimoh O., Ojo O. Fatoba, Omotola O. Babajide, and Leslie F. Petrik. 2015. “Pharmaceuticals,
Endocrine Disruptors, Personal Care Products, Nanomaterials and Perfluorinated Pollutants: A
Review.” Environmental Chemistry Letters 14 (1):27–49. https://doi.org/10.1007/s10311-015-
0537-z.
US EPA, OW. 2015. “National Primary Drinking Water Regulations.” Overviews and Factsheets. US
EPA. November 30, 2015. https://www.epa.gov/ground-water-and-drinking-water/national-
primary-drinking-water-regulations.
Vandenberg, Laura N. 2011. “Exposure to Bisphenol A in Canada: Invoking the Precautionary Principle.”
CMAJ : Canadian Medical Association Journal 183 (11):1265–70.
https://doi.org/10.1503/cmaj.101408.
Vazquez, Marcela, Rey Gutiérrez, Arturo Escobar, Juan G Rivera, and Salvador Vega. 2017. “Presencia
de ftalatos en agua embotellada comercializada en la ciudad de México y su migración durante el
almacenamiento a diferentes temperaturas.” Tecnología y Ciencias del Agua,.
Wagner, Martin, and Jörg Oehlmann. 2011. “Endocrine Disruptors in Bottled Mineral Water: Estrogenic
Activity in the E-Screen.” The Journal of Steroid Biochemistry and Molecular Biology, Endocrine
Disruptors, 127 (1–2):128–35. https://doi.org/10.1016/j.jsbmb.2010.10.007.
Walia, Anish Singh. 2017. “Random Forests in R.” 2017. https://datascienceplus.com/random-forests-in-
r/.
Whitley, Elise, and Jonathan Ball. 2002. “Statistics Review 6: Nonparametric Methods.” Critical Care 6
(6):509–13.
Yanina G. Muñoz Reyes. 2015. “Influencia Del pH En La Absorción de Los Fármacos.” Ciencias.
https://es.slideshare.net/Yaninin/influencia-del-ph-en-la-absorcin-de-los-frmacos.
94
ANEXOS
95
ANEXO A. Código diseño experimental en R.
rm(list=ls(all=TRUE))
library(agricolae)
trt=c(1:8)
k=4
res=design.bib(trt,k)
write.csv(res$book,"resultado.csv",row.names=FALSE)
muestras=res$statistics$treatmeans*res$statistics$r
muestras
ANEXO B. Cromatógrafo de Gases GC _MS 2010 Shimadzu (sistema GC-MS)
Fuente. Elaboración propia
96
ANEXO C. Cartuchos de silica C18 hiperSept.
Fuente. Elaboración propia
97
ANEXO D. Filtros de celulosa 0,45um.
Fuente. https://es.aliexpress.com/w/wholesale-cellulose-membrane.html
ANEXO E. Vial de 1 mL.
Fuente. Elaboración propia
.
98
ANEXO F. Retención de minerales (A) y retención de disruptores endocrinos (B)
Fuente. Esta investigación 2017.
ANEXO G. Certificado de análisis del patrón de mezcla de esteres y ftalatos (ver carpeta de
ANEXOS).
ANEXO H. Carpeta que contiene archivos txt de ftalatos arrojados del análisis
cromatográfico (ver carpeta de ANEXOS).
99
ANEXO H.1. Cromatograma estándar de patrón de ftalatos y esteres.
Fuente. (RESTEK CORPORATION 2016a)
100
ANEXO I. Cromatograma de patrón de ftalatos y esteres.
Fuente. Elaboración propia.
101
ANEXO J. Carpeta que contiene archivos txt de ftalatos arrojados del análisis
cromatográfico (ver carpeta de ANEXOS)
ANEXO K. Ficha de datos de seguridad de mezcla de esteroides y farmacéuticos (ver carpeta
de ANEXOS)
ANEXO L. Certificado de análisis del patrón de mezcla de esteroides y farmacéuticos (ver
carpeta de ANEXOS)
102
ANEXO L.1. Cromatograma general de mezcla de esteroides y mezcla de farmacéuticos
Fuente.(RESTEK CORPORATION 2016).
103
ANEXO M. Ficha de datos de seguridad de mezcla de farmacéuticos 1 (ver carpeta de ANEXOS)
ANEXO N. Certificado de análisis del patrón de mezcla de hormonas y farmacéuticos (ver carpeta de ANEXOS)
ANEXO N.1. Cromatograma general de mezcla de farmacéuticos 1.
Fuente. (RESTEK CORPORATION 2016b).
104
ANEXO O. Ficha de datos de seguridad de mezcla de farmacéuticos 2 (ver carpeta de ANEXOS)
ANEXO P. Certificado de análisis del patrón de mezcla de farmacéuticos 2 (ver carpeta de ANEXOS)
ANEXO P.1. Cromatograma general de mezcla de farmacéuticos 2.
Fuente. (RESTEK CORPORATION 2016c).
105
ANEXO Q. Cromatograma específico de mezcla de farmacéuticos final.
Fuente. Elaboración propia.
106
ANEXO R. Carpeta que contiene archivos txt de farmacéuticos arrojados del análisis
cromatográfico (ver carpeta de ANEXOS)
ANEXO S. Matriz total de compuestos en Excel (ver carpeta de ANEXOS)
ANEXO T. Código de análisis de componentes principales (PCA) en R.
rm(list=ls(all=TRUE)) M=read.table("datos.txt",header=TRUE) attach(M) plot(M[,5:20],pch=20) library(ade4) Mpca<-dudi.pca(M[,5:dim(M)[2]]) pve <- 100 * Mpca$eig /sum(Mpca$eig) cumsum(pve) wth=3*580 hth=wth/2^(.5) tiff(filename="A-figura1.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #fig1 s.label(Mpca$li, xax = 1, yax = 2) dev.off() wth=3*580 hth=wth/2^(.5) tiff(filename="B-CLUSTERS.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #fig2 - separacion por clusters cl <- kmeans(M[,5:20], 4) s.class(dfxy=Mpca$li, fac= as.factor(cl$cluster), col=names(table(cl$cluster)),xax=1,yax=2) cluster=cbind(M[,1:4], cl$cluster) dev.off() wth=3*580
107
hth=wth/2^(.5) tiff(filename="C-ENVASE.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #fig3 - separacion por envase s.class(dfxy=Mpca$li, fac= as.factor(ENVASE), col=c(1:length(ENVASE)),xax=1,yax=2) dev.off() wth=3*580 hth=wth/2^(.5) tiff(filename="D-ORIGEN.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #fig4 - separacion por origen s.class(dfxy=Mpca$li, fac= as.factor(ORIGEN), col=c(1:length(ORIGEN)),xax=1,yax=2) dev.off() wth=3*580 hth=wth/2^(.5) tiff(filename="E-GAS.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #fig5 - separacion por gas s.class(dfxy=Mpca$li, fac= as.factor(GAS), col=c(1:length(GAS)),xax=1,yax=2) dev.off() wth=3*580 hth=wth/2^(.5) tiff(filename="F-VARIABLES.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #fig6 - analisis de variables s.corcircle(Mpca$co, xax = 1, yax = 2) dev.off() wth=3*580 hth=wth/2^(.5) tiff(filename="G-MUESTRASYVARIABLES.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #fig7 - muestras y variables scatter(Mpca) dev.off()
108
ANEXO U. Código en R para análisis de Outliers.
rm(list=ls(all=TRUE)) library(mvoutlier) M=read.table("datos.txt",header=TRUE) attach(M) Y=M[,5:20] Y2=cbind(Y[,c(7:14,16)]) x.out=pcout(Y2,makeplot=FALSE,explvar =.75) out1=x.out$wfinal01 table(out1) outpropio=matrix(1,174,1) outpropio[which(x.out$x.dist1>100)]=0, table(outpropio) outpropio=matrix(1,174,1) outpropio[which(x.out$x.dist1>75)]=0, table(outpropio) outpropio=matrix(1,174,1) outpropio[which(x.out$x.dist1>50)]=0, table(outpropio) outpropio=matrix(1,174,1) outpropio[which(x.out$x.dist1>10)]=0, table(outpropio) ANEXO V. Código de análisis de correspondencia múltiple (MCA) en R.
rm(list=ls(all=TRUE)) M=read.table("datos.txt",header=TRUE) attach(M) #transforma a factores METf=MET METf[which(MET<=0)]="1-NO-DETECTADO" METf[which(MET>=7000)]="3-ALTO" METf[which(MET<7000 & MET>0)]="2-BAJO" ETIf=ETI ETIf[which(ETI<=0)]="1-NO-DETECTADO" ETIf[which(ETI>=5600)]="3-ALTO" ETIf[which(ETI<5600 & ETI>0)]="2-BAJO"
109
ISOf=ISO ISOf[which(ISO<=0)]="1-NO-DETECTADO" ISOf[which(ISO>=700)]="3-ALTO" ISOf[which(ISO<700 & ISO>0)]="2-BAJO" BUTf=BUT BUTf[which(BUT<=0)]="1-NO-DETECTADO" BUTf[which(BUT>=700)]="3-ALTO" BUTf[which(BUT<700 & BUT>0)]="2-BAJO" BISf=BIS BISf[which(BIS<=0)]="1-NO-DETECTADO" BISf[which(BIS>=0)]="3-ALTO" BISf[which(BIS<0 & BIS>0)]="2-BAJO" OCTf=OCT OCTf[which(OCT<=0)]="1-NO-DETECTADO" OCTf[which(OCT>=280)]="3-ALTO" OCTf[which(OCT<280 & OCT>0)]="2-BAJO" TERf=TER TERf[which(TER<=0)]="1-NO-DETECTADO" TERf[which(TER>=1190)]="3-ALTO" TERf[which(TER<1190 & TER>0)]="2-BAJO" ACEf=ACE ACEf[which(ACE<=0)]="1-NO-DETECTADO" ACEf[which(ACE>=304377.826)]="3-ALTO" ACEf[which(ACE<304377.826 & ACE>0)]="2-BAJO" CAFf=CAF CAFf[which(CAF<=0)]="1-NO-DETECTADO" CAFf[which(CAF>=21000)]="3-ALTO" CAFf[which(CAF<21000 & CAF>0)]="2-BAJO" FLUf=FLU FLUf[which(FLU<=0)]="1-NO-DETECTADO" FLUf[which(FLU>=58100)]="3-ALTO" FLUf[which(FLU<58100 & FLU>0)]="2-BAJO" GEMf=GEM GEMf[which(GEM<=0)]="1-NO-DETECTADO" GEMf[which(GEM>=91301)]="3-ALTO" GEMf[which(GEM<91301 & GEM>0)]="2-BAJO" TRIf=TRI
110
TRIf[which(TRI<=0)]="1-NO-DETECTADO" TRIf[which(TRI>=42000000)]="3-ALTO" TRIf[which(TRI<42000000 & TRI>0)]="2-BAJO" BISAf=BISA BISAf[which(BISA<=0)]="1-NO-DETECTADO" BISAf[which(BISA>=35)]="3-ALTO" BISAf[which(BISA<35 & BISA>0)]="2-BAJO" PRIf=PRI PRIf[which(PRI<=0)]="1-NO-DETECTADO" PRIf[which(PRI>=114128)]="3-ALTO" PRIf[which(PRI<114128 & PRI>0)]="2-BAJO" CARf=CAR CARf[which(CAR<=0)]="1-NO-DETECTADO" CARf[which(CAR>=105000)]="3-ALTO" CARf[which(CAR<105000 & CAR>0)]="2-BAJO" PROf=PRO PROf[which(PRO<=0)]="1-NO-DETECTADO" PROf[which(PRO>=15218)]="3-ALTO" PROf[which(PRO<15218 & PRO>0)]="2-BAJO" Mf=cbind(as.character(ENVASE),as.character(ORIGEN),as.character(GAS),METf,ETIf,ISOf,BUTf,BISf,OCTf,TERf,ACEf,CAFf,FLUf,GEMf,TRIf,BISAf,PRIf,CARf,PROf) colnames(Mf)=c(names(M[,2:4]),names(M[,5:length(names(M))])) Mf=as.data.frame(Mf) library(ade4) library(adegraphics) Macm<-dudi.acm(Mf) pve <- 100 * Macm$eig /sum(Macm$eig) cumsum(pve) wth=3*580 hth=wth/2^(.5) tiff(filename="boxplot.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #boxplot g1 <- s1d.boxplot(dudi.acm(Mf, scan = FALSE)$li[, 1],Mf) dev.off()
111
wth=3*580 hth=wth/2^(.5) tiff(filename="A-Observaciones.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #fig1 - observaciones s.label(Macm$li, xax = 1, yax = 2) dev.off() wth=3*580 hth=wth/2^(.5) tiff(filename="B-clusters.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #fig2 - observaciones+clusters cl <- kmeans(M[,5:20],2) s.class(dfxy=Macm$li, fac= as.factor(cl$cluster), col=c(1:max(cl$cluster)),xax=1,yax=2) dev.off() wth=3*580 hth=wth/2^(.5) tiff(filename="C-MCa.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) par(mar=c(5,5,1,1)) #fig3 - scatter scatter(Macm) dev.off() ANEXO W. Código Wilcoxon test
rm(list=ls(all=TRUE)) M=read.table("datos.txt",header=TRUE) attach(M) #boxplot boxplot(MET~ENVASE,ylab="MET",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") mete=pairwise.wilcox.test(MET,ENVASE,p.adjust="bonf") #boxplot boxplot(MET~ORIGEN,ylab="MET",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") meto=pairwise.wilcox.test(MET,ORIGEN,p.adjust="bonf") #boxplot
112
boxplot(MET~GAS,ylab="MET",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") metg=pairwise.wilcox.test(MET,GAS,p.adjust="bonf") #################################ETI################################# #boxplot boxplot(ETI~ENVASE,ylab="ETI",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") etie=pairwise.wilcox.test(ETI,ENVASE,p.adjust="bonf") #boxplot boxplot(ETI~ORIGEN,ylab="ETI",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") etio=pairwise.wilcox.test(ETI,ORIGEN,p.adjust="bonf") #boxplot boxplot(ETI~GAS,ylab="ETI",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") etig=pairwise.wilcox.test(ETI,GAS,p.adjust="bonf") #################################ISO################################# #boxplot boxplot(ISO~ENVASE,ylab="ISO",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") isoe=pairwise.wilcox.test(ISO,ENVASE,p.adjust="bonf") #boxplot boxplot(ISO~ORIGEN,ylab="ISO",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") isoo=pairwise.wilcox.test(ISO,ORIGEN,p.adjust="bonf") #boxplot boxplot(ISO~GAS,ylab="ISO",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") isog=pairwise.wilcox.test(ISO,GAS,p.adjust="bonf") #################################BUT################################# #boxplot boxplot(BUT~ENVASE,ylab="BUT",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") bute=pairwise.wilcox.test(BUT,ENVASE,p.adjust="bonf") #boxplot boxplot(BUT~ORIGEN,ylab="BUT",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf")
113
buto=pairwise.wilcox.test(BUT,ORIGEN,p.adjust="bonf") #boxplot boxplot(BUT~GAS,ylab="BUT",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") butg=pairwise.wilcox.test(BUT,GAS,p.adjust="bonf") #################################BIS################################# #boxplot boxplot(BIS~ENVASE,ylab="BIS",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") bise=pairwise.wilcox.test(BIS,ENVASE,p.adjust="bonf") #boxplot boxplot(BIS~ORIGEN,ylab="BIS",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") biso=pairwise.wilcox.test(BIS,ORIGEN,p.adjust="bonf") #boxplot boxplot(BIS~GAS,ylab="BIS",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") bisg=pairwise.wilcox.test(BIS,GAS,p.adjust="bonf") #################################OCT################################# #boxplot boxplot(OCT~ENVASE,ylab="OCT",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") octe=pairwise.wilcox.test(OCT,ENVASE,p.adjust="bonf") #boxplot boxplot(OCT~ORIGEN,ylab="OCT",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") octo=pairwise.wilcox.test(OCT,ORIGEN,p.adjust="bonf") #boxplot boxplot(OCT~GAS,ylab="OCT",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") octg=pairwise.wilcox.test(OCT,GAS,p.adjust="bonf") #################################TER################################# #boxplot boxplot(TER~ENVASE,ylab="TER",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") tere=pairwise.wilcox.test(TER,ENVASE,p.adjust="bonf") #boxplot
114
boxplot(TER~ORIGEN,ylab="TER",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") tero=pairwise.wilcox.test(TER,ORIGEN,p.adjust="bonf") #boxplot boxplot(TER~GAS,ylab="TER",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") terg=pairwise.wilcox.test(TER,GAS,p.adjust="bonf") #################################ACE################################# #boxplot boxplot(ACE~ENVASE,ylab="ACE",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") acee=pairwise.wilcox.test(ACE,ENVASE,p.adjust="bonf") #boxplot boxplot(ACE~ORIGEN,ylab="ACE",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") aceo=pairwise.wilcox.test(ACE,ORIGEN,p.adjust="bonf") #boxplot boxplot(ACE~GAS,ylab="ACE",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") aceg=pairwise.wilcox.test(ACE,GAS,p.adjust="bonf") #################################CAF################################# #boxplot boxplot(CAF~ENVASE,ylab="CAF",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") cafe=pairwise.wilcox.test(CAF,ENVASE,p.adjust="bonf") #boxplot boxplot(CAF~ORIGEN,ylab="CAF",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") cafo=pairwise.wilcox.test(CAF,ORIGEN,p.adjust="bonf") #boxplot boxplot(CAF~GAS,ylab="CAF",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") cafg=pairwise.wilcox.test(CAF,GAS,p.adjust="bonf") #################################FLU################################# #boxplot boxplot(FLU~ENVASE,ylab="FLU",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") flue=pairwise.wilcox.test(FLU,ENVASE,p.adjust="bonf")
115
#boxplot boxplot(FLU~ORIGEN,ylab="FLU",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") fluo=pairwise.wilcox.test(FLU,ORIGEN,p.adjust="bonf") #boxplot boxplot(FLU~GAS,ylab="FLU",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") flug=pairwise.wilcox.test(FLU,GAS,p.adjust="bonf") #################################GEM################################# #boxplot boxplot(GEM~ENVASE,ylab="GEM",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") geme=pairwise.wilcox.test(GEM,ENVASE,p.adjust="bonf") #boxplot boxplot(GEM~ORIGEN,ylab="GEM",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") gemo=pairwise.wilcox.test(GEM,ORIGEN,p.adjust="bonf") #boxplot boxplot(GEM~GAS,ylab="GEM",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") gemg=pairwise.wilcox.test(GEM,GAS,p.adjust="bonf") #################################TRI################################# #boxplot boxplot(TRI~ENVASE,ylab="TRI",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") trie=pairwise.wilcox.test(TRI,ENVASE,p.adjust="bonf") #boxplot boxplot(TRI~ORIGEN,ylab="TRI",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") trio=pairwise.wilcox.test(TRI,ORIGEN,p.adjust="bonf") #boxplot boxplot(TRI~GAS,ylab="TRI",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") trig=pairwise.wilcox.test(TRI,GAS,p.adjust="bonf") #################################BISA################################# #boxplot boxplot(BISA~ENVASE,ylab="BISA",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf")
116
bpae=pairwise.wilcox.test(BISA,ENVASE,p.adjust="bonf") #boxplot boxplot(BISA~ORIGEN,ylab="BISA",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") bpao=pairwise.wilcox.test(BISA,ORIGEN,p.adjust="bonf") #boxplot boxplot(BISA~GAS,ylab="BISA",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") bpag=pairwise.wilcox.test(BISA,GAS,p.adjust="bonf") #################################PRI################################# #boxplot boxplot(PRI~ENVASE,ylab="PRI",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") prie=pairwise.wilcox.test(PRI,ENVASE,p.adjust="bonf") #boxplot boxplot(PRI~ORIGEN,ylab="PRI",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") prio=pairwise.wilcox.test(PRI,ORIGEN,p.adjust="bonf") #boxplot boxplot(PRI~GAS,ylab="PRI",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") prig=pairwise.wilcox.test(PRI,GAS,p.adjust="bonf") #################################CAR################################# #boxplotCAR boxplot(CAR~ENVASE,ylab="CAR",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") care=pairwise.wilcox.test(CAR,ENVASE,p.adjust="bonf") #boxplotCAR boxplot(CAR~ORIGEN,ylab="CAR",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") caro=pairwise.wilcox.test(CAR,ORIGEN,p.adjust="bonf") #boxplotCAR boxplot(CAR~GAS,ylab="CAR",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") carg=pairwise.wilcox.test(CAR,GAS,p.adjust="bonf") #################################PRO#################################
117
#boxplot boxplot(PRO~ENVASE,ylab="PRO",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") proe=pairwise.wilcox.test(PRO,ENVASE,p.adjust="bonf") boxplot(PRO~ORIGEN,ylab="PRO",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") proo=pairwise.wilcox.test(PRO,ORIGEN,p.adjust="bonf") boxplot(PRO~GAS,ylab="PRO",xlab="",outline=FALSE) #pairwise.t.test(ST,LUGAR,p.adjust="bonf") prog=pairwise.wilcox.test(PRO,GAS,p.adjust="bonf") N=rbind(mete$p.value,etie$p.value,isoe$p.value,bute$p.value,bise$p.value, octe$p.value,tere$p.value,acee$p.value,cafe$p.value,flue$p.value, geme$p.value,trie$p.value,bpae$p.value,prie$p.value,care$p.value, proe$p.value) N1=rbind(meto$p.value,etio$p.value,isoo$p.value,buto$p.value,biso$p.value, octo$p.value,tero$p.value,aceo$p.value,cafo$p.value,fluo$p.value, gemo$p.value,trio$p.value,bpao$p.value,prio$p.value,caro$p.value, proo$p.value) N2=rbind(metg$p.value,etig$p.value,isog$p.value,butg$p.value,bisg$p.value, octg$p.value,terg$p.value,aceg$p.value,cafg$p.value,flug$p.value, gemg$p.value,trig$p.value,bpag$p.value,prig$p.value,carg$p.value, prog$p.value) NT=cbind(N,N1,N2) NTT<- as.data.frame(NT)
118
ANEXO X. Código Kruskall Wallis y Kruskall wallis Multivariado en R.
rm(list=ls(all=TRUE)) M=read.table("datos.txt",header=TRUE) M <- M[M$ENVASE=="B",] M <- M[,-c(10)]#PORQUE OCT SOLO TIENE 0 attach(M) ###################MET################################ bt2=bartlett.test(MET,ORIGEN) bt3=bartlett.test(MET,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(MET,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(MET,ORIGEN,shapiro.test) sh3=by(MET,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh anova=anova(lm(MET~ORIGEN+GAS)) #se puede utilizar aov print(anova) kruskal1=kruskal.test(MET~ORIGEN) kruskal2=kruskal.test(MET~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################ETI################################ bt2=bartlett.test(ETI,ORIGEN) bt3=bartlett.test(ETI,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(ETI,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(ETI,ORIGEN,shapiro.test) sh3=by(ETI,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh
119
anova=anova(lm(ETI~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(ETI~ORIGEN) kruskal2=kruskal.test(ETI~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################ISO################################ bt2=bartlett.test(ISO,ORIGEN) bt3=bartlett.test(ISO,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(ISO,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(ISO,ORIGEN,shapiro.test) sh3=by(ISO,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh anova=anova(lm(ISO~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(ISO~ORIGEN) kruskal2=kruskal.test(ISO~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ##################BUT################################ bt2=bartlett.test(BUT,ORIGEN) bt3=bartlett.test(BUT,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(BUT,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(BUT,ORIGEN,shapiro.test) sh3=by(BUT,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh
120
anova=anova(lm(BUT~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(BUT~ORIGEN) kruskal2=kruskal.test(BUT~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################BIS################################ bt2=bartlett.test(BIS,ORIGEN) bt3=bartlett.test(BIS,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(BIS,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(BIS,ORIGEN,shapiro.test) sh3=by(BIS,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh anova=anova(lm(BIS~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(BIS~ORIGEN) kruskal2=kruskal.test(BIS~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################TER################################ bt2=bartlett.test(TER,ORIGEN) bt3=bartlett.test(TER,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(TER,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(TER,ORIGEN,shapiro.test) sh3=by(TER,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB)
121
sh anova=anova(lm(TER~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(TER~ORIGEN) kruskal2=kruskal.test(TER~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################ACE################################ bt2=bartlett.test(ACE,ORIGEN) bt3=bartlett.test(ACE,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(ACE,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(ACE,ORIGEN,shapiro.test) sh3=by(ACE,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh anova=anova(lm(ACE~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(ACE~ORIGEN) kruskal2=kruskal.test(ACE~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################CAF################################ bt2=bartlett.test(CAF,ORIGEN) bt3=bartlett.test(CAF,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(CAF,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(CAF,ORIGEN,shapiro.test) sh3=by(CAF,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB)
122
sh anova=anova(lm(CAF~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(CAF~ORIGEN) kruskal2=kruskal.test(CAF~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################FLU################################ bt2=bartlett.test(FLU,ORIGEN) bt3=bartlett.test(FLU,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(FLU,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(FLU,ORIGEN,shapiro.test) sh3=by(FLU,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh anova=anova(lm(FLU~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(FLU~ORIGEN) kruskal2=kruskal.test(FLU~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################GEM################################ bt2=bartlett.test(GEM,ORIGEN) bt3=bartlett.test(GEM,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(GEM,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(GEM,ORIGEN,shapiro.test) sh3=by(GEM,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh
123
anova=anova(lm(GEM~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(GEM~ORIGEN) kruskal2=kruskal.test(GEM~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################TRI################################ bt2=bartlett.test(TRI,ORIGEN) bt3=bartlett.test(TRI,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(TRI,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(TRI,ORIGEN,shapiro.test) sh3=by(TRI,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh anova=anova(lm(TRI~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(TRI~ORIGEN) kruskal2=kruskal.test(TRI~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################BISA################################ bt2=bartlett.test(BISA,ORIGEN) bt3=bartlett.test(BISA,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(BISA,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(BISA,ORIGEN,shapiro.test) sh3=by(BISA,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB)
124
sh anova=anova(lm(BISA~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(BISA~ORIGEN) kruskal2=kruskal.test(BISA~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################PRI################################ bt2=bartlett.test(PRI,ORIGEN) bt3=bartlett.test(PRI,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(PRI,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(PRI,ORIGEN,shapiro.test) sh3=by(PRI,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh anova=anova(lm(PRI~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(PRI~ORIGEN) kruskal2=kruskal.test(PRI~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################CAR################################ bt2=bartlett.test(CAR,ORIGEN) bt3=bartlett.test(CAR,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(CAR,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(CAR,ORIGEN,shapiro.test) sh3=by(CAR,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB)
125
sh anova=anova(lm(CAR~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(CAR~ORIGEN) kruskal2=kruskal.test(CAR~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) ###################PRO################################ bt2=bartlett.test(PRO,ORIGEN) bt3=bartlett.test(PRO,GAS) bt=cbind(bt2$p.value,bt3$p.value) bt sh1=by(PRO,ENVASE,shapiro.test) #si p-value<0.05 => no normalidad sh2=by(PRO,ORIGEN,shapiro.test) sh3=by(PRO,GAS,shapiro.test) shA=cbind(sh1$A$p.value,sh2$A$p.value,sh3$A$p.value) shB=cbind(sh1$B$p.value,sh2$B$p.value,sh3$B$p.value) sh=cbind(shA,shB) sh anova=anova(lm(PRO~ORIGEN+GAS)) #se puede utilizar aov #se puede utilizar aov print(anova) kruskal1=kruskal.test(PRO~ORIGEN) kruskal2=kruskal.test(PRO~GAS) krus=cbind(kruskal1$p.value,kruskal2$p.value) print(krus) #MULTIANOVA todos los compuestos Y=as.matrix(M[,5:19]) manova=manova(Y~GAS+ORIGEN) summary(manova) #MULTIANOVA plastificantes YP=as.matrix(cbind(M[,5:9],M[16])) manova=manova(YP~GAS+ORIGEN) summary(manova) #MULTIANOVA farmaceuticos y hormonas
126
YF=as.matrix(cbind(M[,10:15],M[17:19])) manova=manova(YF~GAS+ORIGEN) summary(manova) #KRUSKAL-WALLIS MULTIVARIADO library(ade4) pcaY=dudi.pca(Y,scannf=FALSE,nf=dim(Y)[2]) kruskalM1=randtest(discrimin(pcaY, factor(ORIGEN),scannf=FALSE,nf=dim(Y)[2]),nrep=9999) kruskalM1 kruskalM2=randtest(discrimin(pcaY, factor(GAS),scannf=FALSE,nf=dim(Y)[2]),nrep=9999) kruskalM2 #KRUSKAL-WALLIS MULTIVARIADO PLASTIFICANTES library(ade4) pcaYP=dudi.pca(YP,scannf=FALSE,nf=dim(YP)[2]) kruskalM1=randtest(discrimin(pcaYP, factor(ORIGEN),scannf=FALSE,nf=dim(YP)[2]),nrep=9999) kruskalM1 kruskalM2=randtest(discrimin(pcaYP, factor(GAS),scannf=FALSE,nf=dim(YP)[2]),nrep=9999) kruskalM2 #KRUSKAL-WALLIS MULTIVARIADO FARMACEUTICOS Y HORMONAS library(ade4) pcaYF=dudi.pca(YF,scannf=FALSE,nf=dim(YF)[2]) kruskalM1=randtest(discrimin(pcaYF, factor(ORIGEN),scannf=FALSE,nf=dim(YF)[2]),nrep=9999) kruskalM1 kruskalM2=randtest(discrimin(pcaYF, factor(GAS),scannf=FALSE,nf=dim(YF)[2]),nrep=9999) kruskalM2
127
ANEXO Y. Código información mutua promedio (AMI) en R
rm(list=ls(all=TRUE)) M=read.table("datos.txt",header=TRUE) attach(M) #M <- M[-c(1,2,3,4)] #transforma a factores #cuando tengo condiciones iguales puedo aplicar un ciclo i=5 Mf=matrix(data=NA,nrow=174,ncol=1) while (i<=length(names(M))) { f=M[,i] f[which(M[,i] <= 0)]="No detectado" f[which(M[,i] > 0)]="detectado" Mf=cbind(Mf,f) i=i+1 } Mf=as.data.frame(Mf) Mf <- Mf[-c(1)] colnames(Mf)=names(M[,5:length(names(M))]) Mf=cbind(M[2:4],Mf) Mf=as.data.frame(Mf) attach(Mf) ##FACTORES METC=as.factor(MET) ETIC=as.factor(ETI) ISOC=as.factor(ISO) BUTC=as.factor(BUT) BISC=as.factor(BIS) OCTC=as.factor(OCT) TERC=as.factor(TER) ACEC=as.factor(ACE) CAFC=as.factor(CAF) FLUC=as.factor(FLU) GEMC=as.factor(GEM) TRIC=as.factor(TRI) BISAC=as.factor(BISA) PRIC=as.factor(PRI) CARC=as.factor(CAR) PROC=as.factor(PRO)
128
ENVC=as.factor(ENVASE) ORIC=as.factor(ORIGEN) GASC=as.factor(GAS) #############probabilidades###################### P10=length(which(METC=="No detectado"))/dim(M)[1] P11=length(which(METC=="detectado"))/dim(M)[1] E1=-((P10*log2(P10))+(P11*log2(P11)))# Entropia P20=length(which(ETIC=="No detectado"))/dim(M)[1] P21=length(which(ETIC=="detectado"))/dim(M)[1] E2=-((P20*log2(P20))+(P21*log2(P21)))# Entropia P30=length(which(ISOC=="No detectado"))/dim(M)[1] P31=length(which(ISOC=="detectado"))/dim(M)[1] E3=-((P30*log2(P30))+(P31*log2(P31)))# Entropia P40=length(which(BUTC=="No detectado"))/dim(M)[1] P41=length(which(BUTC=="detectado"))/dim(M)[1] E4=-((P40*log2(P40))+(P41*log2(P41)))# Entropia P50=length(which(BISC=="No detectado"))/dim(M)[1] P51=length(which(BISC=="detectado"))/dim(M)[1] E5=-((P50*log2(P50))+(P51*log2(P51)))# Entropia P60=length(which(OCTC=="No detectado"))/dim(M)[1] P61=length(which(OCTC=="detectado"))/dim(M)[1] E6=-((P60*log2(P60))+(P61*log2(P61)))# Entropia P70=length(which(TERC=="No detectado"))/dim(M)[1] P71=length(which(TERC=="detectado"))/dim(M)[1] E7=-((P70*log2(P70))+(P71*log2(P71)))# Entropia P80=length(which(ACEC=="No detectado"))/dim(M)[1] P81=length(which(ACEC=="detectado"))/dim(M)[1] E8=-((P80*log2(P80))+(P81*log2(P81)))# Entropia P90=length(which(CAFC=="No detectado"))/dim(M)[1] P91=length(which(CAFC=="detectado"))/dim(M)[1] E9=-((P90*log2(P90))+(P91*log2(P91)))# Entropia P100=length(which(FLUC=="No detectado"))/dim(M)[1] P101=length(which(FLUC=="detectado"))/dim(M)[1] E10=-((P100*log2(P100))+(P101*log2(P101)))# Entropia P110=length(which(GEMC=="No detectado"))/dim(M)[1] P111=length(which(GEMC=="detectado"))/dim(M)[1]
129
E11=-((P110*log2(P110))+(P111*log2(P111)))# Entropia P120=length(which(TRIC=="No detectado"))/dim(M)[1] P121=length(which(TRIC=="detectado"))/dim(M)[1] E12=-((P120*log2(P120))+(P121*log2(P121)))# Entropia P130=length(which(BISAC=="No detectado"))/dim(M)[1] P131=length(which(BISAC=="detectado"))/dim(M)[1] E13=-((P130*log2(P130))+(P131*log2(P131)))# Entropia P140=length(which(PRIC=="No detectado"))/dim(M)[1] P141=length(which(PRIC=="detectado"))/dim(M)[1] E14=-((P140*log2(P140))+(P141*log2(P141)))# Entropia P150=length(which(CARC=="No detectado"))/dim(M)[1] P151=length(which(CARC=="detectado"))/dim(M)[1] E15=-((P150*log2(P150))+(P151*log2(P151)))# Entropia P160=length(which(PROC=="No detectado"))/dim(M)[1] P161=length(which(PROC=="detectado"))/dim(M)[1] E16=-((P160*log2(P160))+(P161*log2(P161)))# Entropia ################FACTORES######################## PEA=length(which(ENVC=="A"))/dim(M)[1] PEB=length(which(ENVC=="B"))/dim(M)[1] EEA=-((PEA*log2(PEA))) EEB=-((PEB*log2(PEB))) EE=-((PEA*log2(PEA))+(PEB*log2(PEB)))# Entropia POA=length(which(ORIC=="A"))/dim(M)[1] POB=length(which(ORIC=="B"))/dim(M)[1] EOA=-((POA*log2(POA))) EOB=-((POB*log2(POB))) EO=-((POA*log2(POA))+(POB*log2(POB)))# Entropia PGA=length(which(GASC=="A"))/dim(M)[1] PGB=length(which(GASC=="B"))/dim(M)[1] EGA=-((PGA*log2(PGA))) EGB=-((PGB*log2(PGB))) EG=-((PGA*log2(PGA))+(PGB*log2(PGB)))# Entropia #Entropia Conjunta envasse···············································
130
###Entropia conjunta ENVASE CON MET #COM1_ENV-MET=A-no detectado Penv_met1=(length(which(ENVC=="A"& METC=="No detectado")))/ dim(M)[1] #COM2_ENV-MET=A-detectado Penv_met2=(length(which(ENVC=="A"& METC=="detectado")))/ dim(M)[1] #COM3_ENV-MET= B- no detectado Penv_met3=(length(which(ENVC=="B"& METC=="No detectado")))/ dim(M)[1] #COM4_ENV-MET= B-detectado Penv_met4=(length(which(ENVC=="B"& METC=="detectado")))/ dim(M)[1] E_ENVA_MET=-(Penv_met1*log2(Penv_met1)+Penv_met2*log2(Penv_met2)) E_ENVB_MET=-(Penv_met3*log2(Penv_met3)+Penv_met4*log2(Penv_met4)) E_ENV_MET=-(Penv_met1*log2(Penv_met1)+Penv_met2*log2(Penv_met2)+Penv_met3*log2(Penv_met3)+Penv_met4*log2(Penv_met4)) ###Entropia conjunta ENVASE CON ETI #COM1_ENV-ETI=A-no detectado Penv_eti1=(length(which(ENVC=="A"& ETIC=="No detectado")))/ dim(M)[1] #COM2_ENV-ETI=A-detectado Penv_eti2=(length(which(ENVC=="A"& ETIC=="detectado")))/ dim(M)[1] #COM3_ENV-ETI= B- no detectado Penv_eti3=(length(which(ENVC=="B"& ETIC=="No detectado")))/ dim(M)[1] #COM4_ENV-ETI= B-detectado Penv_eti4=(length(which(ENVC=="B"& ETIC=="detectado")))/ dim(M)[1] E_ENVA_ETI=-(Penv_eti1*log2(Penv_eti1)+Penv_eti2*log2(Penv_eti2)) E_ENVB_ETI=-(Penv_eti3*log2(Penv_eti3)+Penv_eti4*log2(Penv_eti4)) E_ENV_ETI=-(Penv_eti1*log2(Penv_eti1)+Penv_eti2*log2(Penv_eti2)+Penv_eti3*log2(Penv_eti3)+Penv_eti4*log2(Penv_eti4)) ###Entropia conjunta ENVASE CON ISO #COM1_ENV-ISO=A-no detectado Penv_iso1=(length(which(ENVC=="A"& ISOC=="No detectado")))/ dim(M)[1]
131
#COM2_ENV-ISO=A-detectado Penv_iso2=(length(which(ENVC=="A"& ISOC=="detectado")))/ dim(M)[1] #COM3_ENV-ISO= B- no detectado Penv_iso3=(length(which(ENVC=="B"& ISOC=="No detectado")))/ dim(M)[1] #COM4_ENV-ISO= B-detectado Penv_iso4=(length(which(ENVC=="B"& ISOC=="detectado")))/ dim(M)[1] E_ENVA_ISO=-(Penv_iso1*log2(Penv_iso1)+Penv_iso2*log2(Penv_iso2)) E_ENVB_ISO=-(Penv_iso3*log2(Penv_iso3)+Penv_iso4*log2(Penv_iso4)) E_ENV_ISO=-(Penv_iso1*log2(Penv_iso1)+Penv_iso2*log2(Penv_iso2)+Penv_iso3*log2(Penv_iso3)+Penv_iso4*log2(Penv_iso4)) ###Entropia conjunta ENVASE CON BUT #COM1_ENV-BUT=A-no detectado Penv_but1=(length(which(ENVC=="A"& BUTC=="No detectado")))/ dim(M)[1] #COM2_ENV-BUT=A-detectado Penv_but2=(length(which(ENVC=="A"& BUTC=="detectado")))/ dim(M)[1] #COM3_ENV-BUT= B- no detectado Penv_but3=(length(which(ENVC=="B"& BUTC=="No detectado")))/ dim(M)[1] #COM4_ENV-BUT= B-detectado Penv_but4=(length(which(ENVC=="B"& BUTC=="detectado")))/ dim(M)[1] E_ENVA_BUT=-(Penv_but1*log2(Penv_but1)+Penv_but2*log2(Penv_but2)) E_ENVB_BUT=-(Penv_but3*log2(Penv_but3)+Penv_but4*log2(Penv_but4)) E_ENV_BUT=-(Penv_but1*log2(Penv_but1)+Penv_but2*log2(Penv_but2)+Penv_but3*log2(Penv_but3)+Penv_but4*log2(Penv_but4)) ###Entropia conjunta ENVASE CON DEPH #COM1_ENV-DEPH=A-no detectado Penv_deph1=(length(which(ENVC=="A"& BISC=="No detectado")))/ dim(M)[1] #COM2_ENV-DEPH=A-detectado Penv_deph2=(length(which(ENVC=="A"& BISC=="detectado")))/ dim(M)[1] #COM3_ENV-DEPH= B- no detectado Penv_deph3=(length(which(ENVC=="B"& BISC=="No detectado")))/ dim(M)[1]
132
#COM4_ENV-DEPH= B-detectado Penv_deph4=(length(which(ENVC=="B"& BISC=="detectado")))/ dim(M)[1] E_ENVA_DEPH=-(Penv_deph1*log2(Penv_deph1)+Penv_deph2*log2(Penv_deph2)) E_ENVB_DEPH=-(Penv_deph3*log2(Penv_deph3)+Penv_deph4*log2(Penv_deph4)) E_ENV_DEPH=-(Penv_deph1*log2(Penv_deph1)+Penv_deph2*log2(Penv_deph2)+Penv_deph3*log2(Penv_deph3)+Penv_deph4*log2(Penv_deph4)) ###Entropia conjunta ENVASE CON OCT #COM1_ENV-OCT=A-no detectado Penv_oct1=(length(which(ENVC=="A"& OCTC=="No detectado")))/ dim(M)[1] #COM2_ENV-OCT=A-detectado Penv_oct2=(length(which(ENVC=="A"& OCTC=="detectado")))/ dim(M)[1] #COM3_ENV-OCT= B- no detectado Penv_oct3=(length(which(ENVC=="B"& OCTC=="No detectado")))/ dim(M)[1] #COM4_ENV-OCT= B-detectado Penv_oct4=(length(which(ENVC=="B"& OCTC=="detectado")))/ dim(M)[1] E_ENVA_OCT=-(Penv_oct1*log2(Penv_oct1)+Penv_oct2*log2(Penv_oct2)) E_ENVB_OCT=-(Penv_oct3*log2(Penv_oct3)) E_ENV_OCT=-(Penv_oct1*log2(Penv_oct1)+Penv_oct2*log2(Penv_oct2)+Penv_oct3*log2(Penv_oct3)) ###Entropia conjunta ENVASE CON TER #COM1_ENV-TER=A-no detectado Penv_ter1=(length(which(ENVC=="A"& TERC=="No detectado")))/ dim(M)[1] #COM2_ENV-TER=A-detectado Penv_ter2=(length(which(ENVC=="A"& TERC=="detectado")))/ dim(M)[1] #COM3_ENV-TER= B- no detectado Penv_ter3=(length(which(ENVC=="B"& TERC=="No detectado")))/ dim(M)[1] #COM4_ENV-TER= B-detectado Penv_ter4=(length(which(ENVC=="B"& TERC=="detectado")))/ dim(M)[1] E_ENVA_TER=-(Penv_ter1*log2(Penv_ter1)+Penv_ter2*log2(Penv_ter2)) E_ENVB_TER=-(Penv_ter3*log2(Penv_ter3)+Penv_ter4*log2(Penv_ter4))
133
E_ENV_TER=-(Penv_ter1*log2(Penv_ter1)+Penv_ter2*log2(Penv_ter2)+Penv_ter3*log2(Penv_ter3)+Penv_ter4*log2(Penv_ter4)) ###Entropia conjunta ENVASE CON ACE #COM1_ENV-ACE=A-no detectado Penv_ace1=(length(which(ENVC=="A"& ACEC=="No detectado")))/ dim(M)[1] #COM2_ENV-ACE=A-detectado Penv_ace2=(length(which(ENVC=="A"& ACEC=="detectado")))/ dim(M)[1] #COM3_ENV-ACE= B- no detectado Penv_ace3=(length(which(ENVC=="B"& ACEC=="No detectado")))/ dim(M)[1] #COM4_ENV-ACE= B-detectado Penv_ace4=(length(which(ENVC=="B"& ACEC=="detectado")))/ dim(M)[1] E_ENVA_ACE=-(Penv_ace1*log2(Penv_ace1)+Penv_ace2*log2(Penv_ace2)) E_ENVB_ACE=-(Penv_ace3*log2(Penv_ace3)+Penv_ace4*log2(Penv_ace4)) E_ENV_ACE=-(Penv_ace1*log2(Penv_ace1)+Penv_ace2*log2(Penv_ace2)+Penv_ace3*log2(Penv_ace3)+Penv_ace4*log2(Penv_ace4)) ###Entropia conjunta ENVASE CON CAF #COM1_ENV-CAF=A-no detectado Penv_caf1=(length(which(ENVC=="A"& CAFC=="No detectado")))/ dim(M)[1] #COM2_ENV-CAF=A-detectado Penv_caf2=(length(which(ENVC=="A"& CAFC=="detectado")))/ dim(M)[1] #COM3_ENV-CAF= B- no detectado Penv_caf3=(length(which(ENVC=="B"& CAFC=="No detectado")))/ dim(M)[1] #COM4_ENV-CAF= B-detectado Penv_caf4=(length(which(ENVC=="B"& CAFC=="detectado")))/ dim(M)[1] E_ENVA_CAF=-(Penv_caf1*log2(Penv_caf1)+Penv_caf2*log2(Penv_caf2)) E_ENVB_CAF=-(Penv_caf4*log2(Penv_caf4)) E_ENV_CAF=-(Penv_caf1*log2(Penv_caf1)+Penv_caf2*log2(Penv_caf2)+Penv_caf4*log2(Penv_caf4))
134
###Entropia conjunta ENVASE CON FLU #COM1_ENV-FLU=A-no detectado Penv_flu1=(length(which(ENVC=="A"& FLUC=="No detectado")))/ dim(M)[1] #COM2_ENV-FLU=A-detectado Penv_flu2=(length(which(ENVC=="A"& FLUC=="detectado")))/ dim(M)[1] #COM3_ENV-FLU= B- no detectado Penv_flu3=(length(which(ENVC=="B"& FLUC=="No detectado")))/ dim(M)[1] #COM4_ENV-FLU= B-detectado Penv_flu4=(length(which(ENVC=="B"& FLUC=="detectado")))/ dim(M)[1] E_ENVA_FLU=-(Penv_flu1*log2(Penv_flu1)+Penv_flu2*log2(Penv_flu2)) E_ENVB_FLU=-(Penv_flu3*log2(Penv_flu3)+Penv_flu4*log2(Penv_flu4)) E_ENV_FLU=-(Penv_flu1*log2(Penv_flu1)+Penv_flu2*log2(Penv_flu2)+Penv_flu3*log2(Penv_flu3)+Penv_flu4*log2(Penv_flu4)) ###Entropia conjunta ENVASE CON GEM #COM1_ENV-GEM=A-no detectado Penv_gem1=(length(which(ENVC=="A"& GEMC=="No detectado")))/ dim(M)[1] #COM2_ENV-GEM=A-detectado Penv_gem2=(length(which(ENVC=="A"& GEMC=="detectado")))/ dim(M)[1] #COM3_ENV-GEM= B- no detectado Penv_gem3=(length(which(ENVC=="B"& GEMC=="No detectado")))/ dim(M)[1] #COM4_ENV-GEM= B-detectado Penv_gem4=(length(which(ENVC=="B"& GEMC=="detectado")))/ dim(M)[1] E_ENVA_GEM=-(Penv_gem1*log2(Penv_gem1)+Penv_gem2*log2(Penv_gem2)) E_ENVB_GEM=-(Penv_gem3*log2(Penv_gem3)+Penv_gem4*log2(Penv_gem4)) E_ENV_GEM=-(Penv_gem1*log2(Penv_gem1)+Penv_gem2*log2(Penv_gem2)+Penv_gem3*log2(Penv_gem3)+Penv_gem4*log2(Penv_gem4)) ###Entropia conjunta ENVASE CON TRI
135
#COM1_ENV-TRI=A-no detectado Penv_tri1=(length(which(ENVC=="A"& TRIC=="No detectado")))/ dim(M)[1] #COM2_ENV-TRI=A-detectado Penv_tri2=(length(which(ENVC=="A"& TRIC=="detectado")))/ dim(M)[1] #COM3_ENV-TRI= B- no detectado Penv_tri3=(length(which(ENVC=="B"& TRIC=="No detectado")))/ dim(M)[1] #COM4_ENV-TRI= B-detectado Penv_tri4=(length(which(ENVC=="B"& TRIC=="detectado")))/ dim(M)[1] E_ENVA_TRI=-(Penv_tri1*log2(Penv_tri1)+Penv_tri2*log2(Penv_tri2)) E_ENVB_TRI=-(Penv_tri3*log2(Penv_tri3)+Penv_tri4*log2(Penv_tri4)) E_ENV_TRI=-(Penv_tri1*log2(Penv_tri1)+Penv_tri2*log2(Penv_tri2)+Penv_tri3*log2(Penv_tri3)+Penv_tri4*log2(Penv_tri4)) ###Entropia conjunta ENVASE CON BPA #COM1_ENV-BPA=A-no detectado Penv_bpa1=(length(which(ENVC=="A"& BISAC=="No detectado")))/ dim(M)[1] #COM2_ENV-BPA=A-detectado Penv_bpa2=(length(which(ENVC=="A"& BISAC=="detectado")))/ dim(M)[1] #COM3_ENV-BPA= B- no detectado Penv_bpa3=(length(which(ENVC=="B"& BISAC=="No detectado")))/ dim(M)[1] #COM4_ENV-BPA= B-detectado Penv_bpa4=(length(which(ENVC=="B"& BISAC=="detectado")))/ dim(M)[1] E_ENVA_BPA=-(Penv_bpa1*log2(Penv_bpa1)+Penv_bpa2*log2(Penv_bpa2)) E_ENVB_BPA=-(Penv_bpa3*log2(Penv_bpa3)+Penv_bpa4*log2(Penv_bpa4)) E_ENV_BPA=-(Penv_bpa1*log2(Penv_bpa1)+Penv_bpa2*log2(Penv_bpa2)+Penv_bpa3*log2(Penv_bpa3)+Penv_bpa4*log2(Penv_bpa4)) ###Entropia conjunta ENVASE CON PRI #COM1_ENV-PRI=A-no detectado Penv_pri1=(length(which(ENVC=="A"& PRIC=="No detectado")))/ dim(M)[1]
136
#COM2_ENV-PRI=A-detectado Penv_pri2=(length(which(ENVC=="A"& PRIC=="detectado")))/ dim(M)[1] #COM3_ENV-PRI= B- no detectado Penv_pri3=(length(which(ENVC=="B"& PRIC=="No detectado")))/ dim(M)[1] #COM4_ENV-PRI= B-detectado Penv_pri4=(length(which(ENVC=="B"& PRIC=="detectado")))/ dim(M)[1] E_ENVA_PRI=-(Penv_pri1*log2(Penv_pri1)+Penv_pri2*log2(Penv_pri2)) E_ENVB_PRI=-(Penv_pri3*log2(Penv_pri3)+Penv_pri4*log2(Penv_pri4)) E_ENV_PRI=-(Penv_pri1*log2(Penv_pri1)+Penv_pri2*log2(Penv_pri2)+Penv_pri3*log2(Penv_pri3)+Penv_pri4*log2(Penv_pri4)) ###Entropia conjunta ENVASE CON CAR #COM1_ENV-CAR=A-no detectado Penv_car1=(length(which(ENVC=="A"& CARC=="No detectado")))/ dim(M)[1] #COM2_ENV-CAR=A-detectado Penv_car2=(length(which(ENVC=="A"& CARC=="detectado")))/ dim(M)[1] #COM3_ENV-CAR= B- no detectado Penv_car3=(length(which(ENVC=="B"& CARC=="No detectado")))/ dim(M)[1] #COM4_ENV-CAR= B-detectado Penv_car4=(length(which(ENVC=="B"& CARC=="detectado")))/ dim(M)[1] E_ENVA_CAR=-(Penv_car1*log2(Penv_car1)+Penv_car2*log2(Penv_car2)) E_ENVB_CAR=-(Penv_car3*log2(Penv_car3)+Penv_car4*log2(Penv_car4)) E_ENV_CAR=-(Penv_car1*log2(Penv_car1)+Penv_car2*log2(Penv_car2)+Penv_car3*log2(Penv_car3)+Penv_car4*log2(Penv_car4)) ###Entropia conjunta ENVASE CON PRO #COM1_ENV-PRO=A-no detectado Penv_pro1=(length(which(ENVC=="A"& PROC=="No detectado")))/ dim(M)[1] #COM2_ENV-PRO=A-detectado Penv_pro2=(length(which(ENVC=="A"& PROC=="detectado")))/ dim(M)[1] #COM3_ENV-PRO= B- no detectado
137
Penv_pro3=(length(which(ENVC=="B"& PROC=="No detectado")))/ dim(M)[1] #COM4_ENV-PRO= B-detectado Penv_pro4=(length(which(ENVC=="B"& PROC=="detectado")))/ dim(M)[1] E_ENVA_PRO=-(Penv_pro1*log2(Penv_pro1)+Penv_pro2*log2(Penv_pro2)) E_ENVB_PRO=-(Penv_pro4*log2(Penv_pro4)) E_ENV_PRO=-(Penv_pro1*log2(Penv_pro1)+Penv_pro2*log2(Penv_pro2)+Penv_pro4*log2(Penv_pro4)) #Entropia Conjunta origen··············································· ###Entropia conjunta ORI CON MET #COM1_ORI-MET=A-no detectado Pori_met1=(length(which(ORIC=="A"& METC=="No detectado")))/ dim(M)[1] #COM2_ORI-MET=A-detectado Pori_met2=(length(which(ORIC=="A"& METC=="detectado")))/ dim(M)[1] #COM3_ORI-MET= B- no detectado Pori_met3=(length(which(ORIC=="B"& METC=="No detectado")))/ dim(M)[1] #COM4_ORI-MET= B-detectado Pori_met4=(length(which(ORIC=="B"& METC=="detectado")))/ dim(M)[1] E_ORIA_MET=-(Pori_met1*log2(Pori_met1)+Pori_met2*log2(Pori_met2)) E_ORIB_MET=-(Pori_met3*log2(Pori_met3)+Pori_met4*log2(Pori_met4)) E_ORI_MET=-(Pori_met1*log2(Pori_met1)+Pori_met2*log2(Pori_met2)+Pori_met3*log2(Pori_met3)+Pori_met4*log2(Pori_met4)) ###Entropia conjunta ORI CON ETI #COM1_ORI-ETI=A-no detectado Pori_eti1=(length(which(ORIC=="A"& ETIC=="No detectado")))/ dim(M)[1] #COM2_ORI-ETI=A-detectado Pori_eti2=(length(which(ORIC=="A"& ETIC=="detectado")))/ dim(M)[1] #COM3_ORI-ETI= B- no detectado Pori_eti3=(length(which(ORIC=="B"& ETIC=="No detectado")))/ dim(M)[1] #COM4_ORI-ETI= B-detectado
138
Pori_eti4=(length(which(ORIC=="B"& ETIC=="detectado")))/ dim(M)[1] E_ORIA_ETI=-(Pori_eti1*log2(Pori_eti1)+Pori_eti2*log2(Pori_eti2)) E_ORIB_ETI=-(Pori_eti3*log2(Pori_eti3)+Pori_eti4*log2(Pori_eti4)) E_ORI_ETI=-(Pori_eti1*log2(Pori_eti1)+Pori_eti2*log2(Pori_eti2)+Pori_eti3*log2(Pori_eti3)+Pori_eti4*log2(Pori_eti4)) ###Entropia conjunta ORI CON ISO #COM1_ORI-ISO=A-no detectado Pori_iso1=(length(which(ORIC=="A"& ISOC=="No detectado")))/ dim(M)[1] #COM2_ORI-ISO=A-detectado Pori_iso2=(length(which(ORIC=="A"& ISOC=="detectado")))/ dim(M)[1] #COM3_ORI-ISO= B- no detectado Pori_iso3=(length(which(ORIC=="B"& ISOC=="No detectado")))/ dim(M)[1] #COM4_ORI-ISO= B-detectado Pori_iso4=(length(which(ORIC=="B"& ISOC=="detectado")))/ dim(M)[1] E_ORIA_ISO=-(Pori_iso1*log2(Pori_iso1)+Pori_iso2*log2(Pori_iso2)) E_ORIB_ISO=-(Pori_iso3*log2(Pori_iso3)+Pori_iso4*log2(Pori_iso4)) E_ORI_ISO=-(Pori_iso1*log2(Pori_iso1)+Pori_iso2*log2(Pori_iso2)+Pori_iso3*log2(Pori_iso3)+Pori_iso4*log2(Pori_iso4)) ###Entropia conjunta ORI CON BUT #COM1_ORI-BUT=A-no detectado Pori_but1=(length(which(ORIC=="A"& BUTC=="No detectado")))/ dim(M)[1] #COM2_ORI-BUT=A-detectado Pori_but2=(length(which(ORIC=="A"& BUTC=="detectado")))/ dim(M)[1] #COM3_ORI-BUT= B- no detectado Pori_but3=(length(which(ORIC=="B"& BUTC=="No detectado")))/ dim(M)[1] #COM4_ORI-BUT= B-detectado Pori_but4=(length(which(ORIC=="B"& BUTC=="detectado")))/ dim(M)[1] E_ORIA_BUT=-(Pori_but1*log2(Pori_but1)+Pori_but2*log2(Pori_but2)) E_ORIB_BUT=-(Pori_but3*log2(Pori_but3)+Pori_but4*log2(Pori_but4))
139
E_ORI_BUT=-(Pori_but1*log2(Pori_but1)+Pori_but2*log2(Pori_but2)+Pori_but3*log2(Pori_but3)+Pori_but4*log2(Pori_but4)) ###Entropia conjunta ORI CON DEPH #COM1_ORI-DEPH=A-no detectado Pori_deph1=(length(which(ORIC=="A"& BISC=="No detectado")))/ dim(M)[1] #COM2_ORI-DEPH=A-detectado Pori_deph2=(length(which(ORIC=="A"& BISC=="detectado")))/ dim(M)[1] #COM3_ORI-DEPH= B- no detectado Pori_deph3=(length(which(ORIC=="B"& BISC=="No detectado")))/ dim(M)[1] #COM4_ORI-DEPH= B-detectado Pori_deph4=(length(which(ORIC=="B"& BISC=="detectado")))/ dim(M)[1] E_ORIA_DEPH=-(Pori_deph1*log2(Pori_deph1)+Pori_deph2*log2(Pori_deph2)) E_ORIB_DEPH=-(Pori_deph3*log2(Pori_deph3)+Pori_deph4*log2(Pori_deph4)) E_ORI_DEPH=-(Pori_deph1*log2(Pori_deph1)+Pori_deph2*log2(Pori_deph2)+Pori_deph3*log2(Pori_deph3)+Pori_deph4*log2(Pori_deph4)) ###Entropia conjunta ORI CON OCT #COM1_ORI-OCT=A-no detectado Pori_oct1=(length(which(ORIC=="A"& OCTC=="No detectado")))/ dim(M)[1] #COM2_ORI-OCT=A-detectado Pori_oct2=(length(which(ORIC=="A"& OCTC=="detectado")))/ dim(M)[1] #COM3_ORI-OCT= B- no detectado Pori_oct3=(length(which(ORIC=="B"& OCTC=="No detectado")))/ dim(M)[1] #COM4_ORI-OCT= B-detectado Pori_oct4=(length(which(ORIC=="B"& OCTC=="detectado")))/ dim(M)[1] E_ORIA_OCT=-(Pori_oct1*log2(Pori_oct1)+Pori_oct2*log2(Pori_oct2)) E_ORIB_OCT=-(Pori_oct3*log2(Pori_oct3)+Pori_oct4*log2(Pori_oct4)) E_ORI_OCT=-(Pori_oct1*log2(Pori_oct1)+Pori_oct2*log2(Pori_oct2)+Pori_oct3*log2(Pori_oct3)+Pori_oct4*log2(Pori_oct4))
140
###Entropia conjunta ORI CON TER #COM1_ORI-TER=A-no detectado Pori_ter1=(length(which(ORIC=="A"& TERC=="No detectado")))/ dim(M)[1] #COM2_ORI-TER=A-detectado Pori_ter2=(length(which(ORIC=="A"& TERC=="detectado")))/ dim(M)[1] #COM3_ORI-TER= B- no detectado Pori_ter3=(length(which(ORIC=="B"& TERC=="No detectado")))/ dim(M)[1] #COM4_ORI-TER= B-detectado Pori_ter4=(length(which(ORIC=="B"& TERC=="detectado")))/ dim(M)[1] E_ORIA_TER=-(Pori_ter1*log2(Pori_ter1)+Pori_ter2*log2(Pori_ter2)) E_ORIB_TER=-(Pori_ter3*log2(Pori_ter3)+Pori_ter4*log2(Pori_ter4)) E_ORI_TER=-(Pori_ter1*log2(Pori_ter1)+Pori_ter2*log2(Pori_ter2)+Pori_ter3*log2(Pori_ter3)+Pori_ter4*log2(Pori_ter4)) ###Entropia conjunta ORI CON ACE #COM1_ORI-ACE=A-no detectado Pori_ace1=(length(which(ORIC=="A"& ACEC=="No detectado")))/ dim(M)[1] #COM2_ORI-ACE=A-detectado Pori_ace2=(length(which(ORIC=="A"& ACEC=="detectado")))/ dim(M)[1] #COM3_ORI-ACE= B- no detectado Pori_ace3=(length(which(ORIC=="B"& ACEC=="No detectado")))/ dim(M)[1] #COM4_ORI-ACE= B-detectado Pori_ace4=(length(which(ORIC=="B"& ACEC=="detectado")))/ dim(M)[1] E_ORIA_ACE=-(Pori_ace1*log2(Pori_ace1)+Pori_ace2*log2(Pori_ace2)) E_ORIB_ACE=-(Pori_ace3*log2(Pori_ace3)+Pori_ace4*log2(Pori_ace4)) E_ORI_ACE=-(Pori_ace1*log2(Pori_ace1)+Pori_ace2*log2(Pori_ace2)+Pori_ace3*log2(Pori_ace3)+Pori_ace4*log2(Pori_ace4)) ###Entropia conjunta ORI CON CAF
141
#COM1_ORI-CAF=A-no detectado Pori_caf1=(length(which(ORIC=="A"& CAFC=="No detectado")))/ dim(M)[1] #COM2_ORI-CAF=A-detectado Pori_caf2=(length(which(ORIC=="A"& CAFC=="detectado")))/ dim(M)[1] #COM3_ORI-CAF= B- no detectado Pori_caf3=(length(which(ORIC=="B"& CAFC=="No detectado")))/ dim(M)[1] #COM4_ORI-CAF= B-detectado Pori_caf4=(length(which(ORIC=="B"& CAFC=="detectado")))/ dim(M)[1] E_ORIA_CAF=-(Pori_caf1*log2(Pori_caf1)+Pori_caf2*log2(Pori_caf2)) E_ORIB_CAF=-(Pori_caf4*log2(Pori_caf4)) E_ORI_CAF=-(Pori_caf1*log2(Pori_caf1)+Pori_caf2*log2(Pori_caf2)+Pori_caf4*log2(Pori_caf4)) ###Entropia conjunta ORI CON FLU #COM1_ORI-FLU=A-no detectado Pori_flu1=(length(which(ORIC=="A"& FLUC=="No detectado")))/ dim(M)[1] #COM2_ORI-FLU=A-detectado Pori_flu2=(length(which(ORIC=="A"& FLUC=="detectado")))/ dim(M)[1] #COM3_ORI-FLU= B- no detectado Pori_flu3=(length(which(ORIC=="B"& FLUC=="No detectado")))/ dim(M)[1] #COM4_ORI-FLU= B-detectado Pori_flu4=(length(which(ORIC=="B"& FLUC=="detectado")))/ dim(M)[1] E_ORIA_FLU=-(Pori_flu1*log2(Pori_flu1)+Pori_flu2*log2(Pori_flu2)) E_ORIB_FLU=-(Pori_flu3*log2(Pori_flu3)+Pori_flu4*log2(Pori_flu4)) E_ORI_FLU=-(Pori_flu1*log2(Pori_flu1)+Pori_flu2*log2(Pori_flu2)+Pori_flu3*log2(Pori_flu3)+Pori_flu4*log2(Pori_flu4)) ###Entropia conjunta ORI CON GEM #COM1_ORI-GEM=A-no detectado Pori_gem1=(length(which(ORIC=="A"& GEMC=="No detectado")))/ dim(M)[1] #COM2_ORI-GEM=A-detectado
142
Pori_gem2=(length(which(ORIC=="A"& GEMC=="detectado")))/ dim(M)[1] #COM3_ORI-GEM= B- no detectado Pori_gem3=(length(which(ORIC=="B"& GEMC=="No detectado")))/ dim(M)[1] #COM4_ORI-GEM= B-detectado Pori_gem4=(length(which(ORIC=="B"& GEMC=="detectado")))/ dim(M)[1] E_ORIA_GEM=-(Pori_gem1*log2(Pori_gem1)+Pori_gem2*log2(Pori_gem2)) E_ORIB_GEM=-(Pori_gem3*log2(Pori_gem3)+Pori_gem4*log2(Pori_gem4)) E_ORI_GEM=-(Pori_gem1*log2(Pori_gem1)+Pori_gem2*log2(Pori_gem2)+Pori_gem3*log2(Pori_gem3)+Pori_gem4*log2(Pori_gem4)) ###Entropia conjunta ORI CON TRI #COM1_ORI-TRI=A-no detectado Pori_tri1=(length(which(ORIC=="A"& TRIC=="No detectado")))/ dim(M)[1] #COM2_ORI-TRI=A-detectado Pori_tri2=(length(which(ORIC=="A"& TRIC=="detectado")))/ dim(M)[1] #COM3_ORI-TRI= B- no detectado Pori_tri3=(length(which(ORIC=="B"& TRIC=="No detectado")))/ dim(M)[1] #COM4_ORI-TRI= B-detectado Pori_tri4=(length(which(ORIC=="B"& TRIC=="detectado")))/ dim(M)[1] E_ORIA_TRI=-(Pori_tri1*log2(Pori_tri1)+Pori_tri2*log2(Pori_tri2)) E_ORIB_TRI=-(Pori_tri3*log2(Pori_tri3)+Pori_tri4*log2(Pori_tri4)) E_ORI_TRI=-(Pori_tri1*log2(Pori_tri1)+Pori_tri2*log2(Pori_tri2)+Pori_tri3*log2(Pori_tri3)+Pori_tri4*log2(Pori_tri4)) ###Entropia conjunta ORI CON BPA #COM1_ORI-BPA=A-no detectado Pori_bpa1=(length(which(ORIC=="A"& BISAC=="No detectado")))/ dim(M)[1] #COM2_ORI-BPA=A-detectado Pori_bpa2=(length(which(ORIC=="A"& BISAC=="detectado")))/ dim(M)[1] #COM3ORI-BPA= B- no detectado Pori_bpa3=(length(which(ORIC=="B"& BISAC=="No detectado")))/ dim(M)[1]
143
#COM4_ORI-BPA= B-detectado Pori_bpa4=(length(which(ORIC=="B"& BISAC=="detectado")))/ dim(M)[1] E_ORIA_BPA=-(Pori_bpa1*log2(Pori_bpa1)+Pori_bpa2*log2(Pori_bpa2)) E_ORIB_BPA=-(Pori_bpa3*log2(Pori_bpa3)+Pori_bpa4*log2(Pori_bpa4)) E_ORI_BPA=-(Pori_bpa1*log2(Pori_bpa1)+Pori_bpa2*log2(Pori_bpa2)+Pori_bpa3*log2(Pori_bpa3)+Pori_bpa4*log2(Pori_bpa4)) ###Entropia conjunta ORI CON PRI #COM1_ORI-PRI=A-no detectado Pori_pri1=(length(which(ORIC=="A"& PRIC=="No detectado")))/ dim(M)[1] #COM2_ORI-PRI=A-detectado Pori_pri2=(length(which(ORIC=="A"& PRIC=="detectado")))/ dim(M)[1] #COM3_ORI-PRI= B- no detectado Pori_pri3=(length(which(ORIC=="B"& PRIC=="No detectado")))/ dim(M)[1] #COM4_ORI-PRI= B-detectado Pori_pri4=(length(which(ORIC=="B"& PRIC=="detectado")))/ dim(M)[1] E_ORIA_PRI=-(Pori_pri1*log2(Pori_pri1)+Pori_pri2*log2(Pori_pri2)) E_ORIB_PRI=-(Pori_pri3*log2(Pori_pri3)+Pori_pri4*log2(Pori_pri4)) E_ORI_PRI=-(Pori_pri1*log2(Pori_pri1)+Pori_pri2*log2(Pori_pri2)+Pori_pri3*log2(Pori_pri3)+Pori_pri4*log2(Pori_pri4)) ###Entropia conjunta ORI CON CAR #COM1_ORI-CAR=A-no detectado Pori_car1=(length(which(ORIC=="A"& CARC=="No detectado")))/ dim(M)[1] #COM2_ORI-CAR=A-detectado Pori_car2=(length(which(ORIC=="A"& CARC=="detectado")))/ dim(M)[1] #COM3_ORI-CAR= B- no detectado Pori_car3=(length(which(ORIC=="B"& CARC=="No detectado")))/ dim(M)[1] #COM4_ORI-CAR= B-detectado Pori_car4=(length(which(ORIC=="B"& CARC=="detectado")))/ dim(M)[1]
144
E_ORIA_CAR=-(Pori_car1*log2(Pori_car1)+Pori_car2*log2(Pori_car2)) E_ORIB_CAR=-(Pori_car3*log2(Pori_car3)+Pori_car4*log2(Pori_car4)) E_ORI_CAR=-(Pori_car1*log2(Pori_car1)+Pori_car2*log2(Pori_car2)+Pori_car3*log2(Pori_car3)+Pori_car4*log2(Pori_car4)) ###Entropia conjunta ORI CON PRO #COM1_ORI-PRO=A-no detectado Pori_pro1=(length(which(ORIC=="A"& PROC=="No detectado")))/ dim(M)[1] #COM2_ORI-PRO=A-detectado Pori_pro2=(length(which(ORIC=="A"& PROC=="detectado")))/ dim(M)[1] #COM3_ORI-PRO= B- no detectado Pori_pro3=(length(which(ORIC=="B"& PROC=="No detectado")))/ dim(M)[1] #COM4_ORI-PRO= B-detectado Pori_pro4=(length(which(ORIC=="B"& PROC=="detectado")))/ dim(M)[1] E_ORIA_PRO=-(Pori_pro1*log2(Pori_pro1)+Pori_pro2*log2(Pori_pro2)) E_ORIB_PRO=-(Pori_pro4*log2(Pori_pro4)) E_ORI_PRO=-(Pori_pro1*log2(Pori_pro1)+Pori_pro2*log2(Pori_pro2)+Pori_pro4*log2(Pori_pro4)) #Entropia Conjunta GAS··············································· ###Entropia conjunta GAS CON MET #COM1_GAS-MET=A-no detectado Pgas_met1=(length(which(GASC=="A"& METC=="No detectado")))/ dim(M)[1] #COM2_GAS-MET=A-detectado Pgas_met2=(length(which(GASC=="A"& METC=="detectado")))/ dim(M)[1] #COM3_GAS-MET= B- no detectado Pgas_met3=(length(which(GASC=="B"& METC=="No detectado")))/ dim(M)[1] #COM4_GAS-MET= B-detectado Pgas_met4=(length(which(GASC=="B"& METC=="detectado")))/ dim(M)[1] E_GASA_MET=-(Pgas_met1*log2(Pgas_met1)+Pgas_met2*log2(Pgas_met2)) E_GASB_MET=-(Pgas_met3*log2(Pgas_met3)+Pgas_met4*log2(Pgas_met4))
145
E_GAS_MET=-(Pgas_met1*log2(Pgas_met1)+Pgas_met2*log2(Pgas_met2)+Pgas_met3*log2(Pgas_met3)+Pgas_met4*log2(Pgas_met4)) ###Entropia conjunta ENVASE CON ETI #COM1_GAS-ETI=A-no detectado Pgas_eti1=(length(which(GASC=="A"& ETIC=="No detectado")))/ dim(M)[1] #COM2_GAS-ETI=A-detectado Pgas_eti2=(length(which(GASC=="A"& ETIC=="detectado")))/ dim(M)[1] #COM3_GAS-ETI= B- no detectado Pgas_eti3=(length(which(GASC=="B"& ETIC=="No detectado")))/ dim(M)[1] #COM4_GAS-ETI= B-detectado Pgas_eti4=(length(which(GASC=="B"& ETIC=="detectado")))/ dim(M)[1] E_GASA_ETI=-(Pgas_eti1*log2(Pgas_eti1)+Pgas_eti2*log2(Pgas_eti2)) E_GASB_ETI=-(Pgas_eti3*log2(Pgas_eti3)+Pgas_eti4*log2(Pgas_eti4)) E_GAS_ETI=-(Pgas_eti1*log2(Pgas_eti1)+Pgas_eti2*log2(Pgas_eti2)+Pgas_eti3*log2(Pgas_eti3)+Pgas_eti4*log2(Pgas_eti4)) ###Entropia conjunta GAS CON ISO #COM1_GAS-ISO=A-no detectado Pgas_iso1=(length(which(GASC=="A"& ISOC=="No detectado")))/ dim(M)[1] #COM2_GAS-ISO=A-detectado Pgas_iso2=(length(which(GASC=="A"& ISOC=="detectado")))/ dim(M)[1] #COM3_GAS-ISO= B- no detectado Pgas_iso3=(length(which(GASC=="B"& ISOC=="No detectado")))/ dim(M)[1] #COM4_GAS-ISO= B-detectado Pgas_iso4=(length(which(GASC=="B"& ISOC=="detectado")))/ dim(M)[1] E_GASA_ISO=-(Pgas_iso1*log2(Pgas_iso1)+Pgas_iso2*log2(Pgas_iso2)) E_GASB_ISO=-(Pgas_iso3*log2(Pgas_iso3)+Pgas_iso4*log2(Pgas_iso4)) E_GAS_ISO=-(Pgas_iso1*log2(Pgas_iso1)+Pgas_iso2*log2(Pgas_iso2)+Pgas_iso3*log2(Pgas_iso3)+Pgas_iso4*log2(Pgas_iso4)) ###Entropia conjunta GAS CON BUT
146
#COM1_GAS-BUT=A-no detectado Pgas_but1=(length(which(GASC=="A"& BUTC=="No detectado")))/ dim(M)[1] #COM2_GAS-BUT=A-detectado Pgas_but2=(length(which(GASC=="A"& BUTC=="detectado")))/ dim(M)[1] #COM3_GAS-BUT= B- no detectado Pgas_but3=(length(which(GASC=="B"& BUTC=="No detectado")))/ dim(M)[1] #COM4_GAS-BUT= B-detectado Pgas_but4=(length(which(GASC=="B"& BUTC=="detectado")))/ dim(M)[1] E_GASA_BUT=-(Pgas_but1*log2(Pgas_but1)+Pgas_but2*log2(Pgas_but2)) E_GASB_BUT=-(Pgas_but3*log2(Pgas_but3)+Pgas_but4*log2(Pgas_but4)) E_GAS_BUT=-(Pgas_but1*log2(Pgas_but1)+Pgas_but2*log2(Pgas_but2)+Pgas_but3*log2(Pgas_but3)+Pgas_but4*log2(Pgas_but4)) ###Entropia conjunta GAS CON DEPH #COM1_GAS-DEPH=A-no detectado Pgas_deph1=(length(which(GASC=="A"& BISC=="No detectado")))/ dim(M)[1] #COM2_GAS-DEPH=A-detectado Pgas_deph2=(length(which(GASC=="A"& BISC=="detectado")))/ dim(M)[1] #COM3_GAS-DEPH= B- no detectado Pgas_deph3=(length(which(GASC=="B"& BISC=="No detectado")))/ dim(M)[1] #COM4_GAS-DEPH= B-detectado Pgas_deph4=(length(which(GASC=="B"& BISC=="detectado")))/ dim(M)[1] E_GASA_DEPH=-(Pgas_deph1*log2(Pgas_deph1)+Pgas_deph2*log2(Pgas_deph2)) E_GASB_DEPH=-(Pgas_deph3*log2(Pgas_deph3)+Pgas_deph4*log2(Pgas_deph4)) E_GAS_DEPH=-(Pgas_deph1*log2(Pgas_deph1)+Pgas_deph2*log2(Pgas_deph2)+Pgas_deph3*log2(Pgas_deph3)+Pgas_deph4*log2(Pgas_deph4)) ###Entropia conjunta GAS CON OCT #COM1_GAS-OCT=A-no detectado Pgas_oct1=(length(which(GASC=="A"& OCTC=="No detectado")))/ dim(M)[1] #COM2_GAS-OCT=A-detectado
147
Pgas_oct2=(length(which(GASC=="A"& OCTC=="detectado")))/ dim(M)[1] #COM3_GAS-OCT= B- no detectado Pgas_oct3=(length(which(GASC=="B"& OCTC=="No detectado")))/ dim(M)[1] #COM4_GAS-OCT= B-detectado Pgas_oct4=(length(which(GASC=="B"& OCTC=="detectado")))/ dim(M)[1] E_GASA_OCT=-(Pgas_oct1*log2(Pgas_oct1)+Pgas_oct2*log2(Pgas_oct2)) E_GASB_OCT=-(Pgas_oct3*log2(Pgas_oct3)+Pgas_oct4*log2(Pgas_oct4)) E_GAS_OCT=-(Pgas_oct1*log2(Pgas_oct1)+Pgas_oct2*log2(Pgas_oct2)+Pgas_oct3*log2(Pgas_oct3)+Pgas_oct4*log2(Pgas_oct4)) ###Entropia conjunta GAS CON TER #COM1_GAS-TER=A-no detectado Pgas_ter1=(length(which(GASC=="A"& TERC=="No detectado")))/ dim(M)[1] #COM2_GAS-TER=A-detectado Pgas_ter2=(length(which(GASC=="A"& TERC=="detectado")))/ dim(M)[1] #COM3_GAS-TER= B- no detectado Pgas_ter3=(length(which(GASC=="B"& TERC=="No detectado")))/ dim(M)[1] #COM4_GAS-TER= B-detectado Pgas_ter4=(length(which(GASC=="B"& TERC=="detectado")))/ dim(M)[1] E_GASA_TER=-(Pgas_ter1*log2(Pgas_ter1)+Pgas_ter2*log2(Pgas_ter2)) E_GASB_TER=-(Pgas_ter3*log2(Pgas_ter3)+Pgas_ter4*log2(Pgas_ter4)) E_GAS_TER=-(Pgas_ter1*log2(Pgas_ter1)+Pgas_ter2*log2(Pgas_ter2)+Pgas_ter3*log2(Pgas_ter3)+Pgas_ter4*log2(Pgas_ter4)) ###Entropia conjunta GAS CON ACE #COM1_GAS-ACE=A-no detectado Pgas_ace1=(length(which(GASC=="A"& ACEC=="No detectado")))/ dim(M)[1] #COM2_GAS-ACE=A-detectado Pgas_ace2=(length(which(GASC=="A"& ACEC=="detectado")))/ dim(M)[1] #COM3_GAS-ACE= B- no detectado
148
Pgas_ace3=(length(which(GASC=="B"& ACEC=="No detectado")))/ dim(M)[1] #COM4_GAS-ACE= B-detectado Pgas_ace4=(length(which(GASC=="B"& ACEC=="detectado")))/ dim(M)[1] E_GASA_ACE=-(Pgas_ace1*log2(Pgas_ace1)+Pgas_ace2*log2(Pgas_ace2)) E_GASB_ACE=-(Pgas_ace3*log2(Pgas_ace3)+Pgas_ace4*log2(Pgas_ace4)) E_GAS_ACE=-(Pgas_ace1*log2(Pgas_ace1)+Pgas_ace2*log2(Pgas_ace2)+Pgas_ace3*log2(Pgas_ace3)+Pgas_ace4*log2(Pgas_ace4)) ###Entropia conjunta GAS CON CAF #COM1_GAS-CAF=A-no detectado Pgas_caf1=(length(which(GASC=="A"& CAFC=="No detectado")))/ dim(M)[1] #COM2_GAS-CAF=A-detectado Pgas_caf2=(length(which(GASC=="A"& CAFC=="detectado")))/ dim(M)[1] #COM3_GAS-CAF= B- no detectado Pgas_caf3=(length(which(GASC=="B"& CAFC=="No detectado")))/ dim(M)[1] #COM4_GAS-CAF= B-detectado Pgas_caf4=(length(which(GASC=="B"& CAFC=="detectado")))/ dim(M)[1] E_GASA_CAF=-(Pgas_caf1*log2(Pgas_caf1)+Pgas_caf2*log2(Pgas_caf2)) E_GASB_CAF=-(Pgas_caf4*log2(Pgas_caf4)) E_GAS_CAF=-(Pgas_caf1*log2(Pgas_caf1)+Pgas_caf2*log2(Pgas_caf2)+Pgas_caf4*log2(Pgas_caf4)) ###Entropia conjunta GAS CON FLU #COM1_GAS-FLU=A-no detectado Pgas_flu1=(length(which(GASC=="A"& FLUC=="No detectado")))/ dim(M)[1] #COM2_GAS-FLU=A-detectado Pgas_flu2=(length(which(GASC=="A"& FLUC=="detectado")))/ dim(M)[1] #COM3_GAS-FLU= B- no detectado Pgas_flu3=(length(which(GASC=="B"& FLUC=="No detectado")))/ dim(M)[1] #COM4_GAS-FLU= B-detectado Pgas_flu4=(length(which(GASC=="B"& FLUC=="detectado")))/ dim(M)[1]
149
E_GASA_FLU=-(Pgas_flu1*log2(Pgas_flu1)+Pgas_flu2*log2(Pgas_flu2)) E_GASB_FLU=-(Pgas_flu3*log2(Pgas_flu3)+Pgas_flu4*log2(Pgas_flu4)) E_GAS_FLU=-(Pgas_flu1*log2(Pgas_flu1)+Pgas_flu2*log2(Pgas_flu2)+Pgas_flu3*log2(Pgas_flu3)+Pgas_flu4*log2(Pgas_flu4)) ###Entropia conjunta GAS CON GEM #COM1_GAS-GEM=A-no detectado Pgas_gem1=(length(which(GASC=="A"& GEMC=="No detectado")))/ dim(M)[1] #COM2_GAS-GEM=A-detectado Pgas_gem2=(length(which(GASC=="A"& GEMC=="detectado")))/ dim(M)[1] #COM3_GAS-GEM= B- no detectado Pgas_gem3=(length(which(GASC=="B"& GEMC=="No detectado")))/ dim(M)[1] #COM4_GAS-GEM= B-detectado Pgas_gem4=(length(which(GASC=="B"& GEMC=="detectado")))/ dim(M)[1] E_GASA_GEM=-(Pgas_gem1*log2(Pgas_gem1)+Pgas_gem2*log2(Pgas_gem2)) E_GASB_GEM=-(Pgas_gem3*log2(Pgas_gem3)+Pgas_gem4*log2(Pgas_gem4)) E_GAS_GEM=-(Pgas_gem1*log2(Pgas_gem1)+Pgas_gem2*log2(Pgas_gem2)+Pgas_gem3*log2(Pgas_gem3)+Pgas_gem4*log2(Pgas_gem4)) ###Entropia conjunta GAS CON TRI #COM1_GAS-TRI=A-no detectado Pgas_tri1=(length(which(GASC=="A"& TRIC=="No detectado")))/ dim(M)[1] #COM2_GAS-TRI=A-detectado Pgas_tri2=(length(which(GASC=="A"& TRIC=="detectado")))/ dim(M)[1] #COM3_GAS-TRI= B- no detectado Pgas_tri3=(length(which(GASC=="B"& TRIC=="No detectado")))/ dim(M)[1] #COM4_GAS-TRI= B-detectado Pgas_tri4=(length(which(GASC=="B"& TRIC=="detectado")))/ dim(M)[1] E_GASA_TRI=-(Pgas_tri1*log2(Pgas_tri1)+Pgas_tri2*log2(Pgas_tri2)) E_GASB_TRI=-(Pgas_tri3*log2(Pgas_tri3)+Pgas_tri4*log2(Pgas_tri4))
150
E_GAS_TRI=-(Pgas_tri1*log2(Pgas_tri1)+Pgas_tri2*log2(Pgas_tri2)+Pgas_tri3*log2(Pgas_tri3)+Pgas_tri4*log2(Pgas_tri4)) ###Entropia conjunta GAS CON BPA #COM1_GAS-BPA=A-no detectado Pgas_bpa1=(length(which(GASC=="A"& BISAC=="No detectado")))/ dim(M)[1] #COM2_GAS-BPA=A-detectado Pgas_bpa2=(length(which(GASC=="A"& BISAC=="detectado")))/ dim(M)[1] #COM3_GAS-BPA= B- no detectado Pgas_bpa3=(length(which(GASC=="B"& BISAC=="No detectado")))/ dim(M)[1] #COM4_GAS-BPA= B-detectado Pgas_bpa4=(length(which(GASC=="B"& BISAC=="detectado")))/ dim(M)[1] E_GASA_BPA=-(Pgas_bpa1*log2(Pgas_bpa1)+Pgas_bpa2*log2(Pgas_bpa2)) E_GASB_BPA=-(Pgas_bpa3*log2(Pgas_bpa3)+Pgas_bpa4*log2(Pgas_bpa4)) E_GAS_BPA=-(Pgas_bpa1*log2(Pgas_bpa1)+Pgas_bpa2*log2(Pgas_bpa2)+Pgas_bpa3*log2(Pgas_bpa3)+Pgas_bpa4*log2(Pgas_bpa4)) ###Entropia conjunta GAS CON PRI #COM1_GAS-PRI=A-no detectado Pgas_pri1=(length(which(GASC=="A"& PRIC=="No detectado")))/ dim(M)[1] #COM2_GAS-PRI=A-detectado Pgas_pri2=(length(which(GASC=="A"& PRIC=="detectado")))/ dim(M)[1] #COM3_GAS-PRI= B- no detectado Pgas_pri3=(length(which(GASC=="B"& PRIC=="No detectado")))/ dim(M)[1] #COM4_GAS-PRI= B-detectado Pgas_pri4=(length(which(GASC=="B"& PRIC=="detectado")))/ dim(M)[1] E_GASA_PRI=-(Pgas_pri1*log2(Pgas_pri1)+Pgas_pri2*log2(Pgas_pri2)) E_GASB_PRI=-(Pgas_pri3*log2(Pgas_pri3)+Pgas_pri4*log2(Pgas_pri4)) E_GAS_PRI=-(Pgas_pri1*log2(Pgas_pri1)+Pgas_pri2*log2(Pgas_pri2)+Pgas_pri3*log2(Pgas_pri3)+Pgas_pri4*log2(Pgas_pri4))
151
###Entropia conjunta GAS CON CAR #COM1_GAS-CAR=A-no detectado Pgas_car1=(length(which(GASC=="A"& CARC=="No detectado")))/ dim(M)[1] #COM2_GAS-CAR=A-detectado Pgas_car2=(length(which(GASC=="A"& CARC=="detectado")))/ dim(M)[1] #COM3_GAS-CAR= B- no detectado Pgas_car3=(length(which(GASC=="B"& CARC=="No detectado")))/ dim(M)[1] #COM4_GAS-CAR= B-detectado Pgas_car4=(length(which(GASC=="B"& CARC=="detectado")))/ dim(M)[1] E_GASA_CAR=-(Pgas_car1*log2(Pgas_car1)+Pgas_car2*log2(Pgas_car2)) E_GASB_CAR=-(Pgas_car3*log2(Pgas_car3)+Pgas_car4*log2(Pgas_car4)) E_GAS_CAR=-(Pgas_car1*log2(Pgas_car1)+Pgas_car2*log2(Pgas_car2)+Pgas_car3*log2(Pgas_car3)+Pgas_car4*log2(Pgas_car4)) ###Entropia conjunta GAS CON PRO #COM1_GAS-PRO=A-no detectado Pgas_pro1=(length(which(GASC=="A"& PROC=="No detectado")))/ dim(M)[1] #COM2_GAS-PRO=A-detectado Pgas_pro2=(length(which(GASC=="A"& PROC=="detectado")))/ dim(M)[1] #COM3_GAS-PRO= B- no detectado Pgas_pro3=(length(which(GASC=="B"& PROC=="No detectado")))/ dim(M)[1] #COM4_GAS-PRO= B-detectado Pgas_pro4=(length(which(GASC=="B"& PROC=="detectado")))/ dim(M)[1] E_GASA_PRO=-(Pgas_pro1*log2(Pgas_pro1)+Pgas_pro2*log2(Pgas_pro2)) E_GASB_PRO=-(Pgas_pro3*log2(Pgas_pro3)+Pgas_pro4*log2(Pgas_pro4)) E_GAS_PRO=-(Pgas_pro1*log2(Pgas_pro1)+Pgas_pro2*log2(Pgas_pro2)+Pgas_pro3*log2(Pgas_pro3)+Pgas_pro4*log2(Pgas_pro4)) #MUTUAL INFORMATION### ################ENVASE######################
152
#MUTUAL INFORMATION ENV VS MET IenvA_met=EEA+E1-E_ENVA_MET IenvB_met=EEB+E1-E_ENVB_MET Ienv_met=EE+E1-E_ENV_MET #MUTUAL INFORMATION ENV VS ETI IenvA_eti=EEA+E2-E_ENVA_ETI IenvB_eti=EEB+E2-E_ENVB_ETI Ienv_eti=EE+E2-E_ENV_ETI #MUTUAL INFORMATION ENV VS ISO IenvA_iso=EEA+E3-E_ENVA_ISO IenvB_iso=EEB+E3-E_ENVB_ISO Ienv_iso=EE+E3-E_ENV_ISO #MUTUAL INFORMATION ENV VS BUT IenvA_but=EEA+E4-E_ENVA_BUT IenvB_but=EEB+E4-E_ENVB_BUT Ienv_but=EE+E4-E_ENV_BUT #MUTUAL INFORMATION ENV VS DEPH IenvA_deph=EEA+E5-E_ENVA_DEPH IenvB_deph=EEB+E5-E_ENVB_DEPH Ienv_deph=EE+E5-E_ENV_DEPH #MUTUAL INFORMATION ENV VS OCT IenvA_oct=EEA+E6-E_ENVA_OCT IenvB_oct=EEB+E6-E_ENVB_OCT Ienv_oct=EE+E6-E_ENV_OCT #MUTUAL INFORMATION ENV VS TER IenvA_ter=EEA+E7-E_ENVA_TER IenvB_ter=EEB+E7-E_ENVB_TER Ienv_ter=EE+E7-E_ENV_TER #MUTUAL INFORMATION ENV VS ACE IenvB_ace=EEA+E8-E_ENVA_ACE IenvA_ace=EEB+E8-E_ENVB_ACE
153
Ienv_ace=EE+E8-E_ENV_ACE #MUTUAL INFORMATION ENV VS CAF IenvA_caf=EEA+E9-E_ENVA_CAF IenvB_caf=EEB+E9-E_ENVB_CAF Ienv_caf=EE+E9-E_ENV_CAF #MUTUAL INFORMATION ENV VS FLU IenvA_flu=EEA+E10-E_ENVA_FLU IenvB_flu=EEB+E10-E_ENVB_FLU Ienv_flu=EE+E10-E_ENV_FLU #MUTUAL INFORMATION ENV VS GEM IenvA_gem=EEA+E11-E_ENVA_GEM IenvB_gem=EEB+E11-E_ENVB_GEM Ienv_gem=EE+E11-E_ENV_GEM #MUTUAL INFORMATION ENV VS TRI IenvA_tri=EEA+E12-E_ENVA_TRI IenvB_tri=EEB+E12-E_ENVB_TRI Ienv_tri=EE+E12-E_ENV_TRI #MUTUAL INFORMATION ENV VS BPA IenvA_bpa=EEA+E13-E_ENVA_BPA IenvB_bpa=EEB+E13-E_ENVB_BPA Ienv_bpa=EE+E13-E_ENV_BPA #MUTUAL INFORMATION ENV VS PRI IenvA_pri=EEA+E14-E_ENVA_PRI IenvB_pri=EEB+E14-E_ENVB_PRI Ienv_pri=EE+E14-E_ENV_PRI #MUTUAL INFORMATION ENV VS CAR IenvA_car=EEA+E15-E_ENVA_CAR IenvB_car=EEB+E15-E_ENVB_CAR Ienv_car=EE+E15-E_ENV_CAR #MUTUAL INFORMATION ENV VS PRO IenvA_pro=EEA+E16-E_ENVA_PRO
154
IenvB_pro=EEB+E16-E_ENVB_PRO Ienv_pro=EE+E16-E_ENV_PRO ############ORIGEN###################### #MUTUAL INFORMATION ORI VS MET IoriA_met=EOA+E1-E_ORIA_MET IoriB_met=EOB+E1-E_ORIB_MET Iori_met=EO+E1-E_ORI_MET #MUTUAL INFORMATION ORI VS ETI IoriA_eti=EOA+E2-E_ORIA_ETI IoriB_eti=EOB+E2-E_ORIB_ETI Iori_eti=EO+E2-E_ORI_ETI #MUTUAL INFORMATION ORI VS ISO IoriA_iso=EOA+E3-E_ORIA_ISO IoriB_iso=EOB+E3-E_ORIB_ISO Iori_iso=EO+E3-E_ORI_ISO #MUTUAL INFORMATION ORI VS BUT IoriA_but=EOA+E4-E_ORIA_BUT IoriB_but=EOB+E4-E_ORIB_BUT Iori_but=EO+E4-E_ORI_BUT #MUTUAL INFORMATION ORI VS BIS IoriA_deph=EOA+E5-E_ORIA_DEPH IoriB_deph=EOB+E5-E_ORIB_DEPH Iori_deph=EO+E5-E_ORI_DEPH #MUTUAL INFORMATION ORI VS OCT IoriA_oct=EOA+E6-E_ORIA_OCT IoriB_oct=EOB+E6-E_ORIB_OCT Iori_oct=EO+E6-E_ORI_OCT #MUTUAL INFORMATION ORI VS TER IoriA_ter=EOA+E7-E_ORIA_TER IoriB_ter=EOB+E7-E_ORIB_TER Iori_ter=EO+E7-E_ORI_TER
155
#MUTUAL INFORMATION ORI VS ACE IoriA_ace=EOA+E8-E_ORIA_ACE IoriB_ace=EOB+E8-E_ORIB_ACE Iori_ace=EO+E8-E_ORI_ACE #MUTUAL INFORMATION ORI VS CAF IoriA_caf=EOA+E9-E_ORIA_CAF IoriB_caf=EOB+E9-E_ORIB_CAF Iori_caf=EO+E9-E_ORI_CAF #MUTUAL INFORMATION ORI VS FLU IoriA_flu=EOA+E10-E_ORIA_FLU IoriB_flu=EOB+E10-E_ORIB_FLU Iori_flu=EO+E10-E_ORI_FLU #MUTUAL INFORMATION ORI VS GEM IoriA_gem=EOA+E11-E_ORIA_GEM IoriB_gem=EOB+E11-E_ORIB_GEM Iori_gem=EO+E11-E_ORI_GEM #MUTUAL INFORMATION ORI VS TRI IoriA_tri=EOA+E12-E_ORIA_TRI IoriB_tri=EOB+E12-E_ORIB_TRI Iori_tri=EO+E12-E_ORI_TRI #MUTUAL INFORMATION ORI VS BPA IoriA_bpa=EOA+E13-E_ORIA_BPA IoriB_bpa=EOB+E13-E_ORIB_BPA Iori_bpa=EO+E13-E_ORI_BPA #MUTUAL INFORMATION ORI VS PRI IoriA_pri=EOA+E14-E_ORIA_PRI IoriB_pri=EOB+E14-E_ORIB_PRI Iori_pri=EO+E14-E_ORI_PRI #MUTUAL INFORMATION ORI VS CAR IoriA_car=EOA+E15-E_ORIA_CAR IoriB_car=EOB+E15-E_ORIB_CAR Iori_car=EO+E15-E_ORI_CAR
156
#MUTUAL INFORMATION ORI VS PRO IoriA_pro=EOA+E16-E_ORIA_PRO IoriB_pro=EOB+E16-E_ORIB_PRO Iori_pro=EO+E16-E_ORI_PRO ############GAS###################### #MUTUAL INFORMATION GAS VS MET IgasA_met=EGA+E1-E_GASA_MET IgasB_met=EGB+E1-E_GASB_MET Igas_met=EG+E1-E_GAS_MET #MUTUAL INFORMATION GAS VS ETI IgasA_eti=EGA+E2-E_GASA_ETI IgasB_eti=EGB+E2-E_GASB_ETI Igas_eti=EG+E2-E_GAS_ETI #MUTUAL INFORMATION GAS VS ISO IgasA_iso=EGA+E3-E_GASA_ISO IgasB_iso=EGB+E3-E_GASB_ISO Igas_iso=EG+E3-E_GAS_ISO #MUTUAL INFORMATION GAS VS BUT IgasA_but=EGA+E4-E_GASA_BUT IgasB_but=EGB+E4-E_GASB_BUT Igas_but=EG+E4-E_GAS_BUT #MUTUAL INFORMATION GAS VS BIS IgasA_deph=EGA+E5-E_GASA_DEPH IgasB_deph=EGB+E5-E_GASB_DEPH Igas_deph=EG+E5-E_GAS_DEPH #MUTUAL INFORMATION GAS VS OCT IgasA_oct=EGA+E6-E_GASA_OCT IgasB_oct=EGB+E6-E_GASB_OCT Igas_oct=EG+E6-E_GAS_OCT #MUTUAL INFORMATION GAS VS TER
157
IgasA_ter=EGA+E7-E_GASA_TER IgasB_ter=EGB+E7-E_GASB_TER Igas_ter=EG+E7-E_GAS_TER #MUTUAL INFORMATION GAS VS ACE IgasA_ace=EGA+E8-E_GASA_ACE IgasB_ace=EGB+E8-E_GASB_ACE Igas_ace=EG+E8-E_GAS_ACE #MUTUAL INFORMATION GAS VS CAF IgasA_caf=EGA+E9-E_GASA_CAF IgasB_caf=EGB+E9-E_GASB_CAF Igas_caf=EG+E9-E_GAS_CAF #MUTUAL INFORMATION GAS VS FLU IgasA_flu=EGA+E10-E_GASA_FLU IgasB_flu=EGB+E10-E_GASB_FLU Igas_flu=EG+E10-E_GAS_FLU #MUTUAL INFORMATION GAS VS GEM IgasA_gem=EGA+E11-E_GASA_GEM IgasB_gem=EGB+E11-E_GASB_GEM Igas_gem=EG+E11-E_GAS_GEM #MUTUAL INFORMATION GAS VS TRI IgasA_tri=EGA+E12-E_GASA_TRI IgasB_tri=EGB+E12-E_GASB_TRI Igas_tri=EG+E12-E_GAS_TRI #MUTUAL INFORMATION GAS VS BPA IgasA_bpa=EGA+E13-E_GASA_BPA IgasB_bpa=EGB+E13-E_GASB_BPA Igas_bpa=EG+E13-E_GAS_BPA #MUTUAL INFORMATION GAS VS PRI IgasA_pri=EGA+E14-E_GASA_PRI IgasB_pri=EGB+E14-E_GASB_PRI Igas_pri=EG+E14-E_GAS_PRI #MUTUAL INFORMATION GAS VS CAR
158
IgasA_car=EGA+E15-E_GASA_CAR IgasB_car=EGB+E15-E_GASB_CAR Igas_car=EG+E15-E_GAS_CAR #MUTUAL INFORMATION GAS VS PRO IgasA_pro=EGA+E16-E_GASA_PRO IgasB_pro=EGB+E16-E_GASB_PRO Igas_pro=EG+E16-E_GAS_PRO ###########redundancia_ENVASE######### R_envA_met=IenvA_met/(EEA+E1) R_envB_met=IenvB_met/(EEB+E1) R_env_met=Ienv_met/(EE+E1) R_envA_eti=IenvA_eti/(EEA+E2) R_envB_eti=IenvB_eti/(EEB+E2) R_env_eti=Ienv_eti/(EE+E2) R_envA_iso=IenvA_iso/(EEA+E3) R_envB_iso=IenvB_iso/(EEB+E3) R_env_iso=Ienv_iso/(EE+E3) R_envA_but=IenvA_but/(EEA+E4) R_envB_but=IenvB_but/(EEB+E4) R_env_but=Ienv_but/(EE+E4) R_envA_deph=IenvA_deph/(EEA+E5) R_envB_deph=IenvB_deph/(EEB+E5) R_env_deph=Ienv_deph/(EE+E5) R_envA_oct=IenvA_oct/(EEA+E6) R_envB_oct=IenvB_oct/(EEB+E6) R_env_oct=Ienv_oct/(EE+E6) R_envA_ter=IenvA_ter/(EEA+E7) R_envB_ter=IenvB_ter/(EEB+E7) R_env_ter=Ienv_ter/(EE+E7) R_envA_ace=IenvA_ace/(EEA+E8) R_envB_ace=IenvB_ace/(EEB+E8) R_env_ace=Ienv_ace/(EE+E8) R_envA_caf=IenvA_caf/(EEA+E9)
159
R_envB_caf=IenvB_caf/(EEB+E9) R_env_caf=Ienv_caf/(EE+E9) R_envA_flu=IenvA_flu/(EEA+E10) R_envB_flu=IenvB_flu/(EEB+E10) R_env_flu=Ienv_flu/(EE+E10) R_envA_gem=IenvA_gem/(EEA+E11) R_envB_gem=IenvB_gem/(EEB+E11) R_env_gem=Ienv_gem/(EE+E11) R_envA_tri=IenvA_tri/(EEA+E12) R_envB_tri=IenvB_tri/(EEB+E12) R_env_tri=Ienv_tri/(EE+E12) R_envA_bpa=IenvA_bpa/(EEA+E13) R_envB_bpa=IenvB_bpa/(EEB+E13) R_env_bpa=Ienv_bpa/(EE+E13) R_envA_pri=IenvA_pri/(EEA+E14) R_envB_pri=IenvB_pri/(EEB+E14) R_env_pri=Ienv_pri/(EE+E14) R_envA_car=IenvA_car/(EEA+E15) R_envB_car=IenvB_car/(EEB+E15) R_env_car=Ienv_car/(EE+E15) R_envA_pro=IenvA_pro/(EEA+E16) R_envB_pro=IenvB_pro/(EEB+E16) R_env_pro=Ienv_pro/(EE+E16) ###########redundancia_ORIGEN######### R_oriA_met=IoriA_met/(EOA+E1) R_oriB_met=IoriB_met/(EOB+E1) R_ori_met=Iori_met/(EO+E1) R_oriA_eti=IoriA_eti/(EOA+E2) R_oriB_eti=IoriB_eti/(EOB+E2) R_ori_eti=Iori_eti/(EO+E2) R_oriA_iso=IoriA_iso/(EOA+E3) R_oriB_iso=IoriB_iso/(EOB+E3) R_ori_iso=Iori_iso/(EO+E3) R_oriA_but=IoriA_but/(EOA+E4) R_oriB_but=IoriB_but/(EOB+E4)
160
R_ori_but=Iori_but/(EO+E4) R_oriA_deph=IoriA_deph/(EOA+E5) R_oriB_deph=IoriB_deph/(EOB+E5) R_ori_deph=Iori_deph/(EO+E5) R_oriA_oct=IoriA_oct/(EOA+E6) R_oriB_oct=IoriB_oct/(EOB+E6) R_ori_oct=Iori_oct/(EO+E6) R_oriA_ter=IoriA_ter/(EOA+E7) R_oriB_ter=IoriB_ter/(EOB+E7) R_ori_ter=Iori_ter/(EO+E7) R_oriA_ace=IoriA_ace/(EOA+E8) R_oriB_ace=IoriB_ace/(EOB+E8) R_ori_ace=Iori_ace/(EO+E8) R_oriA_caf=IoriA_caf/(EOA+E9) R_oriB_caf=IoriB_caf/(EOB+E9) R_ori_caf=Iori_caf/(EO+E9) R_oriA_flu=IoriA_flu/(EOA+E10) R_oriB_flu=IoriB_flu/(EOB+E10) R_ori_flu=Iori_flu/(EO+E10) R_oriA_gem=IoriA_gem/(EOA+E11) R_oriB_gem=IoriB_gem/(EOB+E11) R_ori_gem=Iori_gem/(EO+E11) R_oriA_tri=IoriA_tri/(EOA+E12) R_oriB_tri=IoriB_tri/(EOB+E12) R_ori_tri=Iori_tri/(EO+E12) R_oriA_bpa=IoriA_bpa/(EOA+E13) R_oriB_bpa=IoriB_bpa/(EOB+E13) R_ori_bpa=Iori_bpa/(EO+E13) R_oriA_pri=IoriA_pri/(EOA+E14) R_oriB_pri=IoriB_pri/(EOB+E14) R_ori_pri=Iori_pri/(EO+E14) R_oriA_car=IoriA_car/(EOA+E15) R_oriB_car=IoriB_car/(EOB+E15) R_ori_car=Iori_car/(EO+E15) R_oriA_pro=IoriA_pro/(EOA+E16)
161
R_oriB_pro=IoriB_pro/(EOB+E16) R_ori_pro=Iori_pro/(EO+E16) ###########redundancia_GAS######### R_gasA_met=IgasA_met/(EGA+E1) R_gasB_met=IgasB_met/(EGB+E1) R_gas_met=Igas_met/(EG+E1) R_gasA_eti=IgasA_eti/(EGA+E2) R_gasB_eti=IgasB_eti/(EGB+E2) R_gas_eti=Igas_eti/(EG+E2) R_gasA_iso=IgasA_iso/(EGA+E3) R_gasB_iso=IgasB_iso/(EGB+E3) R_gas_iso=Igas_iso/(EG+E3) R_gasA_but=IgasA_but/(EGA+E4) R_gasB_but=IgasB_but/(EGB+E4) R_gas_but=Igas_but/(EG+E4) R_gasA_deph=IgasA_deph/(EGA+E5) R_gasB_deph=IgasB_deph/(EGB+E5) R_gas_deph=Igas_deph/(EG+E5) R_gasA_oct=IgasA_oct/(EGA+E6) R_gasB_oct=IgasB_oct/(EGB+E6) R_gas_oct=Igas_oct/(EG+E6) R_gasA_ter=IgasA_ter/(EGA+E7) R_gasB_ter=IgasB_ter/(EGB+E7) R_gas_ter=Igas_ter/(EG+E7) R_gasA_ace=IgasA_ace/(EGA+E8) R_gasB_ace=IgasB_ace/(EGB+E8) R_gas_ace=Igas_ace/(EG+E8) R_gasA_caf=IgasA_caf/(EGA+E9) R_gasB_caf=IgasB_caf/(EGB+E9) R_gas_caf=Igas_caf/(EG+E9) R_gasA_flu=IgasA_flu/(EGA+E10) R_gasB_flu=IgasB_flu/(EGB+E10) R_gas_flu=Igas_flu/(EG+E10) R_gasA_gem=IgasA_gem/(EGA+E11) R_gasB_gem=IgasB_gem/(EGB+E11)
162
R_gas_gem=Igas_gem/(EG+E11) R_gasA_tri=IgasA_tri/(EGA+E12) R_gasB_tri=IgasB_tri/(EGB+E12) R_gas_tri=Igas_tri/(EG+E12) R_gasA_bpa=IgasA_bpa/(EGA+E13) R_gasB_bpa=IgasB_bpa/(EGB+E13) R_gas_bpa=Igas_bpa/(EG+E13) R_gasA_pri=IgasA_pri/(EGA+E14) R_gasB_pri=IgasB_pri/(EGB+E14) R_gas_pri=Igas_pri/(EG+E14) R_gasA_car=IgasA_car/(EGA+E15) R_gasB_car=IgasB_car/(EGB+E15) R_gas_car=Igas_car/(EG+E15) R_gasA_pro=IgasA_pro/(EGA+E16) R_gasB_pro=IgasB_pro/(EGB+E16) R_gas_pro=Igas_pro/(EG+E16) #############Redundancia maxima envase############### # Redundancia maxima entre ENV vs MET ######################## if (EEA>E1){ Rm_envA_met=E1/(EEA+E1) }else{ Rm_envA_met=EEA/(EEA+E1) } ##################### if (EEB>E1){ Rm_envB_met=E1/(EEB+E1) }else{ Rm_envB_met=EEB/(EEB+E1) } if (EE>E1){ Rm_env_met=E1/(EE+E1) }else{ Rm_env_met=EE/(EE+E1) }
163
# Redundancia maxima entre ENV vs ETI if (EEA>E2){ Rm_envA_eti=E2/(EEA+E2) }else{ Rm_envA_eti=EEA/(EEA+E2) } if (EEB>E2){ Rm_envB_eti=E2/(EEB+E2) }else{ Rm_envB_eti=EEB/(EEB+E2) } if (EE>E2){ Rm_env_eti=E2/(EE+E2) }else{ Rm_env_eti=EE/(EE+E2) } # Redundancia maxima entre ENV vs ISO if (EEA>E3){ Rm_envA_iso=E3/(EEA+E3) }else{ Rm_envA_iso=EEA/(EEA+E3) } if (EEB>E3){ Rm_envB_iso=E3/(EEB+E3) }else{ Rm_envB_iso=EEB/(EEB+E3) } if (EE>E3){ Rm_env_iso=E3/(EE+E3) }else{ Rm_env_iso=EE/(EE+E3) } # Redundancia maxima entre ENV vs BUT
164
if (EEA>E4){ Rm_envA_but=E4/(EEA+E4) }else{ Rm_envA_but=EEA/(EEA+E4) } if (EEB>E4){ Rm_envB_but=E4/(EEB+E4) }else{ Rm_envB_but=EEB/(EEB+E4) } if (EE>E4){ Rm_env_but=E4/(EE+E4) }else{ Rm_env_but=EE/(EE+E4) } # Redundancia maxima entre ENV vs DEPH if (EEA>E5){ Rm_envA_deph=E5/(EEA+E5) }else{ Rm_envA_deph=EEA/(EEA+E5) } if (EEB>E5){ Rm_envB_deph=E5/(EEB+E5) }else{ Rm_envB_deph=EEB/(EEB+E5) } if (EE>E5){ Rm_env_deph=E5/(EE+E5) }else{ Rm_env_deph=EE/(EE+E5) } # Redundancia maxima entre ENV vs OCT if (EEA>E6){
165
Rm_envA_oct=E6/(EEA+E6) }else{ Rm_envA_oct=EEA/(EEA+E6) } if (EEB>E6){ Rm_envB_oct=E6/(EEB+E6) }else{ Rm_envB_oct=EEB/(EEB+E6) } if (EE>E6){ Rm_env_oct=E6/(EE+E6) }else{ Rm_env_oct=EE/(EE+E6) } # Redundancia maxima entre ENV vs TER if (EEA>E7){ Rm_envA_ter=E7/(EEA+E7) }else{ Rm_envA_ter=EEA/(EEA+E7) } if (EEB>E7){ Rm_envB_ter=E7/(EEB+E7) }else{ Rm_envB_ter=EEB/(EEB+E7) } if (EE>E7){ Rm_env_ter=E7/(EE+E7) }else{ Rm_env_ter=EE/(EE+E7) } # Redundancia maxima entre ENV vs ACE if (EEA>E8){ Rm_envA_ace=E8/(EEA+E8) }else{
166
Rm_envA_ace=EEA/(EEA+E8) } if (EEB>E8){ Rm_envB_ace=E8/(EEB+E8) }else{ Rm_envB_ace=EEB/(EEB+E8) } if (EE>E8){ Rm_env_ace=E8/(EE+E8) }else{ Rm_env_ace=EE/(EE+E8) } # Redundancia maxima entre ENV vs CAF if (EEA>E9){ Rm_envA_caf=E9/(EEA+E9) }else{ Rm_envA_caf=EEA/(EEA+E9) } if (EEB>E9){ Rm_envB_caf=E9/(EEB+E9) }else{ Rm_envB_caf=EEB/(EEB+E9) } if (EE>E9){ Rm_env_caf=E9/(EE+E9) }else{ Rm_env_caf=EE/(EE+E9) } # Redundancia maxima entre ENV vs FLU if (EEA>E10){ Rm_envA_flu=E10/(EEA+E10) }else{
167
Rm_envA_flu=EEA/(EEA+E10) } if (EEB>E10){ Rm_envB_flu=E10/(EEB+E10) }else{ Rm_envB_flu=EEB/(EEB+E10) } if (EE>E10){ Rm_env_flu=E10/(EE+E10) }else{ Rm_env_flu=EE/(EE+E10) } # Redundancia maxima entre ENV vs GEM if (EEA>E11){ Rm_envA_gem=E11/(EEA+E11) }else{ Rm_envA_gem=EEA/(EEA+E11) } if (EEB>E11){ Rm_envB_gem=E11/(EEB+E11) }else{ Rm_envB_gem=EEB/(EEB+E11) } if (EE>E11){ Rm_env_gem=E11/(EE+E11) }else{ Rm_env_gem=EE/(EE+E11) } # Redundancia maxima entre ENV vs TRI if (EEA>E12){ Rm_envA_tri=E12/(EEA+E12) }else{ Rm_envA_tri=EEA/(EEA+E12) }
168
if (EEB>E12){ Rm_envB_tri=E12/(EEB+E12) }else{ Rm_envB_tri=EEB/(EEB+E12) } if (EE>E12){ Rm_env_tri=E12/(EE+E12) }else{ Rm_env_tri=EE/(EE+E12) } # Redundancia maxima entre ENV vs BPA if (EEA>E13){ Rm_envA_bpa=E13/(EEA+E13) }else{ Rm_envA_bpa=EEA/(EEA+E13) } if (EEB>E13){ Rm_envB_bpa=E13/(EEB+E13) }else{ Rm_envB_bpa=EEB/(EEB+E13) } if (EE>E13){ Rm_env_bpa=E13/(EE+E13) }else{ Rm_env_bpa=EE/(EE+E13) } # Redundancia maxima entre ENV vs PRI if (EEA>E14){ Rm_envA_pri=E14/(EEA+E14) }else{ Rm_envA_pri=EEA/(EEA+E14) } if (EEB>E14){ Rm_envB_pri=E14/(EEB+E14)
169
}else{ Rm_envB_pri=EEB/(EEB+E14) } if (EE>E14){ Rm_env_pri=E14/(EE+E14) }else{ Rm_env_pri=EE/(EE+E14) } # Redundancia maxima entre ENV vs CAR if (EEA>E15){ Rm_envA_car=E15/(EEA+E15) }else{ Rm_envA_car=EEA/(EEA+E15) } if (EEB>E15){ Rm_envB_car=E15/(EEB+E15) }else{ Rm_envB_car=EEB/(EEB+E15) } if (EE>E15){ Rm_env_car=E15/(EE+E15) }else{ Rm_env_car=EE/(EE+E15) } # Redundancia maxima entre ENV vs PRO if (EEA>E16){ Rm_envA_pro=E16/(EEA+E16) }else{ Rm_envA_pro=EEA/(EEA+E16) } if (EEB>E16){ Rm_envB_pro=E16/(EEB+E16) }else{ Rm_envB_pro=EEB/(EEB+E16)
170
} if (EE>E16){ Rm_env_pro=E16/(EE+E16) }else{ Rm_env_pro=EE/(EE+E16) } #######################################ORI########################## # Redundancia maxima entre ORI vs MET if (EOA>E1){ Rm_oriA_met=E1/(EOA+E1) }else{ Rm_oriA_met=EOA/(EOA+E1) } if (EOB>E1){ Rm_oriB_met=E1/(EOB+E1) }else{ Rm_oriB_met=EOB/(EOB+E1) } if (EO>E1){ Rm_ori_met=E1/(EO+E1) }else{ Rm_ori_met=EO/(EO+E1) } # Redundancia maxima entre ORI vs ETI if (EOA>E2){ Rm_oriA_eti=E2/(EOA+E2) }else{ Rm_oriA_eti=EOA/(EOA+E2) } if (EOB>E2){ Rm_oriB_eti=E2/(EOB+E2) }else{ Rm_oriB_eti=EOB/(EOB+E2) }
171
if (EO>E2){ Rm_ori_eti=E2/(EO+E2) }else{ Rm_ori_eti=EO/(EO+E2) } # Redundancia maxima entre ORI vs ISO if (EOA>E3){ Rm_oriA_iso=E3/(EOA+E3) }else{ Rm_oriA_iso=EOA/(EOA+E3) } if (EOB>E3){ Rm_oriB_iso=E3/(EOB+E3) }else{ Rm_oriB_iso=EOB/(EOB+E3) } if (EO>E3){ Rm_ori_iso=E3/(EO+E3) }else{ Rm_ori_iso=EO/(EO+E3) } # Redundancia maxima entre ORI vs BUT if (EOA>E4){ Rm_oriA_but=E4/(EOA+E4) }else{ Rm_oriA_but=EOA/(EOA+E4) } if (EOB>E4){ Rm_oriB_but=E4/(EOB+E4) }else{ Rm_oriB_but=EOB/(EOB+E4) } if (EO>E4){ Rm_ori_but=E4/(EO+E4)
172
}else{ Rm_ori_but=EO/(EO+E4) } # Redundancia maxima entre ORI vs DEPH if (EOA>E5){ Rm_oriA_deph=E5/(EOA+E5) }else{ Rm_oriA_deph=EOA/(EOA+E5) } if (EOB>E5){ Rm_oriB_deph=E5/(EOB+E5) }else{ Rm_oriB_deph=EOB/(EOB+E5) } if (EO>E5){ Rm_ori_deph=E5/(EO+E5) }else{ Rm_ori_deph=EO/(EO+E5) } # Redundancia maxima entre ORI vs OCT if (EOA>E6){ Rm_oriA_oct=E6/(EOA+E6) }else{ Rm_oriA_oct=EOA/(EOA+E6) } if (EOB>E6){ Rm_oriB_oct=E6/(EOB+E6) }else{ Rm_oriB_oct=EOB/(EOB+E6) } if (EO>E6){ Rm_ori_oct=E6/(EO+E6) }else{ Rm_ori_oct=EO/(EO+E6)
173
} # Redundancia maxima entre ORI vs TER if (EOA>E7){ Rm_oriA_ter=E7/(EOA+E7) }else{ Rm_oriA_ter=EOA/(EOA+E7) } if (EOB>E7){ Rm_oriB_ter=E7/(EOB+E7) }else{ Rm_oriB_ter=EOB/(EOB+E7) } if (EO>E7){ Rm_ori_ter=E7/(EO+E7) }else{ Rm_ori_ter=EO/(EO+E7) } # Redundancia maxima entre ORI vs ACE if (EOA>E8){ Rm_oriA_ace=E8/(EOA+E8) }else{ Rm_oriA_ace=EOA/(EOA+E8) } if (EOB>E8){ Rm_oriB_ace=E8/(EOB+E8) }else{ Rm_oriB_ace=EOB/(EOB+E8) } if (EO>E8){ Rm_ori_ace=E8/(EO+E8) }else{ Rm_ori_ace=EO/(EO+E8) } # Redundancia maxima entre ORI vs CAF
174
if (EOA>E9){ Rm_oriA_caf=E9/(EOA+E9) }else{ Rm_oriA_caf=EOA/(EOA+E9) } if (EOB>E9){ Rm_oriB_caf=E9/(EOB+E9) }else{ Rm_oriB_caf=EOB/(EOB+E9) } if (EO>E9){ Rm_ori_caf=E9/(EO+E9) }else{ Rm_ori_caf=EO/(EO+E9) } # Redundancia maxima entre ORI vs FLU if (EOA>E10){ Rm_oriA_flu=E10/(EOA+E10) }else{ Rm_oriA_flu=EOA/(EOA+E10) } if (EOB>E10){ Rm_oriB_flu=E10/(EOB+E10) }else{ Rm_oriB_flu=EOB/(EOB+E10) } if (EO>E10){ Rm_ori_flu=E10/(EO+E10) }else{ Rm_ori_flu=EO/(EO+E10) } # Redundancia maxima entre ORI vs GEM if (EOA>E11){ Rm_oriA_gem=E11/(EOA+E11) }else{
175
Rm_oriA_gem=EOA/(EOA+E11) } if (EOB>E11){ Rm_oriB_gem=E11/(EOB+E11) }else{ Rm_oriB_gem=EOB/(EOB+E11) } if (EO>E11){ Rm_ori_gem=E11/(EO+E11) }else{ Rm_ori_gem=EO/(EO+E11) } # Redundancia maxima entre ORI vs TRI if (EOA>E12){ Rm_oriA_tri=E12/(EOA+E12) }else{ Rm_oriA_tri=EOA/(EOA+E12) } if (EOB>E12){ Rm_oriB_tri=E12/(EOB+E12) }else{ Rm_oriB_tri=EOB/(EOB+E12) } if (EO>E12){ Rm_ori_tri=E12/(EO+E12) }else{ Rm_ori_tri=EO/(EO+E12) } # Redundancia maxima entre ORI vs BPA if (EOA>E13){ Rm_oriA_bpa=E13/(EOA+E13) }else{ Rm_oriA_bpa=EOA/(EOA+E13) }
176
if (EOB>E13){ Rm_oriB_bpa=E13/(EOB+E13) }else{ Rm_oriB_bpa=EOB/(EOB+E13) } if (EO>E13){ Rm_ori_bpa=E13/(EO+E13) }else{ Rm_ori_bpa=EO/(EO+E13) } # Redundancia maxima entre ORI vs PRI if (EOA>E14){ Rm_oriA_pri=E14/(EOA+E14) }else{ Rm_oriA_pri=EOA/(EOA+E14) } if (EOB>E14){ Rm_oriB_pri=E14/(EOB+E14) }else{ Rm_oriB_pri=EOB/(EOB+E14) } if (EO>E14){ Rm_ori_pri=E14/(EO+E14) }else{ Rm_ori_pri=EO/(EO+E14) } # Redundancia maxima entre ORI vs CAR if (EOA>E15){ Rm_oriA_car=E15/(EOA+E15) }else{ Rm_oriA_car=EOA/(EOA+E15) } if (EOB>E15){ Rm_oriB_car=E15/(EOB+E15)
177
}else{ Rm_oriB_car=EOB/(EOB+E15) } if (EO>E15){ Rm_ori_car=E15/(EO+E15) }else{ Rm_ori_car=EO/(EO+E15) } # Redundancia maxima entre ORI vs PRO if (EOA>E16){ Rm_oriA_pro=E16/(EOA+E16) }else{ Rm_oriA_pro=EOA/(EOA+E16) } if (EOB>E16){ Rm_oriB_pro=E16/(EOB+E16) }else{ Rm_oriB_pro=EOB/(EOB+E16) } if (EO>E16){ Rm_ori_pro=E16/(EO+E16) }else{ Rm_ori_pro=EO/(EO+E16) } #######################################gas########################## # Redundancia maxima entre GAS vs MET if (EGA>E1){ Rm_gas_met=E1/(EGA+E1) }else{ Rm_gasA_met=EGA/(EGA+E1) } if (EGB>E1){ Rm_gasB_met=E1/(EGB+E1)
178
}else{ Rm_gasB_met=EGB/(EGB+E1) } if (EG>E1){ Rm_gas_met=E1/(EG+E1) }else{ Rm_gas_met=EG/(EG+E1) } # Redundancia maxima entre GAS vs ETI if (EGA>E2){ Rm_gasA_eti=E2/(EGA+E2) }else{ Rm_gasA_eti=EGA/(EGA+E2) } if (EGB>E2){ Rm_gasB_eti=E2/(EGB+E2) }else{ Rm_gasB_eti=EGB/(EGB+E2) } if (EG>E2){ Rm_gas_eti=E2/(EG+E2) }else{ Rm_gas_eti=EG/(EG+E2) } # Redundancia maxima entre GAS vs ISO if (EGA>E3){ Rm_gasA_iso=E3/(EGA+E3) }else{ Rm_gasA_iso=EGA/(EGA+E3) } if (EGB>E3){ Rm_gasB_iso=E3/(EGB+E3) }else{ Rm_gasB_iso=EGB/(EGB+E3)
179
} if (EG>E3){ Rm_gas_iso=E3/(EG+E3) }else{ Rm_gas_iso=EG/(EG+E3) } # Redundancia maxima entre GAS vs BUT if (EGA>E4){ Rm_gasA_but=E4/(EGA+E4) }else{ Rm_gasA_but=EGA/(EGA+E4) } if (EGB>E4){ Rm_gasB_but=E4/(EGB+E4) }else{ Rm_gasB_but=EGB/(EGB+E4) } if (EG>E4){ Rm_gas_but=E4/(EG+E4) }else{ Rm_gas_but=EG/(EG+E4) } # Redundancia maxima entre GAS vs DEPH if (EGA>E5){ Rm_gasA_deph=E5/(EGA+E5) }else{ Rm_gasA_deph=EGA/(EGA+E5) } if (EGB>E5){ Rm_gasB_deph=E5/(EGB+E5) }else{ Rm_gasB_deph=EGB/(EGB+E5) } if (EG>E5){
180
Rm_gas_deph=E5/(EG+E5) }else{ Rm_gas_deph=EG/(EG+E5) } # Redundancia maxima entre GAS vs OCT if (EGA>E6){ Rm_gasA_oct=E6/(EGA+E6) }else{ Rm_gasA_oct=EGA/(EGA+E6) } if (EGB>E6){ Rm_gasB_oct=E6/(EGB+E6) }else{ Rm_gasB_oct=EGB/(EGB+E6) } if (EG>E6){ Rm_gas_oct=E6/(EG+E6) }else{ Rm_gas_oct=EG/(EG+E6) } # Redundancia maxima entre GAS vs TER if (EGA>E7){ Rm_gasA_ter=E7/(EGA+E7) }else{ Rm_gasA_ter=EGA/(EGA+E7) } if (EGB>E7){ Rm_gasB_ter=E7/(EGB+E7) }else{ Rm_gasB_ter=EGB/(EGB+E7) } if (EG>E7){ Rm_gas_ter=E7/(EG+E7) }else{
181
Rm_gas_ter=EG/(EG+E7) } # Redundancia maxima entre GAS vs ACE if (EGA>E8){ Rm_gasA_ace=E8/(EGA+E8) }else{ Rm_gasA_ace=EGA/(EGA+E8) } if (EGB>E8){ Rm_gasB_ace=E8/(EGB+E8) }else{ Rm_gasB_ace=EGB/(EGB+E8) } if (EG>E8){ Rm_gas_ace=E8/(EG+E8) }else{ Rm_gas_ace=EG/(EG+E8) } # Redundancia maxima entre GAS vs CAF if (EGA>E9){ Rm_gasA_caf=E9/(EGA+E9) }else{ Rm_gasA_caf=EGA/(EGA+E9) } if (EGB>E9){ Rm_gasB_caf=E9/(EGB+E9) }else{ Rm_gasB_caf=EGB/(EGB+E9) } if (EG>E9){ Rm_gas_caf=E9/(EG+E9) }else{ Rm_gas_caf=EG/(EG+E9) }
182
# Redundancia maxima entre GAS vs FLU if (EGA>E10){ Rm_gasA_flu=E10/(EGA+E10) }else{ Rm_gasA_flu=EGA/(EGA+E10) } if (EGB>E10){ Rm_gasB_flu=E10/(EGB+E10) }else{ Rm_gasB_flu=EGB/(EGB+E10) } if (EG>E10){ Rm_gas_flu=E10/(EG+E10) }else{ Rm_gas_flu=EG/(EG+E10) } # Redundancia maxima entre GAS vs GEM if (EGA>E11){ Rm_gasA_gem=E11/(EGA+E11) }else{ Rm_gasA_gem=EGA/(EGA+E11) } if (EGB>E11){ Rm_gasB_gem=E11/(EGB+E11) }else{ Rm_gasB_gem=EGB/(EGB+E11) } if (EG>E11){ Rm_gas_gem=E11/(EG+E11) }else{ Rm_gas_gem=EG/(EG+E11) } # Redundancia maxima entre GAS vs TRI if (EGA>E12){ Rm_gasA_tri=E12/(EGA+E12)
183
}else{ Rm_gasA_tri=EGA/(EGA+E12) } if (EGB>E12){ Rm_gasB_tri=E12/(EGB+E12) }else{ Rm_gasB_tri=EGB/(EGB+E12) } if (EG>E12){ Rm_gas_tri=E12/(EG+E12) }else{ Rm_gas_tri=EG/(EG+E12) } # Redundancia maxima entre GAS vs BPA if (EGA>E13){ Rm_gasA_bpa=E13/(EGA+E13) }else{ Rm_gasA_bpa=EGA/(EGA+E13) } if (EGB>E13){ Rm_gasB_bpa=E13/(EGB+E13) }else{ Rm_gasB_bpa=EGB/(EGB+E13) } if (EG>E13){ Rm_gas_bpa=E13/(EG+E13) }else{ Rm_gas_bpa=EG/(EG+E13) } # Redundancia maxima entre GAS vs PRI if (EGA>E14){ Rm_gasA_pri=E14/(EGA+E14) }else{ Rm_gasA_pri=EGA/(EGA+E14)
184
} if (EGB>E14){ Rm_gasB_pri=E14/(EGB+E14) }else{ Rm_gasB_pri=EGB/(EGB+E14) } if (EG>E14){ Rm_gas_pri=E14/(EG+E14) }else{ Rm_gas_pri=EG/(EG+E14) } # Redundancia maxima entre GAS vs CAR if (EGA>E15){ Rm_gasA_car=E15/(EGA+E15) }else{ Rm_gasA_car=EGA/(EGA+E15) } if (EGB>E15){ Rm_gasB_car=E15/(EGB+E15) }else{ Rm_gasB_car=EGB/(EGB+E15) } if (EG>E15){ Rm_gas_car=E15/(EG+E15) }else{ Rm_gas_car=EG/(EG+E15) } # Redundancia maxima entre GAS vs PRO if (EGA>E16){ Rm_gasA_pro=E16/(EGA+E16) }else{ Rm_gasA_pro=EGA/(EGA+E16) } if (EGB>E16){
185
Rm_gasB_pro=E16/(EGB+E16) }else{ Rm_gasB_pro=EGB/(EGB+E16) } if (EG>E16){ Rm_gas_pro=E16/(EG+E16) }else{ Rm_gas_pro=EG/(EG+E16) } ###########################Entropia ################################## EM=rbind(EE,EO,EG,E1,E2,E3,E4,E5,E6,E7,E8,E9,E10,E11,E12,E13,E14,E15,E16) factor=c("ENVASE","ORIGEN","GAS","MET","ETI","ISO","BUT","BIS","OCT","TER","ACE","CAF", "FLU","GEM","TRI","BISA","PRI","CAR","PRO") Entropia_Marginal=cbind(factor,EM) write.csv(Entropia_Marginal,"Entropia_Marginal.cSV",row.names=TRUE) Entropia_Conjunta=rbind(E_ENVA_MET,E_ENVB_MET,E_ENV_MET,E_ENVA_ETI,E_ENVB_ETI,E_ENV_ETI, E_ENVA_ISO,E_ENVB_ISO,E_ENV_ISO,E_ENVA_BUT,E_ENVB_BUT,E_ENV_BUT, E_ENVA_DEPH,E_ENVB_DEPH,E_ENV_DEPH,E_ENVA_OCT,E_ENVB_OCT,E_ENV_OCT, E_ENVA_TER,E_ENVB_TER,E_ENV_TER,E_ENVA_ACE,E_ENVB_ACE,E_ENV_ACE, E_ENVA_CAF,E_ENVB_CAF,E_ENV_CAF,E_ENVA_FLU,E_ENVB_FLU,E_ENV_FLU, E_ENVA_GEM,E_ENVB_GEM,E_ENV_GEM,E_ENVA_TRI,E_ENVB_TRI,E_ENV_TRI, E_ENVA_BPA,E_ENVB_BPA,E_ENV_BPA,E_ENVA_PRI,E_ENVB_PRI,E_ENV_PRI, E_ENVA_CAR,E_ENVB_CAR,E_ENV_CAR,E_ENVA_PRO,E_ENVB_PRO,E_ENV_PRO, E_ORIA_MET,E_ORIB_MET,E_ORI_MET,E_ORIA_ETI,E_ORIB_ETI,E_ORI_ETI,
186
E_ORIA_ISO,E_ORIB_ISO,E_ORI_ISO,E_ORIA_BUT,E_ORIB_BUT,E_ORI_BUT, E_ORIA_DEPH,E_ORIB_DEPH,E_ORI_DEPH,E_ORIA_OCT,E_ORIB_OCT,E_ORI_OCT, E_ORIA_TER,E_ORIB_TER,E_ORI_TER,E_ORIA_ACE,E_ORIB_ACE,E_ORI_ACE, E_ORIA_CAF,E_ORIB_CAF,E_ORI_CAF,E_ORIA_FLU,E_ORIB_FLU,E_ORI_FLU, E_ORIA_GEM,E_ORIB_GEM,E_ORI_GEM,E_ORIA_TRI,E_ORIB_TRI,E_ORI_TRI, E_ORIA_BPA,E_ORIB_BPA,E_ORI_BPA,E_ORIA_PRI,E_ORIB_PRI,E_ORI_PRI, E_ORIA_CAR,E_ORIB_CAR,E_ORI_CAR,E_ORIA_PRO,E_ORIB_PRO,E_ORI_PRO, E_GASA_MET,E_GASB_MET,E_GAS_MET,E_GASA_ETI,E_GASB_ETI,E_GAS_ETI, E_GASA_ISO,E_GASB_ISO,E_GAS_ISO,E_GASA_BUT,E_GASB_BUT,E_GAS_BUT, E_GASA_DEPH,E_GASB_DEPH,E_GAS_DEPH,E_GASA_OCT,E_GASB_OCT,E_GAS_OCT, E_GASA_TER,E_GASB_TER,E_GAS_TER,E_GASA_ACE,E_GASB_ACE,E_GAS_ACE, E_GASA_CAF,E_GASB_CAF,E_GAS_CAF,E_GASA_FLU,E_GASB_FLU,E_GAS_FLU, E_GASA_GEM,E_GASB_GEM,E_GAS_GEM,E_GASA_TRI,E_GASB_TRI,E_GAS_TRI, E_GASA_BPA,E_GASB_BPA,E_GAS_BPA,E_GASA_PRI,E_GASB_PRI,E_GAS_PRI, E_GASA_CAR,E_GASB_CAR,E_GAS_CAR,E_GASA_PRO,E_GASB_PRO,E_GAS_PRO) MI=rbind(Ienv_met,Ienv_met,Ienv_met,Ienv_eti,Ienv_eti,Ienv_eti,Ienv_iso,Ienv_iso,Ienv_iso,Ienv_but,Ienv_but,Ienv_but,Ienv_deph,Ienv_deph,Ienv_deph,Ienv_oct,Ienv_oct,Ienv_oct,Ienv_ter,Ienv_ter,Ienv_ter,Ienv_ace,Ienv_ace,Ienv_ace,Ienv_caf,Ienv_caf,Ienv_caf,Ienv_flu,Ienv_flu,Ienv_flu,Ienv_gem,Ienv_gem,Ienv_gem, Ienv_tri,Ienv_tri,Ienv_tri,Ienv_bpa,Ienv_bpa,Ienv_bpa,Ienv_pri,Ienv_car,Ienv_pri,Ienv_car,Ienv_pri,Ienv_car,Ienv_pro,Ienv_pro,Ienv_pro,Iori_met,Iori_met,Iori_met,Iori_eti,Iori_eti,Iori_eti,Iori_iso,Iori_iso,Iori_iso,Iori_but,Iori_but,Iori_but,Iori_deph,Iori_deph,Iori_deph,Io
187
ri_oct,Iori_oct,Iori_oct,Iori_ter,Iori_ter,Iori_ter,Iori_ace,Iori_ace,Iori_ace,Iori_caf,Iori_caf,Iori_caf,Iori_flu,Iori_flu,Iori_flu,Iori_gem,Iori_gem,Iori_gem, Iori_tri,Iori_tri,Iori_tri,Iori_bpa,Iori_bpa,Iori_bpa,Iori_pri,Iori_pri,Iori_pri,Iori_car,Iori_car,Iori_car,Iori_pro,Iori_pro,Iori_pro,Igas_met,Igas_met,Igas_met,Igas_eti,Igas_eti,Igas_eti,Igas_iso,Igas_iso,Igas_iso,Igas_but,Igas_but,Igas_but,Igas_deph,Igas_deph,Igas_deph,Igas_oct,Igas_oct,Igas_oct,Igas_ter,Igas_ter,Igas_ter,Igas_ace,Igas_ace,Igas_ace,Igas_caf,Igas_caf,Igas_caf,Igas_flu,Igas_flu,Igas_flu,Igas_gem,Igas_gem,Igas_gem, Igas_tri,Igas_tri,Igas_tri,Igas_bpa,Igas_bpa,Igas_bpa,Igas_pri,Igas_pri,Igas_pri,Igas_car,Igas_car,Igas_car,Igas_pro,Igas_pro,Igas_pro) Redundancia=rbind(R_envA_met,R_envB_met,R_env_met,R_envA_eti,R_envB_eti,Rm_env_eti, R_envA_iso,R_envB_iso,R_env_iso,R_envA_but,R_envB_but,Rm_env_but, R_envA_deph,R_envB_deph,R_env_deph,R_envA_oct,R_envB_oct,R_env_oct, R_envA_ter,R_envB_ter,R_env_ter,R_envA_ace,R_envB_ace,R_env_ace, R_envA_caf,R_envB_caf,R_env_caf,R_envA_flu,R_envB_flu,R_env_flu, R_envA_gem,R_envB_gem,R_env_gem,R_envA_tri,R_envB_tri,R_env_tri, R_envA_bpa,R_envB_bpa,R_env_bpa,R_envA_pri,R_envB_pri,R_env_pri, R_envA_car,R_envB_car,R_env_car,R_envA_pro,R_envB_pro,R_env_pro, R_oriA_met,R_oriB_met,R_ori_met,R_oriA_eti,R_oriB_eti,R_ori_eti, R_oriA_iso,R_oriB_iso,R_ori_iso,R_oriA_but,R_oriB_but,R_ori_but, R_oriA_deph,R_oriB_deph,R_ori_deph,R_oriA_oct,R_oriB_oct,R_ori_oct, R_oriA_ter,R_oriB_ter,R_ori_ter,R_oriA_ace,R_oriB_ace,R_ori_ace, R_oriA_caf,R_oriB_caf,R_ori_caf,R_oriA_flu,R_oriB_flu,R_ori_flu, R_oriA_gem,R_oriB_gem,R_ori_gem,R_oriA_tri,R_oriB_tri,R_ori_tri, R_oriA_bpa,R_oriB_bpa,R_ori_bpa,R_oriA_pri,R_oriB_pri,R_ori_pri, R_oriA_car,R_oriB_car,R_ori_car,R_oriA_pro,R_oriB_pro,R_ori_pro, R_gasA_met,R_gasB_met,R_gas_met,R_gasA_eti,R_gasB_eti,R_gas_eti, R_gasA_iso,R_gasB_iso,R_gas_iso,R_gasA_but,R_gasB_but,R_gas_but, R_gasA_deph,R_gasB_deph,R_gas_deph,R_gasA_oct,R_gasB_oct,R_gas_oct, R_gasA_ter,R_gasB_ter,R_gas_ter,R_gasA_ace,R_gasB_ace,R_gas_ace, R_gasA_caf,R_gasB_caf,R_gas_caf,R_gasA_flu,R_gasB_flu,R_gas_flu, R_gasA_gem,R_gasB_gem,R_gas_gem,R_gasA_tri,R_gasB_tri,R_gas_tri, R_gasA_bpa,R_gasB_bpa,R_gas_bpa,R_gasA_pri,R_gasB_pri,R_gas_pri, R_gasA_car,R_gasB_car,R_gas_car,R_gasA_pro,R_gasB_pro,R_gas_pro) Redundancia_Max=rbind(Rm_envA_met,Rm_envB_met,Rm_env_met,Rm_envA_eti,Rm_envB_eti,Rm_env_eti, Rm_envA_iso,Rm_envB_iso,Rm_env_iso,Rm_envA_but,Rm_envB_but,Rm_env_but, Rm_envA_deph,Rm_envB_deph,Rm_env_deph,Rm_envA_oct,Rm_envB_oct,Rm_env_oct,
188
Rm_envA_ter,Rm_envB_ter,Rm_env_ter,Rm_envA_ace,Rm_envB_ace,Rm_env_ace, Rm_envA_caf,Rm_envB_caf,Rm_env_caf,Rm_envA_flu,Rm_envB_flu,Rm_env_flu, Rm_envA_gem,Rm_envB_gem,Rm_env_gem,Rm_envA_tri,Rm_envB_tri,Rm_env_tri, Rm_envA_bpa,Rm_envB_bpa,Rm_env_bpa,Rm_envA_pri,Rm_envB_pri,Rm_env_pri, Rm_envA_car,Rm_envB_car,Rm_env_car,Rm_envA_pro,Rm_envB_pro,Rm_env_pro, Rm_oriA_met,Rm_oriB_met,Rm_ori_met,Rm_oriA_eti,Rm_oriB_eti,Rm_ori_eti, Rm_oriA_iso,Rm_oriB_iso,Rm_ori_iso,Rm_oriA_but,Rm_oriB_but,Rm_ori_but, Rm_oriA_deph,Rm_oriB_deph,Rm_ori_deph,Rm_oriA_oct,Rm_oriB_oct,Rm_ori_oct, Rm_oriA_ter,Rm_oriB_ter,Rm_ori_ter,Rm_oriA_ace,Rm_oriB_ace,Rm_ori_ace, Rm_oriA_caf,Rm_oriB_caf,Rm_ori_caf,Rm_oriA_flu,Rm_oriB_flu,Rm_ori_flu, Rm_oriA_gem,Rm_oriB_gem,Rm_ori_gem,Rm_oriA_tri,Rm_oriB_tri,Rm_ori_tri, Rm_oriA_bpa,Rm_oriB_bpa,Rm_ori_bpa,Rm_oriA_pri,Rm_oriB_pri,Rm_ori_pri, Rm_oriA_car,Rm_oriB_car,Rm_ori_car,Rm_oriA_pro,Rm_oriB_pro,Rm_ori_pro, Rm_gasA_met,Rm_gasB_met,Rm_gas_met,Rm_gasA_eti,Rm_gasB_eti,Rm_gas_eti, Rm_gasA_iso,Rm_gasB_iso,Rm_gas_iso,Rm_gasA_but,Rm_gasB_but,Rm_gas_but, Rm_gasA_deph,Rm_gasB_deph,Rm_gas_deph,Rm_gasA_oct,Rm_gasB_oct,Rm_gas_oct, Rm_gasA_ter,Rm_gasB_ter,Rm_gas_ter,Rm_gasA_ace,Rm_gasB_ace,Rm_gas_ace, Rm_gasA_caf,Rm_gasB_caf,Rm_gas_caf,Rm_gasA_flu,Rm_gasB_flu,Rm_gas_flu, Rm_gasA_gem,Rm_gasB_gem,Rm_gas_gem,Rm_gasA_tri,Rm_gasB_tri,Rm_gas_tri, Rm_gasA_bpa,Rm_gasB_bpa,Rm_gas_bpa,Rm_gasA_pri,Rm_gasB_pri,Rm_gas_pri, Rm_gasA_car,Rm_gasB_car,Rm_gas_car,Rm_gasA_pro,Rm_gasB_pro,Rm_gas_pro) factor1=rbind("ENVA-MET","ENVB-MET","ENV-MET","ENVA-ETI","ENVB-ETI","ENV-ETI", "ENVA-ISO","ENVB-ISO","ENV-ISO","ENVA-BUT","ENVB-BUT","ENV-BUT",
189
"ENVA-DEPH","ENVB-DEPH","ENV-DEPH","ENVA-OCT","ENVB-OCT","ENV-OCT", "ENVA-TER","ENVB-TER","ENV-TER","ENVA-ACE","ENVB-ACE","ENV-ACE", "ENVA-CAF","ENVB-CAF","ENV-CAF","ENVA-FLU","ENVB-FLU","ENV-FLU", "ENVA-GEM","ENVB-GEM","ENV-GEM","ENVA-TRI","ENVB-TRI","ENV-TRI", "ENVA-BPA","ENVB-BPA","ENV-BPA","ENVA-PRI","ENVB-PRI","ENV-PRI", "ENVA-CAR","ENVB-CAR","ENV-CAR","ENVA-PRO","ENVB-PRO","ENV-PRO", "ORIA-MET","ORIB-MET","ORI-MET","ORIA-ETI","ORIB-ETI","ORI-ETI", "ORIA-ISO","ORIB-ISO","ORI-ISO","ORIA-BUT","ORIB-BUT","ORI-BUT", "ORIA-DEPH","ORIB-DEPH","ORI-DEPH","ORIA-OCT","ORIB-OCT","ORI-OCT", "ORIA-TER","ORIB-TER","ORI-TER","ORIA-ACE","ORIB-ACE","ORI-ACE", "ORIA-CAF","ORIB-CAF","ORI-CAF","ORIA-FLU","ORIB-FLU","ORI-FLU", "ORIA-GEM","ORIB-GEM","ORI-GEM","ORIA-TRI","ORIB-TRI","ORI-TRI", "ORIA-BPA","ORIB-BPA","ORI-BPA","ORIA-PRI","ORIB-PRI","ORI-PRI", "ORIA-CAR","ORIB-CAR","ORI-CAR","ORIA-PRO","ORIB-PRO","ORI-PRO", "GASA-MET","GASB-MET","GAS-MET","GASA-ETI","GASB-ETI","GAS-ETI", "GASA-ISO","GASB-ISO","GAS-ISO","GASA-BUT","GASB-BUT","GAS-BUT", "GASA-DEPH","GASB-DEPH","GAS-DEPH","GASA-OCT","GASB-OCT","GAS-OCT", "GASA-TER","GASB-TER","GAS-TER","GASA-ACE","GASB-ACE","GAS-ACE", "GASA-CAF","GASB-CAF","GAS-CAF","GASA-FLU","GASB-FLU","GAS-FLU", "GASA-GEM","GASB-GEM","GAS-GEM","GASA-TRI","GASB-TRI","GAS-TRI", "GASA-BPA","GASB-BPA","GAS-BPA","GASA-PRI","GASB-PRI","GAS-PRI", "GASB-CAR","GASA-CAR","GAS-CAR","GASA-PRO","GASB-PRO","GAS-PRO") Resultados=cbind(factor1,Entropia_Conjunta,MI,Redundancia,Redundancia_Max) Resultados=as.data.frame(Resultados) colnames(Resultados)=c("Variables","Entropia_Conjunta","MI","R","R_MAX") write.csv(Resultados,"Resultados.csv",row.names = FALSE)
190
ANEXO Z. Código Arboles de decisión y de regresión en R
rm(list=ls(all=TRUE)) M=read.table("datos.txt",header=TRUE) attach(M) library(rpart) # Popular decision tree algorithm library(rattle) # Fancy tree plot library(rpart.plot) # Enhanced tree plots library(RColorBrewer) # Color selection for fancy tree plot library(party) # Alternative decision tree algorithm library(partykit) # Convert rpart object to BinaryTree library(caret) #transforma a factores METf=MET METf[which(MET<=0)]="NODETECTADO" METf[which(MET>=7000)]="ALTO" METf[which(MET<7000 & MET>0)]="BAJO" ETIf=ETI ETIf[which(ETI<=0)]="NODETECTADO" ETIf[which(ETI>=5600)]="ALTO" ETIf[which(ETI<5600 & ETI>0)]="BAJO" ISOf=ISO ISOf[which(ISO<=0)]="NODETECTADO" ISOf[which(ISO>=700)]="ALTO" ISOf[which(ISO<700 & ISO>0)]="BAJO" BUTf=BUT BUTf[which(BUT<=0)]="NODETECTADO" BUTf[which(BUT>=700)]="ALTO" BUTf[which(BUT<700 & BUT>0)]="BAJO" BISf=BIS BISf[which(BIS<=0)]="NO-DETECTADO" BISf[which(BIS>0)]="ALTO" OCTf=OCT OCTf[which(OCT<=0)]="NODETECTADO" OCTf[which(OCT>=280)]="ALTO" OCTf[which(OCT<280 & OCT>0)]="BAJO" TERf=TER
191
TERf[which(TER<=0)]="NODETECTADO" TERf[which(TER>=1190)]="ALTO" TERf[which(TER<1190 & TER>0)]="BAJO" ACEf=ACE ACEf[which(ACE<=0)]="NODETECTADO" ACEf[which(ACE>=304377.826)]="ALTO" ACEf[which(ACE<304377.826 & ACE>0)]="BAJO" CAFf=CAF CAFf[which(CAF<=0)]="NODETECTADO" CAFf[which(CAF>=21000)]="ALTO" CAFf[which(CAF<21000 & CAF>0)]="BAJO" FLUf=FLU FLUf[which(FLU<=0)]="NODETECTADO" FLUf[which(FLU>=58100)]="ALTO" FLUf[which(FLU<58100 & FLU>0)]="BAJO" GEMf=GEM GEMf[which(GEM<=0)]="NODETECTADO" GEMf[which(GEM>=91301)]="ALTO" GEMf[which(GEM<91301 & GEM>0)]="BAJO" TRIf=TRI TRIf[which(TRI<=0)]="NODETECTADO" TRIf[which(TRI>=42000000)]="ALTO" TRIf[which(TRI<42000000 & TRI>0)]="BAJO" BISAf=BISA BISAf[which(BISA<=0)]="NODETECTADO" BISAf[which(BISA>=35)]="ALTO" BISAf[which(BISA<35 & BISA>0)]="BAJO" PRIf=PRI PRIf[which(PRI<=0)]="NODETECTADO" PRIf[which(PRI>=114128)]="ALTO" PRIf[which(PRI<114128 & PRI>0)]="BAJO" CARf=CAR CARf[which(CAR<=0)]="NODETECTADO" CARf[which(CAR>=105000)]="ALTO" CARf[which(CAR<105000 & CAR>0)]="BAJO" PROf=PRO PROf[which(PRO<=0)]="NODETECTADO" PROf[which(PRO>=15218)]="ALTO"
192
PROf[which(PRO<15218 & PRO>0)]="BAJO" Mf=cbind(as.character(ENVASE),as.character(ORIGEN),as.character(GAS),METf,ETIf,ISOf,BUTf,BISf,OCTf,TERf,ACEf,CAFf,FLUf,GEMf,TRIf,BISAf,PRIf,CARf,PROf) colnames(Mf)=c(names(M[,2:4]),names(M[,5:length(names(M))])) Mf=as.data.frame(Mf) ########MET categorico#################### #######tre.1## Mfp <- Mf[,c(1:4)] form <- as.formula(MET ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_met_categorico.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="BAJO & NO DETECTADO", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########MET continuo#################### #######tre.1## Mfp <- M[,c(2:5)] form <- as.formula(MET ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5)
193
tiff(filename="classification_tree_met_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########ETI continuo#################### #######tre.1## Mfp <- M[,c(2:6)] Mfp <- Mfp[,-c(4)] form <- as.formula(ETI ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_eti_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########ISO cAtegorico#################### #######tre.1## Mfp <- Mf[,c(1:6)] Mfp <- Mfp[,-c(4,5)] form <- as.formula(ISO ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580
194
hth=wth/2^(.5) tiff(filename="classification_tree_iso_categorico.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########iso continuo#################### #######tre.1## Mfp <- M[,c(2:7)] Mfp <- Mfp[,-c(4,5)] form <- as.formula(ISO ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_iso_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########BUT continuo#################### #######tre.1## Mfp <- M[,c(2:8)] Mfp <- Mfp[,-c(4,5,6)] form <- as.formula(BUT ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580
195
hth=wth/2^(.5) tiff(filename="classification_tree_BUT_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########DEPH cAtegorico#################### #######tre.1## Mfp <- Mf[,c(1:8)] Mfp <- Mfp[,-c(4,5,6,7)] form <- as.formula(BIS ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_DEPH_categorico.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########DEPH continuo#################### #######tre.1## Mfp <- M[,c(2:9)] Mfp <- Mfp[,-c(4,5,6,7)] form <- as.formula(BIS ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names
196
wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_DEPH_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########OCT continuo#################### #######tre.1## Mfp <- M[,c(2:9)] Mfp <- Mfp[,-c(4,5,6,7,8)] form <- as.formula(OCT ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_oct_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########TER continuo#################### #######tre.1## Mfp <- M[,c(2:11)] Mfp <- Mfp[,-c(4,5,6,7,8,9)] form <- as.formula(TER ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits
197
prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_TER_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########ACE continuo#################### #######tre.1## Mfp <- M[,c(2:12)] Mfp <- Mfp[,-c(4,5,6,7,8,9,10)] form <- as.formula(ACE ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_ACE_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########CAF continuo#################### #######tre.1## Mfp <- M[,c(2:13)] Mfp <- Mfp[,-c(4,5,6,7,8,9,10,11)] form <- as.formula(CAF ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits
198
prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_CAF_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########FLU continuo#################### #######tre.1## Mfp <- M[,c(2:14)] Mfp <- Mfp[,-c(4,5,6,7,8,9,10,11,12)] form <- as.formula(FLU ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_FLU_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########GEM continuo#################### #######tre.1## Mfp <- M[,c(2:15)] Mfp <- Mfp[,-c(4,5,6,7,8,9,10,11,12,13)] form <- as.formula(GEM ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits
199
prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_GEM_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########TRI continuo#################### #######tre.1## Mfp <- M[,c(2:16)] Mfp <- Mfp[,-c(4,5,6,7,8,9,10,11,12,13,14)] form <- as.formula(TRI ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_TRI_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########BPA continuo#################### #######tre.1## Mfp <- M[,c(2:17)] Mfp <- Mfp[,-c(4,5,6,7,8,9,10,11,12,13,14,15)] form <- as.formula(BISA ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results
200
summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_BPA_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########PRI continuo#################### #######tre.1## Mfp <- M[,c(2:18)] Mfp <- Mfp[,-c(4,5,6,7,8,9,10,11,12,13,14,15,16)] form <- as.formula(PRI ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_PRI_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########CAR continuo#################### #######tre.1## Mfp <- M[,c(2:19)] Mfp <- Mfp[,-c(4,5,6,7,8,9,10,11,12,13,14,15,16,17)] form <- as.formula(CAR ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results
201
plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_CAR_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off() ########PRO continuo#################### #######tre.1## Mfp <- M[,c(2:20)] Mfp <- Mfp[,-c(4,5,6,7,8,9,10,11,12,13,14,15,16,17,18)] form <- as.formula(PRO ~ .) tree.1 <- rpart(form,data=Mfp,control=rpart.control(minsplit=20,cp=0)) # 11 printcp(tree.1) # display the results plotcp(tree.1) # visualize cross-validation results summary(tree.1) # detailed summary of splits prp(tree.1,varlen=3) # Shorten variable names wth=3*580 hth=wth/2^(.5) tiff(filename="classification_tree_PRO_continuo.tif", width = wth, height = hth, compression = "lzw", pointsize=10, bg="white",res=300) fancyRpartPlot(tree.1,main="", sub="", palettes=c("Greys", "Oranges"), type=2) par(mar=c(5,5,1,1)) dev.off()
202
ANEXO AA. Codigo Random Forest en R.
rm(list=ls(all=TRUE)) MC= read.csv("Calibración.csv", header = TRUE) MV= read.csv("Validación.csv", header = TRUE) FACTORESC <- MC[-c(1,2,3,4)] FACTORESV <- MV[-c(1,2,3,4)] PREDICTORES_C <- MC[2:4] PREDICTORES_V <- MV[2:4] ####### compuestos############# DMPC<-FACTORESC$DMP DMPV<-FACTORESV$DMP # DEPC<-FACTORESC$DEP DEPV<-FACTORESV$DEP DIBPC<-FACTORESC$DIBP DIBPV<-FACTORESV$DIBP # DBPC<-FACTORESC$DBP DBPV<-FACTORESV$DBP DEHPC<-FACTORESC$DEPH DEHPV<-FACTORESV$DEPH DOPC<-FACTORESC$DOP DOPV<-FACTORESV$DOP TERC<-FACTORESC$TER TERV<-FACTORESV$TER ACEC<-FACTORESC$ACE ACEV<-FACTORESV$ACE CAFC<-FACTORESC$CAF CAFV<-FACTORESV$CAF FLUC<-FACTORESC$FLU FLUV<-FACTORESV$FLU GEMC<-FACTORESC$GEM GEMV<-FACTORESV$GEM
203
TRIC<-FACTORESC$TRI TRIV<-FACTORESV$TRI BPAC<-FACTORESC$BPA BPAV<-FACTORESV$BPA PRIC<-FACTORESC$PRI PRIV<-FACTORESV$PRI CARC<-FACTORESC$CAR CARV<-FACTORESV$CAR PROC<-FACTORESC$PRO PROV<-FACTORESV$PRO #Se llama la librería library(randomForest) library(rfUtilities) #se realiza el modelo función randomForest ###MET Model1 <- randomForest(as.factor(DMPC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv1 <- rf.crossValidation(Model1, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model1, PREDICTORES_C, type = "prob") prob_val <- predict(Model1, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model1, PREDICTORES_C) pred_val <- predict(Model1, PREDICTORES_V) #Matrices de Confusión table(pred_cal,DMPC) table(pred_val,DMPV) Model1 model_cv1 importance(Model1) #####DEP######################
204
Model2 <- randomForest(as.factor(DEPC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) #model_cv2 <- rf.crossValidation(Model2, PREDICTORES_C, p=0.10, n=80, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model2, PREDICTORES_C, type = "prob") prob_val <- predict(Model2, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model2, PREDICTORES_C) pred_val <- predict(Model2, PREDICTORES_V) #Matrices de Confusión table(pred_cal,DEPC) table(pred_val,DEPV) Model2 importance(Model2) #######DIBP######### Model3 <- randomForest(as.factor(DIBPC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv3 <- rf.crossValidation(Model3, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model3, PREDICTORES_C, type = "prob") prob_val <- predict(Model3, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model3, PREDICTORES_C) pred_val <- predict(Model3, PREDICTORES_V) #Matrices de Confusión table(pred_cal,DIBPC) table(pred_val,DIBPV) Model3 model_cv3 importance(Model3) ####DBP#######
205
Model4 <- randomForest(as.factor(DBPC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv4 <- rf.crossValidation(Model3, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model3, PREDICTORES_C, type = "prob") prob_val <- predict(Model3, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model3, PREDICTORES_C) pred_val <- predict(Model3, PREDICTORES_V) #Matrices de Confusión table(pred_cal,DBPC) table(pred_val,DBPV) Model3 model_cv3 importance(Model3) ########DEHP######### Model4 <- randomForest(as.factor(DEHPC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv4 <- rf.crossValidation(Model4, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model4, PREDICTORES_C, type = "prob") prob_val <- predict(Model4, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model4, PREDICTORES_C) pred_val <- predict(Model4, PREDICTORES_V) #Matrices de Confusión table(pred_cal,DEHPC) table(pred_val,DEHPV) Model4 model_cv4 importance(Model4)
206
######DOP#################### Model5 <- randomForest(as.factor(DOPC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv5 <- rf.crossValidation(Model5, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model5, PREDICTORES_C, type = "prob") prob_val <- predict(Model5, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model5, PREDICTORES_C) pred_val <- predict(Model5, PREDICTORES_V) #Matrices de Confusión table(pred_cal,DOPC) table(pred_val,DOPV) Model5 model_cv5 importance(Model5) ######TER#################### Model6 <- randomForest(as.factor(TERC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv6 <- rf.crossValidation(Model6, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model6, PREDICTORES_C, type = "prob") prob_val <- predict(Model6, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model6, PREDICTORES_C) pred_val <- predict(Model6, PREDICTORES_V) #Matrices de Confusión table(pred_cal,TERC) table(pred_val,TERV) Model6 model_cv6 importance(Model6)
207
######ACE#################### Model7 <- randomForest(as.factor(ACEC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv7 <- rf.crossValidation(Model7, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model7, PREDICTORES_C, type = "prob") prob_val <- predict(Model7, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model7, PREDICTORES_C) pred_val <- predict(Model7, PREDICTORES_V) #Matrices de Confusión table(pred_cal,ACEC) table(pred_val,ACEV) Model7 model_cv7 importance(Model7) ######CAF#################### Model8 <- randomForest(as.factor(CAFV) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv8 <- rf.crossValidation(Model8, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model8, PREDICTORES_C, type = "prob") prob_val <- predict(Model8, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model8, PREDICTORES_C) pred_val <- predict(Model8, PREDICTORES_V) #Matrices de Confusión table(pred_cal,CAFC) table(pred_val,CAFV) Model8 model_cv8
208
importance(Model8) ######FLU#################### Model9 <- randomForest(as.factor(FLUC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv9 <- rf.crossValidation(Model9, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model9, PREDICTORES_C, type = "prob") prob_val <- predict(Model9, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model9, PREDICTORES_C) pred_val <- predict(Model9, PREDICTORES_V) #Matrices de Confusión table(pred_cal,FLUC) table(pred_val,FLUV) Model9 model_cv9 importance(Model9) ######GEM#################### Model10 <- randomForest(as.factor(GEMC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv10 <- rf.crossValidation(Model10, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model10, PREDICTORES_C, type = "prob") prob_val <- predict(Model10, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model10, PREDICTORES_C) pred_val <- predict(Model10, PREDICTORES_V) #Matrices de Confusión table(pred_cal,GEMC) table(pred_val,GEMV) Model10
209
model_cv10 importance(Model10) ######TRI#################### Model11 <- randomForest(as.factor(TRIC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv11 <- rf.crossValidation(Model11, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model11, PREDICTORES_C, type = "prob") prob_val <- predict(Model11, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model11, PREDICTORES_C) pred_val <- predict(Model11, PREDICTORES_V) #Matrices de Confusión table(pred_cal,TRIC) table(pred_val,TRIV) Model11 model_cv11 importance(Model11) ######BPA#################### Model12 <- randomForest(as.factor(BPAC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv12 <- rf.crossValidation(Model12, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model12, PREDICTORES_C, type = "prob") prob_val <- predict(Model12, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model12, PREDICTORES_C) pred_val <- predict(Model12, PREDICTORES_V) #Matrices de Confusión table(pred_cal,BPAC)
210
table(pred_val,BPAV) Model12 model_cv12 importance(Model12) ######PRI#################### Model13 <- randomForest(as.factor(PRIC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv13 <- rf.crossValidation(Model13, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model13, PREDICTORES_C, type = "prob") prob_val <- predict(Model13, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model13, PREDICTORES_C) pred_val <- predict(Model13, PREDICTORES_V) #Matrices de Confusión table(pred_cal,PRIC) table(pred_val,PRIV) Model13 model_cv13 importance(Model13) ######CAR#################### Model14 <- randomForest(as.factor(CARC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv14 <- rf.crossValidation(Model14, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model14, PREDICTORES_C, type = "prob") prob_val <- predict(Model14, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model14, PREDICTORES_C)
211
pred_val <- predict(Model14, PREDICTORES_V) #Matrices de Confusión table(pred_cal,CARC) table(pred_val,CARV) Model14 model_cv14 importance(Model14) ######PRO#################### Model15 <- randomForest(as.factor(PROC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv15 <- rf.crossValidation(Model15, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model15, PREDICTORES_C, type = "prob") prob_val <- predict(Model15, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model15, PREDICTORES_C) pred_val <- predict(Model15, PREDICTORES_V) #Matrices de Confusión table(pred_cal,PROC) table(pred_val,PROV) Model15 model_cv15 importance(Model15) ######BPA#################### Model16 <- randomForest(as.factor(DEHPC) ~., data = PREDICTORES_C, importance = TRUE, proximity = TRUE, mtry =2) model_cv16 <- rf.crossValidation(Model16, PREDICTORES_C, p=0.10, n=99, ntree=500) #Predicción en Probabilidades prob_cal <- predict(Model16, PREDICTORES_C, type = "prob")
212
prob_val <- predict(Model16, PREDICTORES_V, type = "prob") #predicción en Categorías pred_cal <- predict(Model16, PREDICTORES_C) pred_val <- predict(Model16, PREDICTORES_V) #Matrices de Confusión table(pred_cal,DEHPC) table(pred_val,DEHPV) Model16 model_cv16 importance(Model16) Algoritmo xgboots
rm(list=ls(all=TRUE))
MC= read.csv("Calibración.csv", header = TRUE)
MC <- MC[-c(1)]
MV= read.csv("Validación.csv", header = TRUE)
MV <- MV[-c(1)]
library(Matrix)
library(xgboost)
MC_ENVASE <-MC[-c(2,3)]
MV_ENVASE <-MV[-c(2,3)]
train <- MC_ENVASE
train.y <- train$ENVASE
sparse.train <- sparse.model.matrix(ENVASE ~ ., data = train)
dtrain <- xgb.DMatrix(data = sparse.train, label = train.y)
test <- MV_ENVASE
test.y <- test$ENVASE
sparse.test <- sparse.model.matrix(ENVASE ~ ., data = test)
dtest <- xgb.DMatrix(data = sparse.test, label = test.y)
# 2. XGB TRAIN ----
xgb <- xgb.train( # TREE BUILDER
objective = "binary:logistic",
eval_metric = "auc",
213
data = dtrain,
max_depth = 16,
colsample_bytree = 0.5,
min_child_weight = 5,
eta = 0.015,
nrounds = 500,
watchlist = list(train = dtrain, test = dtest)
)
# 4. POST-BUILD. MANUAL MODEL EXPLORATION ----
library (DiagrammeR)
xgb.plot.tree( # PLOT 100 TREES... TODOS = CRASH!
model = xgb,
feature_names = colnames(sparse.train),
n_first_tree = 100,
plot_width = 1920,
plot_height = 1080
)
importance <- xgb.importance( # GET IMPORTANCE MATRIX
feature_names = colnames(sparse.train),
model = xgb
)
xgb.plot.importance( # ALL VARS
importance_matrix = importance,
rel_to_first = T
)
evalerror <- function(preds, dtrain) {
labels <- getinfo(dtrain, "label")
err <- as.numeric(sum(labels != (preds > 0)))/length(labels)
return(list(metric = "error", value = err))
}
#######ORIGEN#########
MC_ORIGEN <-MC[-c(1,3)]
MV_ORIGEN <-MV[-c(1,3)]
train <- MC_ORIGEN
train.y <- train$ORIGEN
214
sparse.train <- sparse.model.matrix(ORIGEN ~ ., data = train)
dtrain <- xgb.DMatrix(data = sparse.train, label = train.y)
test <- MV_ORIGEN
test.y <- test$ORIGEN
sparse.test <- sparse.model.matrix(ORIGEN ~ ., data = test)
dtest <- xgb.DMatrix(data = sparse.test, label = test.y)
# 2. XGB TRAIN ----
xgb <- xgb.train( # TREE BUILDER
objective = "binary:logistic",
eval_metric = "auc",
data = dtrain,
max_depth = 16,
colsample_bytree = 0.5,
min_child_weight = 5,
eta = 0.015,
nrounds = 500,
watchlist = list(train = dtrain, test = dtest)
)
# 4. POST-BUILD. MANUAL MODEL EXPLORATION ----
library (DiagrammeR)
xgb.plot.tree( # PLOT 100 TREES... TODOS = CRASH!
model = xgb,
feature_names = colnames(sparse.train),
n_first_tree = 100,
plot_width = 1920,
plot_height = 1080
)
importance <- xgb.importance( # GET IMPORTANCE MATRIX
feature_names = colnames(sparse.train),
model = xgb
)
xgb.plot.importance( # ALL VARS
importance_matrix = importance,
rel_to_first = T
)
#######GAS#########
215
MC_GAS <-MC[-c(1,2)]
MV_GAS <-MV[-c(1,2)]
train <- MC_GAS
train.y <- train$GAS
sparse.train <- sparse.model.matrix(GAS ~ ., data = train)
dtrain <- xgb.DMatrix(data = sparse.train, label = train.y)
test <- MV_GAS
test.y <- test$GAS
sparse.test <- sparse.model.matrix(GAS ~ ., data = test)
dtest <- xgb.DMatrix(data = sparse.test, label = test.y)
# 2. XGB TRAIN ----
xgb <- xgb.train( # TREE BUILDER
objective = "binary:logistic",
eval_metric = "auc",
data = dtrain,
max_depth = 16,
colsample_bytree = 0.5,
min_child_weight = 5,
eta = 0.015,
nrounds = 500,
watchlist = list(train = dtrain, test = dtest)
)
# 4. POST-BUILD. MANUAL MODEL EXPLORATION ----
library (DiagrammeR)
xgb.plot.tree( # PLOT 100 TREES... TODOS = CRASH!
model = xgb,
feature_names = colnames(sparse.train),
n_first_tree = 100,
plot_width = 1920,
plot_height = 1080
)
importance <- xgb.importance( # GET IMPORTANCE MATRIX
feature_names = colnames(sparse.train),
model = xgb
)
216
xgb.plot.importance( # ALL VARS
importance_matrix = importance,
rel_to_first = T
)
ANEXO BB. Numero de familia según 4 grupos de clasificación.
Origen Gas Envase # de familias
(Tratamientos)
1 1 1 1
1 1 2 2
1 2 1 3
1 2 2 4
2 1 1 5
2 1 2 6
2 2 1 7
2 2 2 8
Fuente. Elaboración propia.
ANEXO CC. Resultados Diseño experimental con uso de la librería Agricolae del software
R.
Parameters BIB
Lambda 3
treatmeans (tratamientos) 8
Block size (k) 4
Blocks (número de bloques) 14
Replication (Repeticiones) 7
217
Efficiency factor 0.86
# De muestras 56
Fuente. Elaboración propia.
ANEXO DD. Muestras de agua según la clasificación de familias del diseño experimental y
código en R
CODIGO PAIS DE ORIGEN GAS TIPO DE EMBASE FAMILIA
AP-EMP-01-01 Internacional NO Plástico 5
AP-EMP-01-02 Internacional NO Plástico 5
AP-EMP-01-03 Internacional NO Plástico 5
AP-EMP-02-01 Internacional NO Plástico 5
AP-EMP-02-02 Internacional NO Plástico 5
AP-EMP-02-03 Internacional NO Plástico 5
AP-EMP-03-01 Nacional SI Plástico 3
AP-EMP-03-02 Nacional SI Plástico 3
AP-EMP-03-03 Nacional SI Plástico 3
AP-EMP-04-01 Nacional NO vidrio 2
AP-EMP-04-02 Nacional NO vidrio 2
AP-EMP-04-03 Nacional NO vidrio 2
AP-EMP-05-01 Internacional SI vidrio 8
AP-EMP-05-02 Internacional SI vidrio 8
AP-EMP-05-03 Internacional SI vidrio 8
AP-EMP-06-01 Internacional NO plástico 5
AP-EMP-06-02 Internacional NO plástico 5
AP-EMP-06-03 Internacional NO plástico 5
AP-EMP-07-01 Nacional NO plástico 1
AP-EMP-07-02 Nacional NO plástico 1
AP-EMP-07-03 Nacional NO plástico 1
AP-EMP-08-01 Nacional NO plástico 1
AP-EMP-08-02 Nacional NO plástico 1
218
AP-EMP-08-03 Nacional NO plástico 1
AP-EMP-09-01 Internacional SI vidrio 8
AP-EMP-09-02 Internacional SI vidrio 8
AP-EMP-09-03 Internacional SI vidrio 8
AP-EMP-10-01 Nacional NO Plástico 1
AP-EMP-10-02 Nacional NO Plástico 1
AP-EMP-10-03 Nacional NO Plástico 1
AP-EMP-11-01 Nacional NO Plástico 1
AP-EMP-11-02 Nacional NO Plástico 1
AP-EMP-11-03 Nacional NO Plástico 1
AP-EMP-12-01 Nacional SI Plástico 3
AP-EMP-12-02 Nacional SI Plástico 3
AP-EMP-12-03 Nacional SI Plástico 3
AP-EMP-13-01 Nacional SI Plástico 3
AP-EMP-13-02 Nacional SI Plástico 3
AP-EMP-13-03 Nacional SI Plástico 3
AP-EMP-14-01 Internacional NO Plástico 5
AP-EMP-14-02 Internacional NO Plástico 5
AP-EMP-14-03 Internacional NO Plástico 5
AP-EMP-15-01 Internacional SI vidrio 8
AP-EMP-15-02 Internacional SI vidrio 8
AP-EMP-15-03 Internacional SI vidrio 8
AP-EMP-16-01 Internacional NO Plástico 5
AP-EMP-16-02 Internacional NO Plástico 5
AP-EMP-16-03 Internacional NO Plástico 5
AP-EMP-17-01 Nacional NO vidrio 2
AP-EMP-17-02 Nacional NO vidrio 2
AP-EMP-17-03 Nacional NO vidrio 2
AP-EMP-18-01 Nacional NO Plástico 1
AP-EMP-18-02 Nacional NO Plástico 1
219
AP-EMP-18-03 Nacional NO Plástico 1
AP-EMP-19-01 Internacional NO Plástico 5
AP-EMP-19-02 Internacional NO Plástico 5
AP-EMP-19-03 Internacional NO Plástico 5
AP-EMP-20-01 Nacional NO Plástico 1
AP-EMP-20-02 Nacional NO Plástico 1
AP-EMP-20-03 Nacional NO Plástico 1
AP-EMP-21-01 Nacional SI Plástico 3
AP-EMP-21-02 Nacional SI Plástico 3
AP-EMP-21-03 Nacional SI Plástico 3
AP-EMP-22-01 Nacional SI Plástico 3
AP-EMP-22-02 Nacional SI Plástico 3
AP-EMP-22-03 Nacional SI Plástico 3
AP-EMP-23-01 Internacional NO vidrio 6
AP-EMP-23-02 Internacional NO vidrio 6
AP-EMP-23-03 Internacional NO vidrio 6
AP-EMP-23-04 Internacional NO vidrio 6
AP-EMP-23-05 Internacional NO vidrio 6
AP-EMP-23-06 Internacional NO vidrio 6
AP-EMP-23-07 Internacional NO vidrio 6
AP-EMP-24-01 Nacional NO Plástico 1
AP-EMP-24-02 Nacional NO Plástico 1
AP-EMP-24-03 Nacional NO Plástico 1
AP-EMP-25-01 Nacional NO Plástico 1
AP-EMP-25-02 Nacional NO Plástico 1
AP-EMP-25-03 Nacional NO Plástico 1
AP-EMP-26-01 Nacional NO Plástico 1
AP-EMP-26-02 Nacional NO Plástico 1
AP-EMP-26-03 Nacional NO Plástico 1
AP-EMP-27-01 Nacional NO Plástico 1
220
AP-EMP-27-02 Nacional NO Plástico 1
AP-EMP-27-03 Nacional NO Plástico 1
AP-EMP-28-01 Internacional NO Plástico 5
AP-EMP-28-02 Internacional NO Plástico 5
AP-EMP-28-03 Internacional NO Plástico 5
AP-EMP-29-01 Nacional NO Plástico 1
AP-EMP-29-02 Nacional NO Plástico 1
AP-EMP-29-03 Nacional NO Plástico 1
AP-EMP-30-01 Nacional SI Plástico 3
AP-EMP-30-02 Nacional SI Plástico 3
AP-EMP-30-03 Nacional SI Plástico 3
AP-EMP-31-01 Nacional NO Plástico 1
AP-EMP-31-02 Nacional NO Plástico 1
AP-EMP-31-03 Nacional NO Plástico 1
AP-EMP-32-01 Nacional SI Plástico 3
AP-EMP-32-02 Nacional SI Plástico 3
AP-EMP-32-03 Nacional SI Plástico 3
AP-EMP-33-01 Nacional NO Plástico 1
AP-EMP-33-02 Nacional NO Plástico 1
AP-EMP-33-03 Nacional NO Plástico 1
AP-EMP-34-01 Nacional NO Plástico 1
AP-EMP-34-02 Nacional NO Plástico 1
AP-EMP-34-03 Nacional NO Plástico 1
AP-EMP-35-01 Internacional SI Plástico 7
AP-EMP-35-02 Internacional SI Plástico 7
AP-EMP-35-03 Internacional SI Plástico 7
AP-EMP-35-04 Internacional SI Plástico 7
AP-EMP-35-05 Internacional SI Plástico 7
AP-EMP-35-06 Internacional SI Plástico 7
AP-EMP-36-01 Nacional SI vidrio 4
221
AP-EMP-36-02 Nacional SI vidrio 4
AP-EMP-36-03 Nacional SI vidrio 4
AP-EMP-36-04 Nacional SI vidrio 4
AP-EMP-36-05 Nacional SI vidrio 4
AP-EMP-36-06 Nacional SI vidrio 4
AP-EMP-36-07 Nacional SI vidrio 4
AP-EMP-37-01 Nacional NO Plástico 1
AP-EMP-37-02 Nacional NO Plástico 1
AP-EMP-37-03 Nacional NO Plástico 1
AP-EMP-38-01 Nacional SI Plástico 3
AP-EMP-38-02 Nacional SI Plástico 3
AP-EMP-38-03 Nacional SI Plástico 3
AP-EMP-39-01 Nacional NO Plástico 1
AP-EMP-39-02 Nacional NO Plástico 1
AP-EMP-39-03 Nacional NO Plástico 1
AP-EMP-40-01 Nacional SI Plástico 3
AP-EMP-40-02 Nacional SI Plástico 3
AP-EMP-40-03 Nacional SI Plástico 3
AP-EMP-41-01 Nacional NO vidrio 2
AP-EMP-41-02 Nacional NO vidrio 2
AP-EMP-41-03 Nacional NO vidrio 2
AP-EMP-42-01 Nacional NO Plástico 1
AP-EMP-43-01 Nacional SI Plástico 3
AP-EMP-43-02 Nacional SI Plástico 3
AP-EMP-43-03 Nacional SI Plástico 3
AP-EMP-44-01 Nacional NO Plástico 1
AP-EMP-44-02 Nacional NO Plástico 1
AP-EMP-44-03 Nacional NO Plástico 1
AP-EMP-45-01 Nacional SI Plástico 3
AP-EMP-45-02 Nacional SI Plástico 3
222
AP-EMP-45-03 Nacional SI Plástico 3
AP-EMP-46-01 Nacional NO Plástico 1
AP-EMP-46-02 Nacional NO Plástico 1
AP-EMP-46-03 Nacional NO Plástico 1
AP-EMP-47-01 Nacional NO Plástico 1
AP-EMP-47-02 Nacional NO Plástico 1
AP-EMP-47-03 Nacional NO Plástico 1
AP-EMP-48-01 Nacional NO Plástico 1
AP-EMP-48-02 Nacional NO Plástico 1
AP-EMP-48-03 Nacional NO Plástico 1
AP-EMP-49-01 Internacional NO Plástico 5
AP-EMP-49-02 Internacional NO Plástico 5
AP-EMP-49-03 Internacional NO Plástico 5
AP-EMP-50-01 Nacional NO Plástico 1
AP-EMP-50-02 Nacional NO Plástico 1
AP-EMP-50-03 Nacional NO Plástico 1
AP-EMP-51-01 Nacional NO Plástico 1
AP-EMP-51-02 Nacional NO Plástico 1
AP-EMP-51-03 Nacional NO Plástico 1
AP-EMP-52-01 Nacional NO Plástico 1
AP-EMP-52-02 Nacional NO Plástico 1
AP-EMP-52-03 Nacional NO Plástico 1
AP-EMP-53-01 Nacional NO Plástico 1
AP-EMP-54-01 Nacional SI Plástico 3
AP-EMP-55-01 Nacional NO Plástico 1
AP-EMP-56-01 Nacional NO Plástico 1
AP-EMP-57-01 Nacional NO Plástico 1
AP-EMP-58-02 Nacional SI Plástico 3
AP-EMP-59-01 Internacional SI Plástico 7
Fuente. Elaboración propia.
223
ANEXO EE. Entropía conjunta, información mutua y valores de redundancia de factores
respecto a compuestos.
ANEXO EE1. Entropía conjunta, información mutua y valores de redundancia de factores
respecto a DEP. Variables Entropia_Conjunta MI R R_MAX % redundancia
ENVA-DEP 0.370977392 0.00016273
0.08896936 0.46170933 19.27
ENVB- DEP 0.466893239 0.2455324 0.30381284 80.82
ORIA- DEP 0.460132726 0.00138278
0.13312981 0.35420449 37.59
ORIB- DEP 0.584129628 0.16892268 0.26749478 63.15
GASA- DEP 0.519242293 0.0002247
0.1235677 0.31734483 38.94
GASB- DEP 0.603124215 0.16017213 0.26179819 61.18
Fuente. Elaboración propia.
ANEXO EE2. Entropía conjunta, información mutua y valores de redundancia de factores
respecto a DIBP.
Variables Entropia_Conjunta MI R R_MAX % redundancia
ENVA-DIBP 1.044246877 0.00388786
0.13198505 0.18220292 72.44
ENVB- DIBP 0.585721021 0.58596352 0.30454452 192.41
ORIA- DIBP 1.033029732 0.01274312
0.22130705 0.25839107 85.65
ORIB- DIBP 0.795694676 0.46906993 0.34353374 136.54
GASA- DIBP 1.050889495 0.00671164
0.24302355 0.29132542 83.42
GASB- DIBP 0.860812478 0.4314221 0.35016522 123.21
Fuente. Elaboración propia.
ANEXO EE3. Entropía conjunta, información mutua y valores de redundancia de factores
respecto a DBP.
Variables Entropia_Conjunta MI R R_MAX % redundancia
ENVA-DBP 0.716481601 0.00058115
0.13426118 0.26485804 50.69
ENVB- DBP 0.54135989 0.47907461 0.41456483 115.56
ORIA- DBP 0.754903554 0.00252291
0.20635632 0.36037791 57.26
ORIB- DBP 0.708607945 0.36914361 0.45835611 80.54
GASA- DBP 0.815274036 0.00104112
0.19506078 0.39931217 48.85
GASB- DBP 0.72666534 0.36175768 0.46563192 77.69
Fuente. Elaboración propia.
ANEXO EE4. Entropía conjunta, información mutua y valores de redundancia de factores
respecto a DEHP.
224
Variables Entropia_Conjunta MI R R_MAX % redundancia
ENVA-DEHP 1.051127174 0.00706622
0.13351071 0.18069213 73.89
ENVB-DEHP 0.585721021 0.58888666 0.30239441 194.74
ORIA-DEHP 1.051563025 0.00359117
0.21330162 0.25644665 83.18
ORIB-DEHP 0.796371992 0.47216067 0.34124343 138.36
GASA-DEHP 1.053534098 0.00579634
0.24657747 0.28922982 85.25
GASB-DEHP 0.869141832 0.4297094 0.34785412 123.53
Fuente. Elaboración propia.
ANEXO EE5. Entropía conjunta, información mutua y valores de redundancia de factores
respecto a DOP.
Variables Entropia_Conjunta MI R R_MAX % redundancia
ENVA-DOP 0.426346108 0.00924616
0.02122665 0.49678782 4.27
ENVB- DOP 0.430827083 0.33434627 0.33434627 100
ORIA- DOP 0.460132726 0.00547603
0.17713498 0.38698718 45.77
ORIB- DOP 0.608422378 0.16796296 0.29592972 56.76
GASA- DOP 0.519242293 0.00241441
0.16364012 0.34855734 46.95
GASB- DOP 0.629320506 0.15701497 0.2898672 54.17
Fuente. Elaboración propia.
ANEXO EE6. Entropía conjunta, información mutua y valores de redundancia de factores
respecto a TER.
Variables Entropia_Conjunta MI R R_MAX % redundancia
ENVA-TER 0.498865146 0.00158794
0.07018218 0.40855075 17.18
ENVB-TER 0.466893239 0.37593714 0.4241442 88.63
ORIA-TER 0.566463062 7.27E-05
0.14186655 0.48071317 29.51
ORIB-TER 0.608422378 0.26887364 0.3813204 70.51
GASA-TER 0.574224852 0.00412739
0.20441349 0.43965114 46.49
GASB-TER 0.673551938 0.20521576 0.37443888 54.81
Fuente. Elaboración propia.
ANEXO EE7. Entropía conjunta, información mutua y valores de redundancia de factores
respecto a FLU.
225
Variables Entropia_Conjunta MI R R_MAX % redundancia
ENVA-FLU 0.771859372 0.00089262
0.1120069 0.2521754 44.42
ENVB-FLU 0.527292854 0.51214961 0.39860044 128.49
ORIA-FLU 0.798468941 0.00057973
0.19574785 0.34526955 56.69
ORIB-FLU 0.708607945 0.39168487 0.44197849 88.62
GASA-FLU 0.815274036 0.00051834
0.22683373 0.38355033 59.14
GASB-FLU 0.768810322 0.34855618 0.44920993 77.59
Fuente. Elaboración propia.
ANEXO EE8. Entropía conjunta, información mutua y valores de redundancia de factores
respecto a GEM.
Variables Entropia_Conjunta MI R R_MAX % redundancia
ENVA-GEM 0.910739045 9.73E-05
0.13465812 0.20826922 64.66
ENVB-GEM 0.572452273 0.54714396 0.34081906 160.54
ORIA-GEM 0.941007075 1.28E-06
0.19985997 0.29147223 68.57
ORIB-GEM 0.74989204 0.44374715 0.38190209 116.19
GASA-GEM 0.946653014 8.61E-06
0.23515471 0.32676523 71.96
GASB-GEM 0.82118485 0.39769666 0.38883552 102.28
Fuente. Elaboración propia.
ANEXO EE9. Entropía conjunta, información mutua y valores de redundancia de factores
respecto a TRI.
Variables Entropia_Conjunta MI R R_MAX % redundancia
ENVA-TRI 0.716481601 0.00058115
0.13426118 0.26485804 50.69
ENVB-TRI 0.54135989 0.47907461 0.41456483 115.56
ORIA-TRI 0.769955859 0.00041994
0.19053156 0.36037791 52.87
ORIB-TRI 0.695658616 0.38067208 0.45835611 83.05
GASA-TRI 0.841794734 0.00845591
0.16887627 0.39931217 42.29
GASB-TRI 0.692729851 0.39156379 0.46563192 84.09
Fuente. Elaboración propia.
ANEXO EE10. Entropía conjunta, información mutua y valores de redundancia de factores
respecto a BPA.
Variables Entropia_Conjunta MI R R_MAX % redundancia
226
ENVA-BPA 0.963837923 0.00057092
0.12856395 0.19818137 64.87
ENVB-BPA 0.572452273 0.56555579 0.32696234 172.97
ORIA-BPA 0.972345862 0.00063723
0.20923413 0.27877333 75.06
ORIB-BPA 0.771489801 0.44959874 0.36730578 122.4
GASA-BPA 0.984289289 0.00016693
0.23774006 0.3132084 75.9
GASB-BPA 0.836962752 0.40933338 0.37413461 109.41
Fuente. Elaboración propia.
ANEXO EE11. Entropía conjunta, información mutua y valores de redundancia de factores
respecto a PRI.
Variables Entropia_Conjunta MI R R_MAX % redundancia
ENVA-PRI 0.399526115 0.00267256
0.13623548 0.47389432 28.75
ENVB-PRI 0.491168959 0.27144891 0.36095404 75.2
ORIA-PRI 0.489571754 0.00298528
0.16474147 0.41517135 39.68
ORIB-PRI 0.608422378 0.19753587 0.32095434 61.55
GASA-PRI 0.519242293 0.00612674
0.19843328 0.37565781 52.82
GASB-PRI 0.652556451 0.15634405 0.31460824 49.69
Fuente. Elaboración propia.
ANEXO EE12. Entropía conjunta, información mutua y valores de redundancia de factores
respecto a CAR.
Variables Entropia_Conjunta MI R R_MAX % redundancia
ENVA-CAR 0.927321286 0.00267256
0.12584884 0.20662726 60.91
ENVB-CAR 0.563714835 0.55698699 0.338579 164.51
ORIA-CAR 0.923313214 0.00446071
0.22044875 0.28941411 76.17
ORIB-CAR 0.771489801 0.43125476 0.37954749 113.62
GASB-CAR 0.946653014 0.00014475
0.24028818 0.32457206 74.03
GASA-CAR 0.829412033 0.39537126 0.38646489 102.3
Fuente. Elaboración propia.
ANEXO EE13. Entropía conjunta, información mutua y valores de redundancia de factores
respecto a PRO.
Variables Entropia_Conjunta MI R R_MAX % redundancia
ENVA-PRO 0.451718089 0.01082246
0.02339787 0.47389432 4.94
ENVB-PRO 0.430827083 0.36095404 0.36095404 100
227
ORIA-PRO 0.566463062 0.01966894
0.03355719 0.41517135 8.08
ORIB-PRO 0.514847408 0.32095434 0.32095434 100
GASA-PRO 0.547819101 0.00078588
0.15431858 0.37565781 41.08
GASB-PRO 0.629320506 0.18638458 0.31460824 59.24
Fuente. Elaboración propia.
ANEXO FF. Arboles de Regresión para compuestos.
ANEXO FF1. Árbol de Regresión como variable de respuesta DEP.
228
Fuente. Elaboración propia. ANEXO FF2. Árbol de Regresión como variable de respuesta DIBP.
Fuente. Elaboración propia.
ANEXO FF3. Árbol de Regresión como variable de respuesta DBP.
229
Fuente. Elaboración propia.
ANEXO FF4. Árbol de Regresión como variable de respuesta DEPH.
Fuente. Elaboración propia.
ANEXO FF5. Árbol de Regresión como variable de respuesta DOP.
230
Fuente. Elaboración propia.
ANEXO FF6. Árbol de Regresión como variable de respuesta TER.
Fuente. Elaboración propia.
ANEXO FF7. Árbol de Regresión como variable de respuesta ACE.
231
Fuente. Elaboración propia.
ANEXO FF8. Árbol de Regresión como variable de respuesta CAF.
Fuente. Elaboración propia.
ANEXO FF9. Árbol de Regresión como variable de respuesta FLU.
232
Fuente. Elaboración propia.
ANEXO FF10. Árbol de Regresión como variable de respuesta GEM.
Fuente. Elaboración propia.
ANEXO FF11. Árbol de Regresión como variable de respuesta TRI.
233
Fuente. Elaboración propia.
ANEXO FF12. Árbol de Regresión como variable de respuesta BPA.
Fuente. Elaboración propia.
234
ANEXO FF13.Árbol de Regresión como variable de respuesta PRI.
Fuente. Elaboración propia.
ANEXO FF14.Árbol de Regresión como variable de respuesta CAR.
Fuente. Elaboración propia.
ANEXO FF15.Árbol de Regresión como variable de respuesta PRO.
235
Fuente. Elaboración propia.
ANEXO GG. Tablas de importancia de bosques aleatorios para compuestos.
ANEXO GG1. Importancia de factores para DEP con Random Forest
FACTOR I detectado MeanDecreaseAccuracy obb estimate
ENVASE 1.38 1.37
2.3% ORIGEN -1.27 -1.28
GAS -3.07 -3.07
Fuente. Elaboración propia.
ANEXO GG2. Importancia de factores para DIBP con Random Forest
FACTOR I detectado MeanDecreaseAccuracy obb estimate
ENVASE 3.97 12.68
31% ORIGEN 16.98 21.94
GAS 4.39 9.52
Fuente. Elaboración propia.
ANEXO GG3. Importancia de factores para DBP con Random Forest
236
FACTOR I detectado MeanDecreaseAccuracy obb estimate
ENVASE 10.71 13.9
42.5% ORIGEN 9.78 10.2
GAS 5.42 8.1
Fuente. Elaboración propia.
ANEXO GG4. Importancia de factores para DEHP con Random Forest
FACTOR I detectado MeanDecreaseAccuracy obb estimate
ENVASE 9.28 14.03
39% ORIGEN 8.51 11.00
GAS 4.7 7.38
Fuente. Elaboración propia.
ANEXO GG5. Importancia de factores para DOP con Random Forest
FACTOR I detectado MeanDecreaseAccuracy obb estimate
ENVASE 1.67 5.28
3.45% ORIGEN 1.34 2.37
GAS 3.58 0.21
Fuente. Elaboración propia.
ANEXO GG6. Importancia de factores para TER con Random Forest
FACTOR I detectado MeanDecreaseAccuracy obb estimate
ENVASE 0 0
8.% ORIGEN 0 0
GAS 0 0
Fuente. Elaboración propia.
ANEXO GG7. Importancia de factores para ACE con Random Forest
FACTOR I detectado MeanDecreaseAccuracy obb estimate
ENVASE 6.47 1.44
32.18% ORIGEN 5.7 1.33
GAS -7.89 -8.64
Fuente. Elaboración propia.
ANEXO GG8. Importancia de factores para CAF con Random Forest
FACTOR I detectado MeanDecreaseAccuracy obb estimate
ENVASE 0 0
0.00% ORIGEN 0 0
GAS 0 0
Fuente. Elaboración propia.
ANEXO GG9. Importancia de factores para FLU con Random Forest
237
FACTOR I detectado MeanDecreaseAccuracy obb estimate
ENVASE 11.10 7.75
16% ORIGEN 13.69 12.94
GAS -4.26 -7.37
Fuente. Elaboración propia.
ANEXO GG10. Importancia de factores para GEM con Random Forest
FACTOR I detectado MeanDecreaseAccuracy obb estimate
ENVASE 16.5 14.84
26.4% ORIGEN 4.9 0.63
GAS 8.4 12.04
Fuente. Elaboración propia.
ANEXO GG11. Importancia de factores para TRI con Random Forest
FACTOR I detectado MeanDecreaseAccuracy obb estimate
ENVASE 10.17 6.19
19.5% ORIGEN 10.18 7.22
GAS -2.68 -6.12
Fuente. Elaboración propia.
ANEXO GG12. Importancia de factores para BPA con Random Forest
FACTOR I detectado MeanDecreaseAccuracy obb estimate
ENVASE 13.99 8.71
27.5% ORIGEN 10.45 4.06
GAS -2.37 -4.82
Fuente. Elaboración propia.
ANEXO GG13. Importancia de factores para PRI con Random Forest
FACTOR I detectado MeanDecreaseAccuracy obb estimate
ENVASE -5.30 -5.29
2.3% ORIGEN -6.02 -6.28
GAS 0.08 0.08
Fuente. Elaboración propia.
ANEXO GG14. Importancia de factores para CAR con Random Forest
FACTOR I detectado MeanDecreaseAccuracy obb estimate
ENVASE -4.97 1.35
25.29% ORIGEN -1.41 1.78
GAS 1.59 1.85
Fuente. Elaboración propia.
ANEXO GG15. Importancia de factores para PRO con Random Forest
238
FACTOR I detectado MeanDecreaseAccuracy obb estimate
ENVASE 0 0
3.45% ORIGEN 0 0
GAS 0 0
Fuente. Elaboración propia.