Trabajo 1 de Bioestadística

47
UNIVERSIDAD NACIONAL DE PIURA Facultad de Medicina Humana PARTE I I. ESTADÍSTICA 1.1 Definición Cuando coloquialmente se habla de estadística, se suele pensar en una relación de datos numéricos presentada de forma ordenada y sistemática. Esta idea es la consecuencia del concepto popular que existe sobre el término y que cada vez estámás extendido debido a la influencia de nuestro entorno, ya que hoy día es casi imposible que cualquier medio de difusión, periódico, radio, televisión, etc., no nos aborde diariamente con cualquier tipo de Informaciónestadística sobre accidentes de tráfico, índices de crecimiento de población, turismo, tendencias políticas, etc. Solo cuando nos adentramos en un mundo más específico como es el campo de la investigación de las Ciencias Sociales: Medicina, Biología, Psicología, empezamos a percibir que la Estadística no solo es algo más, sino que se convierte en la única herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidad intrínseca, no puedan ser abordadas desde la perspectiva de las leyes deterministas. Podríamos, desde un punto de vista más amplio, definir la estadística como la ciencia que estudia cómo debe emplearse la información y como dar una guía de acción en situaciones prácticas que entrañan incertidumbre. La Estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos; 1 BIOESTADÍSTICA C.P. Alfredo Sullón León

description

bioestadistica

Transcript of Trabajo 1 de Bioestadística

BIOESTADSTICA

UNIVERSIDAD NACIONAL DE PIURA Facultad de Medicina HumanaPARTE II. ESTADSTICA1.1 Definicin

Cuando coloquialmente se habla de estadstica, se suele pensar en una relacin de datos numricos presentada de forma ordenada y sistemtica. Esta idea es la consecuencia del concepto popular que existe sobre el trmino y que cada vez estms extendido debido a la influencia de nuestro entorno, ya que hoy da es casi imposible que cualquier medio de difusin, peridico, radio, televisin, etc., no nos aborde diariamente con cualquier tipo deInformacinestadstica sobre accidentes de trfico, ndices de crecimiento de poblacin, turismo, tendencias polticas, etc.

Solo cuando nos adentramos en un mundo ms especfico como es el campo de la investigacin de las Ciencias Sociales: Medicina, Biologa, Psicologa, empezamos a percibir que la Estadstica no solo es algo ms, sino que se convierte en la nica herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidad intrnseca, no puedan ser abordadas desde la perspectiva de las leyes deterministas. Podramos, desde un punto de vista ms amplio, definir la estadstica como la ciencia que estudia cmo debe emplearse la informacin y como dar una gua de accin en situaciones prcticas que entraan incertidumbre.

La Estadstica se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrnseca de los mismos; as como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.

1.2 Clasificacin de la Estadstica

Podramos por tanto clasificar la Estadstica en descriptiva, cuando los resultados del anlisis no pretenden ir ms all del conjunto de datos, e inferencial cuando el objetivo del estudio es derivar las conclusiones obtenidas a un conjunto de datos ms amplio.

Estadstica descriptiva: Describe, analiza y representa un grupo de datos utilizando mtodos numricos y grficos que resumen y presentan la informacin contenida en ellos. Estadstica inferencial: Apoyndose en el clculo de probabilidades y a partir de datos muestrales, efecta estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.

1.3 Los Elementos; Poblacin y Caracteres de la Estadstica

Establecemos a continuacin algunas definiciones de conceptos bsicos y fundamentales bsicas como son: elemento, poblacin, muestra, caracteres, variables, etc., a las cuales haremos referencia continuamente a lo largo del texto.

Individuos o elementos: personas u objetos que contienen cierta informacin que se desea estudiar.

Poblacin: conjunto de individuos o elementos que cumplen ciertas propiedades comunes.

Muestra: subconjunto representativo de una poblacin.

Parmetro: funcin definida sobre los valores numricos de caractersticas medibles de una poblacin.

Estadstico:funcin definida sobre los valores numricos de una muestra.

II. Bioestadstica2.1 Definicin

La bioestadstica es una ciencia de la estadstica que se ocupa de los problemas planteados dentro de las ciencias de la vida, como la biologa, la medicina, entre otros.

La aplicacin resulta hoy en da necesaria, en los campos:

salud pblica, que incluye: epidemiologa, nutricin, salud ambiental y en investigacin de servicios sanitarios. genmica y poblaciones genticas medicina ecologa bioensayos

La colaboracin de la bioestadstica ha sido clave en el desarrollo de nuevos frmacos, en el entendimiento de enfermedades crnicas como el cncer y el sida, y estos son algunos de los miles de ejemplos posibles.La estrecha relacin de la Estadstica con el mtodo cientfico hace de la Bioestadstica una disciplina imprescindible en la mayora de los proyectos en el rea tecnolgica.El pensamiento estadstico no slo resuelve y entiende compleja metodologa para dar respuesta a hiptesis, sino que es capaz de organizar el sistema que involucra la investigacin desde el diseo general, diseo de muestreo, control de calidad de la informacin, anlisis y presentacin de resultados.

III. Variables Estadsticas3.1 Definicin:

Cuando hablemos de variable haremos referencia a un smbolo (X,Y,A,B,. . . ) que puede tomar cualquier modalidad (valor) de un conjunto determina- do, que llamaremos dominio de la variable o rango. En funcin del tipo de dominio, las variables las clasificamos del siguiente modo:

3.2 Clasificacin:

Variables cualitativas, cuando las modalidades posibles son de tipo no- minal. Por ejemplo, el grupo sanguneo tiene por modalidades: Grupos Sanguneos posibles: A, B, AB, O

Variables cuasi cuantitativas u ordinales son las que, aunque sus modalidades son de tipo nominal, es posible establecer un orden entre ellas. Por ejemplo, si estudiamos el grado de recuperacin de un paciente al aplicarle un tratamiento, podemos tener como modalidades:

Grado de recuperacin: Nada, Poco, Moderado, Bueno, Muy Bueno.A veces se representan este tipo de variables en escalas numricas, por ejemplo, puntuar el dolor en una escala de 1 a 5. Debemos evitar sin embargo realizar operaciones algebraicas con estas cantidades. Un dolor de intensidad 4 no duele el dobleque otro de intensidad 2!

Variables cuantitativas o numricasson las que tienen por modalidades cantidades numricas con las que podemos hacer operaciones aritmticas. Dentro de este tipo de variables podemos distinguir dos grupos:

Discretas, cuando no admiten siempre una modalidad intermedia entre dos cualesquiera de sus modalidades. Un ejemplo es el nmero de hijos en una poblacin de familias:Nmero de hijos posibles: 0, 1, 2, 3, 4, 5, . . .Continuas, cuando admiten una modalidad intermedia entre dos cualesquiera de sus modalidades, v.g. el peso X de un nio al nacer.

Ocurre a veces que una variable cuantitativa continua por naturaleza, aparece como discreta. Este es el caso en que hay limitaciones en lo que concierne a la precisin del aparato de medida de esa variable, v.g. si medimos la altura en metros de personas con una regla que ofrece dos decimales de precisin, podemos obtenerAlturas medidas en cm: 1.50, 1.51, 1.52, 1.53,. . .

En realidad lo que ocurre es que con cada una de esas mediciones expresamos que el verdadero valor de la misma se encuentra en un intervalo de radio 0,005. Por tanto cada una de las observaciones de X representa ms bien un intervalo que un valor concreto.

3.3 SEGN LA INFLUENCIA

Segn la influencia que asignemos a unas variables sobre otras, podrn ser:

Variables independientes

Son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando intrnsecamente a los casos del mismo. Un tipo especial son las variables de control, que modifican al resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de un sesgo.Es aquella caracterstica o propiedad que se supone ser la causa del fenmeno estudiado. En investigacin experimental se llama as a la variable que el investigador manipula.

Variables dependientes

Son las variables de respuesta que se observan en el estudio y que podran estar influenciadas por los valores de las variables independientes.Hayman (1974: 69) la define como propiedad o caracterstica que se trata de cambiar mediante la manipulacin de la variable independiente.La variable dependiente es el factor que es observado y medido para determinar el efecto de la variable independiente.

IV. GRFICOS

4.1 DEFINICIN

Los grficos son medios popularizados y a menudo los ms convenientes para presentar datos, se emplean para tener una representacin visual de la totalidad de la informacin. Los grficos estadsticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fcilmente los hechos esenciales y compararlos con otros.

4.2 TIPOS DE GRFICOS ESTADSTICOS

a) Barrasb) Lneasc) Circularesd) rease) Cartogramasf) Mixtosg) Histogramas

Otros grficos

h) Dispersogramasi) Pictogramas

a) Grficos de barras

Consiste en dos ejes perpendiculares y una barra o rectngulo para cada valor de la variable. Normalmente, se suele colocar en el eje horizontal los valores de la variable (aunque tambin se puede hacer en el vertical). El otro eje se grada segn los valores de las frecuencias. La representacin grfica consiste en dibujar una barra o un rectngulo para cada uno de los valores de la variable de altura igual a su frecuencia.

b) Grficos de lneas

En este tipo de grfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre s.Se pueden usar para representar: una serie dos o ms series

c) Grficos circulares

Estos grficos nos permiten ver la distribucin interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor, segn lo que se desee destacar.Se pueden ser: En dos dimensiones en tres dimensiones

d)Grficos de reas

En estos tipos de grficos se busca mostrar la tendencia de la informacin generalmente en un perodo de tiempo. Pueden ser: Para representar una serie para representar dos o ms series en dosdimensiones en tres dimensiones.

e) Cartogramas

Estos tipos de grficos se utilizan para mostrar datos sobre una base geogrfica. La densidad de datos se puede marcar por crculos, sombreado, rayado o color.

f) Grficos Mixtos

En estos tipos de grficos se representan dos o ms series de datos, cada una con un tipo diferente de grfico. Son grficos ms vistosos y se usan para resaltar las diferencias entre las series.Pueden ser: en dosdimensiones en tres dimensiones.

g) Histogramas

Estos tipos de grficos se utilizan para representa distribuciones de frecuencias. Algn software especfico para estadstica grafican la curva de gauss superpuesta con el histograma.

OTROS GRFICOS

En esta categora se encuentran la mayora de los grficos utilizados en publicidad. Se los complementa con un dibujo que est relacionado con el origen de la informacin a mostrar. Son grficos llamativos, atraen la atencin del lector.h) Dispersogramas

Son grficos que se construyen sobre dos ejes ortogonales de coordenadas, llamados cartesianos, cada punto corresponde a un par de valores de datos x e y de un mismo elemento suceso.

i) Pictogramas

Los pictogramas son grficos similares a los grficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Generalmente este dibujo debe cortarse para representar los datos.Es comn ver grficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con el nico fin de hacer ms vistoso el grfico, estos tipos de grficos no constituyen un pictograma.

Pueden ser: En dos dimensiones En tres dimensiones.

V. MEDIDAS DE TENDENCIA CENTRAL5.1 PROMEDIOS0. Estadsticos de tendencia central

MEDIA O MEDIA ARITMTICA ()

Es la medida de centralizacin ms utilizada, ms conocida y la ms sencilla de calcular, debido principalmente a que sus ecuaciones se prestan para el manejo algebraico, lo cual la hace de gran utilidad. Su principal desventaja radica en su sensibilidad al cambio de uno de sus valores o a los valores extremos demasiado grandes o pequeos. La media se define como la suma de todos los valores observados, dividido por el nmero total de observaciones.

Cuando los valores representan una poblacin la ecuacin se define como:

Donde (m) representa la media, (N) representa el tamao de la poblacin y (Xi) representa cada uno de los valores de la poblacin. Ya que en la mayora de los casos se trabajan con muestras de la poblacin todas las ecuaciones que se presenten a continuacin sern representativas para las muestras. La media aritmtica para una muestra est determinada como:

Donde (X) representa la Media para la muestra, (n) el tamao de la muestra y (Xi) representa cada uno de los valores observados. Esta frmula nicamente es aplicable si los datos se encuentran desagrupados; en caso contrario debemos calcular la media mediante la multiplicacin de los diferentes valores por la frecuencia con que se encuentren dentro de la informacin; es decir,

Donde (Yi) representa el punto medio de cada observacin, (ni) es la frecuencia o nmero de observaciones en cada clase y (n) es el tamao de la muestra siendo igual a la suma de las frecuencias de cada clase.

Para entender mejor este concepto vamos a suponer que hemos tomado la edad de 5 personas que presentan los primeros sntomas de alzheimier al azar cuyos resultados fueron (61, 65, 59, 63, 71). Para facilitar su interpretacin se han generado tres rangos de edad los cuales se han establecido de 21 a 30 aos, de 31 a 40 aos y de 41 a 50 aos. Si nos fijamos en estos rangos notaremos que los puntos medios son 25, 35 y 45 respectivamente. Los resultados de la organizacin de estos datos se representan en la tabla [5-1].

RANGOYiniYi*ni

51-6055155

61-70653195

71-8075175

Figura 5-1 Si aplicamos la frmula para valores agrupados obtendramos que la media es igual a

Lo que nos indicara que el promedio de edad de los encuestados es de 65 aos. Si a estos mismos resultados le aplicamos la ecuacin para datos desagrupados (Ecuacin 5-3), tomando como referencia cada uno de los valores individuales, obtendramos que la media es igual a:

Lo que nos indicara que el promedio de edad para los datos desagrupados es de64 aos aproximadamente. Esta diferencia se debe a que al agrupar los datos se pierde parcialmente la exactitud de los clculos, principalmente al aumentar el nmero de datos. Para evitar estos inconvenientes, SPSS nos permite calcular las Medias, como si se trataran de valores desagrupados, aunque tiene algunos procedimientos para valores agrupados.Las propiedades de la media son las siguientes:

La media de una constante es la propia constante. La media de la suma o diferencia de variables es igual a la suma o diferencia de las medias de dichas variables. La media del producto de una constante por una variable, es igual a la constante por la media de la variable. La media de una combinacin lineal de dos o ms variables es igual a la combinacin lineal de las medias de dichas variables. La media es el centro de gravedad de la distribucin, ya que las desviaciones respecto a la media suman 0.Es importante resaltar que existe una gran variedad de medias como la Media geomtrica, la Media ponderada, la Media cuadrtica, etc. Por el momento slo hacemos nfasis en la media aritmtica ya que es la ms utilizada, aunque se recomienda a los lectores profundizar en estos temas.

MEDIANA(Me)

La mediana es el valor del elemento que ocupa el lugar central, si los datos estn ordenados, bien de forma creciente o de forma decreciente, es decir, nos permite conocer el valor que se encuentra exactamente en la mitad del conjunto de datos despus que las observaciones se han ubicado en serie ordenada. Esta medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del mismo. Para determinar la posicin de la mediana se utiliza la frmula:

Para comprender este concepto vamos a suponer que tenemos la serie ordenada de temperaturas corporales de pacientes con procesos febriles (37,37.5, 38, 38.5, 39), la posicin de la mediana sera:

Lo que nos indica que el valor de la mediana corresponde a la tercera posicin de la serie, que equivale a 38C. Si por el contrario contamos con un conjunto de datos que contiene un nmero par de observaciones, es necesario promediar los dos valores medios de la serie. Si en el ejemplo anterior le anexamos el valor 39.5, tendramos la serie ordenada (37,37.5, 38, 38.5, 39, 39.5) y la posicin de la mediana sera,

Es decir, la posicin tres y medio. Dado que es imposible destacar la posicin tres y medio, es necesario promediar los dos valores de la posiciones tercera y cuarta para producir una mediana equivalente, que para el caso corresponden a (38+38.5)/2 =38.25. Lo que nos indicara que la mitad de los valores se encuentra por debajo del valor 38.5 y la otra mitad se encuentra por encima de este valor.En conclusin la mediana nos indica el valor que separa los datos en dos fracciones iguales con el cincuenta por ciento de los datos cada una. Para las muestras que cuentan con un nmero impar de observaciones o datos, la mediana dar como resultado una de las posiciones de la serie ordenada; mientras que para las muestras con un nmero par de observaciones se debe promediar los valores de las dos posiciones centrales.

MODA (Mo)La medida modal nos indica el valor que ms veces se repite dentro de los datos; es decir, si tenemos la serie ordenada de edades de nios que van al consultorio peditrico de la doctora Margarita Torres (2, 2, 5 y 7), el valor que ms veces se repite es el nmero 2 quien sera la moda de los datos. Es posible que en algunas ocasiones se presente dos valores con la mayor frecuencia, lo cual se denomina Bimodal o en otros casos ms de dos valores, lo que se conoce como multimodal.En conclusin las Medidas de tendencia central, nos permiten identificar los valores ms representativos de los datos, de acuerdo a la manera como se tienden a concentrar.

La Media nos indica el promedio de los datos; es decir, nos informa el valor que obtendra cada uno de los individuos si se distribuyeran los valores en partes iguales. La Mediana por el contrario nos informa el valor que separa los datos en dos partes iguales, cada una de las cuales cuenta con el cincuenta por ciento de los datos. Por ltimo la Moda nos indica el valor que ms se repite dentro de los datos.

0. Estadsticos de posicin

Los estadsticos de posicin van a ser valores de la variable caracterizados por superar a cierto porcentaje de observaciones en la poblacin (o muestra). Tenemos fundamentalmente a los percentiles como medidas de posicin, y asociados a ellos veremos tambin los percentiles, cuartiles y deciles.

PERCENTILESPara una variable discreta, se define el percentil de orden k, como la observacin, Pk, que deja por debajo de si el k% de la poblacin. Vase la figura 2.4. Esta definicin nos recuerda a la mediana, pues como

Consecuencia de la definicin es evidente que:En el caso de una variable continua, el intervalo donde se encuentra Pk(li1, li], se calcula buscando el que deja debajo de si al k% de las observaciones. Dentro de el, Pk se obtiene segn la relacin:

CUARTILESLos cuartiles, Ql, son un caso particular de los percentiles. Hay 3, y se definen como:Q1 = P25 Q2 = P50 = Med Q3 = P75

DECILESSe definen los deciles como los valores de la variable que dividen a las observaciones en 10 grupos de igual tamao. Ms precisamente, definimos D1,D2, . . . , D9 Como:Di = P10 i i = 1, . . . , 9Ejemplo de clculo de cuartiles con una variable discretaDada la siguiente distribucin en el nmero de hijos de cien familias, calcular sus cuartiles.Solucin:1. Primer cuartil:; Primera Ni > n/4 = 39; luego Q1 = 2.

2. Segundo cuartil: Primera Ni > 2 n/4 = 65; luego Q2 = 3.

3. Tercer cuartil:; Primera Ni > 3 n/4 = 85; luego Q3 = 4.

Ejemplo general de distribucin de frecuencias: La distribucin de una variable tiene por polgono acumulativo de frecuencias el de la figura 2.5. Si el nmero total de observaciones es 50 personas en las cuales se evalu la edad en la cual se present la enfermedad de varicela.1. Elaborar una tabla estadstica con los siguientes elementos: intervalos, marcas de clase, frecuencia absoluta, frecuencia absoluta acumulada, frecuencias relativa y frecuencias relativa acumulada.2. Cuntas personas tuvieron varicela antes de los 10 aos, cuantas antes de los 8 y cuantas despus de 11.3. Determine los cuartiles.

Solucin:1. En la siguiente tabla se proporciona la informacin pedida y algunos clculos auxiliares que nos permitirn responder a otras cuestiones.

2. EDADESCalculemos el nmero de observaciones pedido:7 a 12 5 55 7 a 10X3 x

10+25+3= 38 personas menores de 10 aos enfermaron de varicela.7 a 12 5 5 57 a 8 x1 X

10+25+1= 36 personas menores de 8 aos enfermaron de varicela.7 a 12 5 5 57 a 11 X4 X

10+25+4= 39 personas menores de 11 aos enfermaron de varicela.3. Cuartiles:

VI. Medidas de variabilidad o dispersin

6.1 DEFINICIN

Los estadsticos de tendencia central o posicin nos indican donde se sita un grupo de puntuaciones. Los de variabilidad o dispersin nos indican si esas puntuaciones o valores estn prximas entre s; o si por el contrario estn o muy dispersas.

Ejemplo:Un Grupo de 12 estudiantes de medicina fueron pesados en iguales condiciones, los pesos fueron: 55, 60, 53, 54, 48, 50, 51, 58, 62, 59, 63, 70 en este caso, se observa que son diferentes, entonces hay dispersin.6.2 RANGOUna medida razonable de la variabilidad podra ser la amplitud o rango,que se obtiene restando el valor ms bajo de un conjunto de observaciones del valor ms alto.

6.2.1PROPIEDADES DEL RANGO

Es fcil de calcular y sus unidades son las mismas que las de la variable.

No utiliza todas las observaciones (solo dos de ellas).

Se puede ver muy afectada por alguna observacin extrema.

El rango aumenta con el nmero de observaciones, o bien se quedaigual.

En cualquier caso nunca disminuye.

La frmula para calcularlo es:R=Xmximo-xmnimo.

Donde:x mximo es el valor ms grande de la variablex mnimo es el valor ms pequeo de la variable

Ejemplo:

La siguiente serie corresponde a 11 pacientes internados en Hospital Cayetano Heredia cuyas edades estn en la muestra.

410182650555660688081

R= 81 4 = 77

El rango, es decir la diferencia entre el valor mximo y el mnimo es 77, obsrvese que los dems valores estn entre los valores extremos.

6.3 Varianza

La varianza, , se define como la media de las diferencias cuadrticas de n puntuaciones con respecto a su media aritmtica, es decir:

Es la medida que cuantifica la variabilidad de los datos respecto al valor de la media. Si los valores de las distancias son iguales, el valor de la varianza es cero. Si los datos son diferentes pero cercanos entre s, la varianza es pequea. Si los datos estn muy distantes, la varianza es grande.

Se puede definir tambin como la sumatoria de las diferencias de cada uno de los datos con respecto a la media dividida entre n-1.

Se calcula restando de cada observacin el valor de la media; las diferencias se elevan al cuadrado, luego la sumatoria se divide entre n-1 si los datos corresponden a una muestra, o, entre N si pertenecen a una poblacin.Las diferencias se elevan al cuadrado para desaparecer los signos negativas que se generan al restar la media a cada uno de los valores xi, de esta manera se evita que la suma algebraica de estas diferencias den como resultado cero. La varianza tiene las propiedades matemticas necesarias para analizar mejor los datos en comparacin a la desviacin media, medida que se obtiene de sumar las diferencia de los valores xi con su media, sin tomar en cuenta el signo y dividiendo la sumatoria entre el nmero de observaciones.

Cuando se trata de una muestra el smbolo de la varianza es s y cuando corresponde a una poblacin .

La frmula para obtener la varianza cuando los datos no estn agrupados es la siguiente:

Donde:

representa los valores de la variable, x1 , x2 , ., etc.nmero de observaciones de la muestra es la media aritmtica

La frmula alternativa para un gran nmero de datos es:

USOS:

1. Se usa como elemento importante para realizar diferentes pruebas de inferencia estadstica.2. Sirve para calcular la desviacin estndar, medida muy utilizada en las ciencias de la salud para analizar la variabilidad de los datos cuantitativos.3. Sirve para calcular el tamao de muestras cuando se requiere estudiar una variable cuantitativa.

Ejemplo:

De la misma poblacin se obtuvo una muestra de 10 personas de la localidad castilla para calcular el promedio de la frecuencia cardiaca en las mismas condiciones. Los datos se presentan a continuacin.

12345678910

65807580908065807070

Calcular la media aritmtica

Calcular la varianza, para lo cual se usar la frmula que corresponde a una muestra, dado que es la medida con suficientes propiedades para usarla en inferencia estadstica.

La varianza es . Se puede apreciar que la variabilidad de los datos es pequea, debido a que estos son valores cercanos entre s. La medida se expresa en unidades al cuadrado, y por lo tanto no se usa para su interpretacin; sin embargo, a partir de ella podemos calcular la desviacin estndar, medida muy usada en el anlisis de datos en salud.

6.4 DESVIACIN TPICA O ESTNDAR

Es la media cuadrtica de las desviaciones con respecto al promedio aritmtico, es la raz cuadrada de la varianza o es la raz cuadrada de la media aritmtica de los cuadrados de las desviaciones de los datos de la serie respecto a su media aritmtica.

La desviacin estndar representa la " VARIAVILIDAD PROMEDIO" de una distribucin, porque mide el promedio de las desviaciones de la media. Se debe de tomar en cuenta, que mientras mayor sea la dispersin de la media en una distribucin mayor, ser la desviacin estndar. Se aplica la siguiente frmula:

6.4.1Caractersticas de la desviacin estndar

Siempre es un valor positivo.

Est influenciada por todos los valores de la muestra o poblacin. Mayor influencia ejercen los valores extremos que los que estn cerca al promedio, debido a que son elevados al cuadrado en el clculo.

Sirve para definir la dispersin de los datos alrededor de la media.

Si la distribucin de la poblacin sigue una distribucin normal, en forma de campana (campana de Gauss), las observaciones se concentrarn en la parte central e incluirn, aproximadamente:

1 68% 2 95% 3 99%

6.4.2 Clculo de la desviacin estndar

El clculo es sumamente fcil, consiste en extraer la raz cuadrada de la varianza. En el ejemplo se tiene que:

La descripcin de las variables numricas se hace se hace con los valores de la media y la desviacin estndar, porque con estos dos valores tenemos una idea del conjunto de los datos ( 3 incluir el 99%). Tambin nos dar la regularidad y la variabilidad de los datos.

INTERPRETACION: El 68% de las personas de la localidad de castilla tienen entre 67.53 y 83.48 (75.5 7.98) respiraciones por minuto, o mejor an, entre 18 y 22 respiraciones por minuto, por ser una variable cuantitativa discreta.

6.5 DESVIACIN MEDIA

Es la media aritmtica de las desviaciones respecto a las medias tomadas en valor absoluto, o sea que es la suma de las desviaciones absolutas de las observaciones desde su media aritmtica, dividida entre el nmero de observaciones.

Para calcularla se pueden utilizar las siguientes frmulas:

Del ejercicio anterior de la frecuencia cardiaca de las personas.12345678910

65807580908065807070

El clculo se hace considerando los valores absolutos de las desviaciones, se obvia los signos. La sumatoria de estas diferencias se divide entre el nmero de observaciones.

El promedio de las desviaciones de las observaciones respecto a la media es 6.5.VII. COEFICIENTE DE VARIACIN

El coeficiente de variacin permite comparar la dispersin entre dos poblaciones distintas e incluso, comparar la variacin producto de dos variables diferentes (que pueden provenir de una misma poblacin).

Estas variables podran tener unidades diferentes, por ejemplo, podremos determinar si los datos tomados al medir el volumen de llenado de un envase de cierto lquido varan ms que los datos tomados al medir la temperatura del lquido contenido en el envase al salir al consumidor. El volumen los mediremos en centmetros cbicos y la temperatura en grados centgrados.El coeficiente de variacin elimina la dimensionalidad de las variables y tiene en cuenta la proporcin existente entre una medida de tendencia y la desviacin tpica o estndar., la frmula es:

La media y la desviacin estndar se expresan en la misma unidad de medida, las que se anulan cuando se hace el clculo, obtenindose una medida independiente a la unidad de medicin. El coeficiente de variacin es til tambin para comparar los resultados obtenidos por diferentes personas que efectan investigaciones en las que se estudian la misma variable.

Ejemplo: comparar la dispersin de los pesos de una muestra de sujetos obtenidos en libras con el peso de otra muestra expresada en kilogramos.

Si el coeficiente es: < 10 % se dice que hay poca dispersin

10 33% la dispersin es aceptable

34 50% dispersin es alta

50% la dispersin es muy alta

CLCULO DEL COEFICIENTE DE VARIACIN

CV=x100 = 10.56 %

La variacin relativa de las frecuencia cardiaca de las personas en castilla fue 10.56 %.

Parte II

CONCLUSIONES

Los conceptos antes mencionados han sido analizados e investigados de tal manera de hacer ms fcil su comprensin y entendimientos ya que la estadstica es la ciencia que trata de entender, organizar y tomar decisiones que estn de acuerdo con los anlisis efectuados Es la ciencia que estudia cmo debe emplearse la informacin y cmo dar una gua de accin en situaciones prcticas que entraan incertidumbre La colaboracin de la bioestadstica ha sido clave en el desarrollo de nuevos frmacos, en el entendimiento de enfermedades crnicas como el cncer y el sida, y estos son algunos de los miles de ejemplos posibles. La estrecha relacin de la Estadstica con el mtodo cientfico hace de la Bioestadstica una disciplina imprescindible en la mayora de los proyectos en el rea tecnolgica. El pensamiento estadstico no slo resuelve y entiende compleja metodologa para dar respuesta a hiptesis, sino que es capaz de organizar el sistema que involucra la investigacin desde el diseo general, diseo de muestreo, control de calidad de la informacin, anlisis y presentacin de resultados.

ANEXOSMS EJEMPLOS MDICOS RELACIONADOS CON ESTADSTICA

Ejemplo 1:Se ha realizado un estudio para comparar los pesos promedio de nios y nias de primer grado en una escuela secundaria se usar una muestra aleatoria de 20 nios y otra de 25 nias. Se sabe que tanto para nios como para nias los pesos siguen una distribucin normal. El promedio de los pesos de todos los nios de primer grado de esa escuela es de 100 libras y su desviacin estndar es de 14.142, mientras que el promedio de los pesos de todas las nias del primer grado de esa escuela es de 85 libras y su desviacin estndar es de 12.247 libras. Si representa el promedio de los pesos de 20 nios y es el promedio de los pesos de una muestra de 25 nias, encuentre la probabilidad de que el promedio de los pesos de los 20 nios sea al menos 20 libras ms grande que el de las 25 nias.

Solucin:Datos 1 = 100 libras2 = 85 libras1 = 14.142 libras2 = 12.247 librasn1 = 20 nios n2 = 25 nias= ?

Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de nios sea al menos 20 libras ms grande que el de la muestra de las nias es 0.1056.

Ejemplo 2:El Hospital Regional III Cayetano Heredia de Piura requiere de tubos de de rayos catdicos para realizar sus placas de Rayos X, y en este caso pone a solicitud 2 clases de tubos de diferentes fabricas. Los tubos de la compaa A tienen una vida media de 7.2 aos con una desviacin estndar de 0.8 aos, mientras que los de la B tienen una vida media de 6.7 aos con una desviacin estndar de 0.7. Determine la probabilidad de que una muestra aleatoria de 34 tubos de la compaa A tenga una vida promedio de al menos un ao ms que la de una muestra aleatoria de 40 tubos de la compaa B.

Solucin:Datos:A = 7.2 aos B = 6.7 aosA = 0.8 aosB = 0.7 aosnA = 34 tubosnB = 40 tubos= ?

Ejemplo 3:Para poner al servicio de salud ambulancias, as atender ms rpido las emergencias lejanas, el Gerente de Hospital de Sullana el Dr. Juan Razuri Gallardo. Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrndose una desviacin estndar de 1.23km/L para la primera gasolina y una desviacin estndar de 1.37km/L para la segunda gasolina; se prueba la primera gasolina en 35 ambulancias y la segunda en 42 ambulancias. a. Cul es la probabilidad de que la primera gasolina de un rendimiento promedio mayor de 0.45km/L que la segunda gasolina? b. Cul es la probabilidad de que la diferencia en rendimientos promedio se encuentre entre 0.65 y 0.83km/L a favor de la gasolina 1?

Solucin:En este ejercicio no se cuenta con los parmetros de las medias en ninguna de las dos poblaciones, por lo que se supondrn que son iguales.Datos:1 = 1.23 Km/Lto2 = 1.37 Km/Lton1 = 35 autos n2 = 42 autosa. = ?

b.

La probabilidad de que la diferencia en rendimientos promedio en las muestras se encuentre entre 0.65 y 0.83 Km/Lto a favor de la gasolina 1 es de 0.0117.Ejemplo 4:Si en Piura se quiere estudiar la influencia que puede tener el tabaco con el peso de los nios al nacer. Para ello se consideran dos grupos de mujeres embarazadas (unas que fuman un paquete al da y otras que no) y se obtienen los siguientes datos sobre el peso X, de sus hijos:

En ambos grupos los pesos de los recin nacidos provienen de sendas distribuciones normales de medias desconocidas, y con varianzas que si bien son desconocidas, podemos suponer que son las mismas. Calcular en cuanto influye el que la madre sea fumadora en el peso de su hijo. Solucin: Si X1 es la v.a. que describe el peso de un nio que nace de madre no fumadora, y X2 el de un hijo de madre fumadora, se tiene por hiptesis que

Si queremos estimar en cuanto influye el que la madre sea fumadora en el peso de su hijo, podemos estimar un intervalo de confianza para, lo que nos dar la diferencia de peso esperado entre un nio del primer grupo y otro del segundo. El estadstico que se ha de aplicar para esta cuestin es:

Donde

Consideramos un nivel de significacin que nos parezca aceptable, por ejemplo , y el intervalo buscado se obtiene a partir de: (ver la Figura)

Figura: Regin que se utiliza para calcular el intervalo de confianza.

Con lo cual se puede decir que un intervalo de confianza para el peso esperado en que supera un hijo de madre no fumadora al de otro de madre fumadora est comprendido con un nivel de confianza del entre los 0,068 Kg. y los 0,731 Kg.

EJEMPLO N 5:Vamos a suponer que hemos tomado la edad de 5 personas que presentan los primeros sntomas de alzhimer al azar cuyos resultados fueron (61, 65, 59, 63, 71). Para facilitar su interpretacin se han generado tres rangos de edad los cuales se han establecido de 21 a 30 aos, de 31 a 40 aos y de 41 a 50 aos. Si nos fijamos en estos rangos notaremos que los puntos medios son 25, 35 y 45 respectivamente. Los resultados de la organizacin de estos datos se representan en esta tablita:RANGOYiniYi*ni

51-6055155

61-70653195

71-8075175

Si aplicamos la frmula para valores agrupados obtendramos que la media es igual a

Lo que nos indicara que el promedio de edad de los encuestados es de 65 aos. Si a estos mismos resultados le aplicamos la ecuacin para datos desagrupados (Ecuacin 5-3), tomando como referencia cada uno de los valores individuales, obtendramos que la media es igual a:

Lo que nos indicara que el promedio de edad para los datos desagrupados es de64 aos aproximadamente.

BIBLIOGRAFA

http://www.vitutor.com/estadistica/descriptiva/a_1.html

http://www.itcomitan.edu.mx/tutoriales/estadistica/contenido/unidad_2_4.html

http://www.bioestadistica.uma.es/libro/node106.htm

http://www.uclm.es/profesorado/jmezo/estadistica/t2.pdf

http://www.slideshare.net/guestb0c835/clases-de-graficas-estadisticas

http://guajiros.udea.edu.co/descriptiva/articulos/Curso%20de%20EstadIstica%20Basica.pdf

http://www.eumed.net/libros/2007a/239/5d.htm

1BIOESTADSTICA C.P. Alfredo Sulln Len