ESTADÍGRAFOS

11
Estadígrafos Después de haber ordenado y descrito un conjunto de datos, aún el análisis resulta todavía un tanto incompleto; es necesario entonces resumir la información y facilitar así su análisis e interpretación utilizando ciertos indicadores. A estos indicadores se les denomina también ESTADIGRAFOS o MEDIDAS DE RESUMEN, permiten hallar un valor numérico, el mismo que representa a toda la población o muestra en estudio. Clasificación: Las medidas de resumen más importantes se clasifican en tres grupos: - Medidas de tendencia central: Media, mediana, moda - Medidas de dispersión: Desviación estándar, varianza, coeficiente de variación Medidas De Tendencia Central Son los valores numéricos que indican el "centro" de un conjunto de datos, describen a todo el conjunto señalando una característica que destaca. Los estadígrafos de tendencia central más importantes son: Media Aritmética O Promedio Aritmético Es el punto de equilibrio de una serie de datos, el valor que tendrían todos los datos de no existir diferencias entre ellos. a) Para datos no agrupados: Se obtiene sumando los valores de todos los datos y dividiendo esta suma entre el número total de datos. La fórmula es: n S xi

description

Informacion acerca de calculos estadisticos

Transcript of ESTADÍGRAFOS

EstadgrafosDespus de haber ordenado y descrito un conjunto de datos, an el anlisis resulta todava un tanto incompleto; es necesario entonces resumir la informacin y facilitar as su anlisis e interpretacin utilizando ciertos indicadores.A estos indicadores se les denomina tambin ESTADIGRAFOS o MEDIDAS DE RESUMEN, permiten hallar un valor numrico, el mismo que representa a toda la poblacin o muestra en estudio.Clasificacin:Las medidas de resumen ms importantes se clasifican en tres grupos:- Medidas de tendencia central:Media, mediana, moda- Medidas de dispersin:Desviacin estndar, varianza, coeficiente de variacinMedidas De Tendencia CentralSon los valores numricos que indican el "centro" de un conjunto de datos, describen a todo el conjunto sealando una caracterstica que destaca. Los estadgrafos de tendencia central ms importantes son:Media Aritmtica O Promedio AritmticoEs el punto de equilibrio de una serie de datos, el valor que tendran todos los datos de no existir diferencias entre ellos.a)Para datos no agrupados: Se obtiene sumando los valores de todos los datos y dividiendo esta suma entre el nmero total de datos. La frmula es: n Sxi i = 1X= -----------nb)Para datos agrupados: La media se obtiene sumando el producto que se obtiene del valor medio del intervalo de clase por la frecuencia de esa clase y dividiendo esta suma entre el nmero total de datos. El valor medio del intervalo de clase se obtiene sumando el lmite inferior ms el lmite superior de la clase y dividiendo esta suma entre dos. La frmula es: n Snh.xh --- h=1X=------------------nhLa media tiene como ventajas cuando los datos estn distribuidos normal o simtricamente, es de gran estabilidad porque toma en cuenta todos los datos y nos permite estimar y probar parmetros en inferencias.Sin embargo, tambin tiene algunas desventajas como que al incluir todos los datos, puede ser afectado por valores extremos, por ello no es recomendable calcular la media en datos agrupados que tienen clases abiertas en los extremos.Mediana: Es un valor numrico de posicin central, que nos determina que el 50 % de las observaciones sea menor o igual que l y el otro 50 % sea mayor o igual. Para obtenerlo se deben seguir los siguientes pasos:a)Para datos no agrupados:A.Ordenar los datos de menor a mayor.B.Determinar la posicin con:pMd =n+1= E + f(Entero + fraccin)2C.Calcular el valor de la mediana con:vMd = xE+ fDdondeD = (xE+1- xE)b)Para datos agrupados:A.Obtener Nh(nmero de datos acumulado)B.Determinar la posicin de la mediana (y marcar la clase que la contiene), con:pMd =NhC.Calcular el valor de la mediana con:Donde:LMdi= Lmite real inferior (por redondeo) de la clase que contiene la medianaIMd= Tamao del intervalo de la clase Mediana.N(Md-1)= Nmero de datos acumulado hasta la clase anterior a la clase mediananMd= Nmero de datos de la clase mediana.La mediana no est afectada por valores extremos, es til cuando los datos agrupados tienen clases abiertas en los extremos. Se aplica tambin a variables de la escala ordinal.ModaEs el valor que ms se repite, , en una distribucin de frecuencias, es el valor de ms alta frecuencia. Si hay dos o ms valores con esta caracterstica, se dice entonces que el conjunto de datos es bi o multimodal. Si la cantidad de elementos que se repiten es mayor que n/2, entonces se afirma que no hay moda.a)Para datos no agrupados: La moda es el valor ms frecuente o el que ms se repite.b)Para datos agrupados:A.La posicin de la moda est en la clase de frecuencia mxima, a ella se le denomina clase moda.pMo = nmxB.El valor de la moda se calcula con:vMo =LMoi+IMoD1D1 +D2Donde:LMoi=Lmite real inferior (por redondeo) de la clase modaIMo=Tamao del intervalo de la clase modaD1=nMo- n(Mo-1)D2=nMo- n(Mo+1)nMo=Valor de la clase modan(Mo-1)=Valor de la clase anterior a la clase modan(Mo+1)=Valor de la clase posterior a la clase moda.

Medidas De DispersionSon aquellas que miden cunto se alejan de la media cada uno de los valores de la variable.VarianzaEs el promedio de la suma de las desviaciones al cuadrado con respecto a la media. Sirve para comparar dos o ms distribuciones. Se obtiene de la siguiente manera:a)Para datos no agrupados:nS(xi-x)2i = 1S2=nA cualquier clase se le ubica como cero, luego va en positivo hacia abajo y en negativo hacia arriba, esa es la columnadhS2=9 [25(209) - (39)2]525b)Para datos agrupados:S2=I2[NSnhdh2- (Snhdh)2]N2Desviacin StandardEs igual a la raz cuadrada de la varianza, tiene algunos principios que mencionamos:a)A mayor dispersin alrededor de la media, mayor valor de la desviacin estndar.b)Las desviaciones extremas con respecto a la media, pesan mucho para determinar el valor de la desviacin estndar.c)Para distribuciones normales:El 68,97 % de las observaciones est en X 1 SEl 95,45 % de las observaciones est en X 2 SEl 99,73 % de las observaciones est en X 3 SCoeficiente De VariacinMide la homogeneidad de una muestra.CV=Sx100X.Se da en porcentaje, el resultado es la heterogeneidad de la poblacin; el resto de 100 % es la homogeneidadSesgo.Cualquier error en el diseo o conduccin del estudio que produce una conclusin diferente de la verdad. El sesgo puede ser minimizado asegurando que los participantes de los estudios sean:

- comparablemente seleccionados- similarmente encuestados

El coeficiente de SESGO determina el grado de asimetra (alargamiento de la distribucinHacia la izquierda o hacia la derecha). Para determinar el sesgo de una distribucin de frecuencias se utiliza el:

Si el coeficiente de sesgo tiene un valor positivo se dice que la distribucin es SESGADA a DERECHA o que tiene SESGO POSITIVO.Si el coeficiente de sesgo tiene un valor negativo se dice que la distribucin es SESGADA a IZQUIERDA o que tiene SESGO NEGATIVO.Si el coeficiente de sesgo tiene un valor 0 se dice que la distribucin es INSESGADA o que tiene SESGO 0.Sesgo negativo sesgo positivo insesgadaOtras expresiones que se utilizan para el sesgo son:

El valor absolutoEs el que tiene un numero ms all del lado del cero en el que esteEl valor absoluto de -8 es 8, o sea vale 8 pero como esta del lado izquierdo del cero le agregamos el (-), para poder ubicarloAl valor absoluto tambin se lo llama modulo y se lo simboliza con dos rayitas I de cada lado del nmero as:l 5 l = 5 y l-5 l = 5El modulo o valor absoluto de un nmero siempre es positivoSi por ejemplo tienes algo comolxl =3 la x puede ser x1=3 y x2=-3Si tienes algo como lxl=-9 no existe ya que no puede ser negativo un modulo.El valor relativoDe un nmero o de una expresin hace referencia no solamente a su valor como tal sino tambin atiende a otros aspectos, como puede ser su posicin o su orientacin.Con respecto a la recta de los reales un nmero es negativo o positivo segn de qu lado del cero se encuentre.Estimacin de ParmetrosLa teora de muestreo puede emplearse para obtener informacin acerca de muestras obtenidas aleatoriamente de una poblacin conocida. Sin embargo, desde un punto de vista prctico, suele ser ms importante y ser capaz de inferir informacin acerca de una poblacin a partir de muestras de ellas. Dichos problemas son tratados por la inferencia estadsticaque utiliza principios de muestreo. Un problema importante de la inferencia estadstica es la estimacin deparmetrospoblacionaleso simplemente parmetros(como la media y la varianza poblacionales), a partir de losestadsticos mustralescorrespondientes oestadsticos(como la media y la varianza muestral.Estimados sin SesgoSi la media de la distribucin muestral de un estadstico es igual al parmetro poblacional correspondiente, el estadstico se denominaestimador sin sesgodel parmetro; de otra manera, es denominadoestimador sesgado. Los valores correspondientes de dichos estadsticos se llaman estimados sin sesgo o sesgados, respectivamente.1.- La media de la distribucin muestral de las mediasesx, la media poblacional. Por lo tanto, la media muestral x es un estimado sin sesgo de la media poblacional.2.- La media de la distribucin muestral de las varianzas es:s2= (N-1/ N)2donde2es la varianza poblacional y N es el tamao de la muestra .Entonces, la varianza muestral s2es un estimado sesgado de la varianza poblacional2. Usandola varianza modificada.2=(N/ N-1) s2Se encuentra que2=2, de modo que2es un estimado sin sesgo de2.Sin embargoes un estimado de.En trminos de esperanza matemtica se poda decir que un estadstico no est sesgado si su esperanzaes igual al parmetro poblacional correspondienteEstimados EficientesSi las distribuciones mustrales de dos estadsticos tienen la misma media o esperanza matemtica entonces el estadstico con la menor varianza se denominaestimador eficientede la media, mientras que el otro estadstico se le llamaestimador ineficiente. Los valores correspondientes de los estadsticos se conocen, respectivamente, como estimadores eficientes. Si se consideran todos los estadsticos posibles, cuyas distribuciones mustrales tienen la misma media, aquel con la menor varianza suele denominarse el mejor o ms eficienteestimadorde dicha media.La distribucin muestral de la media y la mediana tienen la misma media; a saber la media poblacional. Sin embargo, la varianza de la distribucin muestral de las medias es ms pequea que la varianza de la distribucin muestral de las medianas. Por lo tanto, la media muestral ofrece un estimado ineficiente de esta De todos los estadsticos que estiman la media poblacional, la media muestral ofrece el mejor o ms eficiente estimado. En la prctica, suelen usarse los estimados ineficientes debido a la relativa facilidad con que se obtienen algunos de ellos.Estimados por Punto y Estimados por Intervalo; su ConfiabilidadEl estimado de un parmetro poblacional dado por un solo nmero se denominaestimado puntualdel parmetro. El estimado de un parmetro poblacional dado por dos nmeros, entre los cuales se considera esta el parmetro, se denominaestimadopor intervalo del parmetro. Los estimados por intervalo indican la precisin de un estimado y son, por lo tanto preferibles a los estimados por punto.Ejemplo:Si se dice que una distancia medida es de 5.28 metros se est dando un estimado por punto. Si por otro lado, la distancia es de 5.28 mas menos 0.03metros (es decir, la distancia est entre 5.25m y 5.31 m), se est dando un estimado por intervalo.La informacin sobre el error o precisin de un estimado se conoce comoconfiabilidad.Estimados por Intervalo de Confianza de Parmetros PoblacionalesSeansysla media y la desviacin estndar (error estndar), en ese orden, de la distribucin muestral de un estadstico S. Entonces, si la distribucin muestral de S es en formas aproximadas a la normal (lo cual es verdadero para muchos estadsticos si el tamao de la muestra es N mayor o menor que 30.IncertidumbreLa incertidumbre refiere la duda o perplejidad que sobre un asunto o cuestin se tiene.En este sentido del trmino, la incertidumbre se iguala a unestado de duda en el que predomina el lmite de la confianza o la creencia en la verdad de un determinadoconocimiento; el sentimiento absolutamente opuesto a la incertidumbre es la certeza.en Estadstica, la propagacin de incertidumbrees el efecto de variables de incertidumbres, tambin llamados errores, en la incertidumbre de establecer una funcin matemtica basada en estos.

Ciencia Comocienciase designa todo aquel conocimiento adquirido a travs del estudio o de la prctica, constituido por una serie de principios y leyes, deducidos mediante la observacin y el razonamiento, y estructurados sistemticamente para su comprensin. El origen de la palabra cienciase rastrea en el vocablo latnscienta, que significa conocimiento, saber.Elmtodo cientficoSe refiere a la serie de etapas que hay que recorrer para obtener un conocimiento vlido desde el punto de vista cientfico, utilizando para esto instrumentos que resulten fiables. Lo que hace este mtodo es minimizar la influencia de lasubjetividaddel cientfico en su trabajo.Entre los pasos necesarios que conforman el mtodo cientfico, se hallan laobservacin(el investigador debe apelar a sus sentidos para estudiar el fenmeno de la misma manera en que ste se muestra en la realidad), lainduccin(partiendo de las observaciones, el cientfico debe extraer los principios particulares de ellas), elplanteo de una hiptesis(surgido de la propia observacin), lademostracin o refutacin de la mismay la presentacin de latesis(lateora cientfica).