Estadistica ii expo
-
Upload
daniel-marquez -
Category
Documents
-
view
1.457 -
download
2
Transcript of Estadistica ii expo
Definición de Estadística Inferencial
La Estadística inferencial o Inferencia estadística estudia cómo sacar
conclusiones generales para toda la población a partir del estudio de una
muestra, y el grado de fiabilidad o significación de los resultados obtenidos.
Ventajas y limitaciones para el uso de la muestra
El trabajo con una muestra implica eficiencia, pues significa ahorro de
recursos, esfuerzos y tiempo. Con el uso del muestreo se pueden obtener
resultados razonablemente más precisos que el estudio de todo el universo,
pues para el estudio de solo una muestra, el personal mínimo necesario puede
ser mejor preparado para recoger información más detallada y elaborada.
Como limitación se debe mencionar el error de muestreo, producto de
variabilidad intrínseca que poseen los elementos de todo universo o población.
El termino error no debe entenderse como sinónimo de equivocación.
También suelen introducirse errores por otras vías, los cuales se
denominan errores sistemáticos. Los cuales son: Imputables al observador,
Imputables al método de observación o medición e Imputables a lo observado
(unidad de muestreo).
Conceptos básicos de muestreo: Población estadística,
unidades individuales, parámetro, muestreo, muestra, estadístico o
estadígrafo.
Población estadística:
Población estadística, en estadística, también llamada universo o
colectivo, es el conjunto de elementos de referencia sobre el que se realizan
unas de las observaciones. Población (‘population’) es el conjunto sobre el que
estamos interesados en obtener conclusiones (hacer inferencia). Normalmente
es demasiado grande para poder abarcarlo.
Parámetro:
Valor numérico que describe una característica de la población (Pardo
Merino). Los parámetros se estiman a partir de la información aportada por una
muestra de la población.
Ejemplo: Si se considera como universo a todos los estudiantes
regulares de la Universidad de Los Andes, la edad promedio de estos, el
porcentaje de estudiantes de sexo femenino que fuman, el ingreso medio todos
los estudiantes, son valores que describen a este conjunto Contenido.
Muestreo:
Se conoce como muestreo a la técnica para la selección de una muestra
a partir de una población.
Al elegir una muestra se espera conseguir que sus propiedades sean
extrapolables a la población. Este proceso permite ahorrar recursos, y a la vez
obtener resultados parecidos a los que se alcanzarían si se realizase un
estudio de toda la población.
Cabe mencionar que para que el muestreo sea válido y se pueda realizar
un estudio adecuado (que consienta no solo hacer estimaciones de la
población sino estimar también los márgenes de error correspondientes a
dichas estimaciones), debe cumplir ciertos requisitos. Nunca podremos estar
enteramente seguros de que el resultado sea una muestra representativa, pero
sí podemos actuar de manera que esta condición se alcance con una
probabilidad alta.
En el muestreo, si el tamaño de la muestra es más pequeño que el
tamaño de la población, se puede extraer dos o más muestras de la misma
población. Al conjunto de muestras que se pueden obtener de la población se
denomina espacio muestral. La variable que asocia a cada muestra su
probabilidad de extracción, sigue la llamada distribución muestral.
Muestra:
En estadística una muestra estadística (también llamada muestra
aleatoria o simplemente muestra) es un subconjunto de casos o individuos de
una población estadística.
Las muestras se obtienen con la intención de inferir propiedades de la
totalidad de la población, para lo cual deben ser representativas de la misma.
Para cumplir esta característica la inclusión de sujetos en la muestra debe
seguir una técnica de muestreo. En tales casos, puede obtenerse una
información similar a la de un estudio exhaustivo con mayor rapidez y menor
coste
Por otra parte, en ocasiones, el muestreo puede ser más exacto que el
estudio de toda la población porque el manejo de un menor número de datos
provoca también menos errores en su manipulación. En cualquier caso, el
conjunto de individuos de la muestra son los sujetos realmente estudiados.
El número de sujetos que componen la muestra suele ser inferior que el
de la población, pero suficiente para que la estimación de los parámetros
determinados tenga un nivel de confianza adecuado. Para que el tamaño de la
muestra sea idóneo es preciso recurrir a su cálculo.
Estadístico o Estadígrafo:
Son las medidas descriptivas inherentes a una muestra, las cuales
pueden usarse como estimación del parámetro. Como ejemplo podría tomarse
los salarios promedio de una muestra de los empleados de la empresa.
Clases de muestreos: probabilístico y no probabilístico
Muestreo probabilístico
Los métodos de muestreo probabilísticos son aquellos que se basan en el
principio de equis probabilidad. Es decir, aquellos en los que todos los
individuos tienen la misma probabilidad de ser elegidos para formar parte de
una muestra y, consiguientemente, todas las posibles muestras de tamaño n
tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de
muestreo probabilísticos nos aseguran la representatividad de la muestra
extraída y son, por tanto, los más recomendables.
Métodos de muestreo no probabilísticos A veces, para estudios exploratorios, el muestreo probabilístico resulta
excesivamente costoso y se acude a métodos no probabilísticos, aun siendo
conscientes de que no sirven para realizar generalizaciones (estimaciones
inferenciales sobre la población), pues no se tiene certeza de que la muestra
extraída sea representativa, ya que no todos los sujetos de la población tienen
la misma probabilidad de ser elegidos. En general se seleccionan a los sujetos
siguiendo determinados criterios procurando, en la medida de lo posible, que
la muestra sea representativa.
En algunas circunstancias los métodos estadísticos y epidemiológicos
permiten resolver los problemas de representatividad aun en situaciones de
muestreo no probabilístico, por ejemplo los estudios de caso-control, donde los
casos no son seleccionados aleatoriamente de la población.
Tipos de Muestreo No Probabilistico: Intencional, Accidental y
por Cuotas.
Muestreo intencional o de conveniencia:
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras "representativas" mediante la inclusión en la muestra de
grupos supuestamente típicos. Es muy frecuente su utilización en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto.
También puede ser que el investigador seleccione directa e
intencionadamente los individuos de la población. El caso más frecuente de
este procedimiento el utilizar como muestra los individuos a los que se tiene
fácil acceso (los profesores de universidad emplean con mucha frecuencia a
sus propios alumnos). 3.- Bola de nieve:
Se localiza a algunos individuos, los cuales conducen a otros, y estos a
otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones "marginales",
delincuentes, sectas, determinados tipos de enfermos, etc.
Muestreo Discrecional:
A criterio del investigador los elementos son elegidos sobre lo que él
cree que pueden aportar al estudio.
Muestreo por cuotas:
También denominado en ocasiones "accidental". Se asienta generalmente
sobre la base de un buen conocimiento de los estratos de la población y/o de
los individuos más "representativos" o "adecuados" para los fines de la
investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio
estratificado, pero no tiene el carácter de aleatoriedad de aquél.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un
número de individuos que reúnen unas determinadas condiciones, por
ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en
Gijón. Una vez determinada la cuota se eligen los primeros que se encuentren
que cumplan esas características. Este método se utiliza mucho en las
encuestas de opinión.
Tipos de muestreo Probabilistico Muestreo Aleatorio Simple,
Muestreo Sistemático y Muestreo Estratificado .
Muestreo aleatorio simple:
El procedimiento empleado es el siguiente: 1) se asigna un número a
cada individuo de la población y 2) a través de algún medio mecánico (bolas
dentro de una bolsa, tablas de números aleatorios, números aleatorios
generados con una calculadora u ordenador, etc.) se eligen tantos sujetos
como sea necesario para completar el tamaño de muestra requerido. Este
procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica
cuando la población que estamos manejando es muy grande.
Muestreo aleatorio sistemático:
Este procedimiento exige, como el anterior, numerar todos los elementos
de la población, pero en lugar de extraer n números aleatorios sólo se extrae
uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y
los elementos que integran la muestra son los que ocupa los lugares i, i+k,
i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el
resultado de dividir el tamaño de la población entre el tamaño de la muestra:
k= N/n. El número i que empleamos como punto de partida será un número al
azar entre 1 y k. El riesgo este tipo de muestreo está en los casos en que se
dan periodicidades en la población ya que al elegir a los miembros de la
muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la población. Imaginemos que estamos
seleccionando una muestra sobre listas de 10 individuos en los que los 5
primeros son varones y los 5 últimos mujeres, si empleamos un muestreo
aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o
sólo mujeres, no podría haber una representación de los dos sexos.
Muestreo aleatorio estratificado:
Trata de obviar las dificultades que presentan los anteriores ya que
simplifican los procesos y suelen reducir el error muestral para un tamaño
dado de la muestra. Consiste en considerar categorías típicas diferentes entre
sí (estratos) que poseen gran homogeneidad respecto a alguna característica
(se puede estratificar, por ejemplo, según la profesión, el municipio de
residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de
muestreo es asegurarse de que todos los estratos de interés estarán
representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formarán
parte de la muestra. En ocasiones las dificultades que plantean son demasiado
grandes, pues exige un conocimiento detallado de la población. (Tamaño
geográfico, sexos, edades). La distribución de la muestra en función de los
diferentes estratos se denomina afijación, y puede ser de diferentes tipos:
Afijación Simple: A cada estrato le corresponde igual número de
elementos muéstrales.
Afijación Proporcional: La distribución se hace de acuerdo con el peso
(tamaño) de la población en cada estrato.
Afijación Óptima: Se tiene en cuenta la previsible dispersión de los
resultados, de modo que se considera la proporción y la desviación típica.
Tiene poca aplicación ya que no se suele conocer la desviación.
Muestreo Aleatorio Simple (M.A.S) Manejo de la tabla de números Aleatorios.
Una muestra simple aleatoria es aquella en que sus elementos son
seleccionados mediante el muestreo aleatorio simple. Es aquel en que cada
elemento de la población tiene la misma probabilidad de ser seleccionado para
integrar la muestra Cada uno de los elementos de la muestra, se selecciona
aleatoriamente uno por uno.
Existen dos formas: Muestreo con reemplazo: Es aquel en que un
elemento puede ser seleccionado más de una vez en la muestra para ello se
extrae un elemento de la población se observa y se devuelve a la población,
por lo que de esta forma se pueden hacer infinitas extracciones de la población
aun siendo esta finita. Muestreo sin reemplazo: No se devuelve los elementos
extraídos a la población hasta que no se hallan extraídos todos los elementos
de la población que conforman la muestra.
Muestreo aleatorio simple ventajas y desventajas
Ventajas
Sencillo y de fácil comprensión. Cálculo rápido de medias y varianzas.
Existen paquetes informáticos para analizar los datos.
Desventajas
Requiere que se posea de antemano un listado completo de toda la
población. Si trabajamos con muestras pequeñas, es posible que no
representen a la población adecuadamente.
Método de selección
Existen diversos procedimientos para extraer una muestra aleatoria:
Realizar un sorteo con papeles o bolas enumeradas y sacar uno a uno tantos
como lo indique el tamaño de la muestra. Utilizar la tabla de números aleatorios
pero solamente para poblaciones finitas, la utilización de estas tablas puede
realizarse de diferentes modos.
Existen diferentes tablas de números aleatorios. Se utilizará como
referencia la tabla de M. G. Kendall y B. Babington Smith.
Ejemplo: Dada la siguiente población formada por la edad del hijo mayor
de 200 núcleos familiares de una cierta región. Seleccione una muestra
aleatoria de tamaño 10 (use la tabla de números aleatorios, escoja la tercera
fila, tercera columna del segundo bloque de a 1000) numere la población
horizontalmente.
48 49 50 51 50 46 47 56 47 38
53 50 47 46 48 47 48 46 46 50
42 51 51 49 47 51 48 47 42 49
46 48 50 47 48 47 51 56 45 49
45 54 61 46 48 46 46 47 50 34
46 46 51 39 53 55 52 49 47 46
33 40 52 46 44 52 44 54 41 33
48 49 52 42 42 49 47 47 38 48
44 43 44 40 44 45 49 44 43 42
49 49 48 41 51 51 52 42 40 47
37 48 45 46 50 45 47 53 43 47
44 40 46 46 45 48 47 42 47 46
52 53 47 49 46 47 49 42 43 42
43 38 52 50 44 52 44 53 43 45
41 57 47 48 52 53 40 49 40 50
45 42 44 53 57 46 62 47 50 47
45 51 43 45 39 39 41 44 35 41
54 48 51 53 54 42 48 51 37 38
42 37 52 50 45 55 51 46 38 43
53 43 42 39 46 52 53 39 51 40
Para extraer la muestra lo primero que hacemos es disponer tres
columnas en las cuales la primera se ubicaran los números aleatorios, es decir
los números extraídos de la tabla de números aleatorios; en la segunda
columna pondremos los números aleatorios rectificados que serán aquellos
números aleatorios menores que N =200 y los restos de las divisiones de los
números aleatorios mayores que N =200 y menores que el mayor múltiplo de N
es decir 800 y en la tercera columna de encontrar los valores de la muestra.
En la tabla de números aleatorios la tercera fila, tercera columna del
segundo bloque de a 1000 le corresponde al número 3 pero como tenemos que
coger el número aleatorio de tres dígitos el primer número aleatorio sería el
017, los demás serian, 984, 955, 130, 850, 374, 665, 910, 288, 753, 765, 691,
496, 001, hemos escogido 14 números de la tabla de números aleatorios
debido a que hay 4 que son mayores que 800. Veamos a continuación como
extraemos la muestra de la población
Para el primer número aleatorio 017 se busca en la población el valor que
ocupa la posición 017 leída la población horizontalmente que seria la edad de
48 años, el número aleatorio 984 no se contempla dentro del análisis ya que es
mayor que 800, al igual que el número 955, el número 130, le corresponde la
edad de 52 años, al número 850 no se contempla dentro del análisis, el 374
como es mayor que 200 se divide por 200 y se obtiene reto 174 y este es el
número aleatorio rectificado correspondiéndole la edad de 53 años, al número
665 se divide por 200 y se obtiene resto 65 que es el número aleatorio
rectificado correspondiéndole la edad de 44 años en la población, a
continuación presentaremos la tabla de las tres columnas a la cual nos
referimos anteriormente como una vía fácil y práctica para obtener la muestra
deseada.
Nota: obsérvese que en la muestra existen edades que se repiten esto
puede pasar si el muestreo es con reemplazo si el muestreo es sin reemplazo
debemos seguir buscando de la misma manera en la tabla de números
aleatorios seguido del número 001, hasta lograr tener la muestra con 10
valores de la población no repetidos. Número aleatorio Número aleatorio
rectificado Muestra
Números aleatorios Números rectificado Muestra
017 017 48
984 - -
955 - -
130 130 42
850 - -
374 174 53
910 - -
288 088 44
753 153 44
765 165 39
691 091 49
496 096 51
001 001 48
Determinación del tamaño de muestra requerido para la estimación
de la media poblacional en el M.A.S
¿Cuál es el número mínimo de unidades de análisis (personas, etc), que
se necesitan para conformar una muestra ( n ) que me asegure un error
estándar menor que 0.01, dada la población N
Es el r estándar para el nivel de confianza
Ejemplo:
Se desea estimar el peso promedio de los sacos que son llenados por un
nuevo instrumento en una industria. Se conoce que el peso de un saco que se
llena con este instrumento es una variable aleatoria con distribución normal. Si
se supone que la desviación típica del peso es de 0,5 kg. Determine el tamaño
de muestra aleatoria necesaria para determinar una probabilidad igual a 0,95
de que el estimado y el parámetro se diferencien modularmente en menos de
0,1 kg.
Evidentemente un tamaño de muestra no puede ser fraccionario por lo
que se debe aproximar por exceso. El tamaño de muestra sería de 97.
Cuando datos son cualitativos (análisis de fenómenos sociales o cuando
se utilizan escalas nominales), se utiliza la siguiente fórmula
Siendo sabiendo que
es la varianza de la poblacion es la varianza de la muestra
es error estandar 8media poblacion – media muestral
Ejemplo
De una población de 1 176 adolescentes de una ciudad X se desea
conocer la aceptación por los programas de planificación familiar y para ello se
desea tomar una muestra por lo que se necesita saber la cantidad de
adolescentes que deben entrevistar para tener una información adecuada con
error estándar menor de 0.015 al 90 % de confiabilidad.
Tamaño de muestra para estimar la media con m.s.a.
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza:
Ejemplo
En un lote de frascos para medicina, con una población de 8000 unidades, se
desea estimar la media de la capacidad en centímetros cúbicos de los mismos.
A través de un pre muestreo de tamaño 35 se ha estimado que la desviación
estándar es de 2 centímetros cúbicos. Si queremos tener una precisión 0.25
cms 3, y un nivel de significancia del 5%. ¿De qué tamaño debe de ser la
muestra?
SOLUCIÓN: DATOS:
S = 2 cms 3 ; N = 8000; d = 0.25 cms 3; a = 0.05 (5%) ; Z a/2 = 1.96
Sólo faltaría muestrear 203 frascos, pues los datos de los 35 frascos del
pre muestreo siguen siendo válidos.
Tamaño de muestra para estimar proporciones con m.s.a. en bastantes
ocasiones, la variable bajo estudio es de tipo binomial, en ese caso para
calcular el tamaño de muestra bajo el m.s.a., se utiliza
Muestreo Estratificado afijación igual, proporcional y óptima
Muestreo estratificado
El objetivo del diseño de encuestas por muestreo es maximizar la cantidad de
Información para un coste dado. El muestreo aleatorio simple suele suministrar
Buenas estimaciones de parámetros poblacionales a un coste bajo, pero existen Otros
procedimientos de muestreo, como el muestreo estratificado, que en muchas
Ocasiones incrementa la cantidad de información para un coste dado.
El muestreo estratificado es un diseño de muestreo probabilístico en el que
Dividimos a la población en subgrupos o estratos. La estratificación puede basarse en
una amplia variedad de atributos o características de la población como edad, genero,
nivel socioeconómico, ocupación, etc.
Así, consideramos una población heterogénea con N unidades, y en la que la
subdividimos en L subpoblaciones denominados estratos lo más homogéneas posibles
no solapadas, atendiendo a criterios que puedan ser importantes en el estudio, de
tamaños
N1; N2; …..NL. Obviamente
N1 + N2 + :….. + NL = N;
Donde N es el total de individuos de la población. La muestra estratificada de
Tamaño n se obtiene seleccionando una muestra aleatoria simple de tamaño nh (h =
1;2;….L) de cada uno de los estratos en que se subdivide la población de forma
independiente. De igual modo,
n1 + n2 + : : : + nL = n;
Donde n es el tamaño de la muestra que queremos seleccionar. Podemos
expresar la formación de estratos en la población y la formación de la muestra
estratificada de la forma siguiente:
Este muestreo se utiliza cuando la población de estudio es muy
heterogénea ya que necesitáramos un gran esfuerzo muestral para obtener
cierta precisión mientras que si la población está dividida en grupos, bloques o
estratos que sean internamente homogéneos, el esfuerzo en cada grupo será
mínimo resultando globalmente un esfuerzo menor. Por ejemplo, si
preguntamos en una facultad el número medio de horas de estudio los estratos
en este estudio serán los cursos.
Las razones para el uso del muestreo estratificado son las siguientes:
El muestreo estratificado puede aportar información más precisa de
algunas subpoblaciones que varían bastante en tamaño y propiedades entre sí,
pero que son homogéneas dentro de sí. Los estratos deberían en lo posible
estar constituidos por unidades homogéneas.
El uso adecuado del muestro estratificado puede generar ganancia en
precisión, pues al dividir una población heterogénea en estratos homogéneos,
El muestreo en estos estratos tiene poco error debido precisamente a la
homogeneidad.
Motivaciones de tipo geográfico ya que se requieren estimaciones para
ciertas áreas o regiones geográficas.
Las cuestiones que plantea este tipo de muestreo son:
¿Qué características utilizar para dividir la población en estratos?
¿Cómo se identificaran los estratos?
¿Cuantos estratos debe haber?
¿Cuántas unidades seleccionar de cada estrato?
Proporcional
Sea n el número de individuos de la población total que forman parte de
alguna muestra:
Cuando la asignación es proporcional el tamaño de la muestra de cada
estrato es proporcional al tamaño del estrato correspondiente con respecto a la
población total:
Optima
Cuando se realiza un muestreo estratificado, los tamaños muestrales en cada
uno de los estratos, ni, los elige quien hace el muestreo, y para ello puede
basarse en alguno de los siguientes criterios:
Elegir los ni de tal modo que se minimice la varianza del estimador, para un
coste especificado, o bien,
habiendo fijado la varianza que podemos admitir para el estimador,
minimizar el coste en la obtención de las muestras.
Así en un estrato dado, se tiende a tomar una muestra más grande cuando:
El estrato es más grande;
El estrato posee mayor variabilidad interna (varianza);
El muestreo es más barato en ese estrato.
Para ajustar el tamaño de los estratos cuando conocemos la dispersión
interna de cada uno de los mismos, tenemos el siguiente resultado:
7.4.4.4 Teorema
[Asignación de Neyman] Sea E una población con N elementos, dividida
en k estratos, con Ni elementos cada uno de ellos,
Sea n el número total de elementos al realizar el muestreo, y que se dividen en
cada estrato como
Sea X la v.a. que representa el carácter que intentamos estudiar. Sobre
cada estrato puede definirse entonces la v.a.
Como el valor medio de X obtenida en una muestra de tamaño ni en el
estrato Ei. Sea la varianza de dicha v.a.; Entonces
Se minimiza cuando
Donde
Bibliografía
Wikipedia 10 jul 2013 Muestra estadística disponible en:
http://es.wikipedia.org/wiki/Muestra_estad%C3%ADstica
Monografías Febrero 2005 Introducción a la estadísticahttp://www.monografias.com/trabajos19/la-estadistica/la-estadistica.shtml
Matemáticas Muestreo estratificado disponible en:
http://matematicas.unex.es/~inmatorres/teaching/muestreo/assets/cap_4.pdf
Apuntes de estadística para administración
8 de agosto de 2011 Población y Muestra, Parámetro y Estadígrafo disponible
en:http://estadisticaparaadministracion.blogspot.com/2011/10/poblacion-y-
muestra-parametro-y.html
Yahoo. Que es estadígrafo disponible en:http://es.answers.yahoo.com/question/index?qid=20070320184545AAgCar8
slideshare Muestreo aleatorio simple disponible en :http://www.slideshare.net/milit/muestreo-aleatorio-simple
emathematics. Muestreo e inferencia estadística disponible en:http://www.emathematics.net/estadistica/muestreo/index.php?tipo=estratificado
República Bolivariana de Venezuela
Ministerio del Poder Popular Para la Educación Superior
I.U.P “Santiago Mariño”
Maturín- EDO- Monagas
Prof: Bachiller:
Yuly Gonzalez Daniel Márquez C.I 20312911
Maturín, Julio de 2013