Laboratorio No 1 - Tutorial

download Laboratorio No 1 - Tutorial

of 16

Transcript of Laboratorio No 1 - Tutorial

  • Universidad Nacional de Misiones

    PROBABILIDAD Y ESTADISTICA

    Ing. Kerkhoff Alejandro 1

    Laboratorio N 1 Poblacin y Muestreo Conjunto de elementos, personas o individuos de los cuales queremos obtener un dato. Muestras Aleatorias y No-Aleatorias. En Microsoft Excel, podemos utilizar una funcin que nos permita seleccionar una muestra dentro de una poblacin. Ejemplo:

    Legajo del Alumno

    Ingreso familiar

    Legajo del Alumno

    Ingreso familiar

    1 A 3014/1 780 11 M 3269/1 780 2 A 3016/6 750 12 N 3698/7 730 3 A 3025/7 730 13 O 9865/1 500 4 B 2589/8 760 14 P 3265/5 680 5 D 2356/9 790 15 Q 3265/1 700 6 F 2541/8 800 16 R 1235/2 720 7 H 2659/4 900 17 S 1523/2 810 8 J 5859/1 850 18 T 2356/5 910 9 K 5623/2 820 19 U 1256/3 855 10 K 5623/3 760 20 V 1254/2 770

    Tabla N1 Datos Ejemplo N1. Ingreso Familiar.

    Alumnos de la Facultad con sus respectivos Legajos y el Ingreso por Familia. Determinar poblacin trabajando con muestras aleatorias de los mismos. Contando con la tabla de la figura anterior, seleccionamos Herramientas y dentro de ella seleccionar Anlisis de Datos.

    Seleccionamos la opcin Muestra, donde aparecer otra ventana que deber completarse con los datos y caractersticas del problema planteado.

  • Universidad Nacional de Misiones

    PROBABILIDAD Y ESTADISTICA

    Ing. Kerkhoff Alejandro 2

    En el recuadro Entrada incorporar los datos, tenemos opcin de seleccionar Rtulos. Paso siguiente seleccionar Mtodo de Muestreo y por ultimo, la Opcin de Salida. Posteriormente se puede obtener el Promedio ($ 779,375)

    Otra forma do obtener el Promedio es con el total de los datos ($ 769.65), la diferencia es por que el promedio realizado solo toma 8 muestras de la poblacin.

  • Universidad Nacional de Misiones

    PROBABILIDAD Y ESTADISTICA

    Ing. Kerkhoff Alejandro 3

    Estadstica Descriptiva

    Anlisis de Datos

    Variables Cuantitativa y Cualitativa. Medidas Descriptivas. Frecuencia Absoluta, Relativa y Acumulada. Histograma. La Variable, es aquello que vamos a analizar en el estudio que estemos desarrollando. Variables Cualitativas Nominales y Ordinales. Variables Cuantitativas Discretas y Continuas. Medidas Descriptivas a analizar en un conjunto de datos son las Medidas de Posicin, Medidas de Dispersin y las Medidas de Forma. Ejemplo:

    Alumnos de la Facultad con sus alturas correspondientes. Se puede observar que la cantidad de alumnos es 20. El paso siguiente, consiste en seleccionar la opcin Anlisis de Datos en el men Herramientas. Se abre una ventana donde se debe seleccionar la opcin Estadstica Descriptiva.

  • Universidad Nacional de Misiones

    PROBABILIDAD Y ESTADISTICA

    Ing. Kerkhoff Alejandro 4

    Aceptando esta opcin se abrir una nueva ventana, en la que se debern incorporar los datos de los que se disponen dentro de Rango de Entrada.

    Especificar la forma en que han sido cargados los datos, Agrupados por Filas o Columnas. En nuestro caso seleccionar la opcin Columna, ya que los datos fueron ingresados de esa forma. Para las Opciones de Salida debemos seleccionar Resumen de Estadsticas, y para K-simo mayor, K-simo menor (si se desea segn los datos que tenemos) lo seleccionamos si es necesario, para nuestro caso no; hechas las selecciones simplemente hacemos clic sobre la palabra Aceptar, se abrir una nueva hoja dentro del libro que estamos trabajando presentando el siguiente cuadro.

  • Universidad Nacional de Misiones

    PROBABILIDAD Y ESTADISTICA

    Ing. Kerkhoff Alejandro 5

    Medidas Descriptivas Medidas de Posicin Nos informan cul es la tendencia central de la variable, sus valores medios. Media (1.742), Mediana (1.745), Moda (1.79) Medidas de Dispersin Estos datos nos permiten juzgar la confiabilidad de las medidas de tendencia central. Varianza de la Muestra (0.00400632), y la Desviacin Estndar (0.06329546). Medidas de Forma Estos datos nos dan una idea de la manera en la que estn distribuidos los datos. Curtosis o Kurtosis (indica que tan puntiaguda es la distribucin de probabilidades de los datos, se compara con una distribucin normal) Si K > 0 (pico alto), si K < 0 (distribucin plana) y, K = 0 (no presenta pico ni es plana). Coeficiente de Asimetra (analiza si la curva que forman los datos, presenta la misma forma a izquierda y a la derecha de la Media Aritmtica). Si As > 0 (curva asimetra positiva, distribucin hacia la izquierda de la media), As < 0 (curva asimtrica negativa, distribucin hacia la derecha de la media), y As = 0 Simtrico. Curtosis (-0.7367 distribucin plana), Coeficiente de Asimetra (-0.168 asimtrica negativa).

    Histograma

    Se utiliza el histograma para graficar los datos cuantitativos resumidos en las tablas de Frecuencia. Nos informa, cul es el nmero de apariciones de un valor en un conjunto de datos. Para obtener el histograma debemos entrar en el men Herramientas, opcin Anlisis de Datos, Histograma y hacemos clic en Aceptar. Aparecer una ventana en la que incorporaremos los datos de Entrada, Rango de entrada, y si tenemos un Rango de Clase (si no lo tenemos definida el programa divide los datos). En Opciones de Salida podemos seleccionar la opcin de Pareto (histograma ordenado), Porcentaje Acumulado y Crear Grafico.

  • Universidad Nacional de Misiones

    PROBABILIDAD Y ESTADISTICA

    Ing. Kerkhoff Alejandro 6

    Al aceptar estas opciones, se abrir una nueva hoja dentro del mismo libro en el que estamos trabajando con el siguiente cuadro y grafico.

    Utilizando el programa de EXCEL

    Nociones Bsicas Estadstica Microsoft Excel Autores: Maria Elizabeth Cristfoli y Matas Belliard. www.edicionesmaurina.com.ar/estadistica

  • Universidad Nacional de Misiones

    PROBABILIDAD Y ESTADISTICA

    Ing. Kerkhoff Alejandro 7

    Anlisis de Datos Est aplicacin le permite realizar el Anlisis de Datos, de las muestras que decidimos tomar, obteniendo medidas descriptivas de dicho conjunto de datos. El programa permite obtener: Medidas de posicin, medidas de variabilidad y medidas de forma. Ingreso de datos en los archivos del programa.

    Hacemos clic sobre el icono ingreso de Datos e ingresamos los datos correspondientes a nuestro problema.

  • Universidad Nacional de Misiones

    PROBABILIDAD Y ESTADISTICA

    Ing. Kerkhoff Alejandro 8

    Despus del ingreso de los datos volvemos al Men (imagen anterior), y seleccionamos esotro icono Anlisis de Datos

    Como se ve ya en esta pgina obtenemos los datos que necesitamos sin que insertemos algn paso adicional.

    Anlisis de Datos Agrupados Ejercicio Referencial TP N 1: Los datos corresponden a una muestra del tiempo de servicio (en minutos) de 60 componentes electrnicos:

    0,7 0,4 3.4 4,8 2,0 1,0 5,5 6,2 1,2 4,4 1,5 2,4 3,4 6,4 3,7 4,8 2,5 5,5 0,3 8,7 2,7 0,4 2,2 2,4 0,5 1,7 9,3 8,0 4,7 5,9 0,7 1,6 5,2 0,6 0,9 3,9 3,3 0,2 0,2 4,9 9,6 1,9 9,1 1,3 10,6 3,0 0,3 2,9 2,9 4,8 8,7 2,4 7,2 1,5 7,9 11,7 6,3 3,8 6,9 5,3

    Para los datos consignados: 1. Encontrar el nmero ptimo de intervalos de clase. 2. Construir una distribucin de frecuencias. 3. Construir el histograma y polgono de frecuencias (absolutas y relativas), y el grfico y

    polgono de frecuencias acumuladas (absolutas y relativas).

    Clase Frecuencia%

    acumulado Clase Frecuencia %

    acumulado0,20 2 3,33% 1,84 16 26,67%1,84 16 30,00% 3,49 14 50,00%3,49 14 53,33% 5,13 9 65,00%5,13 9 68,33% 6,77 8 78,33%6,77 8 81,67% 10,06 5 86,67%8,41 4 88,33% 8,41 4 93,33%

    10,06 5 96,67% 0,20 2 96,67%y mayor... 2 100,00%y mayor... 2 100,00%

  • Universidad Nacional de Misiones

    PROBABILIDAD Y ESTADISTICA

    Ing. Kerkhoff Alejandro 9

    Histograma

    02468

    1012141618

    1,84

    3,49

    5,13

    6,7710

    ,06 8,41

    0,20

    y may

    or...

    Clase

    Frec

    uenc

    ia

    0,00%20,00%40,00%60,00%80,00%100,00%120,00%

    Frecuencia% acumulado

    Componentes Electrnicos

    Media 4,07948718 Error tpico 0,4864726 Mediana 3,8 Moda 4,8 Desviacin estndar 3,03802043 Varianza de la muestra 9,22956815 Curtosis -0,15608802 Coeficiente de asimetra 0,65953604 Rango 11,5 Mnimo 0,2 Mximo 11,7 Suma 159,1 Cuenta 39

    Utilizando el programa de EXCEL

    Nociones Bsicas Estadstica Microsoft Excel Autores: Maria Elizabeth Cristfoli y Matas Belliard. www.edicionesmaurina.com.ar/estadistica

  • Universidad Nacional de Misiones

    PROBABILIDAD Y ESTADISTICA

    Ing. Kerkhoff Alejandro 10

    Frecuencia Acumulada

    0,6

    0,8

    1,0

    1,2

    Histograma

    0,100

    0,150

    0,200

    0,250

    0,300

    0,350

  • Universidad Nacional de Misiones

    PROBABILIDAD Y ESTADISTICA

    Ing. Kerkhoff Alejandro 11

    Anlisis de Datos Agrupados Total de Datos 60

    Valor Medio 4,000Varianza Muestral 8,333

    Desviacin Estandar 2,887Asimetria 0,748Curtosis -0,455Mediana 6

    Modo 1Valor Mximo 12Valor Mnimo 0

    Recorrido 12Asimetra de los Datos Asimetra Positiva

    Distribucin de probabilidad

    Binomial, Poisson, Geomtrica, Hipergeomtrica

    Para la resolucin de los ejercicios con las diferentes distribuciones de probabilidad, con el programa Microsoft Excel se seleccionaran del TP N 5 algunos ejercicios que hacen referencia a los mismos. Distribucin Binomial: Ejercicio N 1 (TP N5 Distribucin de Variable Aleatoria Discreta) La variable aleatoria X tiene una distribucin binomial con n = 10 y p = 0.5. a) Cul es el valor ms probable? b) Hallar las siguientes probabilidades: P (X = 5); P (X 2). Con el programa Microsoft Excel se puede desde la barra de herramientas Insertar Funcin, seleccionando la categora Estadsticas, luego seleccionamos la funcin que deseamos trabajar, en nuestro primer caso seria la Distribucin Binomial

  • Universidad Nacional de Misiones

    PROBABILIDAD Y ESTADISTICA

    Ing. Kerkhoff Alejandro 12

    Seguidamente se abrir una ventana donde tendrn que cargar los datos del problema a resolver.

    Para la resolucin de nuestro ejercicio tenemos los siguientes datos: n = 10 y p = 0.5. P (X = 5) = 0.246

    Para P (X 2) = P (X = 0) + P (X = 1) + P (X = 2) Se obtiene la probabilidad para x = 0; 1 y 2. y se suman.

    P(X=0) 0,00097656P(X=1) 0,00976563P(X=2) 0,04394531

    P (X 2) 0,0546875

  • Universidad Nacional de Misiones

    PROBABILIDAD Y ESTADISTICA

    Ing. Kerkhoff Alejandro 13

    O se cambia en la opcin Acumulado el falso por el Verdadero para obtener P (X 2)

    Distribucin Poisson: Sea X la variable aleatoria que cuenta el nmero de fallas superficiales de un alambre delgado de cobre, y que dicha variable tiene una distribucin de Poisson con media de 2,3 fallas por milmetro. a) Determinar la probabilidad de tener exactamente dos fallas en un milmetro de alambre. b) Calcular la probabilidad de tener 10 fallas en cinco milmetros de alambre. c) Si sabemos que en el alambre hay fallas, cul es la probabilidad de haya menos de tres en dos milmetros de alambre? Con el programa Microsoft Excel se puede desde la barra de herramientas Insertar Funcin, seleccionando la categora Estadsticas, luego seleccionamos la funcin que deseamos trabajar, en caso seria la Distribucin Poisson, como en el caso anterior pero cambia el tipo de distribucin. Los datos que debemos ingresar son los siguientes:

    X ; Media = 2.3 ( = np) y Acumulado, Verdadero (usa para la funcin acumulativa de Poisson), o Falso ( usa la funcin de probabilidad bruta de Poisson), segn se requiera. a) Determinar la probabilidad de tener exactamente dos fallas en un milmetro de alambre. P (X = 2) = 0.265

  • Universidad Nacional de Misiones

    PROBABILIDAD Y ESTADISTICA

    Ing. Kerkhoff Alejandro 14

    b) Calcular la probabilidad de tener 10 fallas en cinco milmetros de alambre. Para cinco milmetros de alambre la media ser: 2.3*5 = 11.5 P(X=10)= 0.1129 c) Si sabemos que en el alambre hay fallas, cul es la probabilidad de haya menos de tres en dos milmetros de alambre? En este caso nuestra media cambia ya que son dos milmetros de alambre, 2,3*2 = 4,6

    P (X < 3) = 0.3257 Distribucin Geomtrica: Suponga que la variable aleatoria X tiene una distribucin geomtrica con p = 0,5. a) Calcular las siguientes probabilidades: P(X = 1); P(X = 4); P(X = 8); P(X 2); Si la probabilidad de xito en cada ensayo es p, entonces la probabilidad de que x ensayos sean necesarios para obtener un xito es: P (X = x) = p (1 p) x-1 Por lo tanto podemos escribir la formula en un casillero del programa Microsoft Excel para poder obtener los resultados, no tiene la funcin en el programa ni las tablas correspondientes como la tiene con relacin a las distribuciones anteriores. En la resolucin de nuestro ejercicio tenemos: p = 0.5; 1 p = 0.5 P (X = x) = 0.5 (0.5) x-1 p 0,5 1-p 0,5 X 1 2 3 4 5 6 7 8 P(X = x) 0,50000 0,25000 0,12500 0,06250 0,03125 0,01563 0,00781 0,00391

  • Universidad Nacional de Misiones

    PROBABILIDAD Y ESTADISTICA

    Ing. Kerkhoff Alejandro 15

    Para P(X = 1) = 0.5 Para P(X = 4) = 0.0625 Para P(X = 8) = 0.00391 Para P(X 2) = 0.75 Distribucin Hipergeomtrica: Suponga que X tiene una distribucin hipergeomtrica con N = 60, n = 6 y K = 20. a) Calcular P (X = 1); P (X = 7); P (X < 4). Con el programa Microsoft Excel se puede desde la barra de herramientas Insertar Funcin, seleccionando la categora Estadsticas, luego seleccionamos la funcin que deseamos trabajar, en caso seria la Distribucin Hipergeomtrica (distr. Hipergeomtrica), como en el caso anterior pero cambia el tipo de distribucin. Los datos que debemos ingresar son los siguientes: h(x;N;n;k); Los argumentos de la funcin que deben ingresarse en el programa deben ser los siguientes: Muestra xito: es el nmero de xitos en la muestra. (x) Nm. de muestra: es el tamao de la muestra. (n) Poblacin xito: es el nmero de xitos en la poblacin. (k) Nm. de poblacin: es el tamao de la poblacin. (N) a) P (X = 1) ; h(1;60;6;20) -P (X = 1) = 0.2628 Cargando los datos en el programa como se describi anteriormente, y seguidamente hacemos clic en Aceptar, tenemos el resultado en el cuadro que hemos seleccionado.

  • Universidad Nacional de Misiones

    PROBABILIDAD Y ESTADISTICA

    Ing. Kerkhoff Alejandro 16

    -Para P (X = 7) el programa Microsoft Excel me da un error, esto se debe a que la probabilidad que me piden X=7, supera el tamaa de la muestra. -Para P (X < 4) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) = 0.07666 + 0.2628 + 0.3468 +0.2249 = 0.9113 Si armamos un cuadro en Excel como el siguiente; donde en cada uno obtenemos la probabilidad segn lo requerido por y luego sumamos los datos podremos obtener:

    P(X = 0) 0,07666968P(X = 1) 0,26286747P(X = 2) 0,34683902P(X = 3) 0,22497666

    Total 0,91135282