Sesión01.pdf

38
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2015. 1 Taller de Estadística Sesión 1 Introducción a la Recolección y Descripción de Datos

Transcript of Sesión01.pdf

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    1Taller de Estadstica

    Sesin 1

    Introduccin a la Recoleccin

    y Descripcin de Datos

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    2Taller de Estadstica

    Qu es la estadstica?

    La Estadstica es uncampo de la ciencia quecomprende procedimientosdestinados a servir en elproceso de decisincuando hay incertidumbre.

    Esta definicin puntualizados aspectos que el gerenteenfrenta continuamente:toma de decisiones eincertidumbre.

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    3Taller de Estadstica

    Datos

    Los datos son los hechos y los nmeros que serenen, analizan y resumen para su presentacine interpretacin.

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    4Taller de Estadstica

    Elementos, Variables,

    Observaciones

    El nmero total de datos es igual al nmero de

    elementos multiplicado por el de variables.

    Al conjunto de medidas recogidas de un elemento en

    particular se le llama observacin.

    Una variable es una caracterstica de inters de cada

    elemento.

    Los elementos son las entidades de las cuales

    recogemos los datos.

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    5Taller de Estadstica

    Datos, Elementos, Variables y

    Observaciones

    Variables

    Elementos

    Datos

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    6Taller de Estadstica

    Escalas de Medicin

    La escala indica adems qu tipos de resmenes de

    datos y de anlisis estadsticos son los ms apropiados.

    La escala determina la cantidad de informacin que

    debe contener el dato.

    Las escalas de medicin son:

    Nominal

    Ordinal

    De intervalo

    De razn

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    7Taller de Estadstica

    Nominal

    Se usan etiquetas no numricas o cdigos

    numricos.

    Los Datos son etiquetas o nombres usados para

    Identificar un atributo de un elemento.

    Escalas de Medicin

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    8Taller de Estadstica

    Ordinal

    Se pueden usar una etiqueta no numrica o un

    cdigo numrico.

    Los datos tienen las propiedades de una

    medicin nominal y adicionalmente el orden o la

    posicin relativa de cada categora tiene

    significado.

    Escalas de Medicin

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    9Taller de Estadstica

    De Intervalo

    Datos de Intervalo son siempre numricos.

    Los datos tienen las propiedades de los ordinales

    y las distancias que hay entre las observaciones se

    miden en trminos de una unidad de medida fija.

    Esta escala tiene el cero relativo que indica que

    para esta variable el punto cero depende de quien

    evala. En el cero, no siempre no hay nada.

    Escalas de Medicin

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    10Taller de Estadstica

    De razn

    Los datos tienen todas las propiedades de los deintervalo y en este caso el cociente de dosvalores tiene un significado.

    Variables como son distancia, altura, peso, ytiempo usan la escala de razn.

    Esta escala tiene el cero absoluto que indica quepara esta variable no existe nada en el puntocero.

    Escalas de Medicin

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    11Taller de Estadstica

    Cada escala provee diferente informacin

    Nominal

    Ordinal

    Intervalo

    Razn

    Tercero Segundo GanadorTercero Segundo Ganador

    Tercero Segundo Ganador

    20 segundos 1 segundo

    1 minuto 59 2/5 segundos para 11/4 millas

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    12Taller de Estadstica

    Fuentes existentes

    Estudios Estadsticos

    Interior a la empresa en casi todos los

    departamentos

    Servicios de Bases de Datos Dow Jones & Co.

    Agencias de Gobierno

    Gremios Cmaras de Comercio, Sociedad

    Nacional de Industrias

    Internet

    Fuentes de Datos

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    13Taller de Estadstica

    Estadstica Descriptiva

    Datos resumidos y presentados

    convenientemente. Dichos resmenes

    pueden ser:

    tabulares

    grficos o

    numricos

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    14Taller de Estadstica

    Una distribucin de frecuencias es una tabla

    que resume los datos mostrando la frecuencia o

    nmero de elementos que hay dentro de cada una

    de sus clases, que deben ser mutuamente

    excluyentes y colectivamente exhaustivas.

    El objetivo es proveer informacin acerca del

    conjunto de datos que no podra obtenerse

    rpidamente por simple observacin de los datos

    originales.

    Distribucin de frecuencias

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    15Taller de Estadstica

    La frecuencia relativa de una clase es la fraccin

    o proporcin del total de datos que pertenecen a

    una determinada clase.

    Una distribucin de frecuencias relativas es una

    tabla que nos resume un conjunto de datos

    mostrando la frecuencia relativa para cada clase.

    Distribucin de frecuencias relativas

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    16Taller de Estadstica

    Un grfico de barras es una herramienta grficapara trabajar con datos cualitativos.

    En un eje (normalmente el horizontal), colocamoslas etiquetas con los nombres de las categoras.

    En el otro eje (normalmente el vertical), se puedeusar la frecuencia, la frecuencia relativa.

    Usamos una barra de ancho fijo que dibujamosarriba de cada etiqueta, con una altura de acuerdocon su correspondiente frecuencia.

    Las barras estn separadas para enfatizar quecada clase es una categora diferente.

    Grfico de Barras

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    17Taller de Estadstica

    El grfico de pie es una herramienta grfica usada

    generalmente para presentar distribuciones de

    frecuencia relativa de datos cualitativos.

    Primero se traza un crculo; luego usando las frecuencias relativas se subdivide en sectores que corresponden a la frecuencia relativa de cada clase.

    Dado que hay 360 en un circulo, una clase con una

    frecuencia relativa de .25 consumir .25(360) = 90

    de ese crculo.

    Grfico de Pie

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    18Taller de Estadstica

    Guas para seleccionar el nmero de clases

    Use entre 5 y 20 clases.

    Conjuntos de datos con un nmero grande de

    elementos, generalmente requieren un nmero

    grande de clases.

    Conjuntos de datos pequeos usualmente

    requieren pocas clases

    Distribucin de Frecuencias

    Para Datos Numricos

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    19Taller de Estadstica

    Gua para seleccionar el Ancho de Clase

    Use clases de igual ancho

    Ancho aproximado de clase =

    Nmero de Clases

    Dato ms grande - Dato ms pequeo

    Distribucin de Frecuencias

    Para Datos Numricos

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    20Taller de Estadstica

    Distribucin Acumulada de Frecuenciasmuestra el nmero de observaciones con valoresiguales o menores que el lmite superior de cadaclase.

    Distribucin Acumulada de FrecuenciasRelativas muestra la proporcin de tems convalores menores o iguales al el lmite superior decada clase.

    Distribucin Acumulada de FrecuenciasPorcentuales muestra el porcentaje de tems convalores menores o iguales al el lmite superior decada clase.

    Distribucin Acumulativa

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    21Taller de Estadstica

    La funcin FRECUENCIA no es una funcin

    simple de Excel.

    FRECUENCIA nos proporciona valores mltiples.

    En Excel, la formula que dan como respuesta

    mltiples valores se llaman frmula matricial.

    Una frmula matricial tiene una forma especial de

    ingresar.

    Usando la funcin FRECUENCIA de

    Excel para Construir una Distribucin

    de Frecuencias

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    22Taller de Estadstica

    Pasos para ejecutar esta funcin:

    Paso 1 Seleccionar la matriz donde deben

    aparecer las frecuencias

    Paso 2 Escribir la siguiente frmula:

    {= FRECUENCIA (Datos,Grupos)}

    Paso 3 Presionar CTRL + SHIFT + ENTER

    (La frmula aparecer en toda la matriz

    seleccionada)

    Usando la funcin FRECUENCIA de

    Excel para Construir una Distribucin

    de Frecuencias

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    23Taller de Estadstica

    Histograma

    El histograma es una manera muy comn de

    presentar grficamente datos cuantitativos.

    La variable de inters se coloca en el eje horizontal.

    Se dibuja un rectngulo arriba de cada intervalo de

    clase con una altura correspondiente a su

    frecuencia, frecuencia relativa, o frecuencia

    porcentual.

    A diferencia del grfico de barras, un histograma

    no tiene separaciones entre rectngulos de clases

    adyacentes

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    24Taller de Estadstica

    Usando herramientas de Excel

    Datos

    Anlisis

    de Datos

    Histograma

    Usando Excel para Construir un

    Histograma

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    25Taller de Estadstica

    Anlisis Exploratorio de

    Datos

    El Anlisis Exploratorio de Datos es un conjunto de

    tcnicas que usan aritmtica simple y grficos

    fciles de dibujar para resumir datos rpidamente.

    Una de estas tcnicas es el diagrama de hoja y

    tallo.

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    26Taller de Estadstica

    Diagrama de Hoja y Tallo

    Cada dgito en el tallo es una hoja.

    Cada lnea en el diagrama se conoce como tallo.

    A la derecha de la lnea, registramos el ltimo dgito de cada dato en orden.

    El primer dgito de cada dato se coloca a la izquierda de una lnea vertical.

    Es muy parecido a un histograma, con la ventaja de que este diagrama conserva los valores originales.

    Un Diagrama de Hoja y Tallo nos muestra ambos el orden y la forma de la distribucin de los datos.

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    27Taller de Estadstica

    Dado que tenemos el primer dgito repetido, el

    primer valor corresponde a valores de la hoja de

    0 - 4, y el segundo a valores de la hoja de 5 - 9.

    Si se cree que un diagrama de hoja y tallo est

    muy concentrado, podemos abrir el diagrama

    usando dos tallos para cada dgito inicial.

    Diagrama de Hoja y Tallo

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    28Taller de Estadstica

    tallo hoja

    Ejemplo: Wells

    4 (01) 8

    5 (01) 2

    5 (03) 7 8 9

    6 (02) 3 4

    6 (10) 6 6 7 7 7 7 7 8 9 9

    7 (11) 0 1 1 1 1 1 2 2 3 4 4

    7 (15) 5 5 5 5 6 7 7 7 8 8 8 9 9 9 9

    8 (33) 0 0 0 0 0 1 1 1 1 1 1 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4

    8 (27) 5 5 5 5 5 5 5 5 6 6 6 7 7 7 7 7 8 8 8 8 8 8 9 9 9 9 9

    9 (22) 0 0 0 0 1 1 1 2 2 2 2 2 2 2 3 3 3 4 4 4 4 4

    9 (20) 5 5 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 9 9

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    29Taller de Estadstica

    Unidades de la Hoja

    Cuando no se muestran las unidades de la hoja,

    se asume que es 1.

    Las unidades pueden ser 100, 10, 1, 0.1, y as.

    En el ejemplo anterior, la unidad de la hoja fue 1.

    Cada hoja se define por un slo dgito.

    Diagrama de Hoja y Tallo

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    30Taller de Estadstica

    Ejemplo: Unidad de hoja = 0.1

    Si tenemos los siguientes datos

    8

    9

    10

    11

    Unidad de hoja = 0.1

    6 8

    1 4

    2

    0 7

    8.6 11.7 9.4 9.1 10.2 11.0 8.8

    El diagrama de hoja y tallo para estos datos sera:

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    31Taller de Estadstica

    16

    17

    18

    19

    Unidad de hoja = 10

    8

    1 9

    0 3

    1 7

    1806 1717 1974 1791 1682 1910 1838

    El 82 de 1682Se redondea a 80 y se representa

    por un 8.

    Ejemplo: Unidad de hoja = 10

    Si tenemos los siguientes datos

    El diagrama de hoja y tallo sera:

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    32Taller de Estadstica

    Tablas de Contingencia y

    Diagramas de Dispersin

    Tablas de Contingencia y Diagramas de Dispersin

    son dos mtodos que permiten resumir los datos

    para dos (o ms) variables simultneamente.

    Los gerentes necesitan mtodos que les permitan

    graficar y tabular datos de manera que se entiendan

    las relaciones entre dos variables.

    Hasta el momento hemos visto mtodos que

    resumen datos pero una variable a la vez.

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    33Taller de Estadstica

    Tablas de Contingencia

    Tabla de contingencia es una forma de resumir en

    una tabla datos de dos variables simultneamente.

    Se puede usar si:

    ambas variables son cualitativas, o

    Si alguna es cuantitativa, para hacer la tabladebe ser transformada en otra cualitativa.

    Las filas y las columnas definen las clases para

    cada una de las dos variables.

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    34Taller de Estadstica

    El patrn general que muestran los puntos

    sugieren la relacin entre las variables.

    Una de las variables se muestra en el eje vertical

    y la otra en el horizontal.

    Un diagrama de dispersin es una representacin

    grfica de la relacin entre dos variables

    cuantitativas.

    Una lnea de tendencia es una aproximacin de la

    relacin.

    Diagramas de Dispersin y

    Lneas de Tendencia

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    35Taller de Estadstica

    Diagrama de Dispersin

    Una relacin positiva

    x

    y

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    36Taller de Estadstica

    x

    y

    Una relacin negativa

    Diagrama de Dispersin

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    37Taller de Estadstica

    x

    y

    Ninguna relacin

    Diagrama de Dispersin

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2015.

    38Taller de Estadstica

    Procedimientos Grficos y Tabulares

    Cualitativo Cuantitativo

    Mtodos

    Tabulares

    Mtodos

    Tabulares

    Mtodos

    Grficos

    Mtodos

    Grficos

    Dist.Frec.

    Dist.Frec.Relat.

    Dist.Frec.Porc.

    Tab.deConting.

    Grfico de

    Barras

    Grfico de

    Pie

    Dist. Frec.

    Dist.Frec.Relat.

    Dist.Frec.Acum.

    Dist.Frec.Relat.A

    cumuladas

    Diagrama de

    Hoja y Tallo

    Tab.deConting.

    Histograma

    Ojiva

    Diagrama de

    Dispersin

    Dato