UNIDAD I ESTADISTICA Introducción a la Teoría Estadística MATERIAL PREPARADO POR: LIC. OSCAR NOÉ...

Post on 07-Jan-2015

22 views 14 download

Transcript of UNIDAD I ESTADISTICA Introducción a la Teoría Estadística MATERIAL PREPARADO POR: LIC. OSCAR NOÉ...

UNIDAD IESTADISTICA

Introducción a la Teoría Estadística

MATERIAL PREPARADO POR: LIC. OSCAR NOÉ LÓPEZ CORDÓNOSCARNOE@LOPEZCORDON.NET

SIN IMPORTAR LA CARRERA QUE ELIJAN, TENDRÁN LA NECESIDAD DE TOMAR DECISIONES EN LAS QUE SABER HACER UN ANÁLISIS DE DATOS RESULTARÁ DE UTILIDAD. CON EL FIN DE TOMAR UNA DECISIÓN BASADA EN INFORMACIÓN, SERÁ NECESARIO REALIZAR LO SIGUIENTE:1.DETERMINAR SI EXISTE INFORMACIÓN ADECUADA O SI SE REQUIERE INFORMACIÓN ADICIONAL.2.REUNIR INFORMACIÓN ADICIONAL, SI SE NECESITA, DE MANERA QUE NO SE OBTENGAN RESULTADOS ERRÓNEOS.3.RESUMIR LOS DATOS DE MANERA ÚTIL E INFORMATIVA4.ANALIZAR LA INFORMACIÓN DISPONIBLE.5.OBTENER CONCLUSIONES Y HACER INFERENCIAS AL MISMO TIEMPO QUE SE EVALÚA EL RIESGO DE TOMAR UNA DECISIÓN INCORRECTA.

Porqué Estudiar Estadística

ESTADÍSTICA

“Es un método científico encaminado a la planificación, recopilación, presentación, análisis e interpretación de datos numéricos, útil para la toma de decisiones”.

Esta definición enfatiza las etapas de una investigación estadística e insiste en que es un método científico.

4

DEFINICIÓN DE ESTADÍSTICA

La Estadística es la Ciencia de la

• SISTEMATIZACIÓN, RECOLECCIÓN, ORDENAMIENTO Y POSTERIOR PRESENTACIÓN de los datos referentes a un fenómeno o hecho social para su estudio metódico, con objeto de

TOMAR DECISIONES u obtener conclusiones.

DEDUCIR LAS LEYES que rigen esos fenómenos y poder de esa forma hacer previsiones sobre los mismos,

5

HISTORIA DE LA ESTADÍSTICA

• Su raíz: STATUS = cosas del EstadoEnumeración de las características más relevantes de la sociedad: número de familias, de cabezas de ganado, etc.

SUS ORÍGENES:• Censo del emperador chino Tao 2238 a.C.• Documentos asirios, egipcios y griegos.• Censos en el Imperio Romano para recoger tributos.

LA BASE CIENTÍFICA:• Se desarrolla a lo largo de los siglos XVI, XVII y XVIII.• Destacan dos escuelas importantes: la alemana y la inglesa.• En España las contribuciones más relevantes son las de Uztáriz,

Campomanes y Jovellanos.

6

HISTORIA DE LA ESTADÍSTICA

• El origen del cálculo de probabilidades surge con el paso de describir la realidad a buscar modelos que la expliquen: Pascal y Fermat (s. XVII)

LA ÉPOCA DORADA : Siglos XVIII y siguientes.• Bernouilli, Leibniz, Bayes, Legendre, Gauss, Laplace, etc.• Chebychev, Markov, Kolmogorov, etc.

LA ÉSTADÍSTICA MATEMÁTICA: Principios del s. XX.• La fusión entre la recogida, descripción y análisis de la información

con el Cálculo de Probabilidades da lugar a la Estadística Matemática.

• Student, Fisher, Neyman, Pearson, etc.

OBJETIVO

El objetivo fundamental de la teoría estadística, consiste en investigar la posibilidad de extraer de los datos estadísticos, inferencias válidas, elaborando los métodos, mediante los cuales pueden obtenerse dichas inferencias.

Esta definición hace énfasis en la estadística como método para obtener inferencias válidas, es decir, se basa en el muestreo.

CLASIFICACIÓN

ESTADÍSTICA DESCRIPTIVA O DEDUCTIVA:Es aquella que se realiza tomando en cuenta

todos los elementos de la población y de ellos se obtienen los datos para encontrar o determinar las características del fenómeno.

También se dice que, es la rama de la estadística que para su estudio toma en cuenta todos los elementos unidades de la población, es decir, se obtiene mediante un censo.

CLASIFICACIÓN

ESTADÍSTICA INFERENCIAL O INDUCTIVA:Es la rama de la estadística que proporciona

normas y reglas para encontrar las características de la población, tomando una muestra.

Permite conocer algún aspecto de la población por medio de una muestra.

OTRAS DEFINICIONES IMPORTANTES

POBLACIÓN:Es el conjunto total de elementos que se desean

investigar. Existe cuando se investigan todas las unidades, es decir, se levanta un censo.

MUESTRA:Es una parte de la población. Existen dos tipos:

MUESTRA PROBALÍSTICA O AL AZAR:Es cuando cada elemento de la población tiene una

oportunidad conocida de ser seleccionado en la muestra.

DE CRITERIO O JUICIO, SUBJETIVAEs cuando la selección de los elementos a incluir en la

muestra se hace utilizando el criterio personal.

Población vrs. Muestra

OTRAS DEFINICIONES IMPORTANTES

DATOS ESTADÍSTICOS:Se refieren a cifras o números. Ejemplo: Número de accidentes de tránsito.

DATOS CUANTITATIVOS:Son los que se refieren a cantidades. Ej. # de habitantes, # de empresas, #

de estudiantes.

DATOS CUALITATIVOS (ATRIBUTOS):Se refieren a calidades y estas no se pueden cuantificar, Ej. El color del

cabello, la rectitud, amabilidad, responsabilidad, etc.

VARIABLE:Datos que pueden tomar diferentes valores. Se distinguen 2 tipos:

VARIABLE DISCRETA: Estas no permiten fraccionamiento. Ej: #de hijos, # de computadoras, #

de libros, # de estudiantes, etc.

VARIABLE CONTÍNUA: Esta sí permite fraccionamiento. Ej. Salarios, Precios, Edad, Temperatura, Estatura, etc.

Resumen: Tipos de Variables

DISTRIBUCIÓN DE FRECUENCIAS:

DEFINICIÓN:Se denomina distribución de frecuencias a una

tabla que utilizando filas y columnas que se utiliza para presentar datos “clasificados” sobre variables.

TIPOS DE DISTRIBUCIÓN:

1.) SERIE SIMPLE AGRUPADA, EJEMPLO:

Salarios Mensuales Q

No. Empleados

1,500.00 31,800.00 52,000.00 82,500.00 33,000.00 1

TOTAL (n) 20

AGRUPADA EN CLASES O CATEGORÍAS EJEMPLO (Con Intervalos Constantes)

Ventas Mensuales(Miles de Q)

No. Empresas

15 – 16 317 – 18 7 19 – 20 1521 – 22 623 – 24 4

TOTAL (n) 35

FRECUENCIA:Indica las veces que se repite la variable. Se identifica con

el símbolo f y está expresada en valores absolutos. (En el ejemplo anterior las frecuencias están representadas en la columna de No. De empresas).

  FRECUENCIAS ABSOLUTAS: Se refiere al número de repeticiones de la variable en

cada clase. Su símbolo es “f”. En el ejemplo anterior son 3,7,15, 6 y 4.

Ventas Mensuales(Miles de Q)

No. Empresas (f) (f¨)

15 – 16 3 8.57%

17 – 18 7 20.00% 19 – 20 15 42.86%

21 – 22 6 17.14%

23 – 24 411.43%

TOTAL (n) 35 100.00%

FRECUENCIAS RELATIVAS:Se obtienen de dividir las frecuencias absolutas de cada clase entre el total de casos. Si se multiplican por 100 quedan expresadas en porcentajes. Su símbolo es f’. La sumatoria de las frecuencias relativas debe ser igual a 1 ó aproximadamente 1 por aproximación de cálculos, o bien al 100%.

FRECUENCIAS ACUMULADAS:Para obtenerlas, se copia el primer valor de la frecuencia

absoluta y se le va sumando las demás frecuencias absolutas de cada clase. De esta manera el dato de la última clase deberá ser igual al total de casos. Su símbolo es F.

Ventas Mensuales(Miles de Q)

No. Empresas (f) (F)

15 – 16 3 3

17 – 18 7 10

19 – 20 15 25

21 – 22 6 31

23 – 24 435

TOTAL 35 xxx

FRECUENCIAS ACUMULADAS RELATIVAS:Estas se obtienen de dividir las frecuencias

acumuladas de cada clase entre el total de casos. Si se multiplican por 100 quedan expresadas en porcentajes. Su símbolo es F’.

Ventas Mensuales(Miles de Q)

No. Empresas (f) (F¨)

15 – 16 3 8.57%

17 – 18 7 28.57%

19 – 20 15 71.43%

21 – 22 6 88.57%

23 – 24 4100.00%

TOTAL (n) 35 Xxx

RECORRIDO O RANGO DE LA VARIABLE (Símbolo “R”)

Es igual al valor máximo menos el valor mínimo mas uno. Comúnmente se dice que es “DESDE DONDE EMPIEZAN LOS DATOS HASTA DONDE TERMINAN”.

R = Valor Máximo (-) Valor Mínimo (+) 1Ej: 24 – 15 + 1 =10 CLASE O GRUPO: (Símbolo “C”)Es una de las partes en que se ha dividido el rango o

recorrido de la variable. Ej: De 15 a 16 es la primera clase.  INTERVALO DE CLASE: SÍMBOLO (Símbolo “I” )Es la diferencia entre el límite superior y el límite

inferior de la clase más la unidad. Ls - Li + 1 = I

LÍMITES DE CLASE:Los valores extremos en cada clase constituyen los límites,

los del lado izquierdo son los límites inferiores y los del lado derecho son los superiores. Límites Inferiores (Li) y Límites Superiores (Ls). Dentro de los Límites de Clase se identifican 2 tipos:

DISCRETOS O APARENTES Están representados en valores enteros, es decir no están

representados en forma fraccionada. Ej. De 15 a 16.  REALES O VERDADEROS: Para encontrar los valores reales de los límites de clase se

procede así: a los inferiores se les resta media unidad y a los superiores se les suma media unidad. Ej. De 14.5 a 16.5

Tipos de Intervalos:1. Constantes (Clases de igual tamaño)2. Variables (fiel a su concepto)3. Abiertos (Uno de ellos es abierto)

MARCA DE CLASE O PUNTO MEDIO (X)Es la semi-suma de los límites de clase. Es el punto

medio del intervalo para cada clase y se obtiene de la semi-suma de los límites.

 X = Ls + Li X = Lrs + Lri 2 2

Cuando el intervalo es constante, se encuentra el punto medio de la primera clase y para los siguientes, únicamente hay que sumarle el intervalo constante.

Ventas Mensuales

No. Empresas Marca de Clase

(Miles de Q) x15 – 16 3 15.517 – 18 7 17.5 19 – 20 15 19.521 – 22 6 21.523 – 24 4 23.5

TOTAL (n) 35  

RECOMENDACIONES PARA CONSTRUIR UNA DISTRIBUCIÓN DE CLASES Y FRECUENCIAS:

1. No deben existir clases con frecuencia "0"2. El número de clases debe fluctuar entre 5 y 15

dependiendo de número de datos de la variable.3. Los intervalos de clase deben ser iguales (amplitud

constante)4. No deben existir clases abiertas5. Cada clase debe quedar bien definida6. No deben existir clases continuas con el mismo número

de frecuencias.7. Que las frecuencias sean ascendentes a partir de la

primera clase, que continúen ascendentemente, lleguen a un punto máximo y luego continúen descendentemente, sin llegar a ser igual a cero.

8. Que se pueda apreciar fácilmente una clase dominante.

PROCEDIMIENTO TÉCNICO PARA ELABORAR UNA DISTRIBUCIÓN DE CLASES Y FRECUENCIAS:

1.) Se ordenan datos de la variable de menor a mayor o viceversa, realizando el conteo de las observaciones o las veces que se repite el mismo dato. Para el conteo se puede utilizar la técnica del tarjado.

2.) Determinar el intervalo constante para cada clase, utilizando la formula sugerida por Herbert Sturges.

 i = RANGO O RECORRIDO DE LA VARIABLE  1 + 3.322 (Log. n)

SIMBOLOGÍARANGO= (VALOR MÁXIMO - VALOR MINIMO) + 1 Denominador = 1 + 3.322 (Constantes)Log n = Logaritmo Decimal del Numero de ElementosN = Número de Datos

3.) Determinar o calcular del número posible de clases, que se obtiene de la siguiente manera.Número de Clases = Rango o Recorrido

Intervalo de Clase 4.) Definir el límite inicial de la primera clase,

esto significa tomar la decisión si se inicia con el valor menor observado, o bien uno un tanto inferior.

5.) Seleccionar el mejor arreglo.

REPRESENTACIÓN GRÁFICA:Las gráficas utilizadas en el curso para la representación

gráfica de una distribución de frecuencias son:

HISTOGRAMA DE PEARSONEs un gráfico de barras de una distribución de frecuencias.

Los límites reales de clase se colocan en el eje horizontal (eje de X) y el número de observaciones en el eje vertical (eje de Y).

  POLÍGONO DE FRECUENCIASEs un gráfico de líneas, que se realiza trazando las mismas

sobre las marcas de clase. Puede obtenerse uniendo los puntos medios del histograma, o bien utilizando las marcas de clase.

  OJIVA DE GALTONEste se elabora tomando de base las frecuencias acumuladas.

JUEGOS DE DATOS A UTILIZAR

Información del Banco de Guatemala, respecto al tipo de cambio desde el año 1995 al 2010.

INTRODUCCIÓN AL USO DE EXCEL

La maestra Pamela Lewis,  autora del libro “La Magia de la Hoja de Cálculo”, considera que esta es una herramienta de aprendizaje poderosa y que si los estudiantes tienen acceso a computadores, deben utilizarla. Argumenta que desarrolla en los estudiantes habilidades para:

organizar datos (ordenar, categorizar, generalizar, comparar y resaltar los elementos claves); realizar diferentes tipos de gráficas que agreguen significado a la información ayudando en la interpretación y análisis; utilizar gráficas para reforzar el concepto de porcentaje; identificar e interpretar para un conjunto de datos, el máximo y mínimo, media, mediana y moda; utilizar elementos visuales concretos con el fin de explorar conceptos matemáticos abstractos (inteligencia visual y espacial);

INTRODUCCIÓN AL USO DE EXCEL

descubrir patrones; comprender conceptos matemáticas básicos

como conteo, adición y sustracción; estimular las capacidades mentales de orden

superior  mediante el uso de fórmulas para responder a preguntas condicionales del tipo “si... entonces”;

solucionar problemas y usar fórmulas para manipular números,

explorar cómo y qué formulas se pueden utilizar en un problema determinado y cómo cambiar las variables que afectan el resultado.