Power point estadistica

25
Nociones de estadística Santiago Cardo Jarana

Transcript of Power point estadistica

Page 1: Power point estadistica

Nociones de estadística

Santiago Cardo Jarana

Page 2: Power point estadistica

Santiago Cardo JaranaNociones de estadística

La estadística estudia la recolección, análisis e interpretación de datos, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, en forma aleatoria o condicionada.

Desde los comienzos de la civilización han existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas. Hacia el año 3000 a.C. los babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción agrícola y de los géneros vendidos o cambiados mediante trueque.Los egipcios analizaban los datos de la población y la renta del país mucho antes de construir las pirámides en el siglo XXXI a.C. Los libros bíblicos de Números y Crónicas incluyen, en algunas partes, trabajos de estadística. El primero contiene dos censos de la población de Israel y el segundo describe el bienestar material de las diversas tribus judías. En China existían registros numéricos similares con anterioridad al año 2000 a.C. Los griegos clásicos realizaban censos cuya información se utilizaba hacia el 594 a.C. para cobrar impuestos.

Historia de la Estadística

Page 3: Power point estadistica

Santiago Cardo JaranaNociones de estadística

El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la población, superficie y renta de todos los territorios bajo su control. Durante la edad media sólo se realizaron algunos censos exhaustivos en Europa.Los reyes carolingios Pipino, el Breve, y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los años 758 y 762 respectivamente. Después de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encargó un censo. La información obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday Book.El registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI, y en 1662 apareció el primer estudio estadístico notable de población, titulado Observations on the London Bills of Mortality (Comentarios sobre las partidas de defunción en Londres). Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el astrónomo inglés Edmund Halley como base para la primera tabla de mortalidad

Page 4: Power point estadistica

Santiago Cardo JaranaNociones de estadística

En el siglo XIX, con la generalización del método científico para estudiar todos los fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la información a valores numéricos. En nuestros días, la estadística se ha convertido en un método efectivo para describir con exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo en el proceso de interpretación de esa información.El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para analizar datos estadísticos. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico.

Page 5: Power point estadistica

Santiago Cardo JaranaNociones de estadística

3000 a. de C. los babilonios utilizaban ya pequeñas tablillas de arcilla para recopilar datos sobre la producción.

Egipto, alrededor del año 3050 a. de C., prolijos datos relativos a la población y la riqueza del país

En el antiguo Israel, la Biblia da referencia, en el libro de los

N ú m e r o s, de los datos estadísticos de recuentos de la población hebrea

Los griegos y romanos, efectuaron censos periódicamente con fines tributarios, sociales y militares

En 1066, el rey Guillermo I encargó un censo en el año 1086 S. XV, XVI y XVII, Leonardo de Vinci,

Copérnico, Galileo Galilei, W. Harvey, F. Bacon y Descartes hicieron operaciones con base en el método científico.

Cronograma

Page 6: Power point estadistica

Santiago Cardo JaranaNociones de estadística

Enrique VII tenía de la peste, en el año 1532 empezaron a registrarse en Inglaterra las defunciones causadas por esta enfermedad

1540, el alemán Sebastián Muster realizó una compilación estadística de los recursos nacionales,

El primer empleo de los datos estadísticos para fines ajenos a la política tuvo lugar en 1691 y estuvo a cargo de Gaspar Neumann

Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la palabra estadística,

XVII encontramos correspondencia relativa a la probabilidad en los juegos de azar entre los matemáticos franceses Blaise Pascal y Pierre de Fermat,

Page 7: Power point estadistica

Santiago Cardo JaranaNociones de estadística

XIX comienzan a asentar las bases teóricas de la teoría de probabilidades Joseph Louis Lagrange y Pierre Simon de Laplace, Carl Friedrich Gauss, y Simeón-Denis Poisson.

Ronald Arnold Fisher la situó como una poderosa herramienta para la planeación y análisis de experimentos. Pearson, desarrolló el análisis de varianza y desarrollo numerosas técnicas de análisis multivariante. Su libro Statistical Methods for Research Workers publicado en 1925, ha sido probablemente el libro de estadística más utilizado a lo largo de muchos años. En el siglo XIX, con la

generalización del método científico para estudiar todos los fenómenos de las ciencias naturales y sociales, los investigadores vieron la necesidad de reducir la información a valores numéricos para evitar la ambigüedad de las descripciones verbales.

Page 8: Power point estadistica

Santiago Cardo JaranaNociones de estadística

Publicaciones Importantes

Page 9: Power point estadistica

Santiago Cardo JaranaNociones de estadística

Aplicaciones

La estadística puede presentarse en diferentes niveles de dificultad matemática y puede estar dirigida hacia aplicaciones en distintos campos de la investigación. De acuerdo con esto, se han escrito muchos libros de texto sobre estadística empresarial, estadística educativa, estadística médica, estadística psicológica,…, e inclusive sobre estadística para historiadores. Cada área de la investigación científica puede beneficiarse del análisis estadístico. Para quien formula las políticas económicas y para quien ayuda al presidente y a otros funcionarios públicos sobre procedimientos económicos apropiados, la estadística ha demostrado ser una herramienta valiosa. Las decisiones sobre las tasas tributarias, los programas sociales, el gasto de defensa y muchos otros asuntos pueden hacerse de manera inteligente tan sólo con la ayuda del análisis estadístico. Los hombres y mujeres de negocios, en su eterna búsqueda de la rentabilidad, consideran que la estadística es esencial en el proceso de toma de decisiones. Los esfuerzos en control de calidad, minimización de costos, combinación de productos e inventarios, y una gran cantidad de otros asuntos empresariales, pueden manejarse efectivamente a través del uso de procedimientos estadísticos comprobados.

Page 10: Power point estadistica

Santiago Cardo JaranaNociones de estadística

Para quienes están en el área de la investigación de mercados, la estadística es de gran ayuda en el momento de determinar como de probable es que un producto nuevo sea exitoso. La estadística también es muy útil para evaluar las oportunidades de inversión por parte de asesores financieros. Los contadores, los jefes de personal, y los fabricantes encuentran oportunidades ilimitadas de beneficiarse con el uso del análisis estadístico. Incluso un investigador en el campo de la medicina, interesado en la efectividad de un nuevo medicamento, considera la estadística una aliada.Así pues, la teoría general de la estadística es aplicable a cualquier campo científico en el cual se hacen observaciones. El estudio y aplicación de los métodos estadísticos son necesarios en todos los campos del conocimiento, sean éstos de nivel técnico o científico.

Page 11: Power point estadistica

Santiago Cardo JaranaNociones de estadística

En mercadotecnia, entre otras cosas, la estadística puede ser utilizada para:

• Estimar la proporción de clientes que prefieren un producto en vez de otro y la razón de esto. • Sacar conclusiones respecto a la estrategia de publicidad que sería más útil para el incremento de ventas de un producto. • Mejorar la calidad de los productos fabricados o de los servicios procurados por la organización

Page 12: Power point estadistica

Santiago Cardo JaranaNociones de estadística

Población. Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

Muestra. Es el subconjunto, extraído de la población, cuyo estudio sirve para añadir características de toda la población

Individuo. Es cada uno de los elementos de que forman la población o muestra.

Población, Muestra E Individuo

POBLACIÓN MUESTRA

Cartas Figuras

Coches Color blanco

Alumnos Hombres

Naranjos Naranja agria

Población de Dos hermanas Empadronados

Page 13: Power point estadistica

Santiago Cardo JaranaNociones de estadística

Existen dos tipos de variable según la medición

Variable cualitativa. Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos.

Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como ”sí” y “no”, ”hombre” y “mujer” o son politómicas cuando pueden adquirir tres o más valores.

Dentro de ellas podemos distinguir:

Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, grave.

Variable cualitativa nominal en esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores o el lugar de residencia.

Tipos de variables

Page 14: Power point estadistica

Santiago Cardo JaranaNociones de estadística

Variable cuantitativa. Son las variables que se expresan mediante cantidades numéricas. Las variables cuantitativas además pueden ser:

Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).

Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg, ...) o la altura (1,64 m, 1,65 m, 1,66 m, ...), que solamente está limitado por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre dos variables, también puede ser el dinero o un salario dado y se puede identificar las clases de variables (cualitativas y cuantitativas).

Nota: Las clases de variables se pueden ser cualitativas y cuantitativas

Page 15: Power point estadistica

Santiago Cardo JaranaNociones de estadística

Según la influencia existen dos tipos:

Variables independientes Son las que el investigador escoge para establecer agrupaciones en el estudio. Un tipo especial son las variables de control, que modifican al resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de un sesgo.

Variables dependientes Son las variables de respuesta que se observan en el estudio y que podrían estar influenciadas por los valores de las variables independientes.Hayman (1974) la define como propiedad o característica que se trata de cambiar mediante la manipulación de la variable independiente.La variable dependiente es el factor que es observado y medido para determinar el efecto de la variable independiente.

Page 16: Power point estadistica

Santiago Cardo JaranaNociones de estadística

Otras

Variable intervinienteSon aquellas características o propiedades que de una manera u otra afectan el resultado que se espera y están vinculadas con las variables independientes y dependientes.

Variable moderadoraSegún Tuckman: representan un tipo especial de variable independiente, que es secundaria, y se selecciona con la finalidad de determinar si afecta la relación entre la variable independiente primaria y las variables dependientes. Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir.

Page 17: Power point estadistica

Santiago Cardo JaranaNociones de estadística

Variable cualitativa

Organización de variables

Un diagrama de barras, también conocido como diagrama de columnas, este esta conformado por barras rectangulares de longitudinales proporcional al de los valores que representan. Los gráficos de barras son usados para comparar dos o más valores. Las barras pueden estar orientadas horizontal o verticalmente

Los Diagrama de sectores consisten en dividir un círculo en tantos sectores como valores de la variable. La amplitud de cada sector debe ser proporcional a la frecuencia del valor correspondiente.

Page 18: Power point estadistica

Santiago Cardo JaranaNociones de estadística

VARIABLES CUANTITATIVAS

Discreta: Diagrama de barras, diagrama de sectores (anteriormente desarrollados)

Continua: Histograma, es un caso particular del diagrama anterior en el caso de variables continuas. Si los intervalos son correlativos, los rectángulos aparecen pegados en la representación gráfica. En caso de que la amplitud de los intervalos no se igual para todos, hay que hacer coincidir el área del rectángulo con la frecuencia del intervalo. Un ejemplo muy utilizado de histograma es una pirámide de población

Page 19: Power point estadistica

Santiago Cardo JaranaNociones de estadística

Moda: es el valor con una mayor frecuencia en una distribución de datos. Hablaremos de una distribución bimodal cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Una distribución trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda.

Mediana: representa el valor de la variable de posición central en un conjunto de datos ordenados. De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la muestra. La mediana coincide con el percentil 50, con el segundo cuartil y con el quinto decil. Su cálculo no se ve afectado por valores extremos.

Determinas la forma de cálculo

Page 20: Power point estadistica

Santiago Cardo JaranaNociones de estadística

Media Existen numerosos ejemplos de medias , una de las pocas propiedades compartidas por todas las medias es cualquier media está comprendida entre el valor máximo y el valor mínimo del conjunto de datos.

i i

i

x fX

f=

Page 21: Power point estadistica

Santiago Cardo JaranaNociones de estadística

Varianza: (que suele representarse como σ2) de una variables aleatorias es una medida de dispersión definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media.

La desviación estándar (denotada con el símbolo σ) es una medida de centralización o dispersión para variables de ratio y de intervalo.Se define como la raíz cuadrada de la Varianza. Junto con este valor, la desviación típica es una medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable.Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer también la desviación que presentan los datos en su distribución respecto de la media aritmética de dicha distribución, con objeto de tener una visión de los mismos más acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones.

Varianza, Desvió Típico Y Coeficiente de Variación

2

2 2i i

i

x fX

fσ = −

2σ σ=

Page 22: Power point estadistica

Santiago Cardo JaranaNociones de estadística

Mapa Conceptual

Variables estadísticas

Cuantitativas Cualitativas

Discretas Continuas

Parámetros estadísticos

Medidas de posición

Valores aislados

Intervalo de valores

Análisis

varianzamedia

Desviación típica

Coeficiente de variación

Mediana

Cuartiles

Percentiles

i i

i

x fX

f=

∑2

2 2i i

i

x fX

fσ = −

∑ 2σ σ= CVX

σ=

Page 23: Power point estadistica

Santiago Cardo JaranaNociones de estadística

Estudio de 3 variables

Meses Niños fi fi*xi^2 Fi %

9 1 9 81 1 2

10 4 40 400 5 10

11 9 99 1089 14 28 Q1

12 16 192 2304 30 60 Me

13 11 143 1859 41 82 Q3

14 8 112 1568 49 98

15 1 15 225 50 100

∑ 50 610 7526

0

2

4

6

8

10

12

14

16

9 10 11 12 13 14 15

Meses de edad de 50 niños en el momento de andar por primera vez

Media 12,2

o2= 1,68

o= 1,296

cv 0,106

Cálculos efectuados con Excell

Según los resultados podemos concluir q se trata de un estudio donde los distintos elementos no se encuentran muy dispersos (tal y como indica el grafico), ya q su desviación típica es baja, por lo que muchos individuos no están muy separados de la media.

Page 24: Power point estadistica

Santiago Cardo JaranaNociones de estadística

0

2

4

6

8

10

12

14

16

18

[50,60) [60,70) [70,80) [80,90) [90,100) [100,110) [110,120)

Peso fi Marca marca*fi fi*marca^2 Fi %

[50 60) 8 55 440 24200 8 12,31

[60 70) 10 65 650 42250 18 27,69 q1

[70 80) 16 75 1200 90000 34 52,31 me

[80 90) 14 85 1190 101150 48 73,85

[90 100) 10 95 950 90250 58 89,23 q3

[100 110) 5 105 525 55125 63 96,92

[110 120) 2 115 230 26450 65 100

∑ 65 5185 429425

Los pesos de los 65 compañeros de gimnasio

Media 79,769

σ2= 243,445

σ= 15,603

cv 0,196

Cálculos efectuados con Excell

Page 25: Power point estadistica

Santiago Cardo JaranaNociones de estadística

suma fi fi*xi fi*xi^2 Fi %

2 3 6 12 3 2,5

3 8 24 72 11 9,17

4 9 36 144 20 16,67

5 11 55 275 31 25,83 Q1

6 20 120 720 51 42,5

7 19 133 931 70 58,33 Me

8 16 128 1024 86 71,67

9 13 117 1053 99 82,5 Q3

10 11 110 1100 110 91,67

11 6 66 726 116 96,67

12 4 48 576 120 100

120 843 6633

El resultado de lanzar dos dados 120 veces

0

5

10

15

20

25

2 3 4 5 6 7 8 9 10 11 12

Media 7,025

σ2= 5,924

σ= 2,434

cv 0,346

Cálculos efectuados con Excell