ESTADÍSTICA DESCRIPTIVA

65
10/06/22 10/06/22 TPAU TPAU 1 ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA

description

ESTADÍSTICA DESCRIPTIVA. COMPETENCIAS Y OBJETIVOS. UNIDAD I :ESTADISTICA DESCRIPTIVA Competencia: - El estudiante debe utilizar correctamente los procedimientos ,técnicas y métodos estadísticos,en el tratamiento y procesamiento de datos de todo trabajo de investigación científica - PowerPoint PPT Presentation

Transcript of ESTADÍSTICA DESCRIPTIVA

Page 1: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 11

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

Page 2: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 22

COMPETENCIAS Y OBJETIVOSCOMPETENCIAS Y OBJETIVOS

• UNIDAD I :ESTADISTICA DESCRIPTIVA• Competencia:• -El estudiante debe utilizar correctamente los procedimientos ,técnicas y métodos

estadísticos,en el tratamiento y procesamiento de datos de todo trabajo de investigación científica

• Objetivos.• -Aplicar adecuadamente las técnicas y procedimientos estadísticos como metodología

de toda investigación principalmente en la Ingeniería.• Descripción general de la unidad:• -Esta unidad comprende el desarrollo de los siguientes aspectos :ciclo metodológico

de la investigación estadística, recopilación. organización ,clasificación y descripción de datos de una muestra aleatoria o población; determinación y utilización de las medidas descriptivas.

• Lectura:Millar/Freund/Jonson “Probabilidad y Estadística para Ingenieros”Edo.de México 1992 Pgs.1 al 40

• Córdova Zamora “Estadística Descriptiva e Inferencial” 2ª ed.Perú 1996 Pags,1 al 69

• Bibliografía Básica: García Oré (1995) “Estadística descriptiva y Probabilidades”(2ª ed) Perú .Pags.2al 83

• Referencia electrónica: http://thales.cica.es/red/Recursos/rd99/ed99-0278-01/inicio.html

Page 3: ESTADÍSTICA DESCRIPTIVA

EstadísticaEstadística Descriptiva DescriptivaCONTENIDO MÍNIMO

1.-INTRODUCCIÓN A LA ESTADÍSTICA(muestreo)2.-ORGANIZACIÓN Y CLASIFICACIÓN DE DATOS3.-MEDIDAS DE POSICIÓN4.-MEDIDAS DE DISPERSIÓN5.-REGRESIÓN LINEAL SIMPLE

Page 4: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 44

IntroducciónIntroducción a la a la EstadísticaEstadística

1.-DEFINICIÓN.- Como ciencia proporciona un conjunto de métodos,técnicas y/o procedimientos ,para recopilar,organizar,presentar ,analizar datos,con el fin de realizar generalizaciones válidas,para tomar decisiones coherentes,ante la incertidumbre,acerca de la población o sus parámetros a partir de datos extraídos de una muestra.

• ESTADÍSTICA DESCRIPTIVA.• ESTADÍSTICA INFERENCIAL

Page 5: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 55

• POBLACIÓN (N).-Conjunto universo,motivo de análisis que tiene por lo menos alguna característica en común,el proceso para obtener toda la información de la población se llama censo

• PARÁMETRO.- Es un nº resumen que sintetiza alguna característica de la población

• MUESTRA (n).- Es un subconjunto propio representativo de la población,el proceso para la obtención de los datos muestrales se llama muestreo

• ESTADÍGRAFO.-Es un nº sintético que resume alguna característica de la muestra

Page 6: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 66

1.- 1.- INTRODUCCIÓN AL MINTRODUCCIÓN AL MUESTREOUESTREO

PROCESO DEL DESARROLLO CIENTÍFICO

DESARROLLO DEL CONOCIMIENTO

MÉTODO ESTADÍSTICO

OBSERVACIÓN DEL FENÓMENO

FORMULACIÓN DE LA HIPÓTESIS

VERIFICACIÓN DE LA HIPÓTEIS

MÉTODO CIENTÍFICO

Page 7: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 77

PERFIL DE TESISPERFIL DE TESIS TÍTULO JUSTIFICACIÓN FORMULACIÓN DEL PROBLEMA HIPÓTESIS OBJETIVOS: METODOLOGÍA:

MÉTODOS : inductivo,deductivo,hidtórico,lógico,experimental etc.

.TÉCNICAS: DE RECOLECCIÓN DE datos (muesreo)

DE PROCESAMIENTO DE DATOS(Estadística Inferencial)

INSTRUMENTOS SOFTWARE ESTADÍSTICO) MARCO TEÓRICO Y REFERENCIAL ESQUEMA TENTATIVO DE LA TÉSIS O PROYECTO DE GRADO ANEXOS BIBLIOGRAFÍA

Page 8: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 88

Metodología de la investigación:

1.-Planteamiento del problema y de la hipótesis:

Se define claramente los objetivos del estudio,se toma una m.a. cuyos datos se utilizan para la inferencia sobre el modelo asignado ó contrastando valores para sus parámetros

2.-Recolección de datos:

a)Datos publicados,b)diseño experimental c)Encuesta

3.-Organización y clasificación de datos:

se debe realizar un análisis de consistencia

4.-Análisis e interpretación de los datos

DESCRIPTIVA

Page 9: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 99

• METODOLO´GIA DE LA INVESTIGACIÓN• 5.-Realización de Inferencia• PRUEBAS PARAMÉTRICAS .-representar la

incertidumbre asociada a la característica en cuestión ,a un modelo probabilístico cuyos parámetros se desconocen

• Estimación de los estadísiticos :• a) Puntual ,b) Por Intervalos de Confianza• 6.-Realizar el TEST DE HIPóTESIS • Contrastar la validez de algún supuesto• acerca de los valores de los parámetros ó • de la Distribución del modelo ,(por IC ó de

Siginificancia,y el “P” value),ó predecir.•

INFRENCIA

Page 10: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 1010

1.2.- Tipos de Muestreo1.2.- Tipos de Muestreo

• Muestreo.- herramienta fundamental de la investigación científica,cuya función básica es determinar q´parte representatriva de la población en estudio debe examinarse con el fin de realizar Inferencia sobre dicha Población.

• Razones para tomar muestras:• a) Poblaciones muy grandes ó infinitas ó desconocidas• b)Costos más económicos en muestras que en poblaciones• c) Mayor rapidez en la recolección de una m.a que el de una

población• d) Mayor exactitud.-al reducirse el volumen de trabajo se puede

emplear personal más capacitado y someterlo a un entrenamiento intensivo,supervisión del trabajo de campo y procesamiento de los resultados,resultados más exactos que la enumeración completa

• e)Destrucción de las unidades estudiadas

Page 11: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 1111

Tipos de muestreoTipos de muestreo

NO PROBABILÍSTICO

INVESTIGADOR

CONOCE LAS CARACTERÍSTICAS DE LA POBLACIÓN →CERTIDUMBRE → → VARIABLE ESTADÍSTICA →ESTADÍSTICA DESCRIPTIVA

PROBABILÍSTICO

INVESTIGADOR NO CONOCE LAS CARACTERÍSTICAS DE LA POBLACIÓN

→INCERTIDUMBRE

→VARIABLE ALEATORIA →ESTADÍSTICA INFERENCIAL

Page 12: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 1212

TIPOS DE MUESTREO TIPOS DE MUESTREO PROBABILÍSTICOSPROBABILÍSTICOS

• MUESTREO ALEATORIO SIMPLE ( M.A.S.)

• MUESTREO ALEATORIO SISTEMÁTICO(M.A.Sys)

• MUESTREO ALEATORIO ESTRATIFICADO(M.A.E)

• MUESTREO ALEATORIO CONGLOMERADO(M.A.C.)

• MUESTREO POLIETÁPICO(M.U.M)

Page 13: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 1313

MUESTREO ALEATORIO SIMPLE (MUESTREO ALEATORIO SIMPLE (M.A.SM.A.S) CON ó sin ) CON ó sin REPOSICIÓNREPOSICIÓN

• La población es homogénea y no muy grande, todos los elementos tienen la misma posibilidad de ser tomados en cuenta

• PROCEDIMIENTO.- las extracciones que se realizan manual ó mediante la generación de Nº aleatorios mediante el PC ,con reposición son independientes ,y si es

sin reposición son dependientes Sea una N(1000)

201 100

Page 14: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 1414

MUESTREO ALEATORIO SISTEMÁTICOMUESTREO ALEATORIO SISTEMÁTICO ( (M.A.Sys)M.A.Sys)

SSea una población grande homogénea N= 1000 ,se ea una población grande homogénea N= 1000 ,se

tomatoma

una m.a. n=50→K=N / n =1000 / 50=20 una m.a. n=50→K=N / n =1000 / 50=201k= 20 2k=40 3k=60 4k=80 5k=100

6k=120 7k 8k 9k 10k

: : : : :

46k 47k 48k=960 49k=980 50k=1000

Page 15: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 1515

Ventajas y desventajas del M.A.SysVentajas y desventajas del M.A.Sys • Ventajas:• - Mayor representatividad que un m.a.s. porque es

más facíl sacar una m.a y se lo puede hacer en una oficina ahorrando tiempo

• -Es casi tan preciso como el estratificado• Desventajas.• -Sólo se pueden tomar k muestras distintas• -Los elementos de la m.a son dependientes• -No es válido si la característica se presenta

periodicamente y no coincide con la posición K

Page 16: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 1616

Muestreo aleatorio estratificadoMuestreo aleatorio estratificado ((M.A.EM.A.E))

Se Se aplica en poblaciones heterogéneas desde el punto de vista de la aplica en poblaciones heterogéneas desde el punto de vista de la característica.por lo que se divide en L clases o L estratos homogéneoscaracterística.por lo que se divide en L clases o L estratos homogéneos

• Sea una Población heterogénea dispersa N tal que N1+N2+…+Nl =N

• Ni = subpoblaciones, cuya m.a. n tal que n1+n2+…+nl =n

• =estratos ni= submuestras

N1n1

N2 n2

N3n3

N4n4

… NLnl

n1 n2 n3

n4 nl

Page 17: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 1717

Ventajas y desventajas del M.A.E.Ventajas y desventajas del M.A.E.

• Ventajas.-• -permite aplicar técnicas de selección diferentes en

cada estrato• -Permite realizar inferencia en cada uno de los

estratos.• -Mayor precisión en los estimadores• -Permite disminuir el tamaño de la muestra• Desventajas.- si la población está muy dispersa se

requiere mucho dinero en cuanto al aspecto logístico

Page 18: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 1818

Selección del tamaño de cada submuestra en el Selección del tamaño de cada submuestra en el M.A.EM.A.E

• -Afijación uniforme (ni=nj=nl)

• -Afijación proporcional /estrato (Wh= Nh/N)

• -Afijación de Mínima Varianza

• -Afijación óptima( en función de sus costos)

• (V óptima≤ V proporcional ≤ V ran)

Page 19: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 1919

Notación y definición en el M.A.ENotación y definición en el M.A.E• .-Una vez estratificado la población y determinados las

submuestras:• -Los símbolos que se refieren al estrato h. son:• h= Identidad del estrato , i = la unidad dentro el estrato• Nh=Nº total de unidades en el h-ésimo estrato• nh=nº de unidades en la h-ésima muestra• yhi = valor obtenido para la i-ésima unidad del h-esimo estrato• Wh = Nh / N = ponderación del estrato h-ésimo• fh = nh / Nh = fracción del muestreo del h-ésimo estrato• Ÿh = yhi / Nh = media verdadera ;ÿ = yhi /nh media

muestral del h-ésimo estrato• S²h = ( yhi –Ÿh ) ² / Nh =varianza verdadera del h-ésimo

estrato

Page 20: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 2020

Muestreo aleatorio por conglomerados Muestreo aleatorio por conglomerados ((M.A.C)M.A.C)

Se aplica también en poblaciones heterogéneas y Se aplica también en poblaciones heterogéneas y dispersonas desde el punto de vista geográficodispersonas desde el punto de vista geográfico

• Sea una población muy heterogénea y dispersa desde el punto de vista geográfico N se divide en Mu unidades de conglomerados heterogéneos

• M1 M2 M3 ….. Mu

M1 M2 M3 ….

….

Mu

n1 n2 n3 nu

Page 21: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 2121

Muestreo polietápico(Muestreo polietápico(MUMMUM))• En la práctica casi es común utilizar diferentes

tipos de muestreo ,es decir debe realizar en varias etapas ,así por ejemplo cuando se utiliza el M.A.E ó el M.A.C ,en cada estrato ó en cada conglomerado se debe aplicar el M.A.S.

• Otro caso tenemos en el muestreo de la”Unidad monetaria” gralmente aplicable en Auditoría que consiste en tomar como unidades aquellos expedientes con mayor cantidad monetaria y dentro cada expediente aplicar el M.A.S.

Page 22: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 2222

• 2.Estadísticos muestrales • DEFINICIÓN Y NOTACIÓN.-.• -CARACTERÍSTICAS O ATRIBUTOS(Y).-

ciertas propiedades q´se quiere medir,analizar,registrar, etc. Para cada unidad de la población si es muestral (y).

• CARACTERÍSTICAS QUE ANALIZA EL MUESTREO.-

• Analiza 4 características de la población: • 1) El total (Y)• 2)la Media E ( Y) 3) La Proporción(P) 4)La Razón( R )

Page 23: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 2323

NOTACIÓN

Característica Población(N) Muestra(n)

1.-Valores yi = y1,y2,...,yN yi = y1,y2,...,yn

2.-Total Y=yi = y1+y2+,...,+yN ; y = yi = y1 +y2+,...,+ yn

3.-La Media Ÿ = yi / N ; : ÿ = yi / n

4.-La Razón R= Y / X : r = y / x

5.-Proporción P= X/N : p = x/n

Page 24: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 2424

Estadísticos muestralesEstadísticos muestrales• ESTIMACIONES Ó ESTADÍGRAFOS

• a)Del total(Y) Ŷ = N ÿ = N yi / n,donde N/ n = factor

de expansión

• b) De la media (Ÿ) ÿ = yi / n ,donde n/N =f ,fracción muestral

• c)De la Varianza(σ²) S² = ∑(xi-x)²/ n

• c) De la razón(Ř) r = y / x = yi / xi

Page 25: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 2525

• ESTADÍSTICOS MUESTRALES• Varianza muestral S² = Σ ( yi –y )²/ n• Varianza de Cochran ó• cuasi varianza S² =Σ ( yi –y )²/ n-1• Media muestral E(y ) = Y =µ• Varianza de la media muestral V(y) = σ²/ n• Media de la Varianza muestral E(S²) = (n-1)σ²/n• MEDIA DE LA CUASI VARIANZA E(S²) = σ²• Caso particular si Y →Bernoulli(p)• Proporción muestral p =y/n ó Σyi/n• Media de la proporción muestral E(p) =P• Varianza de la proporción muestral V(p)= pq/n

Page 26: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 2626

INTERVALOS DE CONFIANZA.- INTERVALOS DE CONFIANZA.- (n (n 50) 50)

1.-IC PARA LA MEDIA (Ÿ) al 100 r % = [ ÿ ± Zo S 1 –f / n ]

donde Zo P(Z< Zo) = (1+ r) / 2

2.-IC PARA EL TOTAL (Y). Al 100r% = [ Nÿ ± ZoN S 1 –f / n ]

-3.-IC para la Proporción (P) al 100% = [p ± Zo S 1 –f / n ]

Nota cuando la muestra es pequeña ,es decir n < 50 se debe utilizar la distribución “t”, El valor crítico es to

donde to P(T<to) = (1+ r) / 2 ; tiene distribución n-1 g.d l.

NIVELES DE SIGNIFICACIÓN () = 50% 20% 10% 5% 1%

NIVELES DE CONFIANZA ( r ) = 50% 80% 90% 95% 99%

VALORES CRÍTICOS (n≥50) ( Zo) = 0.67 1.28 1.65 1.96 2.58

Page 27: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 2727

Ej. Se recabó información sobre una cadena de 676 internets.Cada internet tiene 42 CPU’s ,pero en muchos internetsde no todos los PC funcionan normalmente.Se contó el Nº CPU’s por internet que funcionan normalmente. De 50 Internets(aprox. El 7%) cuyos resultados están en la tabla,donde :N=Tamaño de la póblación 676; n=50 yi = nº de PC q´funcionan ; fi =f recuencias./,internet Se pide estimar

a) El Nº total de PC que funcionan normalmente b)La varianza de la muestra c)El IC para el total al 80%

yi : 42 41 36 32 29 27 23 19 16 15 14 11 10 9 7 6 5 4 3 Total

fi : 23 + 4+ 1+ 1+ 1+ 2 + 1+ 1+ 2 + 2+ 1+ 1+ 1+ 1+ 1+ 3+ 2 +1+ 1 50

Yifi : 966+…………………………………………………… +10 + 4+ 3 1 471

yi²fi:40572 + ………………………………………………… +50 +16 + 9 54 497

Page 28: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 2828

Sol.- Datos . N= 676 ; Unidad muestral = internet n= 50 internet

a)Estimación del Total Y Ŷ = Nÿ = N yi fi / n = 676 (1471)/ 50=19888 fPC q´funcionan normalmente

b) Varianza muestral S² = (1 / n-1) [yi² fi –( yi fi )²/n],reemplazando

S² = (1/ 49) [54497 –(1471)²/ 50] = 229.0 PC²

la desviación típica S = 229 firmas ² = 15.1327 PC

c) El IC para el total(Y) al 80%,:

= [ 19888 ± 1.28(676)(15.13)(0.9623) / 50 ] = [18 107 ; 21 669 ]

Significa que de entre 100 muestras diferentes que se pueden obtener de ésa población se espera que 80 muestras darán la estimación del total entre 18 107 y 21 669 PC que funcionan normalmente

Page 29: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 2929

4.-TAMAÑO MUESTRAL4.-TAMAÑO MUESTRAL• En forma general depende:• 1)Si la población es finita conocida ó infinita desconocida• 2)Del Error admitido ( acuerdo a la calidad de la v.a.)• 3)Del nivel de significación( α →Mín)• 4)Del tipo de muestreo aplicable(con o sin reposicion)• 5)Del estadístico utilizado en la investigación• La fórmula gral n= no N / [no +(N-1)] • donde : n=tamaño de la muestra• N= tamaño de la población

• no= tamaño de la m.a inicial

Page 30: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 3030

Determinación del tamaño de la muestraDeterminación del tamaño de la muestrainicial noinicial no

• •

a) Para la media

1) no= (Zo σ/ E)²;(n≥50)

2) no= (to S/ E)²;(n<50)

Donde Zo=P(Z<zo)=(1+r)/2

to= P(T<to) =(1+r)/2

to→T con n-1 gdl

b) Para la proporción

Si se supone P conocido:

3) no= Zo²pq/E² ;(n≥50)

Si no se conoce P

4)no=1/4 (Zo/E)²

Donde Zo=P(Z<zo)=(1+r)/2

Page 31: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 3131

Ejemplos para estimar el tamaño de la Ejemplos para estimar el tamaño de la m.a.m.a.

• Ej. 1)Un investigador quiere determinar el tiempo promedio que un ensamblador tarda en ensamblar las partes de un ordenador,con una confianza del 95% que la media de su m.a. tenga un error a lo máximo de 0.50 minutos.Se presume por experiencia que la σ= 1.6 minutos.Qué tamaño debe ser la muestra?

• Solución : Y:”tiempo de ensamblaje en minutos”

• Datos; E=0.5, σ= 1.6 ; r=95% →Zo=1.96

• Por 1) n= (Zo σ/ E)² → n=(1.96*1.6 /0.5)² =39.3 =40

• n= 40

Page 32: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 3232

• Ej 2)Se desea estimar el Nº promedio de días de uso continuo antes de que cierto tipo de PC requiera su reparación inicial, si se supone que la σ= 6 días de un lote de 100 PC´s .De qué tamaño debe ser la m.a. para asegurar con una confianza del 90% que la media muestral difiera a lo más por 2 días?

• Solución.- Y:”Tiempo de uso del pc en días”• Datos: N= 100; σ= 6 ;r= 0.90 → Zo= 1.645 ,E=2• Por la fórmula general:n= no N/ [no +(N-1)] • no= (1.645*6 /2)²= 24.354225

• n= 24.354225*100 / [24.354225+(100-1)]= 19.74=20

Page 33: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 3333

• Ej.3)Se desea estimar la Proporción real de CD´s defectuosos en un importación muy grande ,al nivel de un 95% se admite un error a lo sumo de un 4%.de qué tamaño debe ser la m.a. si

• a) No se conoce la proporción real• b)Se sabe q’ la proorción real de defectuosos es 12%• c)Si se conoce el tamaño de la Importación =5000• Solución.-a) r=0.95→Zo=1.96;E=0.04 n=? • Por 4) no= (Zo/2E)²= (1.96 / 2*0.04)²= 600• b) p=0.12 →q=0.88; por 3) no= Zo²pq/E²• n= 1.96²(0.12)(0.88) / (0.04)²= 254• c) N=5000 por :n= no N/ [no +(N-1)]• n=254*5000 /[254 +(5000-1)] =242

Page 34: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 3434

• Conctrucción de los estratos

Una población de 13 435 datos cuya Distribución de frecuencias .Determinar a) los tamaños de los estratos(Nh) b)elTamaño de la m.a (n) si se quiere minimizar el mismo para una V(ÿst) =0.01 puede obiar la cpf.c) Determine los tamaños de las submuestras

Deterdeterminar √fi→ la F(√ fi). De la siguiente manera.

Ii fi √fi F(√fi) Ii fi √ fi F(√fi )

0 -5 3464 58.9 58.9 50-55 125 11.2 340.3

5-10 2516 50.2 109.1 55-60 107 10.3 350.6

10-15 2157 46.4 155.5 60-65 82 9.1 359.7

15-20 1581 39.8 195.3 65-70 50 7.1 366.8

20-25 1142 33.8 229.1 70-75 39 6.2 373.0

25-30 746 27.3 256.4 75-80 25 5.0 378.0

30-35 512 22.6 279.0 80-85 16 4.0 382.0

35-40 376 19.4 298.4 85-90 19 4.4 386.4

40-45 265 16.3 314.7 90-95 2 1.4 387.8

45-50 207 14.4 329.1 95-100 3 1.7 389.5

Page 35: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 3535

• Construción de estratos

• Suponiendo se quiere tener 5 estratos

• Supuestamente serían F(√fi )/ L= 389/5= 77.9

• 77.9 -155.8 -233.7- 311.6 pero los nº más cercanos son:

• Estratos

• 1 2 3 4 5

• Ii. 0-5 5-15 15-25 25-45 45-100

• Fi,√fi 58.9 96.6 73.6 85.6 74.8

Page 36: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 3636

• • N1 = 3464 N2= 4673 N3=2723 N4=1899 N5=676

• W1= N1/N =3464/13435=0.26; W2=4673/13435=0.35 W3= 0.20 W4=0.14 W5=0.05

• n1= ? n2=? n3= ? n4= ? n5= ?• h Wh Sh WhSh nh W1 = N1/N=

3464/13435=0.26• 1 0.26 5 1.30 903• 2 0.35 10 3.50 2432• 3 0.20 7 1.40 973• 4 0.14 5 0.70 486• 5 0.05 1 0.05 36• Total 1 69.5 4830

Page 37: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 3737

• A) por D)Asignación óptima revisada

Vmin(ÿst)=(ΣWhSh)² / n) – Σ WhSh² / N (cpf)

0.01 =(6.95)²/n → n = 4830

b) Por A)Minimizar V(ÿst) para un n total fijo (NEYMAN)

nh= nWhSh / ΣWhSh =nNhSh / ΣNhSh

n1=4830(1.3)/6.95 =903

n2 = 4830(3.5)/6.95=2432

n3 = 4830(1.4)/6.95= 973

n4 = 4830(0.7)/6.95= 486

n5 = 4830(0.05)/6.95= 36

n=4830

Page 38: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 3838

• VARIABLES ESTADÍSTICASEs toda característica que se desea estudiar de la población y que toma mínimamente dos valores:

X: x1 ,x2,...,xn

CLASES DE VARIABLES:1.-CUANTITATIVAS.- Son aquellas que se pueden contar o medir,tenemos: a) Discreta y b)continuas

2.-CUALITATIVAS.-Son aquellas que guardan algún atributo o característica,tenemos:a)Nominal y b) ordinal

Page 39: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 3939

• CICLO METODOLÓGICO

POBLACION (N)

MUESTRA(n)

MUESTRA (n)

muestreo

Toma de decisiones

Estadística inferencial

Estadística descriptiva

Page 40: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 4040

Metodología de la investigación:

1.-Planteamiento del problema y de la hipótesis:

Se define claramente los objetivos del estudio,relacionando con los valores numéricos de las variables observables(y =efecto ;x =causa)

2.-Recolección de datos:

a)Datos publicados,b)diseño experimental c)Encuesta

3.-Organización y clasificación de datos:

se debe realizar un análisis de consistencia

4.-Análisis e interpretación de los datos

Page 41: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 4141

• ORGANIZACIÓN DE LOS DATOS:

• Una vez recopilados los datos ,éstos se los deben presentar en:

1.-Cuadros estadísticos.-que deben tener:

a) Título descriptivo y numerado(superior)

b) Fuente de los datos(pie de página)

c) Unidades en que se expresan

• 2 .-Gráficos:

a) De barras (Verticales u horizontales)

b) Circulares

Page 42: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 4242

• DISTRIBUCIÓN DE FREC. DE V .CUALITATIVAS

Cuadro Nº 1.1. Distrib.de frec. De..........Categorías

X

Frecuencias absolutas simples

fi

Frecuencias relativas hi

Porcentajes pi

C1

C2

.

.

Ck

f1

f2

.

.

fk

h1

h2

.

.

hk

p1

p2

.

.

pk

Totales n 1 100

Page 43: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 4343

• Ejemplo.-

En una entrevista a 20 alumnos sobre la preferencia por tipos de ordenadores:A,B,C,se obtuvieron los siguientes resultado:

A,B,B,A,C,B,B,A,A,B,A,B,B,C,A,B,A,C,A,B, Cuadro nº 1.2.Distrib.de alumnos por pref.de pc

Tipo de PC

X

fi hi pi %

A 8 0.40 40

B 9 0.45 45

C 3 0.15 15

Totales 20 1.00 100

Page 44: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 4444

0

1

2

3

4

5

6

7

8

9

Xi

A

B

C

Figura Nº gráfica de barras

Page 45: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 4545

• Distribución de frec.de v.cuantitativas discretas

Valores

X

fi hi pi %

x1 f1 h1 p1

x2 f2 h2 p2

.

.

.

.

.

.

.

.

xk fk hk pk

Totales n 1.00 100

Valores

X

fi hi pi %

x1 f1 h1 p1

x2 f2 h2 p2

.

.

.

.

.

.

.

.

xk fk hk pk

Totales n 1.00 100

Page 46: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 4646

Distrib.de frec. por Intervalos o clases (n>30)

Cuadro Nº.. Distrib. de frec. por intérvalos

Intérvalos

Ii

Xi fi hi pi %

I1 X1 f1 h1 p1

I2 X2 f2 h2 p2

.

.

.

.

.

.

.

.

.

.

Ik Xk fk hk pk

Totales n 1.00 100

Page 47: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 4747

Procedimiento: ordenar los datos y determinar:

1.-El alcance (A) A=[Valor Mínimo,Valor Máximo]

2.-El Rango (R) R=|Valor Máx-valor Mín|

3.-Nº de Intérvalos (k)

a) 5 < k < 20

b) k=1+3.3 log(n)

4.-Ancho de clase (wi) Wi=|L i +1 -Li|

igual ancho W = R/k

5.-Marca de clase Xi = (Li + Li+1)/2

Page 48: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 4848

• Ejemplo.- se tiene los ingresos quincenales en $us(X) de 45 familias:

63 89 36 49 56 64 59 35 78

43 53 70 57 62 43 68 62 26

64 72 52 51 62 60 71 61 55

59 60 67 57 67 61 67 51 81

53 54 76 44 73 56 62 63 60

Se pide clasificar en 8 clases

Page 49: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 4949

• Cuadro Nº... Distrib.de frec.de los ingresos de 45 familias en dólares

Ii Xi fi hi pi%[26,34>

[34,42>

[42,50>

[50,58>

[58,66>

[66,74>

[74,82>

[82,90>

30

38

46

54

62

70

78

86

1

2

4

10

16

8

3

1

0.022

0.044

0.089

0.222

0.356

0.178

0.067

0.022

2.2

4.4

8.9

22.2

35.6

17.8

6.7

2.2

totales 45 1.000 100

Page 50: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 5050

Histograma de los ingresos de 45 familias

0

2

4

6

8

10

12

14

16

30

38

46

54

62

70

78

86

fi

xi

Page 51: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 5151

Frecuencia absoluta simple fiEs el Nº de datos observados en cada categoría Tal que : Σfi =n Frecuencia relativa simple hiEs la proporción por cada categoría . Tal que: hi = fi/n ; Σhi =1Porcentaje piEs el tanto por ciento de cada categoría Tal que pi = 100%hi ; Σpi = 100% Frecuencia Abs.acumulada FiNº de obs.menores que el límite superior de determinada clase

Tal que :F1=f1 ; Fi= F i-1+fi Frecuencia Relativa acumulada Hi Es la proporción menor al límite superior de determinada clase Tal que :Hi = hi , Hi= Hi-1 +hi ; Hi = Fi/n ; i=1,2,3,....k

Page 52: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 5252

TEMA Nº 3 MEDIDAS DE POSICIÓN Tenemos:La media , la media geométrica armónica,

cuadrática , la mediana,la moda,los cuantiles:

La media aritmética :

a) Para datos no clasificados

poblacional µ =Σ Xi/N ;muestral X = Σxi/n

b)Para datos clasificados

poblacional µ = Σ (xi fi)/N;muestral X = Σ (xi fi)/n

Del Ej. De los ingresos de 45 familias ,el ingreso medio ó percápita es X = Σ (xi fi)/n = 2702/45

X = 60,04 $us semanal

Page 53: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 5353

Propiedades de la media aritmética

Sean: a,b,c, constantes ; x,y variables

1.- M( c ) =C

2.- M( x+ c ) = M( x ) + c

3.- M( ax ) = a M( x )

4.- M ( ax+ b) =aM( x ) +b

5.- M [ x – M( x ) ] = 0

Page 54: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 5454

• La Mediana- Xm ó Md• 1.-Para datos no clasificados,una vez

ordenado,la mediana es:• a) Cuando n es impar es el valor central• b) Cuando n es par es el promedio de los dos

valores centrales• 2.-Para datos clasificados• Xm = Lm + Wm [n/2 –F m-1 ] / fm, donde • la clase mediana se obtiene.• ;Fm n/2 Im = [ Lm ,Lmi +1>

Page 55: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 5555

LA MODA Xmo Ó Mo.-para datos clasificado

Mo = Li + Wi [ 1 / (1 + 2 ) ] ; 1 =fi –fi-1 ; 2 = fi –fi +1

Ej se tiene la siguiente distribución de frecuencias de alturas (pulg ) de 100 personas

Hallar a) La media,b)La Mediana c) la Moda

Ii Xi fi Fi Xi fi (xi-67.95)²fi

60-63

63-66

66-69

69-72

72-75

61.5

64.5

67.5

70.5

73.5

5

18

42

27

8

5

23

65

92

100

307.5

1161.0

2835.0

1903.5

588.0

208.0125

214.2450

8.5050

175.5675

2.46.4200

total 100 6795.0 852.7500

Page 56: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 5656

• Solución

a)la media X = 6795 / 100 = 67,95 pulg

b)La mediana Xm = 66+3[50-23] / 42 =67.90 pulg

c)La moda Mo = 66+3[24 / (24+15 ] =67.8 pulg

Media geométrica .-(G)se utiliza cuando el conjunto es una P.G. Porcentajes.índices etc..

Media armónica (H) .- se utiliza cuando el conjunto es un P.A., tasas, muestra pequeña etc.

Page 57: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 5757

Tema nº 4 MEDIDAS DE DISPERSIÓN

1.-La varianza V(X)

Def gral. V(X) = E[ (x – x )²]

a) Datos no clasificados

S²= Σ (xi – x)² / n-1

b) datos clasificados

S²= Σ (xi – x)² fi / n-1

2.-La desviación típica s

s = V(x)

3.- Coeficiente de variación CV

CV = S / x * 100 %

Page 58: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 5858

Ej. De la anterior distribución hallar a) la varianza b) la desviación c) el coeficiente de variación.

Solución

a) La varianza:

S² = 852.75 / 100 = 8.5275 pulg ²

b) La desviación típica :

S = 8.5275 pulg² = 2.92 pulg

c) El cv =( 2.92 / 76.95 ) *100% =4.30 %

Page 59: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 5959

Propiedades de la Varianza

Sean : a,b,c constantes, X;Y variables

1.-V( c ) = 0

2.-V (X+ c) = V(X)

3.-V( aX ) = a² V (X)

4.-V(aX +b)= a² v(X)

5.-V(X)=M(x²) –[ M(x) ]² ;donde

M(x²)= xi² /n, para datos no clasificados;

M(x²)= xi²fi / n,para datos clasificados

Page 60: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 6060

Momentos.- Definición Gral : E[ (x-a)*]; *= r =1,2,3,..

a) Momentos originales; si a=0

m´r =E [x *] = Σ xi * fi / n

b) Momentos centrales; si a = x

m r = E[ (xi-x)* ] = Σ( xi-x)*fi / n ;*=r = 1,2,3....

Coeficiente de asimetría

Sk = ( x – Mo) / s , si: Sk > 0 sesgado a la derecha

Sk < 0 sesgado a la izquierda

Sk = 0 simétrico

Coeficiente de Kurtosis

Cx = 4 / (²)² si Cx >0 leptocúrtico

si Cx <0 platicúrtico

si Cx =0 mesocúrtico

Page 61: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 6161

Tema nº 5 REGRESIÓN LINEAL SIMPLE

V.E.Bidimensional (X,Y)

-La regresión surge en el análisis de la forma funcional entre X (causa) ,Y(efecto)

-La correlación surge en el análisis de asociación entre X ,Y

- Diagrama de dispersión .- es el gráfico de los pares (xy) ,que da la pauta de la forma funcional entre X e Y

- La covarianza mide el grado de dispersión conjunta entre X ,Y

- Coeficiente de correlación r.-mide el grado de asociación lineal entre X e Y

- -1< r < 1

Page 62: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 6262

Regresión lineal simple .- Y= a + bX ,consiste en estimar la ec.de la recta con el fin de predecir o estimar Y (dependiente) a partir de x( independiente)

Donde a= intercepto; b= pendiente o coeficiente de regresión

Estimación mediante los MCO

Ŷ = â + b X donde b= n [Σxiyi –ΣxiΣyi] / n[Σx²-(Σx)²]

â = y –b x

si b>0 la tendencia lineal es creciente

si b<0 la tendencia lineal es decreciente

si b=0 no hay regresión por que Y= a

Page 63: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 6363

• Ejemplo.-

En un estudio de la relación entre la publicidad por tv y las ventas de ordenadores durante 10 semanas se han recopilado los tiempos de duración en minutos de publicidad por semana (X) y el nº de ordenadores vendidos(y) siendo:

Semana 1 2 3 4 5 6 7 8 9 10

Publicidad(X) 20 30 30 40 50 60 60 60 70 80

Ventas(Y) 50 73 69 87 108 128 135 132 148 170

a)Estimar la recta de regresión ,b) el r c) Estime las ventas si la publicidad es de 90 minutos

Page 64: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 6464

• Solución

Cuadro Nº ...

x y xy X² Y²20

30

30

40

50

60

60

60

70

80

50

73

69

87

108

128

135

132

148

170

1000

2190

2070

3480

5400

7680

8100

7920

10360

13600

400

900

900

1600

2500

3600

3600

3600

4900

6400

2500

5329

4761

7569

11664

16384

18225

17424

21904

28900

500 1100 61800 28400 134660

Page 65: ESTADÍSTICA DESCRIPTIVA

19/04/2319/04/23 TPAUTPAU 6565

SOLUCIÓN

a) b=[10(61800)-500(11009] / [10(28400)-500²] =

b = 68000 / 3400=2 ; b=2

a = 110- 2(50) = 10 ; a=10

Por lo tanto ŷ = 10 + 2 X

b) El r= n [Σxiyi –ΣxiΣyi] / n[Σx²-(Σx)²] * n[Σy²-(Σy)²] =

=680 /681.5424 = 0.998 , r=0.998 altamente positivo

c) Estimación para x=70 ;ŷ = 10 + 2 (90) = 190 ordenadores