DISTRIBUCIONES BIDIMENSIONALES ((Cuaderno para Prof. Jaime García)).docx

40
DISTRIBUCIONES BIDIMENSIONALES Cuando una variable predice exactamente a la otra es una relación funcional. Si la variable da aproximadamente la otra se dice que es una relación estadística. Relaciones funcionales → Medidas Perfectas RelacionesEstadisticas →MedidasCercanas Nota: En las relaciones tenemos siempre dos datos; ( X,Y ) { RelaciónFuncional RelaciónEstadistica Ejemplo de relaciones estadísticas: Exportaciones vs Importaciones Exportaciones>Importaciones Exportaciones Importaciones ( Caso deun país dependiente ) Ingresos v s Productividad Nota: Cuando tomamos toda la población para el estudio se está realizando un censo, pero la estadística se basa en una muestra representativa. X↔Y, La Covarianza es la media de las desviaciones lineales. Covarianza Muestral: (También conocida como la varianza) s xy = ( x i x)( y i y) n i n , donden=muestra . Covarianza Poblacional:

Transcript of DISTRIBUCIONES BIDIMENSIONALES ((Cuaderno para Prof. Jaime García)).docx

DISTRIBUCIONES BIDIMENSIONALES

Cuando una variable predice exactamente a la otra es una relacin funcional.Si la variable da aproximadamente la otra se dice que es una relacin estadstica.

Nota: En las relaciones tenemos siempre dos datos; Ejemplo de relaciones estadsticas:

Nota: Cuando tomamos toda la poblacin para el estudio se est realizando un censo, pero la estadstica se basa en una muestra representativa.

, La Covarianza es la media de las desviaciones lineales.

Covarianza Muestral: (Tambin conocida como la varianza)

Covarianza Poblacional:

La Desviacin es el grado de alejamiento de un dato con respecto a su media.

R= a + bx

Relacin estadstica mltiple

Tendencia lineal de sus variables, asociacin directa.

La relacin entre x e y se muestra en una ecuacin, para este caso:

R= a + bx

Figura 1. Comportamiento grfico de la recta[footnoteRef:1] [1: Recuperado de: http://wiki.monagas.udo.edu.ve/index.php?title=M%C3%ADnimos_Cuadrados_Regresi%C3%B3n_y_Correlaci%C3%B3n_Lineal_M%C3%BAltiple.&oldid=2996]

La variable independiente se denomina factor, y la variable dependiente se denomina respuesta.Coeficiente de Correlacin: Muestra que tanto una variable determina a la otra.

El coeficiente de correlacin debe estar entre -1 y 1. La covarianza y el coeficiente de correlacion sirven para medir el grado de asociacion entre las variables (x,y).Ejercicio: A partir de los siguientes datos de pesos y estaturas tomados de los estudiantes de la clase de estadstica I del segundo semestre de 2013, determine: Covarianza en el caso de los hombres, mujeres y de manera mixta. Coeficiente de Correlacin en el caso de los hombres, mujeres y de manera mixta.

Base Datos Mixtos

EstaturaPeso

1,5550

1,5753

1,651

1,650

1,648

1,650

1,660

1,650

1,664

1,6163

1,6149

1,6248

1,6464

1,6560

1,6855

1,6968

1,768

1,763

1,760

1,765

1,753

1,7158

1,7255

1,7260

1,7884

1,870

1,865

1,8265

Base Datos de Mujeres

EstaturaPeso

1,5550

1,5753

1,648

1,650

1,651

1,660

1,664

1,6149

1,6163

1,6248

1,6464

1,753

1,760

1,768

1,7884

1,650

1,650

Base Datos de Hombres

EstaturaPeso

1,6968

1,6855

1,763

1,8265

1,6560

1,7255

1,870

1,7260

1,865

1,7158

1,765

Solucin:1. Base Datos MixtosBase Datos Mixtos

EstaturaPeso

1,5511,55501501,039

1,5711,57531530,570

1,611,6511510,527

1,611,6501500,594

1,611,6481480,727

1,611,6501500,594

1,611,660160-0,074

1,611,6501500,594

1,611,664164-0,341

1,6111,6163163-0,233

1,6111,61491490,562

1,6211,62481480,510

1,6411,6464164-0,137

1,6511,6560160-0,019

1,6811,6855155-0,051

1,6911,69681680,211

1,711,7681680,302

1,711,7631630,136

1,711,7601600,037

1,711,7651650,203

1,711,753153-0,196

1,7111,7158158-0,039

1,7211,7255155-0,207

1,7211,72601600,059

1,7811,78841842,842

1,811,8701701,480

1,811,8651650,814

1,8211,82651650,936

2846,6728164911,440

0,01479,083

0,00934,726

0,00462,297

0,00479,083

0,004118,654

0,00479,083

0,0041,226

0,00479,083

0,00426,083

0,00316,869

0,00397,869

0,002118,654

0,00126,083

0,0001,226

0,00015,154

0,00182,940

0,00182,940

0,00116,869

0,0011,226

0,00137,297

0,00134,726

0,0020,797

0,00315,154

0,0031,226

0,013630,369

0,018123,369

0,01837,297

0,02337,297

Totales0,1491936,679

2. Base Datos de Mujeres

Base Datos de Mujeres

EstaturaPeso

1,5511,55501500,53

1,5711,57531530,22

1,611,6481480,25

1,634,85031500,57

1,611,6511510,16

1,611,660160-0,09

1,611,664164-0,20

1,6111,61491490,14

1,6111,6163163-0,11

1,6211,62481480,07

1,6411,64641640,09

1,711,753153-0,27

1,711,7601600,23

1,711,7681680,81

1,7811,78841844,13

Totales:1727,68179656,52

EstaturaPeso

1,5510,0065045,76

1,5710,0035314,17

1,610,0014876,82

1,630,00250137,28

1,610,0015133,23

1,610,0016010,47

1,610,0016452,35

1,6110,0004960,29

1,6110,0006338,88

1,6210,0004876,82

1,6410,0006452,35

1,710,0055314,17

1,710,0056010,47

1,710,00568126,23

1,7810,02384741,76

0,051491,06

3. Base Datos de Hombres

Base Datos de Hombres

EstaturaPeso

1,6511,6560600,17

1,6811,6855550,33

1,6911,696868-0,21

1,711,76363-0,02

1,711,76565-0,07

1,7111,7158580,07

1,7211,7255550,05

1,7211,7260600,01

1,811,870700,58

1,811,865650,21

1,8211,8265650,26

Totales:1118,996841,37

EstaturaPeso

1,6510,0064604,75

1,6810,00255551,55

1,6910,00166838,87

1,710,0009630,67

1,710,0009657,95

1,7110,00045811,47

1,7210,00015551,55

1,7210,0001604,75

1,810,0049707,95

1,810,00496561,15

1,8210,0081657,95

0,0299249,61

MOMENTOS

Son medidas para calcular los parmetros y/o estadsticos que caracterizan una poblacin o muestra.

EstadsticosParmetrosPoblacin Objetivo (Parte de la poblacin que tiene la caracterstica en estudio).Poblacin (N)Poblacin ObjetivoMuestra (n)

ParmetrosEstadsticos

Toda la poblacin objetivo.

Media poblacional. Varianza Poblacional. Moda Poblacional. Mediana Poblacional. Curtosis.Estudio de muestras.

Media Muestral. Varianza Muestral. Moda Muestral. Mediana Muestral.

A partir de los resultados obtenidos en la muestra se puede inferir para la poblacin en general.

1. Momento con respecto al origen.2. Momento con respecto a la media.3. Momento con respecto a un valor arbitrario k.

1. Momento de orden r con respecto al origen

Definicin Universal:

Caso Discreto:

Nota:

Caso Continuo:

Nota:

2. Momento de orden r con respecto a la media

Definicin Universal:

Caso Discreto:

Caso Continuo:

3. Momento con respecto a un valor arbitrario k.El valor arbitrario lo fijan los investigadores o especialistas para restringir la tolerancia, de esta manera los datos salen referidos a la norma que se desee fijar. Definicin Universal:

Caso Discreto:

Caso Continuo:

COEFICIENTE DE ASIMETRA

Simetra: Una distribucin es simtrica cuando en un punto la media, moda y mediana son iguales; es decir, hay una equidistancia entre ambo ejes (simetra con respecto a ambos ejes).

Las medidas de asimetra son indicadores que permiten establecer el grado de simetra (o asimetra) que presenta una distribucin de probabilidad de una variable aleatoria sin tener que hacer su representacin grfica. [footnoteRef:2] [2: Recuperado de: http://es.wikipedia.org/wiki/Asimetr%C3%ADa_estad%C3%ADstica]

As= 0(existe la misma concentracin de valores a la derecha y a la izquierda de la media)As< 0(existe mayor concentracin de valores a la izquierda de la media que a su derecha)As > 0 (existe mayor concentracin de valores a la derecha de la media que a su izquierda)

Posibles Resultados Tras Medir El Nivel De Asimetra.[footnoteRef:3] [3: Recuperado de: http://www.aulafacil.com/CursoEstadistica/Lecc-8-est.htm]

Nota: Por efecto de los valores extremadamente altos puede ocurrir un sesgo, es importante resaltar que la media es muy sensible a valores extremos. Algunas veces se puede reemplazar a la media como parmetro por la moda o la mediana, ya que estas medidas no se dejan influenciar por datos extremos, un ejemplo de esto se da en los salarios.

1. Coeficiente De Asimetra De Pearson

2. Coeficiente De Asimetra De Fisher

COEFICIENTE DE CURTOSIS

Esta medida determina el grado de concentracin que presentan los valores en la regin central de la distribucin. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentracin de valores (Leptocrtica), una concentracin normal (Mesocrtica) o una baja concentracin (Platicrtica).[footnoteRef:4] [4: Recuperado de: http://www.spssfree.com/spss/analisis3.html]

[footnoteRef:5] [5: Recuperado de: http://www.spssfree.com/spss/analisis3.html]

1. Coeficiente De Curtosis De Fisher

DISTRIBUCIONES BIVARIANTES

Las distribuciones bivariantes son la representacin de dos variables sujetas a estudio.

Tablas de Doble Entrada:Estas tablas se utilizan mucho en procesos de tabulacin.

Variables Cualitativas: Representan una categora.Tablas de Contingencia.Tienen un sentido de medicin de las proporciones.

Variables Cuantitativas: Nos indican si las variables son dependientes o independientes.

Ocurren simultneamente las caractersticas .Nmero de individuos que tienen simultneamente las caractersticas .1. Distribucin Marginal:

Se llama marginal porque no tiene en cuenta o no la afectan las dems caractersticas que intervienen.

As para obtener la distribucin marginal de x se calculan en el recorrido de y o j.

Para la ocurrencia de la clase con :

Ejemplo:

2. Distribucin CondicionalCual es la frecuencia de que ocurra la caracterstica dado que se da ?

Frecuencias Relativas:ConjuntaMarginalCondicional

Coeficiente de Correlacin: Muestra que tan independiente es una variable de la otra.Las variables de orden cualitativo son dependientes, por ejemplo en los experimentos biolgicos o genticos.Grado de Asociacin: Covarianza.

MEDIA GEOMTRICA (G)No es sensible a valores extremos. Presenta un crecimiento potencial.Es aplicable para clculos financieros a inters compuesto, se emplea en el clculo de tasas de incremento de poblaciones.La media geomtrica no puede tener valores cero y/o un nmero impar de valores negativos.

Frecuencias Unitarias:

De lo anterior deducimos la ecuacin de la media geomtrica:

La media geomtrica se aplica a los consumos asociados a las poblaciones demogrficas.

Dnde:

Ejercicio:La poblacin en Sogamoso en 1940 era de 35000 personas y en el 2012 de 125000 personas.Cul fue la tasa media de crecimiento anual en Sogamoso en el perodo enunciado?Solucin:

Despejando

Sogamoso vienen creciendo a una tasa de 0,02 promedio/anual.Ejercicio:Si se mantienen las condiciones demogrficas. Cul ser la poblacin esperada en 2030?Solucin:

La poblacin esperada en 2030 si se mantienen las condiciones demogrficas ser de personas.

MEDIA ARMNICA (H)

Es el recproco de la media aritmtica de los recprocos de los valores de la serie.

IMPORTANTE:

Ejemplo:Se tienen dos registros de produccin, uno tipo A y otro tipo B.

Cul fue la produccin media de los operarios? Solucin:Del enunciado podemos deducir:

OperarioRegistros Tipo ARegistros Tipo B

18 Camisas/Turno1 Camisa/1 Hora

27 Camisas/Turno1 Camisa/1 y 1/4 Hora

39 Camisas/Turno1 Camisa/55 minutos

46 Camisas/Turno1 Camisa/1 y 1/2 hora

57 Camisas/Turno1 Camisa/1 Hora y 10 minutos

68 Camisas/Turno1 Camisa/1 Hora y 5 minutos

79 Camisas/Turno1 Camisa/50 minutos

86 Camisas/Turno1 Camisa/1 Hora y 35 minutos

97 Camisas/Turno1 Camisa/1 Hora y12 minutos

108 Camisas/Turno1 Camisa/1 Hora y 7 minutos

Ejercicio: Calcular la media aritmtica, acotada, Windsor, geomtrica y armnica para el ejercicio 1 de las estaturas.Solucin:1. Media AritmticaNmero de IntervalosMarca de Clase (xi)nixi*ni

1150,51150,5

2154,500

3158,54634

4162,53487,5

5166,5233829,5

6170,5539036,5

7174,5203490

8178,5142499

9182,53547,5

10186,53559,5

11190,52381

12621615

Media Aritmtica =171,55

2. Media Acotada126100

16

=12,70

/2 =6,35

Nmero de IntervalosMarca de Clase (xi)niMarca de Clase (xi) Acotadani (acotada)xi*ni

1150,51

2154,50

3158,54

4162,53

5166,523166,5233829,5

6170,553170,5539036,5

7174,520174,5203490

8178,514178,5142499

9182,53

10186,53

11190,52

12611018855

Media Acotada =171,41

3. Media WindsorNmero de IntervalosMarca de Clase (xi)niMarca de Clase (xi) Acotadaxi*ni

1150,51166,5166,5

2154,50166,50

3158,54166,5666

4162,53166,5499,5

5166,523166,53829,5

6170,553170,59036,5

7174,520174,53490

8178,514178,52499

9182,53178,5535,5

10186,53178,5535,5

11190,52178,5357

12621615

Media Windsor =171,55

4. Media GeomtricaNmero de IntervalosMarca de Clase (xi)nilog(xi)log(xi)*ni

1150,512,182,18

2154,502,190,00

3158,542,208,80

4162,532,216,63

5166,5232,2251,09

6170,5532,23118,28

7174,5202,2444,84

8178,5142,2531,52

9182,532,266,78

10186,532,276,81

11190,522,284,56

12624,54281,50

Media Geomtrica =171,44

5. Media ArmnicaNmero de IntervalosMarca de Clase (xi)ni1/xi1/xi(ni)

1150,510,006644520,00664452

2154,500,006472490

3158,540,006309150,02523659

4162,530,006153850,01846154

5166,5230,006006010,13813814

6170,5530,005865100,31085044

7174,5200,005730660,11461318

8178,5140,005602240,07843137

9182,530,005479450,01643836

10186,530,005361930,01608579

11190,520,005249340,01049869

1260,064874740,73539862

Media Armnica =171,34

Comparando las medias:M. Aritmtica171,55

M. Acotada171,44

M. Windsor171,55

M. Geomtrica171,44

M. Armnica171,34

MODELO DE ORDEN LINEAL (Regresin Lineal)

El grado de relacin o de tendencia nos sirve para predecir comportamientos futuros histricamente cercanos.Ecuacin Matriz:

El modelo estimado es:, esta es la ecuacin de regresin lineal y de tendencia (Si x e y son magnitudes). Ejemplo 1: (Para n: Perodos Par)Cuando x: Tiempo e y: Magnitud.Las ventas anuales en los ltimos 20 aos:XY

aosmagnitud

::

::

XY

-7

-5

-3

-1

1

3

5

7

n=8

XY

-3

-2

-1

0

1

2

3

n=8

Ejemplo 2:Las exportaciones de durazno boyacense en fresco hechas a Estados Unidos durante los ltimos aos fueron (cantidades en miles de millones): Determinar la ecuacin de regresin y a partir de este calcular las exportaciones para el 2015.Solucin:AosCantidades Exportadas (US $) (OOO)xxy

20013,5-11-38,5121

20024,2-9-37,881

20034,7-7-32,949

20045,6-5-2825

20055,9-3-17,79

20066,7-1-6,71

20076,716,71

200883249

20098,254125

20108,7760,949

20118,9980,181

201210,511115,5121

Totales81,60166,6572

Exportaciones para 2015:

Las exportaciones esperadas para el 2015 son de 11751,386.

Ejemplo 3: (Para n: Perodos Impar)X: Ingresos, Y: Consumo (En $ 000.000)Calcular el consumo para un ingreso de 5.000.000.

xyxy

0,60,60,360,36

0,90,90,810,81

1,111,11,21

1,91,93,613,61

2,62,56,56,76

2,92,98,418,41

3,53,512,2512,25

3,83,513,314,44

4,6418,421,16

6,5532,542,25

9,2873,684,64

37,633,8170,84195,9

Ecuacin:

Para un ingreso de 5.000.000:

AJUSTE DE ORDEN CUADRTICO O PARABLICO

Ejemplo:Los siguientes datos siguen un modelo ? Hallar Para un x=0,0015, x=0,0075 y x=0,005. Cul sera la ganancia?xy

0,0011000

0,00210000

0,00340000

0,00460000

0,00570000

0,00660000

0,00750000

0,028291000

xyxy

0,00110000,0000011E-091E-1210,001

0,002100000,0000048E-091,6E-11200,04

0,003400000,0000092,7E-088,1E-111200,36

0,004600000,0000166,4E-082,56E-102400,96

0,005700000,0000251,3E-076,25E-103501,75

0,006600000,0000362,2E-071,3E-093602,16

0,007500000,0000493,4E-072,4E-093502,45

Totales0,0282910000,000147,8E-074,68E-0914417,721

Sustituyendo en los determinantes y desarrollndolos se obtiene:

XY

0,00158401,7855

0,007545258,9275

0,005-23991,0715

TIP INFORMTICO:

Pasos para graficar el anterior ejercicio en Excel:1. Seleccionar los datos que se desean graficar.2. Clic en insertar.(Los grficos de barras y reas se pueden utilizar para las variables bidimensionales).3. Seleccionar la opcin Grficos de Dispersin, y escoger la nube de puntos. Gracias a este podremos observar la tendencia de los datos y escoger el modelo ms adecuado.4. Agregar lnea de tendencia.

Podemos ver que la formula generada por Excel es similar a la obtenida mediante el uso de determinantes.Coeficiente de determinacin:Sirve para calificar el modelo terico hallado, en otras palabras nos dice que tan bueno es el modelo. Conocido tambin como coeficiente de bondad de ajuste.

La idea es buscar un modelo con un lo ms cercano a 1.

Gracias a Excel se puedo determinar que el modelo que mejor se ajusta a la situacin es una lnea de tendencia polinmica de orden 4.HISTOGRAMAEn el eje y van los , el ancho es la amplitud y el largo la frecuencia.Los rectngulos son el histograma y la lnea que une los puntos medios de cada uno de estos se llama polgono de frecuencias absolutas, es el grafico lineal del fenmeno.1. Histograma de Frecuencias Absolutas (Ejercicio 1 de edades)

La lnea vertical azul es la moda, mo=170,49.2. Histograma de Frecuencias Acumuladas (Ejercicio 1 de edades)