VARIABLES Descriptores parte I

34
VARIABLES Descriptores parte I Mario Briones L. MV, MSc 2005

description

VARIABLES Descriptores parte I. Mario Briones L. MV, MSc 2005. Variables. Son la materia prima de la estadística. Es un atributo que varía entre un individuo y otro. Ejemplo: peso, estatura, color de pelaje, etc. Variables. Algunas variables en un sistema productivo ovino -Raza - PowerPoint PPT Presentation

Transcript of VARIABLES Descriptores parte I

Page 1: VARIABLES Descriptores parte I

VARIABLESDescriptores parte I

Mario Briones L.MV, MSc

2005

Page 2: VARIABLES Descriptores parte I

Variables Son la materia prima de la

estadística. Es un atributo que varía entre un

individuo y otro. Ejemplo: peso, estatura, color de

pelaje, etc.

Page 3: VARIABLES Descriptores parte I

VariablesAlgunas variables en unsistema productivo ovino

-Raza-Peso de las ovejas-Peso del vellón a la esquila-Peso de los corderos al nacimiento-Peso de los corderos a venta-Valor del kilo de peso vivo-Color de la lana-Producción de forraje-Precipitación anual-Forrajeras más comunes-Calidad del suelo

Page 4: VARIABLES Descriptores parte I

VariablesAlgunas variablesrelacionadas con ladificultad de pariciónen vacas:

-Peso del ternero al nacer-Peso de la vaca-Edad de la vaca-Perímetro toráxico-Perímetro de la cabeza-Perímetro de la articulación del carpo-Area de la cavidad pélvica-Grado de dificultad del parto-Condición corporal de la vaca

Page 5: VARIABLES Descriptores parte I

Variables Tipos de variables

Cuantitativas: expresadas en números. Pueden ser de dos tipos:

• Continuas (peso, estatura)• Discretas (tamaño de camada)

Cualitativas• No son “mediciones” sino más bien una

“característica” del individuo. Por ejemplo, sexo, color de pelaje. Puede ser codificada con números (ej: sexo 1= hembra; sexo 2= macho) pero sigue siendo una característica no una medición.

Page 6: VARIABLES Descriptores parte I

Escalas de mediciónVALORES

ORDENADOSVALORES

EQUIDISTANTESPUNTO CERO

NATURAL

NOMINAL

ORDINAL XINTERVALO X XRAZÓN X X X

Page 7: VARIABLES Descriptores parte I

Escalas de medición Nominal: el atributo es sólo un nombre, no hay

relación de precedencia entre las diferentes categorías. Ej: sexo, color.

Ordinal: existe relación de precedencia pero no hay garantía de un intervalo constante entre las categorías. Ej: dificultad de parición.

De intervalo: Existe relación de precedencia y un intervalo constante entre categorías pero no hay cero absoluto. Ej: temperatura en grados Celsius

De razón: Existe un cero absoluto que indica ausencia de valor. Ej. mediciones de peso, tamaño, etc.

Page 8: VARIABLES Descriptores parte I

Escala nominal: Sexo de animales

Macho, Hembra Color de capa en ganado Angus

Negro, Rojo Presencia de un alelo

Positivo, Negativo

Page 9: VARIABLES Descriptores parte I

Escala ordinal: Dificultad de parición

(0) Sin dificultad (1) Con dificultad leve

• Asistencia de una persona (2) Con dificultad severa

• Asistencia de más de una persona (3) Cesárea

• Imposibilidad de parto normal

Page 10: VARIABLES Descriptores parte I

Escala de intervalo

+40+30+20+10 0- 10- 20- 30- 40

No indica ausencia de temperatura

No es el doble de temperaturaque 10 grados

Page 11: VARIABLES Descriptores parte I

Escala de razón:

0.00000 mg

Por ejemplo el peso:Existe un cero absoluto para indicar ausenciade valor. Diez miligramos es el doble de pesocomparado con 5 miligramos

Page 12: VARIABLES Descriptores parte I

Manejo y presentación de datos a programas computacionales. Estructura básicas de base de datos:

registros (individuos) y campos (variables)

madrefecha de

nacimientofecha demedición

edad (días)

alzada (cm)

perímetrotoráxico

(cm)

largoescápula

iz (cm) sexopeso

(kilos)escandalosa 07/11/2001 29-Ene 83 118 122 107 m 153

sta carolina 05/11/2001 29-Ene 85 118 119 98 f 148

falangista 10/09/2001 27-Oct 47 119 114 97 f 114

antigua 21/08/2001 27-Oct 67 119 116 107 m 136

tepa 11/11/2001 29-Ene 79 120 115 109 f 144

diáfana 13/08/2001 27-Oct 75 121 119 110 m 149

chica mañé 06/11/2001 29-Ene 84 121 118 94 m 135

14/08/2001 20-Oct 67 123 114 99 m 133.5

diablita 20/08/2001 27-Oct 68 123 120 106 f 145

huascarina 18/08/2001 27-Oct 70 124 122 112 f 158

codicia 17/08/2001 27-Oct 71 124 118 105 f 132.5

espinita 01/08/2001 27-Oct 87 124 123 108 f 156

huasa bonita 01/11/2001 29-Ene 89 124 128 105 m 180

jardin del sol 31/10/2001 29-Ene 90 125 119 108 m 148

Page 13: VARIABLES Descriptores parte I

Resumen y descripción de datos. Cada vez que se obtienen datos a partir de

una muestra, uno de los primeros procesos es la obtención de DESCRIPTORES, los cuales son una especie de valores representativos de los datos.

Los descriptores obtenidos en una muestra se denominan ESTIMADORES. Estos son un reflejo de los mismos descriptores en la población, donde se denominan PARAMETROS.

Page 14: VARIABLES Descriptores parte I

Resumen y descripción de datos. También los gráficos y tablas son

formas resumidas de entregar el “significado” de los datos

Estas representaciones numéricas y/o gráficas constituyen lo que se denomina ESTADISTICA DESCRIPTIVA

Page 15: VARIABLES Descriptores parte I

Uso de la descripción La ESTADISTICA DESCRIPTIVA es la

base de la ESTADISTICA INFERENCIAL

Inferencias en estadística son las extensiones o conclusiones que, a partir de los datos de la muestra, se hacen sobre la población.

Page 16: VARIABLES Descriptores parte I

Uso de la descripción Estadística descriptiva:

resume o describe una muestra. • Ej: promedio de lluvia caída en cada uno de

los doce meses del año en Chillán. Estadística infererencial:

hace generalizaciones a partir de la muestra, sobre una población mayor• Ej: la probabilidad de lluvia en un periodo

determinado del año.

Page 17: VARIABLES Descriptores parte I

Descripción básica:

A continuación se presentan los datos de producción deleche corregida a 305 días, de un grupo de vaquillas deprimer parto.

Se observa que los datos están ordenados de acuerdocon el número de identificación de los animales, que escomo normalmente se obtiene esta información.Se puede ver que no es muy fácil tener una buenapercepción de la variable, cuando los datos estánpresentados de esta forma.

Page 18: VARIABLES Descriptores parte I

VACA LECHE (K) VACA LECHE (K)123 5680 323 6754134 4890 329 6321166 5837 331 4210190 4856 332 3890198 6321 354 5643201 5768 367 7015234 5342 372 5312236 5765 386 6298239 4876 394 6207266 5205 400 5023275 5212 410 6012288 6915 412 5907297 5910 413 4895312 5189 433 5111317 5654 456 5328

Page 19: VARIABLES Descriptores parte I

VACA LECHE (K) VACA LECHE (K)332 3890 317 5654331 4210 123 5680190 4856 236 5765239 4876 201 5768134 4890 166 5837413 4895 412 5907400 5023 297 5910433 5111 410 6012312 5189 394 6207266 5205 386 6298275 5212 198 6321372 5312 329 6321456 5328 323 6754234 5342 288 6915354 5643 367 7015

ARREGLO ORDENADO

Page 20: VARIABLES Descriptores parte I

Distribución de frecuencia:El primer paso de análisis de la variable es la construcciónde la distribución de frecuencia de la variable en la muestra.Consiste, simplemente, en agrupar los datos a lo largo delrecorrido o rango de la variable para de esta maneraubicar el número de observaciones que se encuentra encada categoría.

Existen fórmulas para determinar el mejor número decategorías que conviene para describir mejor una variablepero en general, las reglas básicas son:dividir el rango (valor más grande menos el más pequeño)en una cantidad de intervalos iguales. En la práctica,se puede también lograr esto por prueba y error.El número de categorías no debe ser muy grande nimuy pequeño, aunque también depende del número de datos.

Page 21: VARIABLES Descriptores parte I

RECORRIDO DE LA VARIABLE

3890 7015

Rango: 7015 - 3890 = 3125

INTERVALOS DE CLASE

3125/5= 625 UNIDADES: ANCHO DEL INTERVALO

Page 22: VARIABLES Descriptores parte I

38903890+625= 4415

4416 +625= 5141

5142 +625= 5767

5768 +625= 6393

6394 +625= 7019

NUMERO DEOBSERVACIONESEN LA CLASE:

2

6

9

10

3

38904415

44165141

51425767

57686393

63947019

LÍMITESSUPERIORE INFERIORDE LA CLASE

Page 23: VARIABLES Descriptores parte I

OBSERVACIONES FRECUENCIA RELATIVA

2 2/30= 0,066

6 6/30= 0,2

9 9/30= 0,3

10 10/30= 0,33

3 3/30= 0,1

38904414

44155149

51405764

57646389

63907015

CLASE

1

2

3

4

5

Page 24: VARIABLES Descriptores parte I

HISTOGRAMA DE FRECUENCIA

0

0,10

0,20

0,30

CLASE1 2 3 4 5

FRECUENCIARELATIVA

Page 25: VARIABLES Descriptores parte I

Notación matemática

X= simboliza la variable

x (minúscula), simboliza los valores individuales

x1, x2, valores particulares de la variable

xi, valor típico de la variable

xN, último valor de una población finita

= sumatoria

Page 26: VARIABLES Descriptores parte I

Tipos de descriptores Descriptores de tendencia central: Descriptores de dispersión:

Page 27: VARIABLES Descriptores parte I

Medidas de tendencia central Media aritmética o promedio

n

xx

n

ii

1

N

xN

ii

1

En la población En la muestra

Page 28: VARIABLES Descriptores parte I

129.5 136 137 139 140 142 143

130 136.5 137.5 139 140.5 142 143

131 136.5 137.5 139 140.5 142 143.5

131.5 136.5 137.5 139 140.5 142 143.5

132 136.5 138 139 141 142 143.5

132 136.5 138 139 141 142 143.5

133 136.5 138 139.5 141 142 144.5

133 136.5 138 140 141 142 144.5

133 137 138 140 141 142 145

133.5 137 138 140 141 142.5 146

134 137 138 140 141 142.5 146

134 137 138 140 141 142.5 147

134 137 138 140 141 143 148.5

135 137 138.5 140 141.3 143 149.5

135 137 138.5 140 141.5 143

135 137 138.5 140 141.5 143

136 137 138.5 140 141.5 143

136 137 138.5 140 141.5 143

136 137 138.5 140 142 143

136 137 139 140 142 143

Ejemplo: arreglo ordenado de 134 valores dealzada en caballos de raza chilena (en cm)

Page 29: VARIABLES Descriptores parte I

Histograma de frecuencia

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

129.5 132.0

132.1 134.5

134.6 137.0

137.1 139.5

139.6 142.0

142.1 144.5

144.6 147.0

147.1 149.5

Intervalos de clase

Fre

cue

nci

a re

lati

va

Page 30: VARIABLES Descriptores parte I

Media aritmética:129.5 136 137 139 140 142 143

130 136.5 137.5 139 140.5 142 143

131 136.5 137.5 139 140.5 142 143.5

131.5 136.5 137.5 139 140.5 142 143.5

132 136.5 138 139 141 142 143.5

132 136.5 138 139 141 142 143.5

133 136.5 138 139.5 141 142 144.5

133 136.5 138 140 141 142 144.5

133 137 138 140 141 142 145

133.5 137 138 140 141 142.5 146

134 137 138 140 141 142.5 146

134 137 138 140 141 142.5 147

134 137 138 140 141 143 148.5

135 137 138.5 140 141.3 143 149.5

135 137 138.5 140 141.5 143

135 137 138.5 140 141.5 143

136 137 138.5 140 141.5 143

136 137 138.5 140 141.5 143

136 137 138.5 140 142 143

136 137 139 140 142 143

139.27

Page 31: VARIABLES Descriptores parte I

Mediana EN UN CONJUNTO DE VALORES ES AQUEL VALOR QUE

DIVIDE AL CONJUNTO EN DOS PARTES IGUALES. IGUAL NÚMERO DE VALORES MAYORES Y MENORES QUE LA MEDIANA

CANTIDAD IMPAR

x1 x2 x3 x4 x5

CANTIDAD PAR

x1 x2 x3 x4 x5 x6

EN EL EJEMPLO

134/2 = 67

posición 67= 139.5Posición 68= 140

(139.5+140)/2= 139.75

Page 32: VARIABLES Descriptores parte I

129.5 136 137 139 140 142 143

130 136.5 137.5 139 140.5 142 143

131 136.5 137.5 139 140.5 142 143.5

131.5 136.5 137.5 139 140.5 142 143.5

132 136.5 138 139 141 142 143.5

132 136.5 138 139 141 142 143.5

133 136.5 138 139.5 141 142 144.5

133 136.5 138 140 141 142 144.5

133 137 138 140 141 142 145

133.5 137 138 140 141 142.5 146

134 137 138 140 141 142.5 146

134 137 138 140 141 142.5 147

134 137 138 140 141 143 148.5

135 137 138.5 140 141.3 143 149.5

135 137 138.5 140 141.5 143

135 137 138.5 140 141.5 143

136 137 138.5 140 141.5 143

136 137 138.5 140 141.5 143

136 137 138.5 140 142 143

136 137 139 140 142 143

Mediana

(139.5+140)/2=139.75

Page 33: VARIABLES Descriptores parte I

Moda LA MODA EN UN CONJUNTO DE VALORES

ES AQUEL VALOR QUE OCURRE CON MAS FRECUENCIA.

SI NINGUN VALOR SE REPITE, NO EXISTE MODA

SI DOS VALORES SE REPITEN LA MISMA CANTIDAD DE VECES, HAY DOS MODAS

EN EL EJEMPLO LA MODA ES 140 CM.

Page 34: VARIABLES Descriptores parte I

Resumen de descriptores de tendencia central MEDIA= 139.27 cm.

MEDIANA= 139.75 cm.

MODA= 140 cm.