conceptos basicos de estadistica

23
1 PROFESOR MARIO RODRIGUEZ L. CONCEPTOS BÁSICOS DE ESTADÍSTICA DESCRIPTIVA UNIVERSIDAD LOS LEONES ESTADÍSTICA Y ANÁLISIS DE DATOS ESCUELA DE PSICOLOGÍA

description

estadistica

Transcript of conceptos basicos de estadistica

Page 1: conceptos basicos de estadistica

1

PROFESOR MARIO RODRIGUEZ L.

CONCEPTOS BÁSICOS DEESTADÍSTICA DESCRIPTIVA

UNIVERSIDAD LOS LEONESESTADÍSTICA Y ANÁLISIS DE DATOS

ESCUELA DE PSICOLOGÍA

Page 2: conceptos basicos de estadistica

2

Conceptos Generales

La Estadística Descriptiva es aquella área de la Estadística

encargada de desarrollar herramientas destinadas a describir el

comportamiento de una serie de datos, definida mediante una

base de datos, pertenecientes a una población o a una muestra.

Población: conjunto de elementos que tienen algunas

características comunes.

Muestra: subconjunto representativo de elementos de la

población.

Variable: característica interés de estudio

Base de Datos: Se entiende por base de datos un conjunto de

elementos cuantitativos o cualitativos que corresponden a los

valores que toma la variable.

Page 3: conceptos basicos de estadistica

3

Análisis de datos en Psicología

El profesional de la Psicología en su ámbito laboral y de

investigación generalmente maneja y procesa gran cantidad de

información tanto de tipo cuantitativo como cualitativo, en este

sentido, frecuentemente está enfrentado a fenómenos que

requiere analizar, los cuales están definidos en función de

características (o variables) sean éstas cuantitativas o cualitativas.

Para el análisis de información, el psicólogo debe conocer las

metodologías que le permiten organizar la información y así

analizar el comportamiento de las principales características o

variables de interés de estudiar. En este curso se propondrán y

estudiarán una diversidad de herramientas útiles para describir el

comportamiento de la información asociada a las variables interés

de estudio del psicólogo. 

Page 4: conceptos basicos de estadistica

4

Organización y Representación de Datos.

Definida la información acerca del fenómeno que se desea

estudiar surge la etapa de “organización y representación de

datos” para el desarrollo de la cual es necesario, en primer lugar,

clasificar la(s) variable(s) a estudiar.

Clasificación de una variable

Discreta

Cuantitativa

Continúa

Variable

Ordinal

Cualitativa

Nominal

Page 5: conceptos basicos de estadistica

5

Variable Cuantitativa es aquella que se expresa en términos de

cantidad, de manera que tiene magnitud y dimensión.

Variable Cualitativa es aquella que se expresa en términos de

cualidad o calidad, de modo que carece de magnitud y dimensión.

 Variable Cuantitativa Discreta (VCD) es aquella característica

cuantitativa que en un intervalo cualquiera toma un número finito

o infinito numerable de valores, es decir, toma un número

reducido de valores o un número contable (ó numerable) de

valores.

 Variable Cuantitativa Continua (VCC) es aquella característica

cuantitativa que en un intervalo cualquiera toma un número

infinito de valores (siempre entre dos valores es posible encontrar

un tercero).

Page 6: conceptos basicos de estadistica

6

 Variable Cualitativa Ordinal (VCO) es aquella característica

cualitativa que es susceptible de ordenar (de forma creciente o

decreciente), por lo tanto, esta variable acepta cualquier condición

de orden (igual, menor, mayor, menor o igual ó a lo más, mayor o

igual ó a lo menos).

 

Variable Cualitativa Nominal (VCN) es aquella característica

cualitativa que no admite ser ordenada, sólo tiene incidencia su

nombre, de allí su patronímico de “nominal”.

Page 7: conceptos basicos de estadistica

7

 Ejemplos de Variables y su clasificación.

Número de pacientes con déficit atencional VCD

Rendimiento académico de un grupo de estudiantes VCC

Nivel Educativo de un grupo de trabajadores VCO

Creencia religiosa de un grupo de personas VCN

Número de patologías de un grupo de estudiantes VCD

Grado de aprendizaje de un grupo de escolares VCO

Región de origen de los pacientes de una consulta VCN

Consumo de fármacos anti ansiolíticos VCC

Nivel de gravedad de un paciente con depresión VCO

Estatura de un grupo de personas VCC

Número de personas del grupo familiar VCD

Page 8: conceptos basicos de estadistica

8

 Distribución de Frecuencias.

Es una herramienta estadística diseñada para tabular (ordenar) la

información relativa a una variable en un cuadro o una tabla

estadística que muestra o describe el comportamiento de la

variable.

Caso Variable Cuantitativa Discreta.

Una D. de F. consta, verticalmente, de dos cuerpos, uno referido a

los valores de la variable y el otro que corresponde a la frecuencia

que toman los distintos valores de la variable (frecuencias

absoluta simple, relativa simple, absoluta acumulada, relativa

acumulada); horizontalmente se ubican los valores de los

intervalos de clase de la variable.

Page 9: conceptos basicos de estadistica

9

ClaseValores de

la variable

Frecuencia

absoluta

simple

Frecuencia

relativa

simple

Frecuencia

absoluta

acumulada

Frecuencia

relativa

acumulada

i Xi ni hi N i Hi

1 x1 n1 h1 N1 H1

2 x2 n2 h2 N2 H2

… … … … … …

m xm nm hm Nm = n Hm = 1

n 1

Page 10: conceptos basicos de estadistica

10

Elementos de la Distribución de Frecuencias VCD

Clase i: corresponde al subíndice i que permite distinguir los

distintos valores de la variable definida por la una D de F.

Valores xi: define cada uno de los valores de la variable

Frecuencia absoluta simple: ni es el número de elementos

pertenecientes al valor xi

Frecuencia relativa simple: hi porcentaje o proporción de

elementos que pertenecen al valor xi

Frecuencia absoluta Acumulada: Ni es el número de elementos que

toman a lo más el valor xi

Frecuencia relativa simple: Hi porcentaje o proporción de

elementos que toman a lo más el valor xi

Page 11: conceptos basicos de estadistica

11

Ejemplo de D de F de VCD

Considere la información relativa al número de estudiantes con

déficit atencional en 30 cursos de un instituto educativo de la

Región Metropolitana, señalada en la siguiente base de datos:

Construya la D de F de la variable en estudio

1° Se debe determinar el valor menor (0) y el valor mayor (5), esto

significa que el recorrido de la variable es 0, 1, 2, 3, 4, 5

2° En una tabla vaciar la información de la B de D, y determinar la

frecuencia absoluta simple (ni), frecuencia relativa simple (hi),

frecuencia absoluta acumulada (Ni) y frecuencia relativa

acumulada (Hi).

3 2 4 0 2 4 1 4 1 10 1 2 0 2 3 2 5 1 11 2 0 1 5 1 1 1 3 3

Page 12: conceptos basicos de estadistica

12

Obteniéndose la siguiente D de F.

La cual permite estudiar el comportamiento de la variable en

estudio, número de estudiantes con déficit atencional, de acuerdo

a preguntas que se pueden plantear, como las siguientes:

a. ¿En cuántos cursos existen dos estudiantes con déficit

atencional?

Respuesta: n3 = 6; lo cual significa que en seis cursos existen dos

estudiantes con déficit atencional.

i Xi ni hi Ni Hi

1 0 4 0,13 4 0,132 1 11 0,37 15 0,503 2 6 0,20 21 0,704 3 4 0,13 25 0,835 4 3 0,10 28 0,936 5 2 0,07 30 1,00

30 1,00

Page 13: conceptos basicos de estadistica

13

b. ¿En qué proporción o porcentaje de cursos hay cuatro

estudiantes con déficit atencional? Respuesta: h5 = 0,10; es decir,

en un 10% de los cursos hay cuatro estudiantes con déficit

atencional.

c. ¿En cuántos cursos existen a lo más tres estudiantes con déficit

atencional? Respuesta: N4 = 25; o sea, en 25 de los cursos existen

a lo más tres estudiantes con déficit atencional.

d. ¿En qué porcentaje de cursos hay a lo más dos estudiantes con

déficit atencional? Respuesta: H3 = 0,70; significa que en el 70%

de los cursos hay a lo más dos estudiantes con déficit atencional.

e. ¿En cuántos cursos hay más de dos estudiantes con déficit

atencional? Respuesta: n – N3 = 30 – 21 = 9; quiere decir que en 9

cursos hay más dos estudiantes con déficit atencional.

Page 14: conceptos basicos de estadistica

14

f. ¿En qué porcentaje de cursos hay más de tres estudiantes con

déficit atencional? Respuesta: 1 – H4 = 1 - 0,83 = 0,17; en el 17%

de los cursos hay más tres estudiantes con déficit atencional.

g. ¿En cuántos cursos hay entre 1 y 3 estudiantes (ambos

incluidos) con déficit atencional? N4 – N1 = 24 – 3 = 21; en 21

cursos hay entre 1 y 3 estudiantes con déficit atencional.

De este modo se pueden plantear muchas otras preguntas que

van a permitir describir el comportamiento de la variable en

estudio, número de estudiantes con déficit atencional.

Page 15: conceptos basicos de estadistica

15

 Caso D de F de una VCC.

Igual que en el caso de una D. de F. de VCD, ésta consta,

verticalmente, de dos cuerpos, uno referido a los valores de la

variable y el otro que corresponde a la frecuencia que toman los

distintos valores de la variable (frecuencias absoluta simple,

relativa simple, absoluta acumulada, relativa acumulada);

horizontalmente se ubican los valores de los intervalos de clase de

la variable.

En este caso, por tratarse de una variable cuantitativa continúa,

surgen los intervalos de clase, que permiten identificar subclases

de valores entre la totalidad de valores, y las marcas de clase, que

son valores representativos de cada una de las clases o intervalos

de clase.

Page 16: conceptos basicos de estadistica

16

ClaseMarca de

Clase

Frecuencia

absoluta

simple

Frecuencia

relativa

simple

Frecuencia

absoluta

acumulada

Frecuencia

relativa

acumulada

i Y' i-1 Y' i Yi ni hi N i Hi

1 Y' 0 Y' 1 Y1 n1 h1 N1 H1

2 Y' 1 Y' 2 Y2 n2 h2 N2 H2

… … … … … … … …

m Y' m-1 Y' m Ym nm hm Nm = n Hm = 1

n 1

I ntervalos

de Clase

Page 17: conceptos basicos de estadistica

17

Elementos de la Distribución de Frecuencias VCC

Clase i: corresponde al subíndice i que permite distinguir los

distintos intervalos de clase de la variable definida en la una D de

F.

Intervalo de clase: Y’i-1 – Y’i: recorrido entre el límite inferior y

superior de la clase i-ésima;

Marca de clase: Yi: elemento representativo de la clase, se calcula

como el promedio aritmético de los límites de la clase i-ésima;

Frecuencia absoluta simple: ni es el número de elementos

pertenecientes al intervalo de clase i-ésima;

Frecuencia relativa simple: hi porcentaje o proporción de

elementos que pertenecen al intervalo de clase i-ésima;

Frecuencia absoluta Acumulada: Ni es el número de elementos que

toman a lo más el valor Y’i (límite superior de la clase i-ésima)

Frecuencia relativa simple: Hi porcentaje o proporción de

elementos que toman a lo más el valor xi

Page 18: conceptos basicos de estadistica

18

Ejemplo de D de F de VCC

Considere la información sobre el Rendimiento Académico, en

puntos, de un grupo de 70 estudiantes de un instituto educativo.

Construya una D de F de nueve intervalos de clase (m = 9) de

amplitud constante.

3,2 5,5 4,0 5,8 3,1 3,9 3,2 3,9 4,2 6,5

2,5 2,8 3,4 5,6 6,3 4,4 5,4 4,8 5,0 5,7

4,7 6,9 5,1 4,0 5,2 3,8 3,8 7,0 5,5 3,3

3,4 4,9 4,8 2,8 5,0 3,2 5,5 3,7 4,1 2,9

5,9 5,5 2,6 3,0 3,4 4,0 4,4 5,6 3,8 4,6

6,4 5,3 4,4 4,2 3,5 3,9 6,4 4,7 6,6 6,7

4,9 3,6 5,4 3,3 4,0 2,6 4,4 4,1 2,6 3,0

Page 19: conceptos basicos de estadistica

19

Para construir la D de F del Rendimiento Académico del grupo de

estudiantes se debe seguir el siguiente algoritmo:En primer lugar se debe identificar el valor menor (y21 = 2,5) y el

valor mayor de la variable (y38 = 7,0) y así se calcula el recorrido:

R = Ymáx – Ymín = 7,0 – 2,5 = 4,5 (eso quiere decir que en un

recorrido de 4,5 puntos se encuentran todos los valores de la

variable en estudio).

Luego, se calcula la amplitud (constante) como la relación entre el

recorrido (R = 4,5) y el número de clases de la D de F (m = 9),

entonces la amplitud es: c = R/m = 4,5/9 = 0,5, y así se generan

los nueve intervalos de clase: 2,5 – 3,0; 3,0 – 3,5;… y así

sucesivamente.

En seguida, se determina la marca de clase (elemento

representativo de cada clase) Yi, como la semi-suma (ó promedio) de los límites de cada intervalo: Yi = (Y’i-1+Y’i)/2 el que es utilizado

como el elemento representativo de cada intervalo de clase.

Finalmente se cuentan los elementos pertenecientes a cada

intervalo de clase generándose la frecuencia absoluta simple: ni.

(en cada clase se incluye hasta su límite superior).

Page 20: conceptos basicos de estadistica

20

Obteniéndose la siguiente D de F.

Obsérvese que al realizar el conteo de los elementos

pertenecientes a cada clase, el valor 3,0 se considera en la

primera clase y no en la segunda (los intervalos de clase son

cerrados con relación al límite superior Y’i)

i Y'i-1 Y'i Yi ni hi Ni Hi

1 2,50 3,00 2,75 9 0,13 9 0,13

2 3,00 3,50 3,25 10 0,14 19 0,27

3 3,50 4,00 3,75 12 0,17 31 0,44

4 4,00 4,50 4,25 8 0,11 39 0,56

5 4,50 5,00 4,75 9 0,13 48 0,69

6 5,00 5,50 5,25 9 0,13 57 0,81

7 5,50 6,00 5,75 5 0,07 62 0,89

8 6,00 6,50 6,25 4 0,06 66 0,94

9 6,50 7,00 6,75 4 0,06 70 1,00

70 1,00

Page 21: conceptos basicos de estadistica

21

Algunas preguntas sobre esta D de F.-¿Cuántos estudiantes obtienen rendimiento entre 5,0 y 5,5

puntos?Respuesta n6 = 9; existen 9 estudiantes con rendimiento entre 5,0

y 5,5 puntos.-¿Qué proporción o porcentaje de estudiantes tienen entre 3,5 y

4,0 puntos?Respuesta h3 = 0,17; significa que hay un 17% de estudiantes que

tienen entre 3,5 y 4,0 puntos.-¿Cuántos estudiantes obtienen a lo más 5,0 puntos?Respuesta: N5 = 48; hay 48 estudiantes que obtienen a lo más 5,0

puntos.-¿Qué porcentaje de estudiantes obtienen a lo más 4,0 puntos?Respuesta H3 = 0,44; quiere decir que un 44% de los estudiantes

obtienen a lo más 4,0 puntos.-¿Cuántos estudiantes obtienen entre 3,50 y 6,00 puntos?Respuesta N7 – N2 = 62 – 19 = 43; existen 43 estudiantes cuyo

rendimiento está entre 3,50 y 6,00 puntos.

Page 22: conceptos basicos de estadistica

22

 Caso Variables Cualitativas.

En el caso de las variables cualitativas la D de F es simple, lo único

que debe tenerse en cuenta es el conjunto de valores que toma la

variable y la frecuencia con que ocurren.

Por ejemplo para una variable ordinal como el nivel educativo la D

de F adquiere la siguiente estructura:

Existen cuatro valores. Lea e interprete el significado de las siguientes cifras: n3 = 15; h2 = 0,4; N2 = 30; H3 = 0,9.

Para una VCN, la situación es de simplísima, puesto que sólo tienen sentido las fas (ni) y frs (hi).

iNivel

Educativoni hi Ni Hi

1 Pre escolar 10 0,2 10 0,22 Básico 20 0,4 30 0,63 Medio 15 0,3 45 0,94 Superior 5 0,1 50 1,0

50 1,0

Page 23: conceptos basicos de estadistica

23

 Representación Gráfica.

La representación gráfica será tratada mediante el uso del

software Excel y se revisa en una clase que se realiza en el

laboratorio de computación utilizando un algoritmo desarrollado

para esta finalidad.

Se desarrollan gráficos para:fas (ni): histograma;

frs (hi): gráfico circular;FAA (Ni): ojiva