10.Estadística y Probabilidad

9
1 TEMA 10: ESTADÍSTICA Y PROBABILIDAD

description

Apuntes sobre Estadística y Probabilidad

Transcript of 10.Estadística y Probabilidad

Page 1: 10.Estadística y Probabilidad

1

TEMA 10:

ESTADÍSTICA

Y

PROBABILIDAD

Page 2: 10.Estadística y Probabilidad

2

INTRODUCCIÓN

Objetivo: La estadística tiene por objeto el desarrollo de técnicas para el conocimiento numérico de

un conjunto de datos empíricos (recogidos mediante experimentos o encuestas).

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de

nuestro estudio.

Muestra: Es un subconjunto, extraído de la población, cuyo estudio sirve para inferir características

de toda la población.

Individuo: Es cada uno de los elementos que forman la población o la muestra.

Caracteres estadísticos: pueden ser cuantitativos, si pueden medirse, o cualitativos, si no pueden

medirse.

Variables estadísticas: Son los distintos valores que puede tomar un carácter estadístico

cuantitativo.

Una variable es discreta cuando solo puede tomar valores aislados. Por ejemplo, el número de hijos.

Una variable es continua cuando puede tomar todos los valores dentro de un intervalo. Por ejemplo,

la estatura.

ESTADÍSTICA DESCRIPTIVA

TABLAS DE FRECUENCIAS

Las tablas de frecuencias sirven para ordenar y organizar los datos estadísticos. Con ellas, una masa

amorfa de datos pasa a ser una colección ordenada y perfectamente inteligible.

Con los datos se construye la tabla de frecuencias:

- En la primera columna, la variable xi, con todos sus posibles valores

- En la segunda columna, la correspondiente frecuencia, ni: número de veces que aparece cada

valor.

FRECUENCIAS RELATIVAS

Cuando se desea comparar varias distribuciones similares con distinto número de elementos, se debe recurrir a las frecuencias relativas.Si N es el número de individuos:

FRECUENCIAS ACUMULADAS

En una distribución de frecuencias, se llama frecuencia acumulada, Ni, correspondiente al valor i-

ésimo, xi, a la suma de la frecuencia de ese valor con todas las anteriores:

Ni = n1 + n2 + … + ni

Page 3: 10.Estadística y Probabilidad

3

TABLAS CON DATOS AGRUPADOS

Cuando en una distribución estadística el número de valores que toma la variable es muy grande,

conviene elaborar una tabla de frecuencias agrupándolos en intervalos. Para ello:

- Se localizan los valores extremos, a y b, y se halla su diferencia, r = b–a

- Se decide el número de intervalos que se quiere formar, teniendo en cuenta la cantidad de datos que

se poseen. El número de intervalos no debe ser inferior a 6 ni superior a 15.

El punto medio de cada intervalo se llama marca de clase. Es el valor que representa a todo el

intervalo para el cálculo de algunos parámetros.

Cuando se elabora una tabla con datos agrupados, se pierde algo de información (pues en ella se

ignora cada valor concreto, que se difumina dentro de un intervalo). A cambio, se gana en claridad y

eficacia.

GRÁFICOS ESTADÍSTICOS

GRAFICOS PARA VARIABLES CUALITATIVAS O CUANTITATIVAS

DISCRETAS

Diagrama de barras:

- En el eje de las X : Se representan los valores de la

variable

- En el eje de las Y : Se representan los valores de la

frecuencia:

- Se levanta para cada valor de la X una barra que representa

la frecuencia de dicho valor.

Si unimos mediante una poligonal los puntos más altos de

cada barra obtenemos el polígono de frecuencias.

GRAFICOS PARA VARIABLES CUANTITATIVAS CONTINUAS

SI TODOS LOS INTERVALOS TIENEN LA MISMA AMPLITUD

Histograma :

- En el eje de las X : Se representan los valores de la

variable

- En el eje de las Y : Se representan los valores de la

frecuencia

- Se levanta para cada valor del intervalo de la X un

rectángulo de altura la frecuencia de dicho intervalo.

Si unimos mediante una poligonal los puntos medios de

cada uno de dichos rectángulos el polígono de

frecuencias.

Las barras están pegadas unas a otras.

Page 4: 10.Estadística y Probabilidad

4

DIAGRAMAS DE SECTORES

Se dibuja un círculo y los porcentajes

correspondientes a cada valor.

PARÁMETROS DE CENTRALIZACIÓN

Los parámetros de centralización son medidas que sintetizan los valores e indican la tendencia de los

datos a agruparse sobre un valor.

Se llaman de centralización porque los datos se distribuyen alrededor de ellos.

Las definiciones siguientes sirven tanto para datos aislados como para datos agrupados en intervalos:

- Si los datos son aislados: los xi son los valores que toma la variable

- Si los datos están agrupados en intervalos: los xi son las marcas de clase.

MEDIA

La media de un conjunto de datos es el resultado que se obtiene al dividir la suma de todos los datos

entre el número total de ellos:

MODA

La moda de una distribución es el valor que tiene mayor frecuencia.

Si hay dos valores que tienen la misma frecuencia máxima, se dice que es una distribución bimodal;

si hay tres, trimodal; y si hay varios, multimodal.

MEDIANA

Si los individuos de una población están colocados en orden creciente según la variable que

estudiamos, el que ocupa el valor central se llama individuo mediano, y su valor, la mediana: Me

La mediana, Me, está situada de modo que antes de ella está el 50% de la población y, detrás, el otro

50%.

Si el número de individuos es par, la median es el valor medio de los dos centrales.

PARÁMETROS DE DISPERSIÓN

Page 5: 10.Estadística y Probabilidad

5

Los parámetros de dispersión son unos valores que indican si los datos de la distribución estás más o

menos cercanos a los parámetros centrales.

RANGO O RECORRIDO

El recorrido es la diferencia entre el valor mayor y el menor de la distribución.

EJEMPLO CON DATOS DISCRETOS Al lanzar un dado se han obtenido los siguientes resultados:

Resultado 1 2 3 4 5 6

Nº de veces 5 9 14 7 9 6

Elabora la tabla estadística y calcula la media, moda, mediana, recorrido, varianza, desviación típica

y coeficiente de variación.

xi ni fi Ni xini xi2 ni

1

5

5/50

5 1-5

5

5

2

9

9/50

14 6-14

18

36

3

14

14/50

28 15-28

42

126

4

7

7/50

35 29-35

28

112

5

9

9/50

44 36-44

45

225

6

6

6/50

50 45-50

36

216

50

174

720

MEDIA:

=

MODA: 3

MEDIANA:

RECORRIDO: 6 – 1 = 5

Page 6: 10.Estadística y Probabilidad

6

EJEMPLO CON INTERVALOS

La edad de los socios de un club de ajedrez juvenil se distribuye en los siguientes intervalos.

Edad [10 , 12) [12 ,14 ) [14 ,16 ) [16 ,18]

Nº de socios 6 12 15 5

Elabora la tabla estadística y calcula la media, moda, mediana, recorrido, varianza, desviación típica

y coeficiente de variación.

Intervalos xi ni fi Ni xini xi2 ni

[10 , 12)

11

6

6/38

6 1-6

66

726

[12 ,14 )

13

12

12/38

18 7-18

156

2028

[14 ,16 )

15

15

15/38

33 19-33

225

3375

[16 ,18 )

17

5

5/38

38 34-38

85

1445

38

532

7574

MEDIA:

=

MODA: 15

MEDIANA:

RECORRIDO: 17 – 11 = 6

Page 7: 10.Estadística y Probabilidad

7

PROBABILIDAD

EXPERIMENTOS DETERMINISTAS Y DE AZAR

Un experimento es determinista si, al realizarse en las mismas condiciones, siempre se obtiene el

mismo resultado.

Un experimento es aleatorio o de azar si no es posible predecir el resultado aunque se realice en las

mismas condiciones.

SUCESOS

El espacio muestral está formado por el conjunto de todos los resultados que se pueden presentar.

Se representa con la letra E y los resultados entre llaves { } y separados por comas.

EJEMPLOS

- Espacio muest ra l de una moneda:

E = {C, X}.

- Espacio muest ra l de un dado:

E = {1, 2 , 3 , 4 , 5 , 6}.

Un suceso elemental es cada uno de los resultados del espacio muestral.

Un suceso es un conjunto de sucesos elementales. Éstos se representan con letras mayúsculas,

escribiendo sus elementos entre llaves y separados por comas.

El suceso contrario de un suceso A está formado por todos los sucesos elementales que no están en

A. Se representa por .

El suceso seguro es el que siempre se presenta, y es igual al espacio muestral.

El suceso imposible es el que nunca se presenta. Se representa con el símbolo .

Page 8: 10.Estadística y Probabilidad

8

EJEMPLO

1. Una bolsa cont iene bolas blancas y negras. Se extraen

sucesivamente t res bolas.

E = {(b,b,b) ; (b ,b,n) ; (b ,n,b); (n ,b,b) ; (b ,n,n) ; (n ,b,n) ; (n ,n ,b) ; (n ,

n ,n)}

2. El suceso A = {extraer t res bolas del mismo color}.

A = {(b,b,b) ; (n , n ,n)}

3. El suceso B = {extraer al menos una bola blanca}.

B= {(b,b,b) ; (b ,b,n) ; (b ,n,b) ; (n ,b,b) ; (b ,n,n) ; (n ,b,n) ; (n ,n ,b)}

4. El suceso C = {extraer una sola bola negra}.

C = {(b,b,n) ; (b ,n,b) ; (n ,b,b)}

EJEMPLO

Consideramos el experimento que consiste en lanzar un dado, si A = "sacar

par". Calcular .

A = {2, 4 , 6}

= {1, 3 , 5}

Page 9: 10.Estadística y Probabilidad

9

SUCESOS COMPATIBLES E INCOMPATIBLES

Dos sucesos son compatibles si se pueden presentar al mimo tiempo, es decir, si

Dos sucesos son incompatibles si no se pueden presentar al mimo tiempo, es decir, si

LA REGLA DE LAPLACE

La probabilidad de un suceso A de un experimento aleatorio es un número entre 0 y 1, que mide la

facilidad de que el suceso ocurra. Cuanto más se acerca a 1 mayor es la posibilidad de ocurrir.

Cuando un experimento aleatorio es regular, es decir que todos los sucesos elementales tienen la

misma probabilidad de ocurrir ó son equiprobables, para calcular la probabilidad de un suceso

cualquiera A, basta contar y hacer el cociente entre el nº de sucesos elementales que componen A

(casos favorables) y el nº de sucesos elementales del espacio muestral (casos posibles).

Este resultado se conoce como Regla de Laplace.