Grupo h1 grapa7_caso_m1_l1.2_e1_v2

10
UNIVERSIDAD INDUSTRIAL DE SANTANDER ESCUELA DE INGENIERÍAS ELÉCTRICA, ELECTRÓNICA Y DE TELECOMUNICACIONES Perfecta Combinación entre Energía e Intelecto 1. INTRODUCCIÓN: La estadística es una ciencia que estudia la recolección, el análisis y la interpretación de datos. Pero una parte muy importante de este proceso de análisis y de interpretación de los datos es la organización. El tener los datos organizados de una manera u otra nos permite ver de una manera más fácil tendencias y comportamientos de los datos. La organización es uno de los aspectos más significativos en el análisis estadístico, nos facilita el trabajo y nos permite llevarlo a cabo de una manera más eficiente. En este informe pretendemos exponer en cierta manera los métodos de organización aprendidos en el material del curso, hablar un poco de las tablas de datos, mostrar ciertas propiedades que podemos sacar de los datos y que nos ayudan en su organización, y ¿por qué no? Aplicar todo esto a un ejemplo en concreto que nos permita ver a lo que se quiere llegar. 2. ASPECTOS TEÓRICOS: a.) Tabla de frecuencia: es una tabla en la que se organizan los datos en clases, es decir, en grupos de valores que escriben una característica de los datos y muestra el número de observaciones del conjunto de datos que caen en cada una de las clases. La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numérico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el número de veces que aparece, es decir, su frecuencia absoluta. Se puede complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. b.) Instrumentos de medición: son los recursos que utiliza el investigador para obtener información o datos de algunas variables que el tiene en estudio. CASO1.2 ESTADÍSTICA Organización de Datos Julián David Gamboa García (Líder), Ronald Andrés Rengifo Mejia (Asegurador), Jorge Andrés Moreno Lozada (Planificador), José David Gómez (control). Grapa: 7 Nombre: R3J Grupo: H1. Actividad: Caso 1.2; Organización de Datos Módulo 1.2, Estadística descriptiva Lección 1.2, Conferencia 2. Docente: Ricardo Llamosa Villalba. Jueves 14 de Junio del 2012.

Transcript of Grupo h1 grapa7_caso_m1_l1.2_e1_v2

Page 1: Grupo h1 grapa7_caso_m1_l1.2_e1_v2

UNIVERSIDAD INDUSTRIAL DE SANTANDERESCUELA DE INGENIERÍAS ELÉCTRICA, ELECTRÓNICA Y DE TELECOMUNICACIONES

Perfecta Combinación entre Energía e Intelecto

1. INTRODUCCIÓN:

La estadística es una ciencia que estudia la recolección, el análisis y la interpretación de datos. Pero una parte muy importante de este proceso de análisis y de interpretación de los datos es la organización. El tener los datos organizados de una manera u otra nos permite ver de una manera más fácil tendencias y comportamientos de los datos. La organización es uno de los aspectos más significativos en el análisis estadístico, nos facilita el trabajo y nos permite llevarlo a cabo de una manera más eficiente. En este informe pretendemos exponer en cierta manera los métodos de organización aprendidos en el material del curso, hablar un poco de las tablas de datos, mostrar ciertas propiedades que podemos sacar de los datos y que nos ayudan en su organización, y ¿por qué no? Aplicar todo esto a un ejemplo en concreto que nos permita ver a lo que se quiere llegar.

2. ASPECTOS TEÓRICOS:

a.) Tabla de frecuencia: es una tabla en la que se organizan los datos en clases, es decir, en grupos de valores que escriben una característica de los datos y muestra el número de observaciones del conjunto de datos que caen en cada una de las clases.

La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numérico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el número de veces que aparece, es decir, su frecuencia absoluta. Se puede complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos.

b.) Instrumentos de medición: son los recursos que utiliza el investigador para obtener información o datos de algunas variables que el tiene en estudio.

C.) Medición: El proceso de asignar un valor numérico a una variable se llama medición. Las escalas de medición sirven para ofrecernos información sobre las clasificaciones que podemos hacer con respecto a las variables (discretas o continuas). Cuando se mide una variable el resultado puede aparecer en uno de cuatro diversos tipos de escalas de medición; nominal, ordinal, intervalo y razón. Conocer la escala a la que pertenece una medición es importante para determinar el método adecuado para describir y analizar esos datos

3. CASOS TRATADOS EN LOS RECURSOS DIDÁCTICOS.

a. Caso 1: Una empresa decide medir el grado de aceptación de 10 clientes sobre un nuevo producto, que hace muy poco tiempo salió al mercado; para ello, utilizarán una tabla que se caracteriza por manejar un conjunto pequeño de posibles resultados de una variable dentro de la muestra o población, y además los clientes tendrán para elegir o calificar de la siguiente manera: muy malo, malo, regular, bueno y excelente.

b. Caso 2: Se muestra un sondeo realizado en la Universidad de Cartagena sobre 30 alumnos, que son estudiantes de Administración Industrial, lo que se pretende es mostrar que edad es la mas representativa; se muestra una serie de edades, para ello se utilizara una tabla la cual suelen ser utilizadas cuando el numero de resultados posibles que puede obtener una variable son muy amplios.

4. RESPUESTA A LA PREGUNTA DE CASOS.

CASO1.2 ESTADÍSTICAOrganización de Datos

Julián David Gamboa García (Líder), Ronald Andrés Rengifo Mejia (Asegurador), Jorge Andrés Moreno Lozada (Planificador), José David Gómez (control).

Grapa: 7 Nombre: R3J Grupo: H1.

Actividad: Caso 1.2; Organización de Datos

Módulo 1.2, Estadística descriptiva

Lección 1.2, Conferencia 2.

Docente: Ricardo Llamosa Villalba. Jueves 14 de Junio del 2012.

Page 2: Grupo h1 grapa7_caso_m1_l1.2_e1_v2

UNIVERSIDAD INDUSTRIAL DE SANTANDERESCUELA DE INGENIERÍAS ELÉCTRICA, ELECTRÓNICA Y DE TELECOMUNICACIONES

Perfecta Combinación entre Energía e Intelecto

I. ¿Qué es y como se relacionan los conceptos de medición, ajuste y calibración?

La medición es una recolección de medidas, de un conjunto de datos, que se hace teniendo en cuenta un patrón o un parámetro estadístico, es decir, la relación que guardan las dimensiones de los datos que estamos midiendo, con el parámetro. El ajuste de esos datos que obtenemos de la medición al parámetro, nos da una idea de las dimensiones posibles de los datos.

II. Defina los siguientes términos con ayuda de los videos:

a) Frecuencia relativa: equivale a la razón de la frecuencia de cada clase sobre el total de datos. H1=f1/nb) Frecuencia Absoluta: numero de veces q se repite un valor dentro de un conjunto de datosc) Marca de clase: son las equivalente del punto medio de cada intervalo de clased) Amplitud de clase: este es el ancho y este equivale a diferencia entre el límite superior y el límite inferior de cada intervaloe) Rango: es le valor de la resultante entre La distancia máxima menos la distancia mínima ajustada a los datos q se van a tratar.f) Límites de las clases (Superior e inferior): Limite inferior: valor mínimo ajustado a los datos tratados y el límite superior es la suma del ancho y el límite menor de los datos ajustados y tratados.g) Intervalos de clase: intervalos empleados en las tablas de frecuencia estadística, los cuales contienen diversas medidas de una variación.

III. ¿Qué son las tablas de frecuencias y qué función cumplen?

Tabla de frecuencias: es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

Su función: es sintetizar conjuntos de datos mediante tablas o gráficos resumen, con el fin de poder identificar el comportamiento característico de un fenómeno y facilitar su análisis exhaustivo.

IV. Revise el material que aparece en RD y cerciórese de que en la sección de Aspectos teóricos de su documento a entregar se encuentre la definición de los siguientes conceptos, y para cada uno de estos resuelva las preguntas

a)   Medidas de tendencia central

Medidas de tendencia central: Son indicadores estadísticos que muestran hacia que valor (o valores) se agrupan los datos.

Media aritmética (µ o X): Es el valor resultante que se obtiene al dividir la sumatoria de un conjunto de datos sobre el número total de datos. Solo es aplicable para el tratamiento de datos cuantitativos. X = Suma (xi) / N

Mediana (Me): Valor que divide una serie de datos en dos partes iguales. La cantidad de datos que queda por debajo y por arriba de la mediana son iguales.

Moda (Mo): indica el valor que más se repite, o la clase que posee mayor frecuencia.

b)   Medidas de dispersión

Nos informan sobre cuánto se alejan del centro los valores de la distribución.

El rango: Es la diferencia entre el mayor y el menor de los datos de una distribución estadística.

La desviación respecto a la media: Es la diferencia entre cada valor de la variable estadística y la media aritmética.

Di = x – x

La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.

La desviación media se representa por 

Page 3: Grupo h1 grapa7_caso_m1_l1.2_e1_v2

UNIVERSIDAD INDUSTRIAL DE SANTANDERESCUELA DE INGENIERÍAS ELÉCTRICA, ELECTRÓNICA Y DE TELECOMUNICACIONES

Perfecta Combinación entre Energía e Intelecto

Desviación media para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la desviación media es:

Varianza: La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.

La varianza se representa por  .

Varianza para datos agrupados

Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Varianza para datos agrupados

Propiedades de la varianza

i. La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.

ii. Si a todos los valores de la variable se les suma un número la varianza no varía.

iii. Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número.

iiii. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total.

Desviación típica: La desviación típica es la raíz cuadrada de la varianza.

Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.

La desviación típica se representa por σ.

Desviación típica para datos agrupados

Propiedades de la Desviación Típica:

i. La desviación típica será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.

ii. Si a todos los valores de la variable se les suma un número la desviación típica no varía.

iii. Si todos los valores de la variable se multiplican por.un número la desviación típica queda multiplicada por dicho número.

iiii.  Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones típicas se puede calcular la desviación típica total.

Page 4: Grupo h1 grapa7_caso_m1_l1.2_e1_v2

UNIVERSIDAD INDUSTRIAL DE SANTANDERESCUELA DE INGENIERÍAS ELÉCTRICA, ELECTRÓNICA Y DE TELECOMUNICACIONES

Perfecta Combinación entre Energía e Intelecto

c) Medidas de forma

Comparan la forma que tiene la representación gráfica, bien sea el histograma o el diagrama de barras de la distribución, con la distribución normal.

Medida de asimetría

Diremos que una distribución es simétrica cuando su mediana, su moda y su media aritmética coinciden.

Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas) descienden más lentamente por la derecha que por la izquierda.

Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos que la distribución es asimétrica a la izquierda.

Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es el Coeficiente de Asimetría de Pearson:

Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha y negativo cuando existe asimetría a la izquierda.

 Medida de apuntamiento o curtosis

   Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos de distribuciones según su grado de curtosis:

Distribución mesocúrtica: Presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). 

Distribución leptocúrtica: Presenta un elevado grado de concentración alrededor de los valores centrales de la variable. 

Distribución platicúrtica:  Presenta un reducido grado de concentración alrededor de los valores centrales de la variable.

d) Medidas de posición

Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos.

Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor. Las medidas de posición son:

Cuartiles: Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.Q2 coincide con la mediana.

i. Ordenamos los datos de menor a mayor. ii Buscamos el lugar que ocupa cada cuartil mediante la expresión.

Deciles: Son ciertos números que dividen la sucesión de datos ordenados en diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales. Se halla por medio de:

Los Percentiles: Son tal vez las medias más utilizadas para propósitos de ubicación o clasificación de las personas cuando atienden características tales como peso, estatura, etc. Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien partes porcentuales iguales. De halla por medio de:

Page 5: Grupo h1 grapa7_caso_m1_l1.2_e1_v2

UNIVERSIDAD INDUSTRIAL DE SANTANDERESCUELA DE INGENIERÍAS ELÉCTRICA, ELECTRÓNICA Y DE TELECOMUNICACIONES

Perfecta Combinación entre Energía e Intelecto

e) Regresión lineal y correlación

La Regresión lineal Comprende el análisis de los datos muéstrales para saber qué es y cómo se relaciona entre si dos o más variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación. Se pueden encontrar varios tipos de regresión:

- Regresión lineal: y= A+ Bx.

- Regresión Logarítmica: y= A + B(ln(x))

-Regresión exponencial: y= Ac(bx)

- Regresión cuadrática: y= A+ Bx +Cx2

Correlación: método por el cual se relacionan dos variables se puede graficar con un diagrama de dispersión de puntos, a la cual se le llama nube de puntos, encuadrado dentro de u grafico de coordenadas XY en el cual se puede trazar una recta y cuyos puntos más cercanos de una recta hablara de una correlación más fuerte.

V. Resuelva lo siguiente:

¿Qué medidas se nombran en los videos?

Medida de tendencia central: media aritmética, mediana y moda. Medidas de dispersión: Desviación estándar, varianza. Mediadas de posición: Cuartiles, deciles, percentiles. Apuntamiento o curtosis, asimetría o deformación.

¿Cuáles de las medidas que se mencionaron anteriormente se pueden calcular con Excel?

Promedio, mediana, moda, Desviación estándar y varianza.

¿Qué formula usa Excel para calcularlas? Para esto utilice la ayuda del programa.

Devuelve la mediana de los números. La mediana es el número que se encuentra en medio de un conjunto de números, es decir, la mitad de los números es mayor que la mediana y la otra mitad es menor.

Devuelve el valor que se repite con más frecuencia en una matriz o rango de datos. Al igual que MEDIANA, MODA es una medida de posición.

5. PREGUNTAS QUE SURGEN DEL CASO:

¿Donde podemos concluir que el trabajo de una tabla de frecuencia es de total efectividad?, o por lo contrario, ¿debemos apoyarnos de otro tipo de tabulación de datos, para dar una mayor veracidad al análisis?

6. CONCLUSIONES.

Page 6: Grupo h1 grapa7_caso_m1_l1.2_e1_v2

UNIVERSIDAD INDUSTRIAL DE SANTANDERESCUELA DE INGENIERÍAS ELÉCTRICA, ELECTRÓNICA Y DE TELECOMUNICACIONES

Perfecta Combinación entre Energía e Intelecto

Después de haber visto el video de apoyo didáctico, lo que se nos enseña allí es una unos casos, en los cuales, van hacer resumidos los datos y se logra a través de las tablas de frecuencia; en la cual, se organizan los datos en clases, es decir, en grupos de valores que escriben una característica de los datos y muestra el número de observaciones del conjunto de datos que caen en cada una de las clase.

7. VALORACIÓN ENTRE PARES

Habiendo visto los mostrados en el video nos damos cuenta que gracias a las tablas de frecuencia logramos hacer una mejor organización de los datos, para cuando llegue la hora de analizarlos, se facilite el tratamiento de los mismos, y se haga de la mejor manera el comprendimiento real de la situación que se nos presente.

8. PREGUNTAS ENTRE PARES NO RESUELTAS:

Todas las preguntas que surgieron fueron respuestas entre las parejas.

9. BIBLIOGRAFÍA.

[1] W. H. Freeman and Company, New York and Basingstoke, Probabilidad y estadística. La ciencia de la incertidumbre, EDITORIAL REVERTÉ, S.A.: Barcelona, España.[2] Descripción de términos http://www.youtube.com/watch?v=BetmKeqtsSk&feature=related [3] Procedimiento para una tabla de frecuencias: http://www.youtube.com/watch?v=JSDu6TomZ6g

[4] Medición de la estadística: http://es.wikiversity.org/wiki/Medici%C3%B3n_en_estad%C3%ADstica.

Page 7: Grupo h1 grapa7_caso_m1_l1.2_e1_v2

UNIVERSIDAD INDUSTRIAL DE SANTANDERESCUELA DE INGENIERÍAS ELÉCTRICA, ELECTRÓNICA Y DE TELECOMUNICACIONES

Perfecta Combinación entre Energía e Intelecto

MIEMBROS

MIEMBRO/ ESTUDIANTE

CICL

O D

E VI

DA

1

DU

LO

LECC

IÓN

ACTIVIDADSESPECÍFICA

ROL

RESP

ON

SABL

E

FECHA TIEMPO ESTADO

CÓDIGO

APELLIDOS Y NOMBRES

DIR

ECTO

R

ASEG

URA

DO

R

Y

CON

TRO

LAD

OR

PLAN

IFIC

ADO

R

INIC

IO

FIN

PLAN

EAD

A

REAL

LOG

RO 2

REAL

IZAR

3

GRAPA 7

2111476

Julián David Gamboa García

1 1.2 Asignar las actividades

X 8 de Junio

11 de Junio

2 a 4 horas

3 horas

C I

2101161

Ronal Andres Rengifo Mejia

1 1.2 Encargado del caso

X 8 de Junio

11 de Junio

2 a 4 horas

3 horas

C I

2102197

Jorge Andres Moreno lozada

1 1.2 Generar preguntas: caso

X 8 de Junio

11 de Junio

2 a 4 horas

3 horas

C I

2091812

Jose David Gomez Ortiz

1 1.2 Encargado del problema

X 8 de Junio

11 de Junio

2 a 4 horas

3 horas

C I

1 I:Inicio, P:Planificar, E:Ejecución, S:Supervisar y controlar, C:Cerrar2 C:Terminada, N:No terminada3 I:Inmediatamente, 1:Una semana, 2:dos semanas, L:más de dos semanas