EstadiStica

7
ESTADISTICA Estudio que reúne, clasifica y recuenta todos los hechos que tienen una determinada característica en común, para poder llegar a conclusiones a partir de los datos numéricos extraídos. La estadística es una ciencia formal y una herramienta que estudia el uso y los análisis provenientes de una muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es la herramienta fundamental que permite llevar a cabo el proceso relacionado de la estadística con la investigación científica. La estadística se divide en dos grandes áreas: Estadística descriptiva: Se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular, entre otros. Estadística inferencial: Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas sí/no (prueba de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen análisis de varianza, series de tiempo y minería de datos. Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada. La estadística inferencial, por su parte, se divide en estadística paramétrica y estadística no paramétrica.

description

,m,,

Transcript of EstadiStica

Page 1: EstadiStica

ESTADISTICA

Estudio que reúne, clasifica y recuenta todos los hechos que tienen una determinada característica en común, para poder llegar a conclusiones a partir de los datos numéricos extraídos.

La estadística es una ciencia formal y una herramienta que estudia el uso y los análisis provenientes de una muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es la herramienta fundamental que permite llevar a cabo el proceso relacionado de la estadística con la investigación científica.

La estadística se divide en dos grandes áreas:

Estadística descriptiva: Se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular, entre otros.

Estadística inferencial: Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas sí/no (prueba de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen análisis de varianza, series de tiempo y minería de datos.

Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada. La estadística inferencial, por su parte, se divide en estadística paramétrica y estadística no paramétrica.

El concepto de población en estadística va más allá de lo que comúnmente se conoce como

tal. Una población se precisa como un conjunto finito o infinito de personas u objetos que

presentan características comunes.

Destacamos algunas definiciones:

"Una población es un conjunto de todos los elementos que estamos estudiando, acerca de

los cuales intentamos sacar conclusiones". Levin & Rubin (1996).

Muestra

Page 2: EstadiStica

"Una muestra debe ser definida en base de la población determinada, y las conclusiones que se obtengan de dicha muestra solo podrán referirse a la población en referencia", El estudio de muestras es más sencillo que el estudio de la población completa; cuesta menos y lleva menos tiempo.

Muestreo

En estadística se conoce como muestreo a la técnica para la selección de una muestra a partir de una población. Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean extrapolables a la población. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzarían si se realizase un estudio de toda la población.

Tipos de muestro

Inicialmente, los muestreos se dividen en dos grandes grupos:

MUESTREO NO PROBABILÍSTICO: No se usa el azar, sino el criterio del investigador, es decir, él decide si la muestra es o no representativa. Un ejemplo puede ser el realizado por un médico para investigar una determinada enfermedad, selecciona sus pacientes.

MUESTREO PROBABILÍSTICO (ALEATORIO): Interviene el azar de alguna forma. Nos vamos a centrar en este tipo de muestreo.

2. MUESTREO ALEATORIO SIMPLE

Es el tipo de muestreo más simple y en él se basan todos los demás. Para obtener los elementos de la muestra se numeran los elementos de la población y se seleccionan al azar los elementos que debe contener la muestra. Todos los elementos tienen la misma probabilidad de ser elegidos.

3. MUESTREO ALEATORIO SISTEMÁTICO

Es una técnica parecida a la anterior, pero, tras elegir un primer elemento al azar, selecciona los demás a intervalos regulares, es decir, "sistematiza la selección de elementos.

4. MUESTREO ESTRATIFICADO

Consiste en dividir la población total en clases homogéneas (estratos). Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...).

La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser de diferentes tipos:

Page 3: EstadiStica

Afijación Igual: A cada estrato le corresponde igual número de elementos.

Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato.

5. MUESTREO POR CONGLOMERADOS

Es parecido al muestreo estratificado, con la diferencia que la población se divide en grupos heterogéneos, como si fueran subpoblaciones dentro de la población general. Ejemplos de conglomerados serían unidades hospitalarias, mesas electorales, etc.

UNA VARIABLE es una propiedad que puede fluctuar y cuya variación es susceptible de adoptar diferentes valores, los cuales pueden medirse u observarse. Las variables adquieren valor cuando se relacionan con otras variables, es decir, si forman parte de una hipótesis o de una teoría.

Variables cualitativas

Son el tipo de variables que como su nombre lo indica expresan distintas cualidades,

características o modalidad. Cada modalidad que se presenta se denomina atributo o

categoría, y la medición consiste en una clasificación de dichos atributos. Dentro de ellas

podemos distinguir:

Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede tomar

distintos valores ordenados siguiendo una escala establecida, aunque no es necesario

que el intervalo entre mediciones sea uniforme, por ejemplo:leve, moderado, fuerte.

Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a

un criterio de orden, como por ejemplo los colores.

Variables cuantitativas

Son las variables que toman como argumento cantidades numéricas, son variables

matemáticas. Las variables cuantitativas además pueden ser:

Variable discreta : Es la variable que presenta separaciones o interrupciones en la

escala de valores que puede tomar. Estas separaciones o interrupciones indican la

ausencia de valores entre los distintos valores específicos que la variable pueda

asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).

Variable continua: Es la variable que puede adquirir cualquier valor dentro de un

intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la

altura (1,64 m, 1,65 m, 1,66 m,...), o el salario. Solamente se está limitado por la

Page 4: EstadiStica

precisión del aparato medidor, en teoría permiten que exista un valor entre dos

variables.

Según la influencia

Según la influencia que asignemos a unas variables sobre otras, podrán ser:

Variables independientes

Una variable independiente es aquella cuyo valor no depende de otra variable. La variable

independiente se representa en el eje de abscisas.

Son las que el investigador escoge para establecer agrupaciones en el estudio,

clasificando intrínsecamente a los casos del mismo. Un tipo especial son las variables de

control, que modifican al resto de las variables independientes y que de no tenerse en

cuenta adecuadamente pueden alterar los resultados por medio de un sesgo.

Es aquella característica o propiedad que se supone ser la causa del fenómeno

estudiado. En investigación experimental se llama así a la variable que el investigador

manipula.

Variables dependientes

Una variable dependiente es aquella cuyos valores dependen de los que tomen otra

variable. La variable dependiente en una función se suele representar por y. La variable

dependiente se representa en el eje ordenadas. Son las variables de respuesta que se

observan en el estudio y que podrían estar influidas por los valores de las variables

independientes.

Hayman (1974 : 69) la define como propiedad o característica que se trata de cambiar

mediante la manipulación de la variable independiente.

La variable dependiente es el factor que es observado y medido para determinar el efecto

de la variable independiente.

UN FENOMENO ALEATORIO

Un fenómeno aleatorio es aquel que puede presentar distintos resultados aunque se realice bajo las mismas condiciones. Además, estos resultados no sonpredecibles. También se dice que los fenómenos aleatorios obedecen al azar, lo que implica que se comportan de manera fortuita. Un ejemplo muy socorrido corresponde a observar la cara que se obtiene al lanzar un dado.

EL NIVEL DE MEDIDA de una variable en matemáticas y estadísticas, también llamado escala de medición, es una clasificación acordada con el fin de describir la naturaleza de la información contenida dentro de los números asignados a los objetos y, por lo tanto, dentro de una variable. Según la teoría de las escalas de medida, varias operaciones matemáticas diferentes son posibles dependiendo del nivel en el cual la variable se mide.

Page 5: EstadiStica

En la estadística descriptiva y con el fin de realizar pruebas de significancia, las variables se

clasifican de la siguiente manera de acuerdo con su nivel de medida:

nominal (también categórica o discreta)

ordinal

de intervalo o intervalar (continua)

de razón o racional (continua)

Las variables de intervalo y de razón también están agrupadas como variables continuas.

Medida nominalEl nivel nominal de medición, de la palabra latina común (nombre) describe variables de

naturaleza categórica que difieren en cualidad más que en cantidad (Salkind, 1998: 113). Este

nivel de medición es exclusivamente cualitativo y sus variables son por lo tanto cualitativas.

En este tipo de medidas, se asignan nombres o etiquetas a los objetos. La asignación se lleva

a cabo evaluando, de acuerdo con un procedimiento, la similaridad de la instancia a ser

medida con cada conjunto de ejemplares nominados o definiciones de categorías.

Medida ordinalEl nivel ordinal describe las variables a lo largo de un continuo sobre el que se pueden

ordenar los valores. En este caso las variables no sólo se asignan a grupos sino que además

pueden establecerse relaciones de mayor que, menor que o igual que, entre los elementos.

Las variables de este tipo además de nombrar se considera el asignar un orden a los datos.

Las operaciones matemáticas posibles son: contabilizar los elementos, igualdad y

desigualdad, además de ser mayor o menor que.

Medida de intervalo o intervalarEste nivel integra las variables que pueden establecer intervalos iguales entre sus valores. Las

variables del nivel de intervalos permiten determinar la diferencia entre puntos a lo largo del

mismo continuo. Las operaciones posibles son todas las de escalas anteriores, más la suma y

la resta.

En este tipo de medida, los números asignados a los objetos tienen todas las características

de las medidas ordinales, y además las diferencias entre medidas representan intervalos

equivalentes.

Ejemplos de este tipo de variables son la fecha, la temperatura, las puntuaciones de una

prueba, la escala de actitudes, las puntuaciones de IQ, conjuntos de años, entre otros.

Page 6: EstadiStica

Medida de razón o racionalEl nivel de razón, cuya denominación procede del latín ratio (cálculo), integra aquellas

variables con intervalos iguales que pueden situar un cero absoluto. Estas variables nombran

orden, presentan intervalos iguales y el cero significa ausencia de la característica. El cero

absoluto supone identificar una posición de ausencia total del rasgo o fenómeno.

Por ejemplo; el ingreso; el cero representaría que no recibe ingreso en virtud de un trabajo, la

velocidad; el cero significa ausencia de movimiento. Otros ejemplos de variables racionales

son la edad, y otras medidas de tiempo. En otras palabras, la escala de razón comienza

desde el cero y aumenta en números sucesivos iguales a cantidades del atributo que está

siendo medido.