Investigación Estadística de Usuarios de Internet

22
INSTITUTO POLITÉCNICO NACIONAL ESCUELA SUPERIOR DE INGENIERÍA MECÁNICA Y ELÉCTRICA Unidad Zacatenco Ingeniería en Comunicaciones y Electrónica Academia de matemáticas Materia: Probabilidad y Estadística Profesor: Salazar Peña Enrique Trabajo de investigación Primer parcial Alumno: xxxx Fecha de entrega: 28-04-2015

description

Trabajo de investigación de estadística, con cálculos de Media, Mediana, Moda, Varianza, Desviación media, Desviación estándar etc.

Transcript of Investigación Estadística de Usuarios de Internet

trabajo de investigacin

INSTITUTO POLITCNICO NACIONALESCUELA SUPERIOR DE INGENIERA MECNICA Y ELCTRICAUnidad ZacatencoIngeniera en Comunicaciones y ElectrnicaAcademia de matemticasMateria: Probabilidad y Estadstica Profesor: Salazar Pea EnriqueTrabajo de investigacinPrimer parcialAlumno: xxxxFecha de entrega: 28-04-2015

trabajo de investigacinUsuarios de internet en distintos pases

Organizacin del proyecto de investigacin:

I. Recoleccin de datos

II. Anlisis de datos

Datos no agrupadosa) Diagrama tallo-hojab) Listado ordenado c) Medidas de tendencia centrald) Medidas de dispersine) Medidas de posicin Datos agrupadosa) Formacin de intervalosb) Tabla de frecuenciasc) Medidas de tendencia centrald) Medidas de dispersine) Medidas de posicinf) Diagrama caja brazos g) Diagrama de barrash) Polgono de Frecuenciasi) Ojiva

III. Interpretacin de resultados

IV. Inferencia de datos

V. Anexos

Evidencias de la recoleccin de datos Glosario

Recoleccin de datos:En la siguiente tabla se muestra una recopilacin de datos, que relacionan un pas con el nmero de usuarios de internet, de una muestra de cien habitantes por cada pas, los datos fueron obtenidos de un estudio realizado por el banco mundial de datos y que estn disponibles en su pgina de internet http://datos.bancomundial.org/

PAIS2013Redondeo

Afganistn5,96

Albania60,160

Alemania84,084

Andorra94,094

Angola19,119

Antigua y Barbuda63,463

Arabia Saudita60,561

Argelia16,517

Argentina59,960

Armenia46,346

Aruba78,979

Australia83,083

Austria80,681

Azerbaiyn58,759

Bahamas72,072

Bahrin90,090

Bangladesh6,57

Barbados75,075

Belars54,254

Blgica82,282

Belice31,732

Benin4,95

Bermudas95,395

Bhutn29,930

Bolivia39,540

Bosnia y Herzegovina67,968

Botswana15,015

Brasil51,652

Brunei Darussalam64,565

Bulgaria53,153

Burkina Faso4,44

Burundi1,31

Cabo Verde37,538

Camboya6,06

Camern6,46

Canad85,886

Chad2,32

Chile66,567

China45,846

Chipre65,566

Colombia51,752

Comoras6,57

Costa Rica46,046

Cte d'Ivoire2,63

Croacia66,767

Cuba25,726

Japn 86,387

Dinamarca94,695

Djibouti9,510

Dominica59,059

Ecuador40,440

Egipto49,650

El Salvador23,123

Emiratos rabes Unidos88,088

Eritrea0,91

Eslovenia72,773

Espaa71,672

Estados Unidos84,284

Estonia80,080

Etiopa1,92

Ex Repblica Yugoslava 61,261

Federacin de Rusia61,461

Fiji37,137

Filipinas37,037

Finlandia91,592

Francia81,982

Gabn9,29

Gambia14,014

Georgia43,143

Ghana12,312

Granada35,035

Grecia59,960

Groenlandia65,866

Guam65,465

Guatemala19,720

Guinea1,62

Guinea-Bissau3,13

Guinea Ecuatorial16,417

Guyana33,033

Hait10,611

Honduras17,818

Hong Kong74,274

Hungra72,672

India15,115

Indonesia15,816

Irn31,431

Iraq9,29

Irlanda78,278

Mxico43,544

Anlisis de datos:Datos no agrupados.Diagrama Tallo Hoja-1, 1, 2, 2, 2, 3, 3, 4, 5, 6, 6, 6, 7, 7, 9, 9

10, 1, 2, 4, 5, 5, 6, 7, 7, 8, 9

20, 3, 6

30, 1, 2, 3, 5, 7, 7,8

40, 0, 3, 4, 6, 6, 6

50, 2, 2, 3, 4, 9, 9

60, 0, 0, 1, 1, 1, 3, 5, 5, 6, 6, 7, 7, 8

72, 2, 2, 3, 4, 5, 8, 9

80, 1, 2, 2, 3, 4, 4, 6, 7, 8

90, 2, 4, 5, 5

Tenemos 89 datos para ordenar.Lista ordenada:

1

1

2

2

2

3

3

4

5

6

6

6

7

7

9

9

10

11

12

14

15

15

16

17

17

18

19

20

23

26

30

31

32

33

35

37

37

38

40

40

43

44

46

46

46

50

52

52

53

54

59

59

60

60

60

61

61

61

63

65

65

66

66

67

67

68

72

72

72

73

74

75

78

79

80

81

82

82

83

84

84

86

87

88

90

92

94

95

95

Medidas de tendencia central:

Media

=4,18647.03*En promedio hay 47 usuarios de internet en cada pas de los 89 con los que se estn trabajando en este proyecto.Mediana:Dato a la mitad de la lista ordenada si son 89 en total la media es:

Moda:Es aquel dato que se repite un mayor nmero de veces, en este caso la moda pueden ser varios datos:

Medidas de dispersin: =47.03

Dato

12-92.0692.064,237.52

23-135.09135.096,083.10

32-88.0688.063,877.28

41-43.0343.031,851.58

51-42.0342.031,766.52

63-123.09123.095,050.38

72-80.0680.063,204.80

92-76.0376.032,892.56

101-37.0337.031,371.22

111-36.0336.031,298.16

121-35.0335.031,227.10

141-33.0333.031,090.98

152-64.0664.062,051.84

161-31.0331.03962.86

172-60.0660.061,803.60

181-29.0329.03842.74

191-28.0328.03785.68

201-27.0327.03730.62

231-24.0324.03577.44

261-21.0321.03442.26

301-17.0617.06291.04

311-16.0316.03256.96

321-15.0315.03225.90

331-14.0314.03196.84

351-12.0312.03144.72

372-20.0620.06201.20

381-9.039.0381.54

402-14.0614.0698.84

431-4.034.0316.24

441-3.033.039.18

463-3.093.093.18

5012.972,978.82

5229.949.9449.40

5315.975,9735.64

5416.976,9748.58

59223.9423.94286.56

60338.9138.91504.66

61341.9141,91585.48

63115.9715.97255.04

65235.9435.94645.84

66237.9437.94719.72

67239.9439.94797.60

68120.9720.97439.74

72374.9174.911,870.50

73125.9725.97674.44

74126.9726.97727.38

75127.9727.97782.32

78130.9730.97959.14

79131.9731.971,022.08

80132.9732.971,087.02

81133.9733.971,153.96

82269.9469.942,445.80

83135.9735.971,293.84

84236.9736.971,366.78

86138.9738.971,518.66

87139.9739.971,597.60

88140.9740.971,678.54

90142.9742.971,846.42

92144.9744.972,022.30

94146.9746.972,206.18

95295.9495.944,602.24

SUMA2,293.0676,906.16

Rango=DatoMayor DatoMenor

Rango=95-1=94

Desviacin media D.M.

Donde n = nmero de datos totales = 89Varianza:

Por lo tanto la varianza es:

Desviacin Standard

La desviacin standard es el equivalente a la raz cuadrada de la varianza por lo tanto:

Medidas de posicin:

=4668=96Datos agrupados:

Rango=DatoMayor DatoMenorRango=95-1=94

Longitud del intervalo ()

C es determinado a partir de la Regla de Sturges:

Y debe de estar entre los intervalos

Donde n es el nmero de datos en este caso 89:

Por lo tanto la longitud del intervalo queda de la siguiente manera:

Diagrama caja brazos:

Diagrama de barras:

Polgono de frecuencias:

Ojiva

Interpretacin de resultados:Los datos con los que se trabaj el proyecto, han sido obtenidos de una base de datos del banco mundial, en l se recopilaron el promedio de usuarios de internet en el ao 2013 de una muestra de cien personas por pas, en el estudio no observe un comportamiento ascendente en todos los pases puesto que se debe considerar que el estudio es general y no enfocado nicamente a pases tecnolgicamente desarrollados, por lo tanto obtuvimos un rango de datos muy amplio, a esta variacin tan grande se le puede atribuir el nivel de infraestructura de cada pas as como, el nivel de idiosincrasia de cada gobierno que delimita un medio tan asequible y que proporciona ms informacin de la que estn dispuestos a dejar conocer, entre otras cosas, el nivel de desarrollo tecnolgico a nivel mundial si es ascendente comparado con los estudios anuales anteriores, sin embargo no todos los pases tienen el mismo nivel de desarrollo y acceso a las tecnologas de informacin y comunicacin.Aun tomando como estudio a 89 pases, podemos decir que en promedio 46% o bien menos de la mitad de sus habitantes tienen acceso a internet, en base a esto concluyo que en el ao 2013 ms de la mitad del mundo tenia delimitado su acceso a las tecnologas de informacin y comunicacin.Inferencia de datos:El estudio, puede ayudar a identificar los pases ms rezagados en desarrollo tecnolgico y adems proporcionar un conocimiento estadstico sobre el crecimiento de la poblacin activa en internet, para poder planificar el desarrollo y mantenimiento de los servidores de las distintas plataformas que existen (Facebook, YouTube, Google, Yahoo!, Gmail, etc.). Pero adems de los servidores, se necesitan dispositivos para acceder a internet (Laptop, Smartphone, Tablet, etc.) Con ayuda de los datos estadsticos que reflejan el crecimiento de los usuarios de internet pueden determinar el aproximado de la demanda de los dispositivos electrnicos para su uso y consumo.Por lo tanto el estudio puede ayudar a empresas que proporcionan los servidores de internet y a las empresas productores de dispositivos electrnicos para que tengan acceso al mismo.

Anexo:Evidencias de la recoleccin de datos:Los datos fueron obtenidos de la pgina del banco mundial de datos, es el siguiente enlace:http://datos.bancomundial.org/indicador/IT.NET.USER.P2

Usuarios de Internet

Los datos se agruparon en una en la tabla que refiere en la recoleccin de datos, en la pgina de internet se muestran datos con punto decimal, por decisin personal se redondearon las cifras para poder trabajar nicamente con nmeros enteros y tener menor dificultad al desarrollar el trabajo.

Glosario:I. Estadstica: Laestadsticaes unaciencia formaly una herramienta que estudia el uso y los anlisis provenientes de una muestra representativa dedatos, busca explicar las correlaciones y dependencias de un fenmeno fsico o natural, de ocurrencia en formaaleatoriaocondicional. II. Estadstica descriptiva: Se dedica a la descripcin, visualizacin y resumen de datos originados a partir de los fenmenos de estudio. Los datos pueden ser resumidos numrica o grficamente. Ejemplos bsicos de parmetros estadsticosson: lamediay ladesviacin estndar. Algunos ejemplos grficos son:histograma,pirmide poblacional,grfico circular, entre otros.

III. Estadstica inferencial: Se dedica a la generacin de losmodelos, inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta laaleatoriedad de las observaciones. Se usa paramodelarpatrones en los datos y extraer inferencias acerca de lapoblacinbajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas s/no (prueba de hiptesis), estimaciones de unas caractersticas numricas (estimacin),pronsticosde futuras observaciones, descripciones de asociacin (correlacin) o modelamiento de relaciones entre variables (anlisis de regresin). Otras tcnicas demodelamientoincluyena nova,series de tiempoyminera de datos.

IV. Parmetro estadstico: En estadstica, unparmetroes un nmero que resume la gran cantidad de datos que pueden derivarse del estudio de unavariable estadstica.1El clculo de este nmero est bien, usualmente mediante una frmulaaritmticaobtenida a partir dedatosde la poblacin

V. Poblacin: Enestadstica, tambin llamadauniverso, es el conjunto de elementos de referencia sobre el que se realizan las observaciones. Tambin es el conjunto sobre el que estamos interesados en obtener conclusiones (inferir). Normalmente es demasiado grande para poder abarcarla, motivo por el cual se puede hacer necesaria la extraccin de una muestra de sta.

VI. Muestra: es un subconjunto de casos o individuos de unapoblacin estadstica.

VII. Dato: es cada uno de los valores que se ha obtenido al realizar un estudio estadstico.

VIII. Medidas de tendencia central: Son valores que suelen situarse hacia el centro de la distribucin de datos. Los ms destacados son lasmediaso promedios (incluyendo lamedia aritmtica, lamedia geomtricay lamedia armnica), lamedianay lamoda

IX. Medidas de dispersin: Resumen la heterogeneidad de los datos, lo separados que estos estn entre s. Medidas de dispersin absolutas, que vienen dadas en las mismas unidades en las que se mide la variable: recorridos, desviaciones medias,varianza,desviacin tpicay media. Medidas de dispersin relativa, que informan de la dispersin en trminos relativos, como un porcentaje. Se incluyen entre estas elcoeficiente de variacin, el coeficiente de apertura, los recorridos relativos y el ndice de desviacin respecto de la mediana.

X. Rango: Es elintervaloentre el valor mximo y el valor mnimo; por ello, comparteunidadescon los datos. Permite obtener una idea de ladispersinde los datos, cuanto mayor es el rango, ms dispersos estn los datos de un conjunto.

XI. Variable: Unavariablees una propiedad que puede fluctuar y cuya variacin es susceptible de adoptar diferentes valores, los cuales pueden medirse u observarse. Lasvariables adquieren valor para la investigacin cuando se relacionan con otras variables, es decir, si forman parte de unahiptesiso de unateora. En este caso se las denomina constructosoconstrucciones hipotticas.

XII. Cuartiles: Loscuartilesson puntos tomados a intervalos regulares de lafuncin de distribucinde unavariable aleatoria., que dividen a la distribucin en cuatro partes (corresponden a los cuartiles 0,25; 0,50 y 0,75)

XIII. Deciles: Enestadstica descriptiva, el conceptodecilse refiere a cada uno de los 9 valores que dividen un grupo de datos (clasificados con unarelacin de orden) en diez partes iguales, y de manera que cada parte representa un dcimo de la poblacin. En resumen, los deciles son cada uno de los nueve valores que dividen un conjunto de datos en diez grupos con iguales efectivos.

XIV. Frecuencia absoluta: Es el promedio de una suma predeterminada y adems consiste en saber cul es el nmero o smbolo de mayor equivalencia. (ni) de una variable estadsticaXi, es el nmero de veces que este valor aparece en el estudio. A mayor tamao de la muestra aumentar el tamao de la frecuencia absoluta; es decir, la suma total de todas las frecuencias absolutas debe dar el total de la muestra estudiada

XV. Frecuencia relativa: es el cociente entre la frecuencia absoluta y el tamao de la muestra.

XVI. Frecuencia acumulada: Es lasuma de las frecuencias absolutasde todos losvalores inferiores o igualesalvalor considerado.

XVII. Media: Enmatemticasyestadsticaunamediaopromedioes unamedida de tendencia central.

XVIII. Mediana: En el mbito de laestadstica, lamedianarepresenta el valor de la variable de posicin central en un conjunto de datos ordenados

XIX. Moda: La moda es el dato ms repetido, el valor de la variable con mayorfrecuencia absoluta.15En cierto sentido se corresponde su definicin matemtica con la locucin "estar de moda", esto es, ser lo que ms se lleva.

XX. Varianza: Enteora de probabilidad, lavarianza(que suele representarse como) de unavariable aleatoriaes unamedida de dispersindefinida como laesperanzadel cuadrado de la desviacin de dicha variable respecto a su media.

XXI. Desviacin Estndar: es una medida del grado de dispersin de los datos con respecto al valor promedio. Dicho de otra manera, ladesviacin estndares simplemente el "promedio" o variacin esperada con respecto a la media aritmtica.

XXII. Medidas de dispersin: muestran la variabilidad de una distribucin, indicando por medio de un nmero si las diferentes puntuaciones de una variable estn muy alejadas de lamedia. Cuanto mayor sea ese valor, mayor ser la variabilidad, y cuanto menor sea, ms homognea ser a lamedia. As se sabe si todos los casos son parecidos o varan mucho entre ellos.

XXIII. Medidas de posicin: Lasmedidas de posicindividen un conjunto de datos en grupos con el mismo nmero de individuos. Para calcular lasmedidas de posicines necesario que los datosestn ordenados demenor a mayor.

Formulario:

Media Mediana:Dato a la mitad de la lista ordenadaModa:Es aquel dato que se repite un mayor nmero de veces.Rango=DatoMayor DatoMenorLongitud del intervalo ()

C es determinado a partir de la Regla de Sturges:

Y debe de estar entre los intervalos Desviacin media D.M.

Varianza:

Desviacin Estndar La desviacin standard es el equivalente a la raz cuadrada de la varianza