SISTEMAS DE INFORMACIÓN Dr. Favio Murillo...

52
SISTEMAS DE INFORMACIÓN Dr. Favio Murillo García

Transcript of SISTEMAS DE INFORMACIÓN Dr. Favio Murillo...

SISTEMAS DE INFORMACIÓN

Dr. Favio Murillo García

Un sistema de información se puede definir técnicamentecomo un conjunto de componentes relacionados querecolectan (o recuperan), procesan, almacenan y distribuyeninformación para apoyar la toma de decisiones y el controlen una organización.

Fuente:http://biblioteca.itson.mx/oa/dip_ago/introduccion_sistemas/index.htm

Sistemas de Información

Hay tres actividades en un sistema de información queproducen la información que esas organizaciones necesitanpara tomar decisiones, controlar operaciones, analizarproblemas y crear nuevos productos o servicios.

Entrada: captura o recolecta datos en bruto tanto delinterior de la organización como de su entorno externo.

Procesamiento: convierte esa entrada de datos en unaforma más significativa.

Salida: transfiere la información procesada a la gente quela usará o a las actividades para las que se utilizará.

Sistemas de Información

Sistemas Para El Procesamiento DeTransacciones (TPS)

Sustituye los procedimientos manuales por otros basadosen computadora. Trata con procesos de rutina bienestructurados, incluye aplicaciones para elmantenimiento de registros.

Sistemas de Información

Sistemas de Soporte para la Decisión (DSS):

Sistema interactivo basado en computadora, el cualayuda a los tomadores de decisión utilizando modelos ydatos para resolver problemas no estructurados. Elobjetivo principal de estos sistemas es el de apoyar, noreemplazar, las capacidades de decisión del ser humano.

Sistemas de Información

Sistemas de Soporte a la toma de Decisiones enGrupo (GDSS)

Ayuda a que la toma de decisiones sea más eficaz paratodos los niveles de usuarios individuales. Ofrecenmuchas herramientas útiles para el trabajo en grupo.Permiten que los documentos compuestos incluyanaplicaciones de diferentes compañías de software. Ayudaa la programación, comunicación y administraciónconjunta de grupos de trabajo.

Sistemas de Información

Sistemas de Trabajo con Conocimientos (KWS)

Los sistemas de oficina y las estaciones de trabajo de diseño.Su principal cometido es integrar los conocimientos en elconjunto de la organización y canalizar los flujos deinformación asociados a puestos intensivos en información.Son denominados K.W.S (Knowledge Work Systems).

Como se observa el conocimiento como activo intangible esdifícil de administrar, incluso apenas se está comprendiendocómo se puede administrar; el conocimiento es partefundamental para las organizaciones y su forma de hacernegocios y tener ventajas competitivas.

Sistemas de Información

Sistemas de Automatización de Oficinas (OAS)

Es una aplicación de Tecnología de información diseñadapara aumentar la productividad de los trabajadores dedatos en la oficina, apoyando las actividades decoordinación y comunicación de la oficina típica.

Coordinan a diversos trabajadores de información,unidades geográficas y áreas funcionales. Manejan ycontrolan documentos. Programan actividades.Comunican.

Sistemas de Información

Los sistemas a Nivel Operativo proveen informaciónque supervisan las actividades elementales ytransacciones de la organización.

Sistemas de Información

Los sistemas a Nivel Administrativo apoyan lasactividades de supervisión, control, de toma dedecisiones y administrativas de los gerentes de nivelmedio.

Sistemas de Información

Los sistemas a Nivel del Conocimiento proveen a lostrabajadores del conocimiento y de datos de unaorganización.

Sistemas de Información

Los sistemas a Nivel Estratégico apoyan lasactividades de planeación a largo plazo de la direccióngeneral de la empresa.

Sistemas de Información

Componentes de una base de

datos

N° V1 V2 V3 V4 V5

1 20

2

3

4

5

6

Registro (casos) Atributo

(variables)

Valor

A cada característica de los elementos de unapoblación se le llama variables. Nos encontraremos convarios tipos de variables: cualitativas y cuantitativas.

Las variables cualitativas son aquellas que se refierena categorías o atributos de los elementos (individuos)estudiados. Las variables cuantitativas son aquellascuyos datos son de tipo numérico.

Variables

Continuas: números infinito no numerables de

elementos. Tiene asociado el concepto de medida

Ejemplo: presión arterial, edad, peso.

Discretas: números finitos numerables de elementos.

Se asocia con el concepto de conteo.

Ejemplo: N° de hijos, N° de casos de tuberculosis por

estado.

Variables cuantitativas

Dicotómicas: sólo hay dos categorías, que son

excluyentes una de la otra

Ejemplo: enfermo-sano, muerto-vivo, mujer-hombre

Nominal: tiene más de dos categorías y no hay orden

entre ellas.

Ejemplo: color de los ojos, grupo sanguíneo

Ordinal: tiene varias categorías y hay orden entre

ellas.

Ejemplo: grado tumoral, calificación del riesgo en

anestesia.

Variables cualitativas

EJERCICIO 1

¿Por qué es importante identificar el tipo de

variables que constituyen una base de datos?

¿Qué ventaja tiene el realizar la codificación de

los elementos que conforman la base de datos?

¿En qué medida es útil la organización y

sistematización de la información?

Estadísticos y gráficos

VARIABLES DESCRIPCIÓN ESTADÍSTICOS Y

GRÁFICOS

Cualitativas en

escala nominal

Valores no

métricos con

ausencia de orden

entre ellos

Distribución de frecuencias

Moda, %, tasas, razones.

Diagrama de barras

Cualitativas en

escala ordinal

Valores no

métricos con

presencia de

orden entre ellos.

Mínimo

Máximo

Mediana

Cuartiles

Percentiles

Rangos intercuartilicos

Gráficos de caja y bigotes

Continuación…

VARIABLES DESCRIPCIÓN ESTADISTICOS Y

GRÁFICOS

Cuantitativa en

escala de

intervalo o de

razón

Cuantitativas:

Discretas

Continuas

En escala de

intervalo

En escala de

razón

Media

Rango

Varianza

Desviación típica

Coeficiente de variación

Coef. de asimetría

Coef. de curtosis

Histograma

FUENTES DE INFORMACIÓN

Fuentes primarias

Fuentes secundarias

FUENTES DE INFORMACIÓN

http://www.inegi.org.mx/

Índice de precios

PIB y cuentas nacionales

DENUE

Ocupación y empleo

Microdatos

Tablero de indicadores económicos

Ciclos económicos

Banco de información economica

FUENTES DE INFORMACIÓN

http://www.inegi.org.mx/

Publicaciones

Encuestas:

ENOE

ENIGH

FUENTES DE INFORMACIÓN

http://www.cnbv.gob.mx/Paginas/default.aspx

http://www.cnbv.gob.mx/Inclusi%C3%B3n/Pagina

s/Bases-de-Datos.aspx

http://www.cnsf.gob.mx/Paginas/Home.aspx

http://www.conasami.gob.mx/

FUENTES DE INFORMACIÓN

http://www.bmv.com.mx/

http://www.imf.org/external/index.htm

http://www.federalreserve.gov/

https://www.bba.org.uk/

MINERÍA DE DATOS

La minería de datos es el proceso de detectar la

información de grandes conjuntos de

datos. Utiliza el análisis matemático para

deducir los patrones y tendencias que existen en

los datos. Normalmente, estos patrones no se

pueden detectar mediante la exploración

tradicional de los datos porque las relaciones son

demasiado complejas o porque hay demasiados

datos.

Fuente: https://msdn.microsoft.com/es-es/library/ms174949.aspx

MINERÍA DE DATOS

Estos patrones y tendencias se pueden recopilar y

definir como un modelo de minería de datos. Los

modelos de minería de datos se pueden aplicar en

escenarios como los siguientes:

Previsión

Riesgo y probabilidad

Recomendaciones

Buscar secuencias

Agrupación

MINERÍA DE DATOS

Definir el problema

¿Qué está buscando? ¿Qué tipos de relaciones intentabuscar?

¿Refleja el problema que está intentando resolver lasdirectivas o procesos de la empresa?

¿Desea realizar predicciones a partir del modelo de mineríade datos o solamente buscar asociaciones y patronesinteresantes?

¿Qué resultado o atributo desea predecir?

¿Qué tipo de datos tiene y qué tipo de información hay encada columna? En caso de que haya varias tablas, ¿cómo serelacionan? ¿Necesita limpiar, agregar o procesar los datosantes de poder usarlos?

¿Cómo se distribuyen los datos? ¿Los datos sonestacionales? ¿Los datos representan con precisión losprocesos de la empresa?

MINERÍA DE DATOS

Preparar los datos

La limpieza de datos no solamente implica quitar los

datos no válidos o interpolar valores que faltan, sino

también buscar las correlaciones ocultas en los datos,

identificar los orígenes de datos que son más precisos

y determinar qué columnas son las más adecuadas

para el análisis.

MINERÍA DE DATOS

Explorar los datos

Entre las técnicas de exploración se incluyen calcular losvalores mínimos y máximos, calcular la media y lasdesviaciones estándar, y examinar la distribución de losdatos. Por ejemplo, al revisar el máximo, el mínimo y losvalores de la media se podría determinar que los datos noson representativos. Las desviaciones estándar y otrosvalores de distribución pueden proporcionar informaciónútil sobre la estabilidad y exactitud de los resultados. Unadesviación estándar grande puede indicar que agregar másdatos podría ayudarle a mejorar el modelo. Los datos quese desvían mucho de una distribución estándar se podríansesgar o podrían representar una imagen precisa de unproblema de la vida real, pero dificultan el ajustar unmodelo a los datos.

MINERÍA DE DATOS

Generar modelos

Para crear un modelo de minería de datos, siga estos pasos generales:

Cree la estructura de minería de datos subyacente eincluya las columnas de datos que sean necesarias.

Seleccione el algoritmo más adecuado para la tareaanalítica.

Elija las columnas de la estructura que se incluirán en elmodelo y especifique cómo se deben usar, es decir, quécolumna contiene el resultado que desea predecir, quécolumnas son únicamente para la entrada, etc.

Opcionalmente, puede establecer los parámetros paraajustar el procesamiento del algoritmo.

Rellene el modelo con datos procesando la estructura y elmodelo.

MINERÍA DE DATOS

Explorar y validar los modelos

Use los modelos para crear predicciones que luego

podrá usar para tomar decisiones

Crear consultas de contenido para recuperar

estadísticas, reglas o fórmulas del modelo

Incrustar la funcionalidad de minería de datos

directamente en una aplicación

Crear un informe que permita a los usuarios realizar

consultas directamente en un modelo de minería de

datos existente

MINERÍA DE DATOS

Implementar y actualizar los modelos

Actualizar los modelos después de la revisión y

análisis. Cualquier actualización requiere que vuelve

a procesar los modelos

Actualizar dinámicamente los modelos, cuando

entren más datos en la organización, y realizar

modificaciones constantes para mejorar la efectividad

de la solución debería ser parte de la estrategia de

implementación.

MANEJO DE DATOS CON MATLAB

Ambiente en MATLAB

Workspace: muestra las variables, se guarda con extensión .mat

Listado de archivos (current folder): muestra los archivos con los que se están trabajando

Editor: muestra los valores de la variables

Ventana de comandos (command window): muestra las instrucciones ejecutadas y resultados

MANEJO DE DATOS CON MATLAB

Crear una variable

a=3

a=[3,4]

a=[3,4;2,6]

a=[3 4; 2 6]

MANEJO DE DATOS CON MATLAB

Vectores y matrices

Vector: columna de valores

Matriz: nxk valores

MANEJO DE DATOS CON MATLAB

Importar datos de Excel

1.- Arrastrar el archivo a la ventana de comandos

2.- Seleccionar el tipo de variables: vector, matriz

etc.

MANEJO DE DATOS CON MATLAB

Archivos m

Son un listado de instrucciones (script) que se

puede ejecutar mediante el botón “RUN” que se

encuentra en el menú variable.

Se recomienda crear una carpeta con todos los

archivos del proyecto.

MANEJO DE DATOS CON MATLAB

Escribir una función

function [med,des,a]=estadistica(x)

n=length(x);

med=sum(x)/n;

a=sum(x);

des=sqrt(sum((x-med).^2/(n-1)));

end

MANEJO DE DATOS CON MATLAB

Llamar una función

[media, desviacion,suma]=estadistica([1.65 1.82

1.72 1.75 1.73 1.85 1.90 1.74 1.76 1.77])

MANEJO DE DATOS CON MATLAB

Ejercicio de una función financiera

Calcular la tasa de interés simple y compuesta

MANEJO DE DATOS CON MATLAB

Análisis estadístico: Medidas de localización

Mean ()

Descripción Calcula la media aritmética de determinados valores.

Sintaxis mean (a) - Si a es un vector, calcula la media de los valores. - Si a es una matriz, calcula la media de cada columna.

mean (a, dim) - Devuelve los valores medios de la dimensión especificada de la matriz a. - La dimensión predefinida es 1.

nanmean() Descripción Calcula la media ignorando aquellos datos perdidos.

MANEJO DE DATOS CON MATLAB

Análisis estadístico: Medidas de localización

geomean (a)

harmmean (a)

max(a); min(a) - Si a es un vector, retorna el valor máximo/mínimo. - Si a es una matriz, retorna máximo/mínimo de cada columna.

nanmax() ; nanmin ()

Descripción Devuelve los valores extremos de una determinada muestra ignorando aquellos datos perdidos.

median ()

MANEJO DE DATOS CON MATLAB

Análisis estadístico: Medidas de dispersión

std (a) - Si a es un vector, retorna la desviación

estándar de los valores. - Si a es una matriz,

retorna la desviación estándar de los valores por

columnas.

var (a)

range (a) - Si a es un vector, calcula el rango del

mismo. - Si a es una matriz, calcula el rango de

cada columna.

MANEJO DE DATOS CON MATLAB

Análisis estadístico: Medidas de dispersión

iqr (a) - Si a es un vector, calcula el rango

intercuartil del mismo. - Si a es una matriz, calcula

el rango intercuartil de cada columna.

prctile (a, p) - “p”, corresponde al percentil que se

busca, puede ser un vector o escalar - “a”, es la

muestra que se analiza, puede ser vector o matriz.

MANEJO DE DATOS CON MATLAB

Análisis estadístico: Medidas de dispersión

quantile (a, p, dim) - “p”, corresponde al quantil

que se busca, puede ser un vector o escalar y se

encuentra entre el rango [0 1] . - “a”, es la muestra

que se analiza, puede ser vector o matriz. - Su

comportamiento hasta este punto es igual a la

función prctile(). - Sin embargo el parámetro dim es

muy útil ya que nos permite buscar quantiles en

otras dimensione. dim=1, por columnas, dim=2, por

filas.

prctile( x , 50) = quantile (x, .50) = mediana

MANEJO DE DATOS CON MATLAB

Análisis estadístico: Medidas de distribución

skewness (a) - Si a es un vector, calcula la

oblicuidad de los valores. - Si a es una matriz,

calcula la oblicuidad de cada columna.

kurtosis (a) - Cuando a es un vector, calcula la

curtosis de los elementos del mismo. - Cuando a es

una matriz, calcula la curtosis para cada columna.

MANEJO DE DATOS CON MATLAB

Análisis estadístico

tabulate (a) - El parámetro a representa la

muestra, y solo puede ser un vector.

cov (a) - Cuando a es un vector, devuelve un valor

con la varianza del mismo. - Cuando a es una

matriz, cada columna es una observación y cada

columna una variable.

MANEJO DE DATOS CON MATLAB

Análisis estadístico

corr(a) - a debe ser una matriz, y devuelve un matriz de correlacion entre columnas.

corr(a,b) - Genera una matriz de correlación entre las dos matrices, las dimensiones de a deben ser iguales a las de b.

[R,P]= corrcoef (a) - Devuelve además una matriz con los valores p usados en las pruebas de hipótesis.

MANEJO DE DATOS CON MATLAB

Análisis estadístico

crosstab (col1 ,col2) - Se genera una matriz donde

el elemento (i,j) corresponde a la cuenta de todas

las observaciones donde col1=i y col2 =j.

grpstats (a, group) - Genera la media de cada

columna de a por grupo, el vector group define

como se agruparan los datos.

MANEJO DE DATOS CON MATLAB

Análisis estadístico

b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]

Del archivo denominado regresión realice un script titulado: e.

El cual que llame las funciones necesarias para obtener: media, media geométrica, mínimo, máximo, desviación estándar, varianza, asimetría, curtosis, mediana, cuartil 3, percentil 30 y rango de cada variable. Asimismo presente una matriz de correlaciones entre las variables, una tabla cruzada entre la antigüedad y el precio y calcule la media del precio por tamaño.