SISTEMAS DE INFORMACIÓN Dr. Favio Murillo...
Transcript of SISTEMAS DE INFORMACIÓN Dr. Favio Murillo...
Un sistema de información se puede definir técnicamentecomo un conjunto de componentes relacionados querecolectan (o recuperan), procesan, almacenan y distribuyeninformación para apoyar la toma de decisiones y el controlen una organización.
Fuente:http://biblioteca.itson.mx/oa/dip_ago/introduccion_sistemas/index.htm
Sistemas de Información
Hay tres actividades en un sistema de información queproducen la información que esas organizaciones necesitanpara tomar decisiones, controlar operaciones, analizarproblemas y crear nuevos productos o servicios.
Entrada: captura o recolecta datos en bruto tanto delinterior de la organización como de su entorno externo.
Procesamiento: convierte esa entrada de datos en unaforma más significativa.
Salida: transfiere la información procesada a la gente quela usará o a las actividades para las que se utilizará.
Sistemas de Información
Sistemas Para El Procesamiento DeTransacciones (TPS)
Sustituye los procedimientos manuales por otros basadosen computadora. Trata con procesos de rutina bienestructurados, incluye aplicaciones para elmantenimiento de registros.
Sistemas de Información
Sistemas de Soporte para la Decisión (DSS):
Sistema interactivo basado en computadora, el cualayuda a los tomadores de decisión utilizando modelos ydatos para resolver problemas no estructurados. Elobjetivo principal de estos sistemas es el de apoyar, noreemplazar, las capacidades de decisión del ser humano.
Sistemas de Información
Sistemas de Soporte a la toma de Decisiones enGrupo (GDSS)
Ayuda a que la toma de decisiones sea más eficaz paratodos los niveles de usuarios individuales. Ofrecenmuchas herramientas útiles para el trabajo en grupo.Permiten que los documentos compuestos incluyanaplicaciones de diferentes compañías de software. Ayudaa la programación, comunicación y administraciónconjunta de grupos de trabajo.
Sistemas de Información
Sistemas de Trabajo con Conocimientos (KWS)
Los sistemas de oficina y las estaciones de trabajo de diseño.Su principal cometido es integrar los conocimientos en elconjunto de la organización y canalizar los flujos deinformación asociados a puestos intensivos en información.Son denominados K.W.S (Knowledge Work Systems).
Como se observa el conocimiento como activo intangible esdifícil de administrar, incluso apenas se está comprendiendocómo se puede administrar; el conocimiento es partefundamental para las organizaciones y su forma de hacernegocios y tener ventajas competitivas.
Sistemas de Información
Sistemas de Automatización de Oficinas (OAS)
Es una aplicación de Tecnología de información diseñadapara aumentar la productividad de los trabajadores dedatos en la oficina, apoyando las actividades decoordinación y comunicación de la oficina típica.
Coordinan a diversos trabajadores de información,unidades geográficas y áreas funcionales. Manejan ycontrolan documentos. Programan actividades.Comunican.
Sistemas de Información
Los sistemas a Nivel Operativo proveen informaciónque supervisan las actividades elementales ytransacciones de la organización.
Sistemas de Información
Los sistemas a Nivel Administrativo apoyan lasactividades de supervisión, control, de toma dedecisiones y administrativas de los gerentes de nivelmedio.
Sistemas de Información
Los sistemas a Nivel del Conocimiento proveen a lostrabajadores del conocimiento y de datos de unaorganización.
Sistemas de Información
Los sistemas a Nivel Estratégico apoyan lasactividades de planeación a largo plazo de la direccióngeneral de la empresa.
Sistemas de Información
Componentes de una base de
datos
N° V1 V2 V3 V4 V5
1 20
2
3
4
5
6
Registro (casos) Atributo
(variables)
Valor
A cada característica de los elementos de unapoblación se le llama variables. Nos encontraremos convarios tipos de variables: cualitativas y cuantitativas.
Las variables cualitativas son aquellas que se refierena categorías o atributos de los elementos (individuos)estudiados. Las variables cuantitativas son aquellascuyos datos son de tipo numérico.
Variables
Continuas: números infinito no numerables de
elementos. Tiene asociado el concepto de medida
Ejemplo: presión arterial, edad, peso.
Discretas: números finitos numerables de elementos.
Se asocia con el concepto de conteo.
Ejemplo: N° de hijos, N° de casos de tuberculosis por
estado.
Variables cuantitativas
Dicotómicas: sólo hay dos categorías, que son
excluyentes una de la otra
Ejemplo: enfermo-sano, muerto-vivo, mujer-hombre
Nominal: tiene más de dos categorías y no hay orden
entre ellas.
Ejemplo: color de los ojos, grupo sanguíneo
Ordinal: tiene varias categorías y hay orden entre
ellas.
Ejemplo: grado tumoral, calificación del riesgo en
anestesia.
Variables cualitativas
EJERCICIO 1
¿Por qué es importante identificar el tipo de
variables que constituyen una base de datos?
¿Qué ventaja tiene el realizar la codificación de
los elementos que conforman la base de datos?
¿En qué medida es útil la organización y
sistematización de la información?
Estadísticos y gráficos
VARIABLES DESCRIPCIÓN ESTADÍSTICOS Y
GRÁFICOS
Cualitativas en
escala nominal
Valores no
métricos con
ausencia de orden
entre ellos
Distribución de frecuencias
Moda, %, tasas, razones.
Diagrama de barras
Cualitativas en
escala ordinal
Valores no
métricos con
presencia de
orden entre ellos.
Mínimo
Máximo
Mediana
Cuartiles
Percentiles
Rangos intercuartilicos
Gráficos de caja y bigotes
Continuación…
VARIABLES DESCRIPCIÓN ESTADISTICOS Y
GRÁFICOS
Cuantitativa en
escala de
intervalo o de
razón
Cuantitativas:
Discretas
Continuas
En escala de
intervalo
En escala de
razón
Media
Rango
Varianza
Desviación típica
Coeficiente de variación
Coef. de asimetría
Coef. de curtosis
Histograma
FUENTES DE INFORMACIÓN
http://www.inegi.org.mx/
Índice de precios
PIB y cuentas nacionales
DENUE
Ocupación y empleo
Microdatos
Tablero de indicadores económicos
Ciclos económicos
Banco de información economica
FUENTES DE INFORMACIÓN
http://www.inegi.org.mx/
Publicaciones
Encuestas:
ENOE
ENIGH
FUENTES DE INFORMACIÓN
http://www.bancodemexico.gob.mx/
Inflación
Mercado de valores
Mercado cambiario
Sistema financiero:
Información general
Publicaciones
Estadísticas
Disposiciones
Servicios
Material de referencia
FUENTES DE INFORMACIÓN
http://www.cnbv.gob.mx/Paginas/default.aspx
http://www.cnbv.gob.mx/Inclusi%C3%B3n/Pagina
s/Bases-de-Datos.aspx
http://www.cnsf.gob.mx/Paginas/Home.aspx
http://www.conasami.gob.mx/
FUENTES DE INFORMACIÓN
http://www.bmv.com.mx/
http://www.imf.org/external/index.htm
http://www.federalreserve.gov/
https://www.bba.org.uk/
MINERÍA DE DATOS
La minería de datos es el proceso de detectar la
información de grandes conjuntos de
datos. Utiliza el análisis matemático para
deducir los patrones y tendencias que existen en
los datos. Normalmente, estos patrones no se
pueden detectar mediante la exploración
tradicional de los datos porque las relaciones son
demasiado complejas o porque hay demasiados
datos.
Fuente: https://msdn.microsoft.com/es-es/library/ms174949.aspx
MINERÍA DE DATOS
Estos patrones y tendencias se pueden recopilar y
definir como un modelo de minería de datos. Los
modelos de minería de datos se pueden aplicar en
escenarios como los siguientes:
Previsión
Riesgo y probabilidad
Recomendaciones
Buscar secuencias
Agrupación
MINERÍA DE DATOS
Definir el problema
¿Qué está buscando? ¿Qué tipos de relaciones intentabuscar?
¿Refleja el problema que está intentando resolver lasdirectivas o procesos de la empresa?
¿Desea realizar predicciones a partir del modelo de mineríade datos o solamente buscar asociaciones y patronesinteresantes?
¿Qué resultado o atributo desea predecir?
¿Qué tipo de datos tiene y qué tipo de información hay encada columna? En caso de que haya varias tablas, ¿cómo serelacionan? ¿Necesita limpiar, agregar o procesar los datosantes de poder usarlos?
¿Cómo se distribuyen los datos? ¿Los datos sonestacionales? ¿Los datos representan con precisión losprocesos de la empresa?
MINERÍA DE DATOS
Preparar los datos
La limpieza de datos no solamente implica quitar los
datos no válidos o interpolar valores que faltan, sino
también buscar las correlaciones ocultas en los datos,
identificar los orígenes de datos que son más precisos
y determinar qué columnas son las más adecuadas
para el análisis.
MINERÍA DE DATOS
Explorar los datos
Entre las técnicas de exploración se incluyen calcular losvalores mínimos y máximos, calcular la media y lasdesviaciones estándar, y examinar la distribución de losdatos. Por ejemplo, al revisar el máximo, el mínimo y losvalores de la media se podría determinar que los datos noson representativos. Las desviaciones estándar y otrosvalores de distribución pueden proporcionar informaciónútil sobre la estabilidad y exactitud de los resultados. Unadesviación estándar grande puede indicar que agregar másdatos podría ayudarle a mejorar el modelo. Los datos quese desvían mucho de una distribución estándar se podríansesgar o podrían representar una imagen precisa de unproblema de la vida real, pero dificultan el ajustar unmodelo a los datos.
MINERÍA DE DATOS
Generar modelos
Para crear un modelo de minería de datos, siga estos pasos generales:
Cree la estructura de minería de datos subyacente eincluya las columnas de datos que sean necesarias.
Seleccione el algoritmo más adecuado para la tareaanalítica.
Elija las columnas de la estructura que se incluirán en elmodelo y especifique cómo se deben usar, es decir, quécolumna contiene el resultado que desea predecir, quécolumnas son únicamente para la entrada, etc.
Opcionalmente, puede establecer los parámetros paraajustar el procesamiento del algoritmo.
Rellene el modelo con datos procesando la estructura y elmodelo.
MINERÍA DE DATOS
Explorar y validar los modelos
Use los modelos para crear predicciones que luego
podrá usar para tomar decisiones
Crear consultas de contenido para recuperar
estadísticas, reglas o fórmulas del modelo
Incrustar la funcionalidad de minería de datos
directamente en una aplicación
Crear un informe que permita a los usuarios realizar
consultas directamente en un modelo de minería de
datos existente
MINERÍA DE DATOS
Implementar y actualizar los modelos
Actualizar los modelos después de la revisión y
análisis. Cualquier actualización requiere que vuelve
a procesar los modelos
Actualizar dinámicamente los modelos, cuando
entren más datos en la organización, y realizar
modificaciones constantes para mejorar la efectividad
de la solución debería ser parte de la estrategia de
implementación.
MANEJO DE DATOS CON MATLAB
Ambiente en MATLAB
Workspace: muestra las variables, se guarda con extensión .mat
Listado de archivos (current folder): muestra los archivos con los que se están trabajando
Editor: muestra los valores de la variables
Ventana de comandos (command window): muestra las instrucciones ejecutadas y resultados
MANEJO DE DATOS CON MATLAB
Importar datos de Excel
1.- Arrastrar el archivo a la ventana de comandos
2.- Seleccionar el tipo de variables: vector, matriz
etc.
MANEJO DE DATOS CON MATLAB
Archivos m
Son un listado de instrucciones (script) que se
puede ejecutar mediante el botón “RUN” que se
encuentra en el menú variable.
Se recomienda crear una carpeta con todos los
archivos del proyecto.
MANEJO DE DATOS CON MATLAB
Escribir una función
function [med,des,a]=estadistica(x)
n=length(x);
med=sum(x)/n;
a=sum(x);
des=sqrt(sum((x-med).^2/(n-1)));
end
MANEJO DE DATOS CON MATLAB
Llamar una función
[media, desviacion,suma]=estadistica([1.65 1.82
1.72 1.75 1.73 1.85 1.90 1.74 1.76 1.77])
MANEJO DE DATOS CON MATLAB
Ejercicio de una función financiera
Calcular la tasa de interés simple y compuesta
MANEJO DE DATOS CON MATLAB
Análisis estadístico: Medidas de localización
Mean ()
Descripción Calcula la media aritmética de determinados valores.
Sintaxis mean (a) - Si a es un vector, calcula la media de los valores. - Si a es una matriz, calcula la media de cada columna.
mean (a, dim) - Devuelve los valores medios de la dimensión especificada de la matriz a. - La dimensión predefinida es 1.
nanmean() Descripción Calcula la media ignorando aquellos datos perdidos.
MANEJO DE DATOS CON MATLAB
Análisis estadístico: Medidas de localización
geomean (a)
harmmean (a)
max(a); min(a) - Si a es un vector, retorna el valor máximo/mínimo. - Si a es una matriz, retorna máximo/mínimo de cada columna.
nanmax() ; nanmin ()
Descripción Devuelve los valores extremos de una determinada muestra ignorando aquellos datos perdidos.
median ()
MANEJO DE DATOS CON MATLAB
Análisis estadístico: Medidas de dispersión
std (a) - Si a es un vector, retorna la desviación
estándar de los valores. - Si a es una matriz,
retorna la desviación estándar de los valores por
columnas.
var (a)
range (a) - Si a es un vector, calcula el rango del
mismo. - Si a es una matriz, calcula el rango de
cada columna.
MANEJO DE DATOS CON MATLAB
Análisis estadístico: Medidas de dispersión
iqr (a) - Si a es un vector, calcula el rango
intercuartil del mismo. - Si a es una matriz, calcula
el rango intercuartil de cada columna.
prctile (a, p) - “p”, corresponde al percentil que se
busca, puede ser un vector o escalar - “a”, es la
muestra que se analiza, puede ser vector o matriz.
MANEJO DE DATOS CON MATLAB
Análisis estadístico: Medidas de dispersión
quantile (a, p, dim) - “p”, corresponde al quantil
que se busca, puede ser un vector o escalar y se
encuentra entre el rango [0 1] . - “a”, es la muestra
que se analiza, puede ser vector o matriz. - Su
comportamiento hasta este punto es igual a la
función prctile(). - Sin embargo el parámetro dim es
muy útil ya que nos permite buscar quantiles en
otras dimensione. dim=1, por columnas, dim=2, por
filas.
prctile( x , 50) = quantile (x, .50) = mediana
MANEJO DE DATOS CON MATLAB
Análisis estadístico: Medidas de distribución
skewness (a) - Si a es un vector, calcula la
oblicuidad de los valores. - Si a es una matriz,
calcula la oblicuidad de cada columna.
kurtosis (a) - Cuando a es un vector, calcula la
curtosis de los elementos del mismo. - Cuando a es
una matriz, calcula la curtosis para cada columna.
MANEJO DE DATOS CON MATLAB
Análisis estadístico
tabulate (a) - El parámetro a representa la
muestra, y solo puede ser un vector.
cov (a) - Cuando a es un vector, devuelve un valor
con la varianza del mismo. - Cuando a es una
matriz, cada columna es una observación y cada
columna una variable.
MANEJO DE DATOS CON MATLAB
Análisis estadístico
corr(a) - a debe ser una matriz, y devuelve un matriz de correlacion entre columnas.
corr(a,b) - Genera una matriz de correlación entre las dos matrices, las dimensiones de a deben ser iguales a las de b.
[R,P]= corrcoef (a) - Devuelve además una matriz con los valores p usados en las pruebas de hipótesis.
MANEJO DE DATOS CON MATLAB
Análisis estadístico
crosstab (col1 ,col2) - Se genera una matriz donde
el elemento (i,j) corresponde a la cuenta de todas
las observaciones donde col1=i y col2 =j.
grpstats (a, group) - Genera la media de cada
columna de a por grupo, el vector group define
como se agruparan los datos.
MANEJO DE DATOS CON MATLAB
Análisis estadístico
b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]
Del archivo denominado regresión realice un script titulado: e.
El cual que llame las funciones necesarias para obtener: media, media geométrica, mínimo, máximo, desviación estándar, varianza, asimetría, curtosis, mediana, cuartil 3, percentil 30 y rango de cada variable. Asimismo presente una matriz de correlaciones entre las variables, una tabla cruzada entre la antigüedad y el precio y calcule la media del precio por tamaño.