NUEVAS TECNOLOGIAS

69
FACULTAD DE INGENIERIA RED NACIONAL UNIVERSITARIA SYLLABUS GENÉRICO NUEVAS TECNOLOGÍAS Facultad de Ciencia y Tecnología Ingeniería de Sistemas NOVENO SEMESTRE 1

description

descricricion de contenido y practias de nuevas tecnologias udabol

Transcript of NUEVAS TECNOLOGIAS

Page 1: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

RED NACIONAL UNIVERSITARIA

SYLLABUS GENÉRICONUEVAS TECNOLOGÍAS

Facultad de Ciencia y Tecnología

Ingeniería de Sistemas

NOVENO SEMESTRE

Ing. Juan Carlos Alejo Quisbert

Gestión Académica I/2010

1

Page 2: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

UDABOLUNIVERSIDAD DE AQUINO BOLIVIA

Acreditada como PLENA mediante R. M. 288/01

VISION DE LA UNIVERSIDAD

Ser la Universidad líder en calidad educativa.

MISION DE LA UNIVERSIDAD

Desarrollar la Educación Superior Universitaria con calidad y competitividad al servicio de la

sociedad.

2

Page 3: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

SYLLABUS GENÉRICO

Asignatura: NUEVAS TECNOLOGIAS

Código: CMP 527

Requisito: CMP 517

Carga Horaria: 80 horasCréditos: 8

I. OBJETIVOS GENERALES DE LA ASIGNATURA.

Mostrar los adelantos tecnológicos y sus aplicaciones prácticas en situaciones reales, como instrumento para el logro de ventajas competitivas en las organizaciones.

Dotar al estudiante de conocimientos actuales y modernos que le permitan ingresar al mercado laboral con mayores expectativas y conocimientos.

II. PROGRAMA ANALÍTICO DE LA ASIGNATURA.

1. INTRODUCCIÓN2. INTERNET E INTRANETS

WEB SERVICES2.1. Introducción2.2.XML2.3.Protocolos

2.3.1. SOAP2.3.2. XML – RPC

2.4.WSDL2.5.UDDI2.6.Web – Securing2.7.Ventajas y Desventajas2.8.Razones para su uso

3

Page 4: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

2.9.Prácticas

3. SOA3.1.¿Qué es SOA?3.2.Tecnología SOA: Proveedores y categorías3.3.Estándares3.4.Gobierno SOA3.5.Open Source y SOA

4. BUSINESS INTELLIGENCE – DATA WAREHOUSE Y DATA MARTS4.1. Sistemas de Información

4.1.1. Sistemas Estratégicos4.1.2. Sistemas Tácticos4.1.3. Sistemas Técnico-Operativos4.1.4. Sistemas Interinstitucionales

4.2. Objetivo de los Sistemas de Apoyo a las Decisiones4.3. Características de un Data Warehouse4.4. Estructura del Data Warehouse 4.5. Ciclo de vida de un Data Warehouse4.6.Elementos Constituyentes de una Arquitectura Data Warehouse 4.7.Operaciones en un Data Warehouse4.8.Transformación de Datos y Metadata4.9.Tabla de Dimensiones4.10. Data Mart

5. OLAP, MOLAP Y ROLAP5.1.OLAP5.2.ROLAP5.3.MOLAP5.4.Data Mining

5.4.1. Técnicas de Data Mining5.4.2. Análisis estadistico5.4.3. Métodos basados en árboles de decisión

5.5.Modelaje5.5.1. Modelo Star Schema

5.5.1.1. Esquema Snowflake5.5.1.2. Esquema MultiStar

5.6.Prácticas generación DWH.

6. HERRAMIENTAS DE BASES DE DATOS MULTIDIMENSIONALES

4

Page 5: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

6.1.Microsoft SQL Server 2005, Oracle

III. BIBLIOGRAFÍA.

KIMBALL, R., “LifeCycle Toolkit for Data Warehuouse”

KENT, P. , “World Wide Web fácil”

DIAZ, J., “World Wide Web paso a paso”, 1997

BREEDLOVE, B., “Web desarrollo de aplicaciones”, 1995

ABBEY COREY, SLOLTZ KEVIN, “Oracle Guía del Aprendizaje, Redes de Computación, Todo acerca”

Hinricsd , “Intranets usos y Aplicaciones”

SYAN, “Internet y seguridad en redes”

YOURDON, “ISO 9000 Liderazgo Virtual”

IV. CONTROL DE EVALUACIONES

1° evaluación parcialFecha: A confirmarse Nota: 100 pts.

2° evaluación parcialFecha: A confirmarseNota: 100 pts.

Examen finalFecha: A confirmarseNota: 100 pts.

5

Page 6: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

V. PLANIFICACIÓN DE ACTIVIDADES

PLANIFICACIÓN DE ACTIVIDADES

MATERIA NUEVAS TECNOLOGÍAS

TURNO TRABAJO

SEMESTRE NOVENO

PARALELO A

DOCENTE ING. JUAN CARLOS ALEJO QUISBERT

OBJETIVO DE LA ASIGNATURA (PLAN DE ESTUDIOS)Mostrar los adelantos tecnológicos y sus aplicaciones prácticas en situaciones reales como instrumento para el logro de ventajas competitivas en las organizaciones.Dotar al estudiante de conocimientos actuales y modernos que le permitan ingresar al mercado laboral con mayores expectativas y conocimientos.

CONTENIDO MÍNIMO CONTENIDO ANALÍTICO ACTIVIDAD PERIODOS ACADÉMICOS

RECURSOS DIDÁCTICOS

INTRODUCCIÓN Introducción a las nuevas tecnologías Clase magistral 2 Pizarra

INTERNET E INTRANETS WEB SERVICES2.1. Introducción2.2. XML2.3. Protocolos2.3.1. SOAP2.3.2. XML – RPC2.4. WSDL2.5. UDDI2.6. Web – Securing2.7. Ventajas y Desventajas2.8. Razones para su uso2.9. Prácticas

Clase magistral, grupos colaborativos de trabajoInvestigación CICC

8 pizarra dinámicas de grupo

SOA 3.1. ¿Qué es SOA?3.2. Tecnología SOA: Proveedores y categorías3.3. Estándares3.4. Gobierno SOA3.5. Open Source y SOA

Clase magistral, grupos colaborativos de trabajo

6 Pizarra, Dinámicas de grupo, computadoras

Primera Evaluación Parcial

2 Evaluación Impresa

BUSINESS INTELLIGENCE – DATA WAREHOUSE Y DATA MARTS

4.1. Sistemas de Información4.1.1. Sistemas Estratégicos4.1.2. Sistemas Tácticos4.1.3. Sistemas Técnico-Operativos

Clase magistral, Grupos ColaborativosBrigadaTeam Teaching

30 Dinámicas de grupo, computadoras

6

Page 7: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

4.1.4. Sistemas Interinstitucionales4.2. Objetivo de los Sistemas de Apoyo a las Decisiones4.3. Características de un Data Warehouse4.4. Estructura del Data Warehouse 4.5. Ciclo de vida de un Data Warehouse4.6. Elementos Constituyentes de una Arquitectura Data Warehouse 4.7. Operaciones en un Data Warehouse4.8. Transformación de Datos y Metadata4.9. Tabla de Dimensiones4.10. Data Mart

Investigación CICC

Segunda Evaluación Parcial

2 Evaluación Impresa

OLAP, MOLAP Y ROLAP 5.1. OLAP5.2. ROLAP5.3. MOLAP5.4. Data Mining5.4.1. Técnicas de Data Mining5.4.2. Análisis estadistico5.4.3. Métodos basados en árboles de decisión5.5. Modelaje5.5.1. Modelo Star Schema5.5.1.1. Esquema Snowflake5.5.1.2. Esquema MultiStar5.6. Prácticas generación DWH.

Grupos Colaborativos

8 Dinámicas de grupo, computadoras

HERRAMIENTAS DE BASES DE DATOS MULTIDIMENSIONALES

Microsoft SQL Server 2005, Oracle Grupos Colaborativos

18 Dinámicas de grupo, computadoras

Evaluación Final 2 Evaluación Impresa

Segundo Turno 2 Evaluación Impresa

TOTAL 80

7

Page 8: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

VI. Cronograma de Extensión

1. BRIGADASLugar: Fecha: Descripción: La brigada se realizara en forma interna, enseñando sobre Nuevas Tecnologías de Información y Comunicación.

2. Team TeachingLugar: Fecha: Invitado: Se invitará un experto en desarrollo de aplicaciones WEB con la implementación de nuevas tecnologías.Descripción: El invitado dará una conferencia sobre los beneficios de JQuery y AJAX en la web.

MATERIA TURNO FECHANOMBRE

DEL INVITADO

CARGO LUGAR DE TRABAJO

FECHA DE NACIMIENTO TELÉFONO CELULAR GRADO

ACADÉMICO

TEMÁTICA DE LA

EXPOSICIÓN

                     

APUNTES

8

Page 9: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

WORK PAPER # 1

PROGRAMA DE CONTROL DE CALIDAD

No. DE PROCEDIMIENTO: No. DE HOJAS :

ELABORÓ: CÓDIGO:

TÍTULO DEL WORK PAPER: XML PARA WWW

DPTO.: Facultad de Ciencia y Tecnología

DESTINADO A:

DOCENTES ALUMNOS X ADMINIST. OTROS

OBSERVACIONES: Asignatura: Nuevas Tecnologías

FECHA DE DIFUSIÓN:

FECHA DE ENTREGA:

9

Page 10: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

XML PARA WWW

XML es un metalenguaje: es un lenguaje para definir lenguajes. Los elementos que lo componen pueden dar información sobre lo que contienen, no necesariamente sobre su estructura física o presentación, como ocurre en HTML.

Usando SGML, por otro lado, se definió precisamente el HTML, el lenguaje que nos es tan conocido. Entonces, ¿cuál es la diferencia entre ambos?

En una primera aproximación se puede decir que mediante XML también podríamos definir el HTML De hecho, HTML es simplemente un lenguaje, mientras que XML como se ha dicho es un metalenguaje, esto es, un lenguaje para definir lenguajes. Y esa es la diferencia fundamental, de la que derivan todas las demás, que iremos viendo a lo largo del documento.

TIPOS DE DOCUMENTOS XML

Bien formados: son todos los que cumplen las especificaciones del lenguaje respecto a las reglas sintácticas que después se van a explicar, sin estar sujetos a unos elementos fijados en un DTD (luego veremos lo que es un DTD). De hecho los documentos XML deben tener una estructura jerárquica muy estricta, de la que se hablará más tarde, y los documentos bien formados deben cumplirla.

Válidos: Además de estar bien formados, siguen una estructura y una semántica determinada por un DTD: sus elementos y sobre todo la estructura jerárquica que define el DTD, además de los atributos, deben ajustarse a lo que el DTD dicte.

Y ahora, ¿qué pinta tiene un documento XML? Aquí podemos ver uno muy sencillo, que iremos estudiando para ver las características del lenguaje:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?><ficha> <nombre>Angel</nombre> <apellido>Barbero</apellido> <direccion>c/Ulises, 36</direccion></ficha>

Lo primero que tenemos que observar es la primera línea. Con ella deben empezar todos los documentos XML, ya que es la que indica que lo que la sigue es XML. Aunque es opcional, es

10

Page 11: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

más que recomendable incluirla siempre. Puede tener varios atributos (los campos que van dentro de la declaración), algunos obligatorios y otros no:

version: indica la versión de XML usada en el documento. La actual es la versión 1.0, con lo que no debe haber mucho problema. Es obligatorio ponerlo, a no ser que sea un documento externo a otro que ya lo incluía (ya veremos qué documentos externos puede haber).

encoding: la forma en que se ha codificado el documento. Se puede poner cualquiera, y depende del parser el entender o no la codificación. Por defecto es UTF-8, aunque podrían ponerse otras, como UTF-16, US-ASCII, ISO-8859-1, etc. No es obligatorio salvo que sea un documento externo a otro principal.

standalone: indica si el documento va acompañado de un DTD (``no''), o no lo necesita (``yes''); en principio no hay porqué ponerlo, porque luego se indica el DTD si se necesita.

En cuanto a la sintáxis del documento, y antes de entrar en el estudio de las etiquetas, hay que resaltar algunos detalles importantes y a los que nos debemos acostumbrar:

Los documentos XML son sensibles a mayúsculas, esto es, en ellos se diferencia las mayúsculas de las minúsculas. Por ello <FICHA> sería una etiqueta diferente a <ficha>.

Además todos los espacios y retornos de carro se tienen en cuenta (dentro de las etiquetas, en los elementos).

Hay algunos caracteres especiales reservados, que forman parte de la sintáxis de XML: <, >, &, " y '. En su lugar cuando queramos representarlos deberemos usar las entidades &lt;, &rt;, &amp;, &quot; y &apos; respectivamente. Más adelante hablaré de las entidades y lo que son, pero baste saber ahora que si escribimos cualquiera de las secuencias anteriores equivaldrá a los correspondientes caracteres citados.

Los valores de los atributos de todas las etiquetas deben ir siempre entrecomillados. Son válidas las dobles comillas (") y la comilla simple (').

Pasando al contenido en sí, vemos etiquetas que nos recuerdan a HTML, y que contienen los datos. Es importante diferenciar entre elementos y etiquetas: los elementos son las entidades en sí, lo que tiene contenido, mientras que las etiquetas sólo describen a los elementos. Un documento XML está compuesto por elementos, y en su sintáxis éstos se nombran mediante etiquetas.

Hay dos tipos de elementos: los vacíos y los no vacíos. Hay varias consideraciones importantes a tener en cuenta al respecto:

11

Page 12: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

Toda etiqueta no vacía debe tener una etiqueta de cerrado: debe estar seguida de . Esto se hace para evitar la aberración (en el buen sentido de la palabra) a la que habían llegado todos los navegadores HTML de permitir que las etiquetas no se cerraran, lo que deja los elementos sujetos a posibles errores de interpretación.

Todos los elementos deben estar perfectamente anidados: no es válido poner: <ficha><nombre>Angel</ficha></nombre>

y sí lo es sin embargo:

<ficha><nombre>Angel</nombre></ficha> Los elementos vacios son aquellos que no tienen contenido dentro del documento. Un

ejemplo en HTML son las imágenes. La sintáxis correcta para estos elementos implica que la etiqueta tenga siempre esta forma: <etiqueta/>

Hasta aquí la sintáxis de XML resumida. Aunque la especificación entera es más prolija en cuanto a detalles sintácticos, codificaciones, etc., creo que no hace falta extenderse mucho en ello, ya que realmente ``el movimiento se demuestra andando'', y será en la práctica cuando veamos los posibles problemas que se pueden plantear. Ahora quedan por ver otros aspectos, el más prioritario, los DTD.

3. DTD: Definición de Tipos de Documento

Como antes se comentó, los documentos XML pueden ser válidos o bien formados (o no serlo, claro, pero entonces no serían documentos XML :-). En cuanto a los válidos, ya sabemos que su gramática está definida en los DTD.

Pues bien, los DTD no son más que definiciones de los elementos que puede incluir un documento XML, de la forma en que deben hacerlo (qué elementos van dentro de otros) y los atributos que se les puede dar. Normalmente la gramática de un lenguaje se define mediante notación EBNF; si alguno la conoce, se habrá dado cuenta de que es bastante engorrosa. Pues el DTD hace lo mismo pero de un modo más intuitivo.

Hay varios modos de referenciar un DTD en un documento XML:

Incluir dentro del documento una referencia al documento DTD en forma de URI (Universal Resource Identifier, o identificador universal de recursos) y mediante la siguiente sintáxis:

<!DOCTYPE ficha SYSTEM "http://www.dat.etsit.upm.es/~abarbero/DTD/ficha.dtd">

12

Page 13: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

En este caso la palabra SYSTEM indica que el DTD se obtendrá a partir de un elemento externo al documento e indicado por el URI que lo sigue, por supuesto entrecomillado.

Luego el documento ficha.dtd será:

<!ELEMENT ficha (nombre+, apellido+, direccion+, foto?)><!ELEMENT nombre (#PCDATA)><!ATTLIST nombre sexo (masculino|femenino) #IMPLIED><!ELEMENT apellido (#PCDATA)><!ELEMENT direccion (#PCDATA)><!ELEMENT foto EMPTY> O bien incluir dentro del propio documento el DTD de este modo:

<?xml version="1.0"?><!DOCTYPE ficha [<!ELEMENT ficha (nombre+, apellido+, direccion+, foto?)><!ELEMENT nombre (#PCDATA)><!ATTLIST nombre sexo (masculino|femenino) #IMPLIED><!ELEMENT apellido (#PCDATA)><!ELEMENT direccion (#PCDATA)><!ELEMENT foto EMPTY>]><ficha><nombre>Angel</nombre><apellido>Barbero</apellido><direccion>c/Ulises, 36</direccion></ficha>

La forma de incluir el DTD directamente como en este ejemplo pasa por añadir a la declaración <!DOCTYPE y después del nombre del nombre del tipo de documento, en vez de la URI del DTD, el propio DTD entre los símbolos '[' y ']'. Todo lo que hay entre ellos será considerado parte del DTD.

En cuanto a la definición de los elementos, es bastante intuitiva: después de la cláusula <!ELEMENT se incluye el nombre del elemento (el que luego se indicara en la etiqueta), y después diferentes cosas en función del elemento:

entre paréntesis, si el elemento es no vacío, se indica el contenido que puede tener el elemento: la lista de elementos hijos o que descienden de él si los tiene, separados por

13

Page 14: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

comas; o el tipo de contenido, normalmente #PCDATA, que indica datos de tipo texto, que son los más habituales.

si es un elemento vacío, se indica con la palabra EMPTY.

Ejemplos de cada caso se pueden ver en el DTD de muestra.

A la hora de indicar los elementos descendientes (los que están entre paréntesis) vemos que van seguidos de unos caracteres especiales: '+', '*', '?' y '|'. Sirven para indicar qué tipo de uso se permite hacer de esos elementos dentro del documento:

+: uso obligatorio y múltiple; permite uno o más elementos de ese tipo dentro del elemento padre, pero como mínimo uno.

*: opcional y múltiple; puede no haber ninguna ocurrencia, una o varias. ?: opcional pero singular; puede no haber ninguno o como mucho uno. |: equivale a un OR, es decir, da la opción de usar un elemento de entre los que forman la

expresión, y solo uno.

De este modo, si por ejemplo encontramos en un DTD la siguiente declaración:

<!ELEMENT ficha (nombre+, apellido+, direccion*, foto?, telefono*|fax*)>

sabremos del elemento ficha que puede contener los siguientes elementos: un nombre y un apellido como mínimo, pero puede tener más de uno de cada; opcionalmente puede incluirse una o varias direcciones, pero no es obligatorio; opcionalmente también se puede incluir una única foto; y por fin, pueden incluirse, aunque no es obligatorio en ninguno de los dos casos, uno o más teléfonos o uno o más números de fax.

Para la definición de los atributos, se usa la declaración <!ATTLIST, seguida de:

el nombre de elemento del que estamos declarando los atributos; el nombre del atributo; los posibles valores del atributo, entre paréntesis y separados por el carácter |, que al

igual que para los elementos, significa que el atributo puede tener uno y sólo uno de los valores incluidos entre paréntesis. O bien, si no hay valores de finidos, se escribe CDATA para indicar que puede ser cualquier valor (alfanumérico, vamos). También podemos indicar con la declaración ID que el valor alfanumérico que se le de será único en el documento, y se podrá referenciar ese elemento a través de ese atributo y valor;

14

Page 15: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

de forma opcional y entrecomillado, un valor por defecto del atributo si no se incluye otro en la declaración;

por último, si es obligatorio cada vez que se usa el elemento en cuestión declarar este atributo, es necesario declararlo con la clausula #REQUIRED; si no lo es, se debe poner #IMPLIED, o bien #FIXED si el valor de dicho atributo se debe mantener fijo a lo largo de todo el documento para todos los elementos del mismo tipo (notar que no es lo mismo esto a lo que significaba ID).

Es importante destacar un aspecto de cara a la optimización del diseño de nuestros DTDs: muchas veces tendremos que decidir entre especificar atributos de nuestros elementos como elementos descendientes o como atributos en sí mismos. Esto es, podríamos suponer una pieza de maquinaria con unas características determinadas, y de la que podemos hablar de dos formas diferentes:

<pieza>MiPieza <color>Rojo</color></pieza>

o bien considerar la opción: <pieza color="Rojo">Mipieza</pieza>

¿Qué diferencia habría entre ambos? Queda a discreción del diseñador el decidir entra ambas.

CUESTIONARIO

1. Que diferencia existe entre XML y HTML?2. Mencione tres características básicas de XML

3. Explique la diferencia entre un documento XML válido y el bien formado

4. Qué es un DTD?

5. Es lo mismo elemento y atiqueta?

6. Proporcione un ejemplo de elemento

15

Page 16: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

7. Explique el significado de PCDATA

8. Proporcione un ejemplo de atributo

9. Explique la función de #REQUIRED y IMPLIED

10. ¿Cuál es la función de los comodines: *, + y ?

16

Page 17: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

WORK PAPER # 2

PROGRAMA DE CONTROL DE CALIDAD

No. DE PROCEDIMIENTO: No. DE HOJAS :

ELABORÓ: CÓDIGO:

TÍTULO DEL WORK PAPER: Esquemas XML

DPTO.: Facultad de Ciencia y Tecnología

DESTINADO A:

DOCENTES ALUMNOS X ADMINIST. OTROS

OBSERVACIONES: Asignatura: Nuevas Tecnologías

FECHA DE DIFUSIÓN:

FECHA DE ENTREGA:

17

Page 18: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

ESQUEMAS XML (XML SCHEME)

Los Esquemas XML (auspiciado por Microsoft y por otras empresas de la industria XML) utilizan una sintaxis parecida a la del XML para describir los documentos. Además, el Esquema XML permite especificar los tipos de elemento que contiene el documento (a través de XML-Data). Por otro lado, es más fácil leer, entender y crear un Esquema XML que un DTD.

<schema name="esquema" xmlns="urn:schemas-microsoft-com:xml-data"> <ElementType name="persona" content="textOnly"> <ElementType name="nombre" content="textOnly"/> <ElementType name="apellidos" content="textOnly"/> <ElementType name="empresa" content="textOnly"/> <ElementType name="telefono" content="textOnly"/> <ElementType name="web" content="textOnly"/> <element type="nombre" minOccurs="1" maxOccurs="1" /> <element type="apellidos" minOccurs="1" maxOccurs="2" /> </ElementType> </schema>

Esquemas XML vs DTDs

Ventajas sobre las DTDs: o Restricciones más precisas sobre los documentos XML (tanto en estructura

como en tipos de datos). o Son documentos XML, por lo que la sintaxis es familiar y las herramientas los

pueden manejar sin técnicas especiales (no como las DTDs). o Soporte para espacios de nombres. o Permiten definir elementos globales y locales (las DTDs sólo globales).

Desventajas sobre las DTDs: o Más complejos. Esto causa:

Dificultades en su comprensión por humanos, sobre todo si están acostumbrados a las DTDs.

Herramientas más grandes y lentas.o Muchas aplicaciones funcionan ya sobre DTDs existentes (la conversión es

posible pero llevará un tiempo). o Se trata de una especificación muy reciente, por lo que el soporte por parte de

muchas herramientas aún está en proceso.

Ejemplo

18

Page 19: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

Pasemos a esquema XML esta sencilla DTD:

<!ELEMENT Libreria (Libro)+><!ELEMENT Libro (Titulo, Autor+, Fecha, ISBN)><!ELEMENT Titulo (#PCDATA)><!ELEMENT Autor (#PCDATA)><!ELEMENT Fecha (#PCDATA)><!ELEMENT ISBN (#PCDATA)>

Un esquema XML equivalente:

<?xml version="1.0"?><xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" targetNamespace="http://www.libros.org" xmlns="http://www.libros.org" elementFormDefault="qualified"> <xs:element name="Libreria" type="TipoLibreria"/> <xs:complexType name="TipoLibreria"> <xs:sequence> <xs:element name="Libro" type="TipoLibro" maxOccurs="unbounded"/> </xs:sequence> </xs:complexType> <xs:complexType name="TipoLibro"> <xs:sequence> <xs:element name="Titulo" type="xs:string"/> <xs:element name="Autor" type="xs:string" maxOccurs="3"/> <xs:element name="Fecha" type="xs:string"/> <xs:element name="ISBN" type="xs:string"/> </xs:sequence> </xs:complexType></xs:schema>

Características

Observar que, a diferencia de la DTD, es XML. Observar cómo los elementos más generales referencian a los más concretos, hasta

llegar a los más básicos. No es la única forma de hacerlo. minOccurs y maxOccurs por defecto valen 1. Observar cómo definimos los elementos básicos como de tipo string.

19

Page 20: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

Los elementos vacíos se definen con un complexType sin elementos.

Espacios de nombres

Hay múltiples espacios de nombres involucrados en un esquema: o Para los elementos del propio esquema (xmlns:xs). o Para los elementos a restringir (targetNamespace). o Para los elementos referenciados con el atributo ref (xmlns), se verá un

ejemplo al final. El atributo elementFormDefault sirve para exigir que al usar el esquema desde un

documento los elementos se asocien con el targetNamespace del esquema.

Uso desde un documento

Este es un pequeño documento XML que utiliza el esquema:

<?xml version="1.0"?><Libreria xmlns="http://www.libros.org" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.libros.org libreria.xsd"> <Libro> <Titulo>My Life and Times</Titulo> <Autor>Paul McCartney</Autor> <Autor>Phil McCartney</Autor> <Fecha>July, 1998</Fecha> <ISBN>94303-12021-43892</ISBN> </Libro> ...</Libreria>

Más estructuras

Otras posibilidades de estructura, además de sequence: o choice: Para alternativas. o all: Para conjuntos de elementos en los que no importa el orden.

Las tres estructuras pueden tener maxOccurs (en all el máximo es 1) y minOccurs

Tipos

20

Page 21: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

En un esquema XML se pueden utilizar tipos para los elementos y atributos, de forma similar a cualquier lenguaje de programación.

Existen una serie de tipos predefinidos, algunos ejemplos: o string o boolean (true-false) o integer o positiveInteger (desde 1) o decimal (7.08) o time (hh:mm:ss) o date (YYYY-MM-DD) o anyURI (http://www.web.com) o ID y NMTOKEN (ver DTDs)

Es posible crear nuevos tipos de datos a partir de los existentes, imponiendo restricciones a éstos:

<xs:simpleType name="TipoColores"> <xs:restriction base="xs:string"> <xs:enumeration value="rojo"/> <xs:enumeration value="blanco"/> <xs:enumeration value="azul"/> </xs:restriction></xs:simpleType>

<xs:simpleType name="TipoEdad"> <xs:restriction base="xs:integer"> <xs:minInclusive value="18"/> <xs:maxInclusive value="65"/> </xs:restriction></xs:simpleType>

enumeration, minInclusive y maxInclusive son algunos ejemplos de facetas, hay muchas más.

Atributos

Veamos cómo se tratan los atributos de los elementos. Dado el siguiente fragmento de DTD:

<!ELEMENT Libro (Titulo, Autor+, Fecha, ISBN)>21

Page 22: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

<!ATTLIST Libro Categoria (biografia | ensayo | ficcion) #REQUIREDDisponible (true | false) "false"Corrector CDATA "">

Resulta el siguiente fragmento de esquema XML:

<xs:complexType name="TipoLibro"> <xs:sequence> <xs:element name="Titulo" type="xs:string"/> <xs:element name="Autor" type="xs:string" maxOccurs="3"/> <xs:element name="Fecha" type="xs:string"/> <xs:element name="ISBN" type="xs:string"/> </xs:sequence> <xs:attribute name="categoria" type="TipoCat" use="required"/> <xs:attribute name="disponible" type="xs:boolean" default="false"/> <xs:attribute name="corrector" type="xs:string" default=""/> </xs:complexType><xs:simpleType name="TipoCat"> <xs:restriction base="xs:string"> <xs:enumeration value="biografia"/> <xs:enumeration value="ensayo"/> <xs:enumeration value="ficcion"/></xs:restriction></xs:simpleType>

Si un elemento tiene contenido simple y atributos (por ejemplo: <elem atr=h4>678</elem>), se restringe así:

<xs:element name="elem"> <xs:complexType> <xs:simpleContent> <xs:extension base="xs:integer"> <xs:attribute name="atr" type="xs:string" use="required"/> </xs:extension> </xs:simpleContent> </xs:complexType></xs:element>

22

Page 23: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

Importar esquemas

Cuando se deben restringir varios espacios de nombre, cada espacio se restringe en un esquema, y desde el principal se importan los demás:

<xs:import schemaLocation="------.xsd"/>

CUESTIONARIO1. ¿Qué es un esquema XML?2. ¿Qué diferencias existen entre un DTD y un Esquema XML?3. ¿Qué es un espacio de nombres?4. Proporcione un ejemplo de definición de elementos 5. Defina un lenguaje en XML para estructurar un Base de Datos de Hojas de Vida, para

ésto

a) Considere lo siguientes datos de los profesionales:Datos personales

Nombre Fecha de Nacimiento (día,mes y año) Carnet de Identidad Teléfono (Puede repetirse 0 o más veces) considere el atributo tipo= móvil,

fijo, trabajo, domicilio Dirección (Solo una) Email (obligatorio)

Datos académicos Secundaria (institución, año) Pregrado (institución, carrera, año ingreso, año de egreso) Postgrado (título obtenido, año ingreso, año de egreso,), considere en este

el atributo nivel: diplomado, maestría, doctoradoOtros estudios (nombre del curso, institución, año), considere el atributo tipo: seminario, congreso, taller, etc.Experiencia de trabajo (institución, cargo, fecha inicio, fecha conclusión)

b) Grafique el esquema jerárquico c) Realice un ejemplo de definición de un elemento compuesto y de un elemento

simple en un DTD o en un XML Schema, de acuerdo a su esquema jerárquicod) Proporcione un ejemplo de aplicación con sus respectivas etiquetas (documento

XML)

23

Page 24: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

WORK PAPER # 3

PROGRAMA DE CONTROL DE CALIDAD

No. DE PROCEDIMIENTO: No. DE HOJAS :

ELABORÓ: CÓDIGO:

TÍTULO DEL WORK PAPER: Data Warehouse y Data marts

24

Page 25: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

DPTO.: Facultad de Ciencia y Tecnología

DESTINADO A:

DOCENTES ALUMNOS X ADMINIST. OTROS

OBSERVACIONES: Asignatura: Nuevas Tecnologías

FECHA DE DIFUSIÓN:

FECHA DE ENTREGA:

DATAWARE HOUSE Y DATA MARTS

Introducción

Hoy en día toda empresa necesita depositar mucha confianza en la toma de decisiones sobre los negocios, para tomar dichas decisiones requerimos hechos y cifras, sabemos que la competencia crece en todo momento entonces las decisiones que debemos tomar en nuestra empresa deben ser mas aceleradas; pero que pasa si tenemos una montaña de información la cual debe ser analizada, lógicamente pensamos que necesitaríamos mucho tiempo.

Por ese motivo se requieren herramientas que nos ayuden a minimizar el tiempo para analizar mucha información con mayor velocidad y precisión; utilizando dichas herramientas logramos mantenernos competitivos, ya que nuestros negocios deben reaccionar al cambio del mercado. De otro modo el mercado globalizado, la presión inmensa de la competencia, los arranques tecnológicos, etc. Debilitaran nuestra empresa. Esto nos muestra que las empresas invierten en tecnología y soluciones con las cuales se mantienen en este mundo cambiante, ahora las empresas no dependen tan solo de factores como ubicación, productos, etc. Sino también del conocimiento. Tal conocimiento basado en información comprensible, detallada y relevante es crucial para lograr y sostener ventaja competitiva. El poseer conocimientos correctos significa

25

Page 26: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

tener respuestas correctas y realizar decisiones estratégicas para la ejecución de la empresa. Pero las tareas de recolectar, procesar, limpiar y transformar la información necesaria para la toma de decisiones no es una tarea sencilla mas si consideramos que una empresa tiene distintas áreas que a veces se encuentran alejadas de los ejecutivos de negocios.

El Componente de Bussines Intelligence que resuelve este caos de los datos es el Data Warehouse.

El Data Warehouse es un conjunto de procesos y acciones, es una colección de datos orientados a un tema, integrados y no volátiles en el soporte al proceso de toma de decisiones de la gerencia.

Data Warehouse

¿Qué es Data Warehousing?

En la actualidad hay una importante cantidad de confusión respecto a lo que es un Data Warehouse que, afortunadamente, está comenzando a despejarse. No obstante, parece que cada proveedor de un producto o servicio relacionado con tecnología informática tiene su definición y, lo que es peor, en su propia jerga no siempre comprensible.

Algunos llaman a Datawahouse Business Intelligence or Decision Support en realidad es considerada la solución integral y oportuna para desarrollar negocio el Datawarehouse se caracteriza por ser:

Integrado - Temático - Histórico - No volatil

Definición :

Es un proceso, no un producto. Es una técnica para consolidar y administrar datos de variadas fuentes con el propósito de responder preguntas de negocios y tomar decisiones, de una forma que no era posible hasta ahora.

Consolidar datos desde una variedad de fuentes. Dentro del marco conceptual de Data Warehousing los agruparemos dentro del proceso de Transformación de Datos.

Manejar grandes volúmenes de datos de una forma que no era posible, o no era costo efectiva. A estos medios los agruparemos en Procesamiento y Administración de Datos.

26

Page 27: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

Acceder a los datos de una forma más directa, en "el lenguaje del negocio", y analizarlos para obtener relaciones complejas entre los mismos. Estos procesos se engloban en dos categorías que serán explicadas más adelante: Acceso a los Datos y Descubrimiento o Data Mining.

Estos desarrollos tecnológicos, correctamente organizados e interrelacionados, constituyen lo que se ha dado en llamar un Data Warehouse o Bodega de Datos. Veamos un poco más en detalle los grupos mencionados.

Existen muchas definiciones para el DW, la más conocida fue propuesta por Inmon[MicroSt96] (considerado el padre de las Bases de Datos) en 1992: "Un DW es una colección de datos orientados a temas, integrados, no-volátiles y variante en el tiempo, organizados para soportar necesidades empresariales". En 1993, Susan Osterfeldt[MicroSt96] publica una definición que sin duda acierta en la clave del DW: "Yo considero al DW como algo que provee dos beneficios empresariales reales: Integración y Acceso de datos. DW elimina una gran cantidad de datos inútiles y no deseados, como también el procesamiento desde el ambiente operacional clásico".

Data Marts

Es un pequeños Data Warehouse, para un determinado numero de usuarios, para un arrea funcional, especifica de la compañía. También podemos definir que un Data Martes es un subconjunto de una bodega de datos para un propósito especifico.

Su función es apoyar a otros sistemas para la toma de decisiones.

Los procesos que conforma el datawarehouse son:

1-Extraccion 2-Elaboración 3-Carga 4-Explotacion

27

Page 28: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

Componentes del Data Warehouse

Diagrama de Funcionamiento

28

Page 29: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

¿Cómo trabaja el Data Warehouse?

Extrae la información operacional. Transforma la operación a formatos consistentes. Automatiza las tareas de la información para prepararla a un análisis eficiente.

¿En quê podemos usarlo?

Manejo de relaciones de marketing. Análisis de rentabilidad. Reducción de costos.

29

Page 30: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

Busines Intelligence se ha vuelto una necesidad en el vertiginoso ritmo del ambiente de negocios actual. Los negocios necesitan aprovechar las posibilidades que les ofrece la actual tecnología para permanecer competitivos y rentables

CUESTIONARIO

1. Cuál es el objetivo de un Data Warehouse?2. Explique brevemente qué es un Data Warehouse3. Explique brevemente qué es un Data Mart4. Explique la diferencia entre un Data Warehouse y un Data Mart5. Qué procesos forman parte en un Data Warehouse6. Explique brevemente el proceso que realiza un Data Warehouse

30

Page 31: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

WORK PAPER # 3

PROGRAMA DE CONTROL DE CALIDAD

No. DE PROCEDIMIENTO: No. DE HOJAS :

ELABORÓ: CÓDIGO:

TÍTULO DEL WORK PAPER: OLAP

DPTO.: Facultad de Ciencia y Tecnología

DESTINADO A:

DOCENTES ALUMNOS X ADMINIST. OTROS

OBSERVACIONES: Asignatura: Nuevas Tecnologías

FECHA DE DIFUSIÓN:

FECHA DE ENTREGA:

31

Page 32: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

OLAP

Es un sinónimo de base de datos multidimensional mediante las cuales se proveen una tecnología para el cálculo y análisis requerido por las aplicaciones analíticas para el "Bussines Intellingence", las bases de datos relacionadas están formadas por un conjunto de registros. Cada registro contiene la información organizada en campos.

El OLAP describe la tecnología asociada al acceso y análisis de datos en líneas.

Sistemas De Data Warehouse Y Oltp

Una base de datos para soportar procesos transaccionales en línea (OLTP), puede no ser adecuada para el Data Warehouse ya que ha sido diseñada para maximizar la capacidad transaccional de sus datos y tipicamente tiene cientos de tablas la gran mayoría normalizadas. Su diseño también ha sido condicionado por los procesos operacionales que deberá soportar para la óptima actualización de sus datos, normalmente muchas de sus tablas en constantes y continuos cambios. Los sistemas Data Warehouse están orientados a procesos de consultas en contraposición con los procesos transaccionales.

OLTPData WarehousePropósitoEjecuta operaciones transaccionales diariamenteConsultas y análisis para la obtención de informaciónEstructuraSistemas de bases de datos relacionalesNormalmente sistemas de bases de datos relacionalesModelo de datosNormalizadoMuchas de sus tablas pueden no estar normalizadas se admite redundancia en los datos. Bases de datos multidimensionales.AccesoSQLSQL más extensiones especiales dependientes de las herramientas de explotación de datos (Data Mining)

No obstante, el SQL estándar puede ser suficiente en manos de personal experto.Tipo de datosLos datos están orientados a la gestión de los negociosLos datos están orientados al análisis de los negocios.

Transforman los datos en información para su análisis. Perdurabilidad Los datos cambian constantemente, vistos globalmente en procesos de reporting sofisticados pueden perder consistencia, o bien, para no perder consistencia deben imponerse mecanismos de bloqueo de datos con un elevado consumo de recursos globales del sistema.Datos históricos con referencias temporales no sujetos a modificaciones.

Características

32

Page 33: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

De acuerdo con Bill Inmon, autor de Building the Data Warehouse Construyendo el almacén de datos, ampliamante reconocido como el gurú creador del concepto data warehousing, existen generalmente cuatro características que describen un almaceén de datos:

1.orientado al sujeto:

Los datos se organizan de acuerdo al sujeto en vez de la aplicación, por ejemplo, una compañia de seguros usando un almacén de datos podría organizar sus datos por cliente, premios, y reclamaciones, en lugar de por diferentes productos (automóviles, vida, etc.). Los datos organizados por sujetos contienen solo la información necesaria para los procesos de soporte para la toma de decisiones.

2.integrados:

Cuando los datos residen en muchas aplicaciones separados por los distintos entornos operacionales, la descodificación de los datos es a menudo inconsistente. Por ejemplo, en una aplicación, la palabra gender podría codificarse como "m" y "f" en otra como "0" y "1". cuando los datos fluyen de un entorno operacional a un entorno de almaceén de datos o de data warehouse, ellos asumen una codificación consistente, por ejemplo gender siempre se transformaría a "m" y "f".

3.variación-temporal:

El almaceén de datos contiene un lugar para guardar datos con una antiguedad de 5 a diez años, o incluso más antiguos, para poder ser usados en comparaciones, tendencias y previsiones. Estos datos no se modificarán.

4. No son inestables:

Los datos no serán modificados o cambiados de ninguna manera una vez ellos han sido introducidos en el almacén de datos, solamente podrán ser cargados, leidos y/o accedidos.

33

Page 34: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

CUESTIONARIO

1. Qué es OLAP?2. Qué es OLTP? 3. Averigue el objetivo de Molap y Rolap 4. Decriba la relación entre OLAP y un Data Warehouse5. Decriba la relación entre MOLAP y un Data Warehouse6. Decriba la relación entre ROLAP y un Data Warehouse7. Esplique brevemente las características de un almacen de datos

34

Page 35: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

WORK PAPER # 4

PROGRAMA DE CONTROL DE CALIDAD

No. DE PROCEDIMIENTO: No. DE HOJAS :

ELABORÓ: CÓDIGO:

TÍTULO DEL WORK PAPER: Data Mining

DPTO.: Facultad de Ciencia y Tecnología

DESTINADO A:

DOCENTES ALUMNOS X ADMINIST. OTROS

OBSERVACIONES: Asignatura: Nuevas Tecnologías

FECHA DE DIFUSIÓN:

FECHA DE ENTREGA:

35

Page 36: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

DATA MINING

En este sentido un sistema Datamining es una tecnología de soporte para usuario final, cuyo objetivo es extraer conocimiento útil y utilizable a partir de la información contenida en las bases de datos de las empresas.

Los objetivos de un sistema Datamining nos permitiría analizar factores de influencia en determinados procesos, predecir o estimar variables o comportamientos futuros, sementar o agrupar ítems similares, además de obtener secuencias de eventos que provocan comportamientos específicos.

Los sistemas Datamining se desarrollan bajo lenguajes de ultima generación basados en la inteligencia artificial y utilizando métodos matemáticos, tales como:

Redes euronales Introducción de reglas Arboles de decisión Conjunto de reglas por clase

Soporta tambien sofisticadas operaciones de análisis tales como los sistemas Scoring y aplicaciones de detección de fraude

CUESTIONARIO

1. Explique el objetivo de Data Mining2. Explique la relación entre Data MIning y Data Warehouse3. Investique los métodos y técnicas que utiliza Data Mining:

Redes NeuronalesIntroducción de reglasArboles de decisiónAlgoritmos GeneticosLogica Difusa

36

Page 37: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

PROGRAMA DE CALIDAD UDABOLDIF – 001

HOJAS DE ESTILO PARA XML: XSL

Aunque se ha establecido un modo para que podamos usar hojas de estilo CSS (Cascade Style Sheets) dentro de documentos XML, es lógico pensar que para aprovechar las características del nuevo lenguaje hace falta tener un estándar paralelo y similar asociado a él. De este modo en el W3C están trabajando sobre la nueva recomendación XSL: eXtensible Stylesheet Language. Aún no ha llegado a ser recomendación, y de momento es un public draft, esto es, un documentosujeto a comentarios y correcciones.

De todos modos, está bastante avanzado, y de hecho empresas como Microsoft e IBM ya ofrecen soporte a algunas de sus características.

Según el W3C, XSL es "un lenguaje para transformar documentos XML", asi como un vocabulario XML para especificar semántica de formateo de documentos.

En definitiva, además del aspecto que ya incluía CSS referente a la presentación y estilo de los elementos del documento, añade una pequeña sintáxis de lenguaje de script pata poder procesar los documentos XML de forma más cómoda.

Al igual que con HTML hasta ahora, se pueden especificar las hojas de estilo, sean CSS o XSL, dentro del propio documento XML o referenciandolas de forma externa.

EL modelo de objetos de documentos DOM

El modelo de objetos de documentos del W3Consortium, o Document Object Model (DOM) es una representación interna estándar de la estructura de un documento, y proporciona un interface al programador (API) para poder acceder de forma fácil, consistente y homogénea a sus elementos, atributos y estilo. Es un modelo independiente de la plataforma y del lenguaje de programación.

El W3C establece varios niveles de actuación, coincidiendo con el tiempo en que se presentan como recomendación:

37

Page 38: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

Nivel 1: se refiere a la parte interna, y modelos para HTML y XML. Contiene funcionalidades para la navegación y manipulación de documentos. Tiene 2 partes: el core o parte básica, referida a documentos XML, y la parte HTML, referida precisamente a los HTML.

Nivel 2: incluye un modelo de objetos e interfaz de acceso a las características de estilo del documento, definiendo funcionalidades para manipular la información sobre el estilo del documento. También incluirá un modelo de eventos para soportar los XML namespaces y consultas enriquecidas.

Posteriores niveles especificarán interfaces a posibles sistemas de ventanas, manipulación de DTD y modelos de seguridad.

Por el momento ya se ha sacado el 1er nivel como recomendación (Octubre 1998), y el public draft del 2º, es decir, está en etapa de consulta y sujeto a comentarios.

El objetivo es que de una vez por todas cualquier script pueda ejecutarse de forma más o menos homogénea en cualquier navegador que soporte dicho DOM. Siempre por supuesto se podrá elegir el implementar modelos propietarios que es lo que ahora ofrecen Netscape y Microsoft, pero tener una plataforma estándar en la que poder crear contenidos sin temor a no estar soportado por alguna marca o versión de navegador, que además sea potente y versátil.

Y por supuesto, como el conjunto de piezas que el W3C está creando para su uso en el intercambio de documentos e información, no estará sujeto al ámbito de los navegadores, sino que su uso será extensible a cualquier tipo de aplicación que acceda a esos documentos.

38

Page 39: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

PROGRAMA DE CALIDAD UDABOLDIF – 002

ESQUEMAS XML

Defina un lenguaje en XML para estructurar un Directorio de Contactos, para esto:

1. Considere los siguientes datos:

Grupo de contacto (considere el atributo categoría : trabajo, estudios, investigación, distracción) . Todo contacto debe registrarse dentro de un grupo

Nombre de contacto Nombre Corto País Fecha de Nacimiento (día,mes y año) Email (obligatorio) Teléfono (Puede repetirse 0 o más veces) considere el atributo tipo= móvil, fijo,

trabajo, domicilio Dirección (Solo una) Profesión

2. Diseñe el esquema jerárquico gráfico a representar.3. Realice el esquema XML (XML Schema), para definición de elementos, tipos de datos y

atributos.4. Realice un documento XML de ejemplo y validelo con el XML Schema del paso 3.5. Realice un documento XSL para presentar los datos en tablas HTML, con las siguientes

condiciones:

a) Primera tabla: Mostrar los contactos del grupo con categoría: estudios (mostrar su nombre y email)

b) Segunda tabla: Mostrar los contactos cuya profesión sea Ingeniero de Sistemas (Mostrar nombre, país, email y fecha de nacimiento).

c) Tercera tabla: Mostrar los contactos cuyo teléfono corresponda al atributo Móvil (Mostrar solo nombre corto y número de teléfono).

NOTA: Los pasos 3 y 4 deben ser realizados con el NetBeans, de acuerdo a lo indicado en la página proporcionada en clases.PROGRAMA DE CALIDAD UDABOL

DIF – 003

39

Page 40: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

IMPACTOS DE DATA WAREHOUSE

El éxito de DW no está en su construcción, sino en usarlo para mejorar procesos empresariales, operaciones y decisiones. Posesionar un DW para que sea usado efectivamente, requiere entender los impactos de implementación en los siguientes ámbitos:

Impactos Humanos.

Efectos sobre la gente de la empresa:

Construcción del DW: Construir un DW requiere la participación activa de quienes usarán el DW. A diferencia del desarrollo de aplicaciones, donde los requerimientos de la empresa logran ser relativamente bien definidos producto de la estabilidad de las reglas de negocio a través del tiempo, construir un DW depende de la realidad de la empresa como de las condiciones que en ese momento existan, las cuales determinan qué debe contener el DW. La gente de negocios debe participar activamente durante el desarrollo del DW, desde una perspectiva de construcción y creación. •Accesando el DW: El DW intenta proveer los datos que posibilitan a los usuarios accesar su propia información cuando ellos la necesitan. Esta aproximación para entregar información tiene varias implicancias:

a) La gente de la empresa puede necesitar aprender nuevas destrezas. b) Análisis extensos y demoras de programación para obtener información será eliminada. Como la información estará lista para ser accesada, las expectativas probablemente aumentarán. c) Nuevas oportunidades pueden existir en la comunidad empresarial para los especialistas de información. d) La gran cantidad de reportes en papel serán reducidas o eliminadas. e) La madurez del DW dependerá del uso activo y retroalimentación de sus usuarios.

Usando aplicaciones DSS/EIS: usuarios de aplicaciones DSS y EIS necesitarán menos experiencia para construir su propia información y desarrollar nuevas destrezas.

3. Impactos Empresariales.

Procesos Empresariales Y Decisiones Empresariales.

Se deben considerar los beneficios empresariales potenciales de los siguientes impactos:

40

Page 41: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

a) Los Procesos de Toma de Decisiones pueden ser mejorados mediante la disponibilidad de información. Decisiones empresariales se hacen más rápidas por gente más informada. b) Los procesos empresariales pueden ser optimizados. El tiempo perdido esperando por información que finalmente es incorrecta o no encontrada, es eliminada. c) Conexiones y dependencias entre procesos empresariales se vuelven más claros y entendibles. Secuencias de procesos empresariales pueden ser optimizados para ganar eficiencia y reducir costos.

d) Procesos y datos de los sistemas operacionales, así como los datos en el DW, son usados y examinados. Cuando los datos son organizados y estructurados para tener significado empresarial, la gente aprende mucho de los sistemas de información. Pueden quedar expuestos posibles defectos en aplicaciones actuales, siendo posible entonces mejorar la calidad de nuevas aplicaciones. Comunicación e Impactos Organizacionales.

Apenas el DW comienza a ser fuente primaria de información empresarial consistente, los siguientes impactos pueden comenzar a presentarse:

a) La gente tiene mayor confianza en las decisiones empresariales que se toman. Ambos, quienes toman las decisiones como los afectados conocen que está basada en buena información. b) Las organizaciones empresariales y la gente de la cual ella se compone queda determinada por el acceso a la información. De esta manera, la gente queda mejor habilitada para entender su propio rol y responsabilidades como también los efectos de sus contribuciones; a la vez, desarrollan un mejor entendimiento y apreciación con las contribuciones de otros. c) La información compartida conduce a un lenguaje común, conocimiento común, y mejoramiento de la comunicación en la empresa. Se mejora la confianza y cooperación entre distintos sectores de la empresa , viéndose reducida la sectorización de funciones. d) Visibilidad, accesibilidad, y conocimiento de los datos producen mayor confianza en los sistemas operacionales.

Impactos Técnicos De DW.

Considerando las etapas de construcción, soporte del DW y soporte de sistemas operacionales, se tienen los siguientes impactos técnicos:

Nuevas destrezas de desarrollo: cuando se construye el DW, el impacto más grande sobre la gente técnica está dada por la curva de aprendizaje, muchas destrezas nuevas se deben aprender, incluyendo:

41

Page 42: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

a) Conceptos y estructura DW. b) El DW introduce muchas tecnologías nuevas (ETT, Carga, Acceso de Datos, Catálogo de Metadatos, Implementación de DSS/EIS ), y cambia la manera que nosotros usamos la tecnología existente. Nuevas responsabilidades de soporte, nuevas demandas de recursos y nuevas expectativas, son los efectos de estos cambios. c) Destrezas de diseño y análisis donde los requerimientos empresariales no son posibles de definir de una forma estable a través del tiempo. d) Técnicas de desarrollo incrementa y evolutivo. e) Trabajo en equipo cooperativo con gente de negocios como participantes activos en el desarrollo del proyecto. • Nuevas responsabilidades de operación: Cambios sobre los sistemas y datos operacionales deben ser examinados más cuidadosamente para determinar el impacto que estos cambios tienen sobre ellos, y sobre el DW.

42

Page 43: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

PROGRAMA DE CALIDAD UDABOLDIF – 004

APLICACIONES DEL DATA WAREHOUSE

Dadas las características de un sistema de Data Warehousing, su aplicación puede tener variados fines, en una diversidad de industrias. No obstante, en términos generales, podemos decir que su aplicación más rica corresponde a entornos de empresas en los que se identifican grandes volúmenes de datos, asociados a: cantidad de clientes, variedad de productos y cantidad de transacciones. A continuación veremos ejemplos de aplicaciones típicas y algunos casos puntuales en distintas industrias.

Comercio Minorista

Utilizan grandes sistemas de Procesamiento Paralelo Masivo para acceder a meses o años de historia transaccional tomada directamente en los puntos de venta de cientos, o miles, de sucursales. Con esta información detallada pueden efectuar en forma más precisa y eficiente actividades de compra, fijación de precios, manejo de inventarios, configuración de góndolas, etc.

Las promociones y las ofertas de cupones son seguidas, analizadas y corregidas. Modas y tendencias son cuidadosamente administradas a efectos de maximizar utilidades y reducir costos de inventario. El stock es reasignado por sucursales o regiones según ventas y tendencias. Estos sistemas con capacidad de procesar gran cantidad de datos detallados permiten implementar eficientemente prácticas de mercadería "en consignación", en esta modalidad la cadena minorista paga al proveedor recién cuando los productos son vendidos y pasados por el lector de códigos de barras (scanner) del punto de venta.

Esta información detallada permite ejercer mayor poder de negociación sobre los proveedores, dado que el comercio minorista puede llegar a saber más que el fabricante sobre sus productos: quién lo compra, dónde, cuándo, con que otros productos, etc.

En su libro "Made in América: My Story" el fundador de Wal*Mart, Sam Walton, escribe: "...me dicen que es la base de datos comercial más grande del mundo. Lo que me gusta es la clase de información que puedo obtener de ella al instante ¡todos esos números!, llevamos 65 semanas de historia de cada artículo que vendemos. Esto significa que puedo elegir cualquiera y decir exactamente cuantos vendimos... no en promedio, sino en cualquier región, distrito o sucursal. Es difícil que un proveedor sepa más acerca de su producto de lo que sabemos nosotros. Nos da el poder de la ventaja competitiva." Para poner esto en perspectiva debemos considerar que las sucursales a las que hace referencia Sam Walton son unas 2500 y que cada una de ellas tiene

43

Page 44: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

una variedad de entre 50.000 y 80.000 artículos, todas las noches 20 millones de actualizaciones se realizan en el Data Warehouse. Wal*Mart es un excelente ejemplo práctico del concepto planteado por A. Tofler en su libro "Powershift": el poder se desplaza del fabricante al minorista por el manejo de la información.

Otras instalaciones de Data Warehousing de magnitud en la industria minorista son las de Kmart, Sears, Meijer, Kohl's Department Stores, American Stores (Jewel/OSCO/Lucky/Savon/ACME/SuperSaver), Mervyn's, Buttrey Food & Drug, QVC Home Shopping, Canadian Tyre, WH Smith Books (Gran Bretaña), Great Universal (GB), Supermercados Casino (Francia), Migrosgenossenschaftsbund (Suiza), Otto Versand (Alemania).

Manufactura de Bienes de Consumo Masivo

Las empresas de este sector necesitan hacer un manejo cada vez más ágil de la información para mantenerse competitivas en la industria. Los Data Warehouses se utilizan para predecir la cantidad de producto que se venderá a un determinado precio y, por consiguiente, producir la cantidad adecuada para una entrega "justo a tiempo". A su vez se coordina el suministro a las grandes cadenas minoristas con inmensas cantidades de productos "en consignación", que no son pagados hasta que estos productos son vendidos al consumidor final.

Las cadenas minoristas y sus proveedores utilizan sus Data Warehouses para compartir información, permitiéndole a las empresas de manufactura conocer el nivel de stock en las góndolas y eventualmente hacerse responsables de la reposición de inventario de la cadena minorista. Como es de esperar esto reduce fuertemente la intermediación. También se utilizan para campañas de marketing, planificación de publicidad y promociones y se coordinan las ofertas de cupones y promociones con las cadenas minoristas.

Un ejemplo interesante es el de Whirlpool. Este fabricante global de electrodomésticos con base en Benton Harbor, Michigan, utiliza su Data Warehouse para hacer un seguimiento directo de sus casi 15 millones de clientes y de sus más de 20 millones de aparatos instalados. Las mayores aplicaciones del sistema son para marketing, ventas, mantenimiento, garantía y diseño de productos. Permite mantener stock de partes más ajustados y mejorar las condiciones de negociación con los proveedores de las mismas. Si, por ejemplo, un determinado motor se identifica como poseedor de una tasa de falla superior, Whirlpool puede utilizar la información para hacer renegociaciones de garantía con el proveedor.

Como anécdota interesante se puede mencionar que durante el verano de 1993 los ingenieros de Whirlpool detectaron una tasa de falla muy alta en una manguera de conexión en una serie de lavarropas que se estaba vendiendo. A partir de allí se detuvo la producción, se identificaron los

44

Page 45: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

clientes y se enviaron técnicos a reemplazar la parte defectuosa antes de que entrara en falla. Esto no solo tuvo un impacto muy importante en satisfacción de clientes sino que se redujeron los costos de garantía por el reemplazo planificado y, especialmente, ¡se evitaron costosos reclamos por daño a la propiedad debidos a pérdidas de agua!

Otras empresas del sector que cuentan con Data Warehouses de importancia son: Coca Cola, Nike, Procter & Gamble, Hallmark, Maybelline, Helene Curtis, 3M, Owens Corning Glass, Karsten Ping Golf Clubs, Walt Disney.

Transporte de Cargas y Pasajeros

Se utilizan Data Warehouses para almacenar y acceder a meses o años de datos de clientes y sistemas de reservas para realizar actividades de marketing, planeamiento de capacidad, monitoreo de ganancias, proyecciones y análisis de ventas y costos, programas de calidad y servicio a clientes.

Las empresas de transporte de cargas llevan datos históricos de años, de millones de cargamentos, capacidades, tiempos de entrega, costos, ventas, márgenes, equipamiento, etc..

Las aerolíneas utilizan sus Data Warehouses para sus programas de viajeros frecuentes, para compartir información con los fabricantes de naves, para la administración del transporte de cargas, para compras y administración de inventarios, etc. Hacen un seguimiento de partes de repuesto, cumplimiento con las regulaciones aeronáuticas, desempeño de los proveedores, seguimiento de equipaje, historia de reservas, ventas y devoluciones de tickets, reservas telefónicas, desempeño de las agencias de viajes, estadísticas de vuelo, contratos de mantenimiento, etc.

Algunas empresas que cuentan con Data Warehouses de magnitud: Cornrail, Union Pacific, Norfolk Southern, American President Lines, Delta, Lufthansa, QANTAS, British Airways, American Airlines, Canadian Airlines, SNFC.

Telecomunicaciones

Estas empresas utilizan sus Data Warehouses para operar en un mercado crecientemente competitivo, desregulado y global que, a su vez, atraviesa profundos cambios tecnológicos. Se almacenan datos de millones de clientes: sus circuitos, facturas mensuales, volúmenes de llamados, servicios utilizados, equipamiento vendido, configuraciones de redes, etc. así como también información de facturación, utilidades, y costos son utilizadas con propósitos de

45

Page 46: NUEVAS TECNOLOGIAS

F A C U L T A D D E I N G E N I E R I A

marketing, contabilidad, reportes gubernamentales, inventarios, compras y administración de redes. Otras Industrias

Muchas otras industrias y actividades utilizan actualmente, o están comenzando a instalar, Data Warehouses: entidades gubernamentales, especialmente para el control impositivo, empresas de servicios públicos, de entretenimiento, editoriales, fabricantes de automóviles, empresas de petroleo y gas, laboratorios farmacéuticos, droguerías, etc.

En la industria informática NCR dispone de los Data Warehouses de mayor magnitud y antigüedad. Sus mayores instalaciones se encuentran en distintos centros de la compañía en Estados Unidos. La de NCR El Segundo, California, es una de las más antiguas del mundo, su primera aplicación fue el seguimiento histórico y detallado de la base de clientes: llamados de servicios, productos instalados, performances, etc. Esta instalación es herencia de Teradata, compañía fundada en 1979 para la producción de sistemas de procesamiento paralelo masivo destinados a aplicaciones de soporte a la toma de decisiones y posteriormente adquirida por NCR.

En NCR San Diego, California, se encuentra el centro de desarrollo de los computadores WorldMark. Sobre los mismos se realizó la demostración del Data Warehouse más grande del mundo: 10 Terabytes de información (=10.000 Gigabytes=10.000.000 Megabytes), para poner esto en términos manejables debemos considerar que toda la información escrita de la Biblioteca del Congreso de los Estados Unidos se podría almacenar en unos 20 Terabytes.

En NCR Dayton, Ohio, la compañía dispone de un Data Warehouse de 1 Terabyte (=1000 Gigabytes) destinado fundamentalmente a tareas de marketing, producción y finanzas. A la fecha tiene almacenados 281.154 documentos, agrupados en 36 grupos de interés temático, que pueden ser accedidos 24 Hs. al día, los siete días de la semana, por 16.100 usuarios distribuidos en 46 países. A principios del año 1996 el sistema estaba respondiendo un promedio de 242.707 consultas mensuales.

46