INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y...

20
Dpto. de Formación y Publicaciones Técnicas INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y AUDIO 3CCD

Transcript of INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y...

Page 1: INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y …diagramas.diagramasde.com/otros/compresion.pdf · 1.2. Densidad de datos y cadencia binaria serie. La frecuencia de muestreo

ÈÈÈÈÈÈÈÈ

����� � �������� ���������� � �������

INTRODUCCION A LAS TECNICASDE COMPRESION DE VIDEO Y

AUDIO

����

Page 2: INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y …diagramas.diagramasde.com/otros/compresion.pdf · 1.2. Densidad de datos y cadencia binaria serie. La frecuencia de muestreo

Introducción a las técnicas de compresión devídeo y audio

Jaume Fresquet Encinas

Dpto. de Formación y Publicaciones Técnicas

SONY ESPAÑA, S. A.GRUPO PRODUCTOS PROFESIONALES

Barcelona, Febrero de 1.997

Page 3: INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y …diagramas.diagramasde.com/otros/compresion.pdf · 1.2. Densidad de datos y cadencia binaria serie. La frecuencia de muestreo

Indice de Materias

1. Conceptos iniciales 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.1. Parámetros principales en la conversión de analógico a digital. 1.

1.2. Densidad de datos y cadencia binaria serie 2. . . . . . . . . . . . . . . . .

2. El gran salto de la década de los 90: La compresión 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.1. Conceptos básicos de compresión. 3. . . . . . . . . . . . . . . . . . . . . . . .

2.2. Aspectos especiales de la compresión en vídeo y audio digital 5. .

3. De dominio de niveles a dominio de frecuencias 7. . . . . . .

3.1. La ”Entropía” un factor determinante 7. . . . . . . . . . . . . . . . . . . . . .

3.2. Concepto de tratamiento de frecuencia por unidad detiempo en audio 8. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3.3. Concepto de gestión de frecuencias por espacio o zonasde imagen en vídeo 10. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4. Nociones sobre la matemática de transformación 13. . . .

4.1. Las transformadas 13. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4.2. La transformada de Fourier (concepto) 13. . . . . . . . . . . . . . . . . . .

4.3. Transformada de Fourier Discreta (DFT) 15. . . . . . . . . . . . . . . . . .

Indice de Materias

Page 4: INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y …diagramas.diagramasde.com/otros/compresion.pdf · 1.2. Densidad de datos y cadencia binaria serie. La frecuencia de muestreo

1. Conceptos iniciales

Grupo Productos Profesionales

Dpto. Formación y Publicaciones Técnicas

1

1.1. Parámetros principales en la conversión deanalógico a digital

Durante la década de los ochenta, fuimos testigos de una rápida proliferaciónde los procesos digitales en audio y vídeo, además de la introducción de unnúmero considerable de formatos para registro digital de imagen y sonido tantoen el campo doméstico como en el profesional, muestra de ello son el CD–Audio, el DAT, los DASH, el D1, el D2, el D3, etc. como formatos digitalesde audio y vídeo.

El denominador común de todos ellos, lo encontramos en el hecho de que lainformación digital procesada y almacenada en la cinta o soporte elegido,corresponde directamente a magnitudes de nivel cuantificado mediante pala-bras binarias de mayor o menor longitud (número de bits) y que dicha cuantifi-cación se produce de forma discreta en el tiempo a mayor o menor frecuenciasegún las características de la señal a tratar (ver figura 1.1).

Figura 1.1

(Relación nivel/tiempo)

Viendo la figura 1.1, podemos afirmar que los parámetros que principalmentedefinirán las características del proceso digital, se encuentran en los criteriosde conversión de analógico a digital o A/D, esto es:

Frecuencia de muestreo; que determina la cadencia o periodicidad delas muestras a tratar posteriormente en el dominio digital, recordemos amodo de ejemplo que en el CD–Audio se utiliza una frecuencia de 44,1KHz (44.100 muestras por segundo), mientras que en vídeo una frecuen-cia comúnmente utilizada es 13,5 MHz (13,5 millones de muestras porsegundo).

Cuantificación; que determina mediante el número de bits la precisióndel nivel evaluado en cada muestra, así por ejemplo mediante 8 bitspodremos evaluar 2=256 niveles, mientras que con 16 bits podremosevaluar 2=65.536 niveles.

Page 5: INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y …diagramas.diagramasde.com/otros/compresion.pdf · 1.2. Densidad de datos y cadencia binaria serie. La frecuencia de muestreo

Conceptos iniciales

Grupo Productos Profesionales

Dpto. Formación y Publicaciones Técnicas

2

1.2. Densidad de datos y cadencia binaria serie.La frecuencia de muestreo y los bits empleados para la cuantificación, determi-nan directamente la densidad de información digital generada y por consi-guiente, la tasa o cadencia binaria serie de un posible canal o línea de transmi-sión.

Siguiendo con los ejemplos del apartado anterior, vemos que tomando los pará-metros del CD–Audio, la densidad de datos digitales generados en la conver-sión A/D puede deducirse de la siguiente forma:

44,1 KHz x 16 bits x 2 canales = 1,4112 Megabits/segundo

En el caso de vídeo según CCIR 4:2:2 tendríamos:

13,5 MHz (Y) + 6,75 MHz (B–Y) + 6,75 MHz (R–Y) x 8 bits = 216 Megabits/segundo

Mediante los cálculos anteriores, hemos deducido la cadencia binaria serie paracasos ejemplo de audio y vídeo, veamos ahora cual sería el posible tamaño deun fichero informático que mediante bytes de 8 bits permita almacenar 1segundo de información en tiempo real;

En el caso de audio, tendríamos:

1,4112 Mb / 8 bits por byte = 176,4 Kby

Mientras que para vídeo el resultado sería:

216 Mb / 8 bits por byte = 27 Mby

Otro punto de comparación que nos permite evaluar la complejidad de gestiónde datos digitales de vídeo y audio en tiempo real, puede ser el considerar lacapacidad de los típicos diskettes de 3,5 pulgadas de tal modo que tendríamos:

1.440 Kby / 176,4 Kby = 8,16 segundos

1,44 Mby / 27 Mby = 0,0533 segundos

O sea que en un disco removible de 3,5 pulgadas del tipo HD, podríamos grabar8,16 segundos de información de audio estéreo con calidad de CD–Audio,dicho de otro modo, para grabar la ópera Persifal de Wagner serían necesarioscerca de 2000 diskettes, o en el caso de vídeo serian necesarios 19 disquetes paragrabar 1 segundo de imagen en movimiento.

Vemos por tanto que uno de los factores que hasta el momento ha limitado laexpansión y proliferación de los soportes audiovisuales en formato digital, essin duda la alta densidad de datos que deben gestionarse.

Page 6: INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y …diagramas.diagramasde.com/otros/compresion.pdf · 1.2. Densidad de datos y cadencia binaria serie. La frecuencia de muestreo

2. El gran salto de la década de los 90:La compresión

Grupo Productos Profesionales

Dpto. Formación y Publicaciones Técnicas

3

2.1. Conceptos básicos de compresiónEn el capítulo anterior, hemos intentado sensibilizar al lector ante el hecho deque la gestión y tratamiento de imagen y sonido en forma digital, tiene comomayor y tal vez único inconveniente la alta densidad de datos que hace evidentelas limitaciones de los soportes de almacenamiento y los canales de transmi-sión.

La solución es sin duda reducir la tasa binaria resultante de la conversión analó-gico/digital sin perdidas substanciales de información de la señal tratada, dichasolución, no por evidente es fácil de implementar y hemos tenido que esperarvarios años desde el inicio del tratamiento digital de información para disponerde tecnologías de hardware y software que permitan de forma fiable y econó-mica dicha reducción, éstas tecnologías junto a soportes de alta densidad ymétodos especiales de modulación o codificación de canal hacen que estemosasistiendo actualmente a lo que podríamos llamar la eclosión, crecimiento yexpansión de un sin fin de métodos de tratamiento, registro y transmisión deimagen y sonido digital.

Es fácil deducir las ventajas que una compresión 10 a 1 p.e. puede ofrecer, estanto como decir que un fichero informático de 100 Kby puede convertirse enotro de 10 Kby sin perdidas de información y con el consiguiente ahorro deespacio en el soporte de almacenamiento, o lo que es lo mismo, que un canalde transmisión de un cierto ancho de banda pase a ocupar un espectro 10 vecesmenor, la solución la encontraremos si partimos de la base que en procesos digi-tales estamos gestionando números y que los números según su origen puedenclasificarse, agruparse y organizarse en base a criterios estadísticos y matemáti-cos.

Figura 2.1.

(Concepto básico de compresión)

Page 7: INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y …diagramas.diagramasde.com/otros/compresion.pdf · 1.2. Densidad de datos y cadencia binaria serie. La frecuencia de muestreo

El gran salto de la decada de los 90: La compresión

Grupo Productos Profesionales

Dpto. Formación y Publicaciones Técnicas

4

La figura 2.1 nos muestra un concepto o criterio de compresión muy utilizadoen ficheros informáticos, se basa en agrupar datos de valor repetido y en vez deasignar un byte para cada dato se registra el valor del dato en un byte junto aotro byte que hace de multiplicador y designa el número de veces que dichovalor aparece en el fichero original,este sistema resulta enormemente efectivocon ficheros de bases de datos o de caracteres ASCII ya que en los mismos sue-len encontrarse largas secuencias de datos contiguos con valor repetido.

Page 8: INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y …diagramas.diagramasde.com/otros/compresion.pdf · 1.2. Densidad de datos y cadencia binaria serie. La frecuencia de muestreo

El gran salto de la década de los 90: La compresión

Grupo Productos Profesionales

Dpto. Formación y Publicaciones Técnicas

5

2.2. Aspectos especiales de la compresión envídeo y audio digital.

Desafortunadamente, el criterio de compresión explicado en el apartado 2.1siendo sencillo y fácil de aplicar, resulta de una efectividad mínima en procesosde señal digital de audio o vídeo.

La razón principal de ello, la encontramos en el hecho de que las secuencias dedatos o muestras digitalizadas que aparecen como resultado de la conversiónanalógico/digital de señales eléctricas de audio o vídeo, resultan del todo alea-torias y sin posibilidad de clasificación en base a criterios estadísticos, dichode otro modo, pensando en la fuente principal de imágenes y sonido que no esotra que la propia naturaleza (un paisaje, un árbol, el trino de los pájaros, etc.etc.) veremos que presentan una gran riqueza de matices y una ausencia totalde uniformidad.

Figura 2.2.1.

(Ejemplo de la posible evolución de una señal de audio o vídeo)

Nota sobre la cadencia de muestreo:

En audio correspondería una muestra cada 22,6 milisegundos a44,1 KHz de muestreo y en vídeo una muestra cada 74 nanose-gundos a 13,5 MHz de muestreo.

La figura 2.2.1 pretende mostrar la posible evolución de una forma de onda quepresenta distintos niveles en muestras consecutivas, independientemente deque el ejemplo sea aplicado a una señal de audio o de vídeo (conceptualmentesólo variaría la cadencia del muestreo), se intenta mostrar el hecho de que losvalores varían de forma totalmente aleatoria, siendo muy difícil de agrupar yclasificar estadísticamente.

Page 9: INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y …diagramas.diagramasde.com/otros/compresion.pdf · 1.2. Densidad de datos y cadencia binaria serie. La frecuencia de muestreo

El gran salto de la década de los 90: La compresión

Grupo Productos Profesionales

Dpto. Formación y Publicaciones Técnicas

6

La solución puede ser reducir el peso de los niveles, así por ejemplo podríamosdividir por 10 las magnitudes resultado de la conversión analógico/digital, detal modo que dichas magnitudes que en su origen pueden tener un peso absolutoalto pasen a tener un valor bajo que pueda ser expresado por palabras binariasde menor longitud (ver figura 2.2.2).

Figura 2.2.2.

(Posible reducción mediante división y posterior multiplicación de magnitud)

El método mostrado en la figura 2.2.2 resulta sencillo y fácil de aplicar, sinembargo, adolece de un problema en cuanto se están manejando niveles deseñal de vídeo y audio.

Supongamos una magnitud que en su origen sea 35 y que por necesidades dereducción la dividimos por 10 para posteriormente y mediante el procesoinverso recuperar su valor original:

Valor original = 35 Valor convertido = 35/10 = 3,5

Valor transmitido o registrado (truncando decimales) = 3

Valor recuperado = 3 x 10 = 30

Error del proceso = 35 – 30 = 5

Resulta evidente que para lograr una reducción efectiva no podemos gestionardecimales, por tanto al intentar recuperar la información original, se produciránerrores de nivel que en audio se traducirán en distorsiones y en vídeo anomalíasde nivel de brillo o de color.

Resulta por tanto evidente que debido a las especiales características de lasseñales de vídeo y audio, en el ámbito o dominio de niveles la reducción binariaes posible pero ofrece resultados de dudosa fiabilidad o transparencia, la solu-ción se ha encontrado trabajando en el ámbito o dominio de frecuencias.

Page 10: INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y …diagramas.diagramasde.com/otros/compresion.pdf · 1.2. Densidad de datos y cadencia binaria serie. La frecuencia de muestreo

3. De dominio de niveles a dominio defrecuencias

Grupo Productos Profesionales

Dpto. Formación y Publicaciones Técnicas

7

3.1. La “Entropía” un factor determinanteEl método comúnmente utilizado para la conversión de analógico a digital,genera una cadena de datos binarios que son un fiel reflejo de la energía o poten-cial de la señal eléctrica original, dicha cadena de datos presenta un alto gradode entropía, entendiendo como tal el desorden que muestran las magnitudes oexpresiones binarias en el momento en que intentan asociarse varias muestraso bytes consecutivos.

Figura 3.1.1.

(Conversión A/D y entropía)

La solución pasa por transformar de dominio de nivel a dominio de frecuencialos datos binarios resultado de la conversión, ya que se ha demostrado que elnivel de entropía es proporcional a la frecuencia (de hecho el nivel de energíadisminuye al aumentar la frecuencia con lo cual disminuye también la posibili-dad de dispersión o desorden de dicha energía) y ello permite un cierto gradode clasificación de los datos, clasificación que a su vez permite en función decriterios fisiológicos un mayor o menor grado de reducción binaria en funciónde la calidad de audio o vídeo deseada.

Figura 3.1.2.

(Entropía en función de la frecuencia)

Page 11: INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y …diagramas.diagramasde.com/otros/compresion.pdf · 1.2. Densidad de datos y cadencia binaria serie. La frecuencia de muestreo

De dominio de niveles a dominio de frecuencias

Grupo Productos Profesionales

Dpto. Formación y Publicaciones Técnicas

8

Por todo ello, tanto en audio como en vídeo la reducción binaria se basa entransportar o almacenar datos correspondientes a magnitudes de frecuencia, ladiferencia principal entre ambos medios la encontramos en el hecho de que paraaudio el criterio es dividir el espectro audible (de 20 ciclos/segundo a 20.000ciclos/segundo) en zonas a tratar con distinto grado de precisión según criteriostemporales, y en el caso de vídeo transformando bloques de imagen en expre-siones numéricas de las frecuencias que contienen dichos bloques, dicho de otromodo y en el ánimo de simplificar la descripción, diremos que en audio se ges-tionan bloques de frecuencias por unidad de tiempo y en vídeo bloques de fre-cuencia por espacio o zona de la imagen (existen métodos de alta eficiencia decompresión en vídeo que contemplan también aspectos temporales y que opor-tunamente trataremos).

3.2. Concepto de tratamiento de frecuencia porunidad de tiempo en audio

El método ATRAC (Audio Transform Acoustic Coding) que emplean el Mini–Disk y el sistema SDDS para películas de cine por ejemplo, utiliza la divisiónespectral con criterios particulares para distintas zonas del espectro audible,algo parecido se realiza mediante el método PASC (Precisión Adaptative Sub–band Coding) empleado en el formato DCC, el denominador común de estossistemas, radica en el hecho de limitar y reducir los datos binarios de audio quese consideran innecesarios para una correcta audición y ello se hace en funciónde aspectos fisiológicos, tal vez ello pueda provocar algunas limitaciones encuanto a la transparencia y fidelidad del proceso, pero no hay que olvidar quenuestro sentido del oído es también limitado, por lo que nos remitimos a losresultados para afirmar que en muchas aplicaciones el balance entre ventajase inconvenientes aconseja el utilizar estos métodos de compresión.

Figura 3.2.2.

(Concepto de bloques de frecuencia/tiempo del ATRAC)

Page 12: INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y …diagramas.diagramasde.com/otros/compresion.pdf · 1.2. Densidad de datos y cadencia binaria serie. La frecuencia de muestreo

De dominio de niveles a dominio de frecuencias

Grupo Productos Profesionales

Dpto. Formación y Publicaciones Técnicas

9

Figura 3.2.1.

(El ATRAC del Mini–Disk como ejemplo de compresión en audio)

A modo de ejemplo, la figura 3.2.1 nos muestra el diagrama en bloques funcio-nal del sistema ATRAC, en dicho diagrama podemos ver las etapas detalladasa continuación.

Filtro de separación:

En esta etapa, la señal digital de audio procedente del conversor analógico–di-gital, pasa por un filtro separando la misma en tres bandas de baja, media y altafrecuencia, lo que permite posteriormente tratar estas tres zonas con criteriosde evaluación o división en subzonas particulares para cada una (se consideraque existen un total de 25 subzonas o frecuencias fisiológicamente críticas parauna correcta audición, sin embargo en el método ATRAC serán tratadas un totalde 52 zonas).

Transformada del coseno modificada:

Corresponde a la parte del proceso donde se evalúa el contenido de informaciónde la señal de audio por zonas espectrales y por unidad de tiempo ello quieredecir que durante un tiempo determinado y en una zona determinada del espec-tro de audio (de las 52 evaluadas) se determina lo siguiente; cantidad de infor-mación que contiene, de que frecuencia es dicha información y contenido armó-nico de la misma, las magnitudes obtenidas por este procedimiento, serán losdatos binarios que posteriormente se transmitirán o grabarán en el soporte ele-gido.

Ubicación de bit:

Mediante el proceso de ubicación de bit, las palabras binarias generadas en elbloque MDCT y que definen la señal de audio, son codificadas de modo quepuedan convertirse en una información o bus de datos serie registrable en elsoporte Magneto–Optico.

Page 13: INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y …diagramas.diagramasde.com/otros/compresion.pdf · 1.2. Densidad de datos y cadencia binaria serie. La frecuencia de muestreo

De dominio de niveles a dominio de frecuencias

Grupo Productos Profesionales

Dpto. Formación y Publicaciones Técnicas

10

Decisión del tamaño de bloque:

Como ya se ha dicho, el proceso de compresión de audio se basa en convertirlos niveles de señal en información de frecuencia trabajando mediante bloquesde frecuencia/tiempo, en esta parte del proceso se decide el tamaño de bloquesegún el tipo de información audible a tratar, así por ejemplo, un impulso trans-itorio se tratará mediante un bloque de corta duración pero con un amplio deta-lle de frecuencia fundamental y sus armónicos, mientras que un sonido de tonoconstante y prolongado se analizará mediante un bloque de larga duración perocon un espectro de frecuencias concentrado.

3.3. Concepto de gestión de frecuencias por espa-cio o zonas de imagen en vídeo

Para lograr una efectiva pero a la vez fiable reducción de datos en vídeo, debentransformarse las magnitudes de nivel/tiempo en magnitudes de frecuencia, detal modo que la información transportada o almacenada corresponda a datosbinarios proporcionales al nivel de energía a distintas frecuencias y no a nivelesproporcionales a la tensión eléctrica de la señal original, para ello se divide laimagen de un cuadro o fotograma de vídeo en zonas de un tamaño predetermi-nado y se analizan los datos de nivel horizontal y verticalmente, convirtiéndo-los en datos que reflejan magnitudes de las frecuencias que contienen las seña-les comprendidas en dichas zonas de imagen.

Figura 3.3.1

(División de la imagen en bloques de zonas para su evaluación)

Bloque de N x N pixels a partir del cualse deduce el contenido en frecuencia

Page 14: INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y …diagramas.diagramasde.com/otros/compresion.pdf · 1.2. Densidad de datos y cadencia binaria serie. La frecuencia de muestreo

De dominio de niveles a dominio de frecuencias

Grupo Productos Profesionales

Dpto. Formación y Publicaciones Técnicas

11

Figura 3.3.2

(Base conceptual del proceso de reducción de datos en vídeo)

En la figura 3.3.2, vemos un diagrama en macrobloques que nos muestra la baseconceptual de la mayoría de métodos de compresión actuales para vídeo, en ellavemos tres bloques claramente definidos cuya función detallamos seguida-mente.

Conversor Analógico/Digital:

En el conversor A/D, la señal analógica de vídeo se muestrea y cuantifica con-virtiéndola (normalmente mediante conversores del tipo “Flash”) en una infor-mación digital formada por bytes o palabras binarias de mayor o menor longitud(mayor o menor número de bits) según la precisión deseada y a una cadenciaen bytes/segundo que dependerá de la resolución o respuesta deseada en alta fre-cuencia.

Transformación de Nivel a Frecuencia:

La transformación de nivel a frecuencia permite mediante transformadas decambio de dominio (Fourier, DCT, Wavelet, etc.), disponer de informaciónbinaria clasificable por grupos de frecuencia, dicha clasificación posibilita laposterior reducción binaria mediante métodos especiales de cuantización, codi-ficación de palabra y modulación de canal serie, es por tanto destacable el hechode que el cambio de dominio en si mismo no es una reducción sino el mediopara conseguirla.

Cuantización:

En el proceso de cuantización se aplican unas tablas predeterminadas, de talmodo que las magnitudes binarias son reducidas proporcionalmente a la fre-cuencia que transportan, normalmente mayor reducción a mayor frecuencia, setrata por tanto de multiplicar los datos por factores predeterminados, así porejemplo las frecuencias bajas podrían multiplicarse por 1 las medias por 0,5 ylas altas por 0,25 (en posteriores capítulos veremos ejemplos concretos).

Page 15: INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y …diagramas.diagramasde.com/otros/compresion.pdf · 1.2. Densidad de datos y cadencia binaria serie. La frecuencia de muestreo

De dominio de niveles a dominio de frecuencias

Grupo Productos Profesionales

Dpto. Formación y Publicaciones Técnicas

12

Codificación de Palabra:

Por último la codificación de palabra adapta los bytes resultantes de la cuantiza-ción en información digital serie apta para la transmisión o registro de la infor-mación, ello se realiza por procedimientos que racionalizan y reducen en lamedida de lo posible la tasa binaria o ancho de banda resultante.

Page 16: INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y …diagramas.diagramasde.com/otros/compresion.pdf · 1.2. Densidad de datos y cadencia binaria serie. La frecuencia de muestreo

4. Nociones sobre la matemática detransformación

Grupo Productos Profesionales

Dpto. Formación y Publicaciones Técnicas

13

4.1. Las TransformadasSe conocen como transformadas a los procesos de cálculo matemáticos que per-miten un cambio de dominio, dicho de otro modo y en el caso que nos ocupa,una transformada permitirá que una información de audio digital que inicial-mente se presenta en modo de nivel por fracción de tiempo, pase a ser frecuen-cia por fracción de tiempo y una señal de vídeo digital que en su origen es deniveles por zonas de imagen o espacio pase a ser frecuencia por zonas de ima-gen o espacio.

La matemática empleada para dicha transformación, es conocida desde hacemuchos años, sin embargo su empleo se ha visto retrasado en el tiempo debidoa la complejidad de acometer su puesta en práctica mediante circuitos electróni-cos fiables y económicos. Dichos circuitos se basan en unidades de cálculo arit-mético de alta velocidad, configurados en arquitecturas por medio de las cuales,las mencionadas unidades de cálculo quedan asociadas a memorias dinámicasque almacenan la información temporalmente en el caso de audio y especial-mente en el caso de vídeo.

Figura 4.1

(Diagrama en bloques del circuito de transformación de dominio)

4.2. La transformada de Fourier (concepto)Tal vez los lectores con un amplio conocimiento matemático, conocen la trans-formada que da título a este apartado, con lo que en el no aportaremos nadanuevo, si no es así, está en el ánimo del autor no tanto definir dicha transfor-mada, como describirla conceptualmente para que la mayoría de lectores sefamiliaricen con los aspectos de la misma que ayudan a entender los procesosdigitales de señal.

Page 17: INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y …diagramas.diagramasde.com/otros/compresion.pdf · 1.2. Densidad de datos y cadencia binaria serie. La frecuencia de muestreo

Nociones sobre la matemática de transformación

Grupo Productos Profesionales

Dpto. Formación y Publicaciones Técnicas

14

Gracias al análisis de Fourier, podemos definir o reproducir una forma de ondade evolución periódica, mediante la suma de un número indeterminado de sinu-soides que tengan relación armónica con la señal que pretendemos definir,dicho de otro modo, mediante la transformada de Fourier podemos descompo-ner una forma de onda obteniendo datos de nivel y fase de la frecuencia funda-mental y armónicos que la componen.

Figura 4.2.1

(Base conceptual del análisis de Fourier)

En la figura 4.2.1 se intenta mostrar el posible resultado de descomponer unaseñal de onda cuadrada en su fundamental y dos armónicos superiores, a la vistadel resultado se deduce que dicha información permite recomponer la señal ori-ginal respetando aproximadamente su evolución.

Un aspecto importante a tener en cuenta, deducible además en el dibujo, es elhecho de que cuanto mayor sea el número de armónicos tratado, mejor fidelidadde representación tendremos en la señal recompuesta.

Figura 4.2.2

(Gráficas de presentación temporal y espectral de una onda cuadrada)

Otra forma de entender este concepto, sería mediante gráficas que nos presententemporal y espectralmente una forma de onda cuadrada, tal y como vemos enla figura 4.2.2, en ella podemos ver como quedaría representada dicha formade onda en el dominio de nivel/tiempo y como podría representarse mediantenivel/frecuencia.

Page 18: INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y …diagramas.diagramasde.com/otros/compresion.pdf · 1.2. Densidad de datos y cadencia binaria serie. La frecuencia de muestreo

Nociones sobre la matemática de transformación

Grupo Productos Profesionales

Dpto. Formación y Publicaciones Técnicas

15

4.3. Transformada de Fourier Discreta (DFT)Debemos entender llegados a este punto, que la transformada de Fourier puededefinir formas de onda periódicas y repetitivas en el tiempo, siendo esta unacondición que raras veces se da en el caso de señales de vídeo y audio, por tantola solución práctica pasa por tratar bloques temporales o espaciales tal y comose ha comentado en capítulos anteriores.

Mediante la definición o acotación de bloques de información, podremos apli-car a dichos bloques un análisis de Fourier que podemos llamar discreto en fre-cuencia, esto es, analizar zonas temporales o espaciales de señal mediante surelación con frecuencias predefinidas y situadas en puntos concretos del espec-tro a tratar.

Figura 4.3.1

(Concepto de respuesta espectralmente continua)

Figura 4.3.2

(Concepto de respuesta espectralmente discreta)

Page 19: INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y …diagramas.diagramasde.com/otros/compresion.pdf · 1.2. Densidad de datos y cadencia binaria serie. La frecuencia de muestreo

Nociones sobre la matemática de transformación

Page 20: INTRODUCCION A LAS TECNICAS DE COMPRESION DE VIDEO Y …diagramas.diagramasde.com/otros/compresion.pdf · 1.2. Densidad de datos y cadencia binaria serie. La frecuencia de muestreo

Grupo Productos Profesionales

DPTO. DE FORMACIONY PUBLICACIONES TECNICAS

BARCELONA, Febrero 1997