Compresion de Video (1)

Post on 24-Jul-2015

40 views 4 download

Transcript of Compresion de Video (1)

COMPRESION DE VIDEOConstantino Pérez Vega

Departamento de Ingeniería de Comunicaciones

Estructura de capas del sistema de TVD

Consideraciones preliminares

La señal digital de vídeo

Vídeo compuesto

Vídeo en componentes

Y + C

Y + Cr + Cb

RGB

El muestreo puede referirse a la frecuencia de subportadora o a la de línea.

Aquí trataremos lo relativo a la Recomendación 601 del CCIR

El muestreo referido a línea produce un patrón ortogonal:

En tanto que el muestreo referido a subportadora produce un patrón de muestreo como el siguiente:

Número de elementos en una imagen con relación de aspecto 4:3

3

4

625

833

625 x 833 = 520.625

Manejando sólo líneas activas, el número de elementos se reduce a 570 x 760 = 433.200

Cuantificando cada muestra con 8 bits, el flujo binario por cuadro resulta de 3,465

Mbits

A 25 cuadros/seg la tasa binaria es de 86,64 Mb/s

La tasa anterior es para una sola señal, por ejemplo vídeo monocromático compuesto o una de las componentes de una señal RGB

Una señal RGB completa requeriría 259 Mb/s

(esto equivale al formato 4:4:4 del CCIR)

En el formato 4:2:2 (Rec. 601 del CCIR), las frecuencias de muestreo son:

Luminancia: 13,5 MHz 108 Mb/s

Crominancia (2): 6,75 MHz

108 Mb/s

216 Mb/sTotal:

REDUCCION DEL CAUDAL BINARIO

Con PCM, DPCM o modulación delta y eliminando los intervalos de “blanking” horizontal y vertical, el caudal se puede reducir a unos 140-150 Mb/s (140 MHz)

Con modulación digital, por ejemplo 16QAM (4 bit/Hz), el ancho de banda requerido se reduce a unos 35 MHz.

Para fines de almacenamiento las cifras anteriores son inaceptables, lo mismo que para radiodifusión terrestre de televisión

Para transmisión, es necesario reducir el ancho de banda como máximo a 5 MHz y la tasa binaria a valores del orden de 1.5 a 2 Mb/s para fines de almacenamiento.

En el caso de transmisión...

Pensando en 16 QAM, el caudal binario debe reducirse a unos 20 Mb/s, de los que aproximadamente un 10% se destinarían a codificación de canal, de modo que la información de video debe transmitirse a 18 Mb/s como máximo.

Es necesario eliminar 122 Mb/s (de 140 Mb/s) o 198 Mb/s (de 216 Mb/s).

Entre los principales motores de la compresión:

Almacenamiento masivo de imágenes

Mayor número de programas por canal de RF

La reducción de información (compresión) se basa en eliminar información redundante o irrelevante aprovechando:

Redundancia espacial y temporal en imágenes

Redundancia temporal en audio

Características perceptuales de la visión y audición

Redundancia espacial

y

x

Redundancia temporal

t

Conversor A/D

Compresión (codificación

de fuente) Codificación

de canal

Decodificación de canal

Decodificación de fuente

Conversor D/A

Vídeo analógico

Vídeo analógico

Transmisor

Receptor

Medio de transmisión

Contexto de la compresión en el sistema de TV digital

Elementos afectados por la TVD

METODOS DE COMPRESION

Sin pérdidas

Basados en modelos

LPC

AR, ARMA

Ajuste polinomial

Fractales

Basados en objetos

Basados en forma de onda

Estadísticos:GilbertFano Huffman

Universales:Codif. AritméticaCodif. Lempel-ZivAjuste de patrones

Métodos de compresión con pérdidas

Dominio espacial y/o temporal

PCM

DPCM

Modulación delta

Cuantificación vectorial

Compresión con pérdidas...

Dominio de frecuencia

Basados en filtrado

Subbandas

Wavelets

Basados en transformadas

Fourier

Karhunen-Loeve

Hadamard

DCT

El método utilizado en JPEG, MPEG-1 y MPEG-2 es el de la transformada del coseno discreto (DCT)

F u v C u C v f x yx u y v

yx

( , ) ( ) ( ) ( , ) cos( )

cos( )

1

4

2 1

16

2 1

160

7

0

7

C w para w

para w

( )

, ,...,

1

20

1 1 2 7

f x y C u C v F u vx u y v

vu

( , ) ( ) ( ) ( , ) cos( )

cos( )

142 1

16

2 1

160

7

0

7

Transformada del Coseno Discreto (DCT)

Imagen Original

Dominio espacial

8x8 pixels

DCT

Dominio de la transformada

8x8 coeficientes

Procesado en el Estudio

Calidad de contribución

Cuantificación perceptual

Algoritmos de compresión

Señal comprimida

1 pixel = 1 muestra Y

+ Cr + Cb

Imagen original

DCT

Hadamard

Fourier

Seno discreto

Karhunen-Loeve

Propiedades de compactación de coeficientes

Cuantificación perceptual

Matriz transformada

:

Matriz de coeficientes perceptuales

=

Matriz cuantificada

perceptualmente

Coeficientes de cuantificación perceptual de luminancia

Ordenación en zig-zag de los coeficientes transformados

Codificación de recorrido

frecuencia horizontal

frecuencia vertical

Efecto del número de coeficientes de la DCT

8x8

Bloque

Macrobloque

Segmento Cuadro

Grupo de Imágenes (GOP)

Secuencia de vídeo

Jerarquía de los datos de vídeo para compresión

Estructura de un macrobloque MPEG

Luminancia (Y)

Cr Cb

Crominancia

16 x 16 muestras

8 x 8 muestras c/u

Segmentación (slicing)Macrobloque

Segmento (slice): secuencia de macrobloques contiguos en orden del barrido

Diferencias entre JPEG y MPEG

JPEG (Joint Photographic Expert Group)

Orientado a la compresión de imágenes fijas

MPEG-1 (Motion Picture Expert Group)

Compresión de imágenes en movimiento.

Originalmente enfocado a almacenamiento en CD

Barrido secuencial

Tasas binarias variables, del orden de 1 Mb/s

MPEG-2

Compresión de imágenes en movimiento

Orientado a televisión: barrido entrelazado

Tasas binarias variables, aprox. de 1 Mb/s a 20 Mb/s

DCT Cuantificador

Codificador de

entropía

Tabla de

cuantificacion

Tabla de

códigoImagen fuente

Decodificador

de

entropía

Cuantificador

inversoIDCT

Bloque8x8

Bloque8x8

Tabla de Tabla de Imagenreconstruída

código cuantificación

Codificador

Decodificador

Imagen codificada

Imagencodificada

Codificador-Decodificador básico

Los estándares MPEG NO especifican el codificador, sino la sintaxis que deben cumplir los datos a decodificar

Tipo de imágenes en MPEG

I: Intracuadro. Se codifican independientemente de las demás, sin otra referencia que la del propio cuadro

P: Predictivas. Resultado de predicciones de imágenes I o P previas en la secuencia

B: Bidireccionales. Resultado de predicciones de las imágenes más cercanas I o P, previas o posteriores en la secuencia

Arboles de decisión para la codificación

Secuencia de codificación

I P B B B P B B P B B I

Grupo de imágenes (GOP)

Secuencia de procesado de la señal de vídeo en MPEG

Estructura del codificador MPEG

Estructura del codificador de vídeo MPEG

Módulo de reconstrucción, común al codificador y decodificador

Compensación de movimiento

Imagen de referencia Predicción hacia adelante

Imagen de referencia Predicción hacia atrás

Imagen actual

tiempo

Reducción de redundancia temporal

+

+

IDCTcuantific.inverso

DCT cuantific. Buffer

estimad. movmto

compens movmto

memoria de cuadr.

+

-

Codificación intercuadro básica

Compensación de movimiento hacia adelante

Compensación bidireccional de movimiento

Perfiles

Niveles

Simple

I,P 4:2:0

Principal

I,P,B 4:2:0

SNR

I,P,B 4:2:0

Escalable Espacial

I,P,B 4:2:0

Alto

I,P,B 4:2:0/4:2:2

Alto 19201152 60 cuadros/s

80 Mb/s

100 Mb/s

Alto - 1440 14401152 60 cuadros/s

60 Mb/s

60 Mb/s

80 Mb/s

Principal 720576

30 cuadros/s

15 Mb/s

15 Mb/s

15 Mb/s

20 Mb/s

Bajo 352288

30 cuadros/s

4 Mb/s

4 Mb/s

Perfiles y niveles en MPEG-2