Posteamelo

MPEG-4Un resumen de como trabaja HDTV usando MPEG-4 Una importante ventaja del estándar de vídeo MPEG-4 es que no sólo proporcionaban herramientas y algoritmos de compresión para aumentar la eficiencia de las normas existentes MPEG-2 y H.263 (H.263 es un códec estándar de vídeo diseñado originalmente como formato comprimido para videoconferencias con una baja tasa de bits), sino que también contribuyó soluciones claves, innovadoras para las nuevas aplicaciones multimedia como vídeo para PC en tiempo real, Internet en teléfonos móviles (conexiones como WAP, GPRS y 3G) y servicios interactivos de acceso a multimedia. Además tiene aplicaciones televigilancia, teleeducación, telemedicina, etc. Muchas de estas soluciones se encuentran ya utilizadas en la práctica. La normalización MPEG-4, cuya denominación oficial ISO / IEC 14496, fue iniciado en 1994 para atender los requerimientos de la rápida convergencia de las telecomunicaciones, computadores, televisión y/o industrias cinematográficas. El MPEG-4 tiene un mandato para normalizar algoritmos de codificación audiovisual en aplicaciones multimedia, televisión digital y aplicaciones multimedia. Las funciones de MPEG-4 son cubrir el contenido basado en la interactividad, el acceso universal, y de la compresión. Un breve resumen son: Contenido basado en la interactividad: • Contenido basado en la manipulación y edición de bitstreams sin transcodificación • Codificación de datos naturalmente híbrido y sintético • Mejora en el tiempo de acceso aleatorio dentro de tiempo limitado y con alta resolución Acceso Universal: • Robusto en ambientes propensos a errores incluyendo redes de cable e inalámbricas. • Escalabilidad granular fina en términos de contenido, calidad, y la complejidad • Velocidades de buena calidad entre 5 y 64 kb en aplicaciones para móviles y hasta 2 Mbps para aplicaciones de TV/cine. Compresión: • Mejora de la eficiencia de codificación • Codificación simultánea de múltiples flujos de datos, por ejemplo, múltiples vistas de vídeo. MPEG-4 se terminó en octubre de 1998 y se convirtió en una norma internacional en los primeros meses de 1999. Las tecnologías desarrolladas durante la estandarización del MPEG-4, que llevó especialmente a usos en los sistemas de multimedia streaming y aplicaciones interactivas, eran significativamente más allá de la eficiencia de compresión en las que el MPEG-1 y MPEG-2 se han desarrollado, de hecho es muy útil para implementarlo en HDTV. MPEG-4 fue el primer intento importante en la codificación basado en objetos, es decir, de descomponer una escena de vídeo múltiples objetos de forma arbitraria, y la eficiente codificación de estos objetos por separado. Este nuevo enfoque permitió a varias funcionalidades adicionales como la región de interés de codificación, adaptación, añadir o borrar objetos en la escena, etc. Además, desde el principio, MPEG-4 fue diseñado para permitir el acceso universal, cubriendo un amplio rango de target bit-rates y a los dispositivos receptores. Por lo tanto, un objetivo importante en la norma proporcionaba nuevos algoritmos para la escalabilidad y la capacidad de manejar errores. Codificación de objetos con formas arbitrarias En esta sección se describe el soporte para la codificación MPEG-4 de objetos con forma arbitrarias, o más bien llamado Video Object Planes (VOPs). Cada VOP corresponde a diferentes objetos. Un conjunto de VOPs, posiblemente incluyendo figuras arbitrarias y posiciones, se conoce como un Group of VOPs (GOV), y a su vez un conjunto de GOVs son llamados Video Object Layer (VOL). Finalmente un conjunto de VOLs son llamados Video Object (VO). Una secuencia de VOs es llamada Visual Object Sequence (VS). Esto se muestra en la jerarquía de la figura. Un ejemplo para entender bien este concepto de capas se muestra en la figura, donde hay tres VOPs, correspondiente a un fondo estático (VOP1), el árbol (VOP2) y el hombre (VOP3). VOL1 es creado al agrupar VOP1 y VOP2, mientras que VOL2 incluye solo a VOP3. Finalmente los diferentes VOLs son compuestos en uno solo, el VO. Cada VO en la escena debe ser codificado y transmitido independientemente, y toda la información requerida para identificar cada VO y para ayudar al decodificador acerca de la composición de cada VOs en escena, se incluye en el bitstream. También se muestra en la figura, una secuencia de escenas indicando la figura del objeto y su posición, donde VOP1 es el objeto y VOP2 es el fondo. Esta información es llamada "alpha map" (mapa alfa) y es un código que indica la figura y la posición de este (en este caso VOP1). Cabe mencionar que estas técnicas son más eficientes en videos cuyas imágenes son relativamente invariantes una con otras, como es el caso de un noticiero o dibujos animados. En un canal de deportes, como el fútbol, cada imagen es prácticamente distinta a la anterior, de modo que las capas VOP sean difíciles de identificar. La razón para el uso de estas técnicas siempre son para mejorar la eficiencia de uso del bitstream (serie de bits) en banda base, y por ende aprovechar eficientemente el ancho de banda de la portadora en caso de transmitir. En otras versiones de MPEG era común transmitir secuencias de imágenes completas. El MPEG-4 permite elegir y comparar inteligentemente que información realmente es esencial de transmitir y esto implica una reducción del bitstream sin perder la calidad de video. MPEG-4 define antes un código basado en bloques para los VOPs que incluyan figuras arbitrarias. Para usar estos bloques para los VOPs donde varían su posición, tamaño y figura, un "shape-adaptive macroblock grid" es implementada, como se muestra en la figura. Una ventana rectangular de tamaño de múltiplos de 16 (tamaño del macroblock), es usado para encapsular el VOP (típicamente en los bordes del objeto) y especificar la posición de los macroblocks. El Contour-Based Shape Coding es otra técnica utilizada, que en contraste con las técnicas de tipo Block-Based (basado en bloques), codifica el contorno que describe la figura del VOP a partir de vértices que envuelven el objeto, formando un polígono (figura). Las posiciones de los vértices se moverán a medida que el objeto cambie de posición o figura. El número de vértices definirá si la aproximación tendrá más o menos error. Mientras menos vértices, más error de aproximación tendrá y viceversa. Para saber el número de vértices que tendrá la figura se define un error promedio que deba tener la figura. En caso de que el error exceda el valor permitido, un nuevo vértice es introducido en el punto con mayor error, y el proceso es repetido para el nuevo polígono. El tema del funcionamiento técnico del estándar MPEG-4 es muy extenso, por lo tanto las otras técnicas no se explicarán en este documento. El propósito de las demás técnicas son similares al explicado anteriormente, como la predicción de objetos que cambian de posición, soporte contenidos en 2D y 3D,Texture Coding, Shape Adaptive DCT, Intercoding, etc. Una buena referencia bibliográfica es el libro MPEG-4 Beyond Conventional Video Coding: Object Coding, Resilience, and Scalability año 2006 de Mihaela van der Schaar. Espero que les sirva y espero sus comentarios para enterarme si les gustó!! Rodrigo Pavez

MPEG-4

Dejá tu comentario

Autor del Post