El paisaje de los códecs está cambiando, con seis nuevos códecs que llegarán a finales de 2021. A principios de 2020, la mayoría de los productores de vídeo en flujo codificaron exclusivamente con el códec H.264, que debutó en 2003. Algunos grandes editores, como Netflix, Amazon, YouTube y Facebook, también desplegaron el sucesor basado en estándares de H.264, el códec HEVC, y/o el códec VP9 de Google. Un grupo de productores experimentaron con el códec AV1 de la Alianza para los Medios Abiertos. Además de estos cuatro códecs existentes, en 2020, MPEG lanzará tres nuevos códecs, Versatile Video Coding (VVC), Essential Video Coding (EVC), y Low Complexity Enhancement Video Coding (LCEVC).
Con seis nuevos códecs que deben considerarse para finales de 2021, vale la pena examinar los factores que contribuyen a la adopción satisfactoria de un códec. En este artículo, revisaré esos factores utilizando H.264 y HEVC, y crearé un marco de análisis que utilizaré en futuros artículos para dificultar el éxito potencial de AV1 y los tres nuevos códecs MPEG.
Tengan en cuenta que escribiré principalmente desde la perspectiva del editor; no desde la perspectiva del vendedor de reproductores o codificadores.
El papel más esencial de un códec es reducir el tamaño del flujo requerido para entregar el vídeo a nuestros espectadores. En muchos casos, la eficiencia se mide en relación con el H.264. Esto se ve en la Figura 1, del informe de comparación de HEVC de 2015 de la Universidad Estatal de Moscú (MSU). A modo de explicación, la MSU siempre presenta sus datos usando x264, uno de varios códecs H.264, con una calidad del 100%. Luego, para cada uno de los otros códecs, muestra el porcentaje de reducción o aumento en la tasa de datos necesario para producir la misma calidad que x264.
Por ejemplo, en el gráfico, el códec x265 puede ofrecer la misma calidad que x264 a un 74% de la tasa de bits, o un ahorro de aproximadamente el 26%. El códec VP9 no se queda tan atrás, con un 77%, o un ahorro de aproximadamente un 23% sobre x264.
Este ahorro representa un beneficio monetario primordial que ofrecen los códecs más recientes. La implementación de x265 en 2015 habría reducido en un 26% los costos de ancho de banda para la entrega de video de igual calidad a los reproductores con capacidad HEVC. VP9 habría reducido los costos de ancho de banda en un 23%.
Piensa en la adaptación del códec como un análisis del punto de equilibrio. Hay dos fuentes de entrada: los ahorros para la entrega a los clientes existentes, que acabamos de cubrir, y los ingresos adicionales para los clientes de los nuevos mercados, que trataré en la siguiente sección. Hay múltiples costos asociados a las implementaciones de los códecs. En el futuro inmediato, se entregará vídeo codificado en H.264, por lo que los costes de codificación y almacenamiento de los nuevos códecs son ambos aditivos. También tendrás que actualizar tu reproductor y realizar algunas pruebas y control de calidad.
El ahorro de ancho de banda obviamente se relaciona con el número de espectadores de cada video. Aquí hay un ejemplo simple. Supongamos que cuesta 20 dólares codificar en una escalera de codificación HEVC, y que se ahorra 0,01 dólares en costos de ancho de banda por espectador. Una vez que 2.000 espectadores vean el video, habrás compensado ese costo. Si 2 millones de espectadores ven el vídeo, te has ahorrado 20.000 dólares en costes de ancho de banda. Por eso es más fácil para las grandes empresas como Netflix, YouTube, Amazon y Facebook para desplegar nuevos códigos.
Independientemente de su tamaño, cuando los ahorros o los nuevos ingresos asociados con el nuevo códec superan los costos de implementación y otros costos, tiene sentido financiero desplegar un nuevo códec. Obviamente, cuanto mayor sea la eficiencia de compresión sobre la solución existente, mayor será el ahorro de ancho de banda.
Todo esto aparte, la gran mayoría de los nuevos despliegues de códecs no son para cosechar ahorros de ancho de banda u otras eficiencias de entrega. Sólo la punta de la pirámide de editores como Netflix, Facebook y YouTube han desplegado VP9, a pesar de que actualmente es alrededor de 35-40% más eficiente que x264. En cambio, los editores suelen adoptar nuevos códecs como HEVC porque abre mercados para nuevos clientes.
Esto nos lleva a la siguiente pregunta.
Audio + Video + IT. Nuestros editores son expertos en la integración de audio/video e IT. Obtenga diariamente información, noticias y redes profesionales. Suscríbete a Pro AV Today.
Cuando Adobe añadió la reproducción de H.264 a Flash en 2007, H.264 era sólo un 15% más eficiente que el códec VP6, que era el códec de Flash más utilizado antes de H.264. A pesar de estos escasos ahorros, ¿por qué la mayoría de los editores se convirtieron a H.264 de forma rápida y completa? Porque mientras que el VP6 no se reproducía en iPods, iPhones u otros dispositivos móviles, H.264 sí lo hacía. Con H.264 tanto en Flash como en el códec predominante en los dispositivos móviles, los editores pudieron dejar de lado el VP6 y llegar a dos mercados con un solo códec, sin ninguna duda.
Del mismo modo, la mayoría de los editores han desplegado HEVC para entregar videos 4K y/o de alto rango dinámico (HDR) a televisores inteligentes, decodificadores y dispositivos OTT. Por ejemplo, en su Informe sobre el formato de los medios de comunicación mundiales de 2019, que informó sobre su producción de 2018, encoding.com informó de que "prevemos un aumento muy importante del volumen en 2019 impulsado por el contenido HDR de UHD, ya que tanto los estándares HDR premium Dolby Vision y HDR+ se mapean al formato de vídeo HEVC". Desafortunadamente, encoding.com no ha actualizado ese informe para los resultados de 2019.
Del mismo modo, por fin, Apple comenzó a dar soporte a la VP9 o AV1 en sus dispositivos AppleTV 4K para que sus espectadores pudieran ver videos 4K en YouTube. Esto presagia la importancia que los vendedores de la Alianza para los Medios Abiertos como Facebook, Netflix, YouTube y Amazon tendrán en la adopción de la AV1.
El resultado final es que si el códec no permite nuevos mercados, el ahorro de ancho de banda es el único beneficio. Como se ha dicho, por la razón que sea, fuera de los mayores editores de video, pocos otros han encontrado estos ahorros una motivación suficiente para desplegar nuevos códecs.
Hemos hablado del análisis del punto de equilibrio. Hago esta pregunta porque el tiempo de codificación se traduce directamente en el costo de la codificación y cuanto más alto es el costo, más difícil es lograr el punto de equilibrio.
Por ejemplo, AWS Elemental MediaConvert cobra 0,024 dólares por minuto por la codificación H.264, 0,048 dólares por minuto por la codificación HEVC y 0,864 dólares por minuto por la codificación AV1. Afortunadamente, los tiempos de codificación AV1 han bajado significativamente en los últimos meses y estoy seguro que los precios de Elemental seguirán. Aún así, cuando los tiempos de codificación son tan glaciales como solían ser las AV1, se necesitan millones de vistas para acumular el ahorro de ancho de banda necesario para lograr el punto de equilibrio.
Esta pregunta habla de la rapidez con que un códec puede ser implementado en plataformas relevantes para su servicio. En 2007, cuando Adobe añadió H.264 a Flash, la reproducción era casi universal en todos los ordenadores y dispositivos móviles. En cambio, con HEVC, el soporte de hardware en los dispositivos móviles era necesario para una reproducción eficiente de la batería, y el hardware de decodificación HEVC dedicado era necesario en la mayoría de los televisores inteligentes, decodificadores y dispositivos OTT.
Con el tiempo, más y más dispositivos comenzaron a soportar HEVC, y ahora es casi omnipresente en los productos de la generación actual, con VP9 sólo ligeramente por detrás. Pero los nuevos códecs que requieren hardware para una reproducción eficiente están empezando desde cero.
Como regla general, los primeros dispositivos de consumo con soporte de hardware tardan unos dos años en aparecer. Por ejemplo, la especificación AV1 se finalizó a mediados de 2018, y los primeros televisores inteligentes con soporte AV1 se enviaron a mediados de 2020. Obviamente, no importa cuán eficiente sea un códec cuando se lanza al mercado; sólo se vuelve relevante cuando la reproducción está disponible en un número sustancial de plataformas a las que se entrega.
Lo que nos lleva a la siguiente pregunta.
Si bien el soporte de hardware requiere dos años, si los requisitos de reproducción son modestos, la reproducción en un navegador o en un sistema operativo móvil puede tardar una cuestión de semanas. Sin embargo, los miembros de la Alianza para los Medios Abiertos Microsoft, Google, Mozilla y Apple controlan la mayoría de los navegadores y sistemas operativos, y los formatos que soportan. Por eso, siete años después de su lanzamiento, HEVC sólo es compatible con el 16,99% de todos los navegadores y sistemas operativos móviles rastreados por www.caniuse.com (Figura 2).
El número comparable para la AV1, que fue lanzada cinco años después... 36.56%. ¿Y qué hay de VP9, que fue lanzada más o menos al mismo tiempo que la HEVC? 94.52%.
Si un número considerable de sus espectadores lo ven en los navegadores y en los dispositivos móviles, el soporte de la plataforma marca una gran diferencia en la economía. Esto es particularmente cierto porque el soporte de software se puede lograr tan rápidamente.
En este momento, parece poco probable que los miembros de la AOM apoyen cualquier códec MPEG, ya sea HEVC, VVC, EVC o LCEVC. Por lo tanto, donde los códecs basados en estándares como H.264 y MPEG-2 tuvieron alguna vez la ventaja, los códecs MPEG están ahora en clara desventaja en los mercados tradicionales de computadoras y móviles.
El Grupo de Expertos en Cinematografía, o MPEG, creó y promovió múltiples códecs de audio y vídeo que ayudaron a la transición del vídeo analógico al digital. En un momento dado, los estándares MPEG como MPEG-2 y H.264 tenían caminos mucho más claros hacia el éxito que los códecs propietarios como VP9. Hoy en día, esa dinámica ha cambiado, por lo que si bien el proceso de estandarización proporciona credibilidad a ciertas tecnologías, no es una garantía de éxito?
¿Qué ha cambiado? Casi todo. Cuando el H.264 se lanzó en 2003, la transmisión era el rey, y la transmisión no era la cola del perro, era una uña. Ahora, el streaming es claramente el perro, y la transmisión la cola, y las compañías que controlan el despliegue de códecs en los navegadores y los sistemas operativos móviles, y las compañías de contenidos como Netflix y YouTube, tienen una increíble influencia en el despliegue de códecs.
Como hablaré más adelante, con el MPEG-2 y el H.264, había una política de regalías clara y coherente, que se fue por la borda con el HEVC, que tiene tres patentes. Dos de los fondos tienen tarifas publicadas y los topes anuales saltan de alrededor de 10 millones de dólares para el H.264 a más de 60 millones de dólares para la HEVC. El otro grupo no publica sus tarifas, y más de siete años después del lanzamiento de HEVC, todavía no ha declarado si cobrarán por las regalías del contenido.
Teniendo en cuenta el ciclo de desarrollo de dos años para el despliegue de códecs, muchas empresas de hardware decidieron desplegar H.264 y HEVC antes de que la política de regalías fuera clara. Después del HEVC, grandes compañías como Apple y Samsung pueden retrasar la adopción de la tecnología hasta que el cuadro de regalías sea más claro, lo que podría añadir otros 24 meses al ciclo de adopción.
Por último, desde la perspectiva de los códecs de vídeo, el MPEG ha pasado de un ciclo de unos diez años entre el MPEG-2, el H.264 y el HEVC a un ciclo de siete años para tres códecs de vídeo adicionales que se ultimarán en 2020. Ciertamente, cada códec ofrece una gama diferente de características, rendimiento y otros aspectos, y es poco probable que todos logren la misma adopción comercial.
La mayoría de los códecs son el resultado de una colaboración entre múltiples partes. En algunos códecs, esto da lugar a una o más patentes mancomunadas que permiten a las empresas recuperar los costos de sus inversiones en investigación y desarrollo. Por el contrario, VP9 fue desarrollado exclusivamente por Google, mientras que AV1 fue desarrollado por la Alianza de Empresas de Medios Abiertos, que aportaron todas sus patentes a AOM sobre una base libre de regalías.
Sin embargo, el hecho de que una empresa u organización afirme ser la propietaria de todos los derechos de una tecnología no hace que sea así. Aunque Google afirma que VP9 es de código abierto, al igual que la Alianza para los Medios Abiertos para AV1, el administrador del fondo de patentes Sisvel ha lanzado fondos de patentes tanto para VP9 como para AV1, afirmando que estos códecs utilizan invenciones cubiertas por los propietarios de patentes en sus fondos (nótese que el autor consulta con Sisvel sobre estos fondos).
Por supuesto, tanto el H.264 como el HEVC están sujetos a derechos de autor tanto para los codificadores como para los decodificadores y algunos tipos de contenido, por lo que la mera existencia de un derecho de autor no condena a la tecnología. Más bien, los posibles licenciantes se preocupan por la cohesión de ese grupo, la claridad de sus condiciones de licencia y la rapidez con que están disponibles.
En 2017, Jonathan Samuelsson, director general de la empresa desarrolladora de códecs Divideon, creó el gráfico que se muestra en la figura 3, que se convirtió en el niño del póster de la disfuncionalidad representada por los propietarios de las patentes relacionadas con la HEVC. Se ven los tres consorcios, y múltiples empresas adicionales, algunas muy significativas, no en cualquier consorcio. Nótese que este es el gráfico original diseñado por Samuelsson; la imagen de la propiedad ha cambiado un poco desde entonces.
Claramente, si usted es un potencial licenciador, preferiría un único grupo que incluyera a todos los contribuyentes de tecnología conocidos, lo que en realidad podría suceder para EVC y LCEVC. Dicho esto, la mayoría de las normas principales tienen más de un fondo común; lo que los licenciantes quieren es una estructura oportuna y conocida para todos los principales contribuyentes. Es significativo que, aunque la norma VVC se terminó en julio de 2020, es poco probable que se conozcan las condiciones de las licencias hasta mediados de 2021. Si se parecen en algo a lo que se ve en la figura 3, es posible que el VVC nunca llegue a despegar.
Si eres un editor de streaming, las preguntas 4-8 dictan la rapidez con la que los desarrolladores de hardware y software pueden adoptar un códec, lo que controla la rapidez con la que puedes empezar a utilizar el códec para entregarlo a tus espectadores. Esta pregunta determina cuánto le costará a usted, como editor de streaming, implementar el contenido con ese códec.
Una vez más, las regalías de contenido no son inauditas y no condenan al fracaso a un códec; tanto el HEVC como el H.264 tienen algunas regalías de contenido. Sin embargo, es evidente que estos costos deben insertarse en el modelo de equilibrio para determinar cuándo y si tiene sentido económico desplegar el nuevo códec.
Mirando hacia atrás, es fácil ver por qué H.264 fue (es) tan exitoso: ofrecía un modesto ahorro de ancho de banda pero jugaba en las computadoras inmediatamente gracias a Flash, y ofrecía la entrada a un nuevo mercado (móvil). La concesión de licencias estaba controlada por un único consorcio de patentes que poseía la mayoría de las patentes asociadas, y aunque se requería un hardware para la reproducción de H.264 en los dispositivos móviles, el soporte de hardware era casi universal al principio y pronto se convirtió en omnipresente.
En cambio, la HEVC debutó con una estructura de licencias muy desarticulada que desalentaba la adopción de la tecnología. Aunque el apoyo de HEVC es casi universal en los dispositivos móviles, los televisores inteligentes y las últimas generaciones de dispositivos OTT, la falta de apoyo de los navegadores reduce el rendimiento general de la inversión, mientras que la falta de claridad sobre las regalías de contenido es una gran preocupación para muchos editores. Como resultado, la HEVC ha sido implementada principalmente por los editores que distribuyen videos 4K y HDR en la sala de estar.