MPEG-4

Материал из Национальной библиотеки им. Н. Э. Баумана
Последнее изменение этой страницы: 04:05, 23 октября 2017.
MPEG-4
MP4.png
Расширение файла .mp4,.264,.m4a,.m4b,.m4e,.m4u,.mp4,.mp4v,.ttxt,.264,.60d
Интернет-тип носителя video/mp4, audio/mp4, application/mp4
Тип кода mpg4
Разработчик ISO
Тип формата container
Контейнеры для Аудио, видео и текст.
Расширенный от MPEG-4 Part 12
Стандарт ISO/IEC 14496-14


MPEG (Moving Pictures Experts Group) — это название экспертной группы ISO, которая работает над созданием стандартов кодирования и сжатия видео- и аудиоданных. Стандарты, подготовленные комитетом, получают такое же название. MPEG-4 включает в себя многие функции MPEG-1, MPEG-2 и других подобных стандартов, добавляя такие функции, как поддержка языка виртуальной разметки VRML для показа 3D объектов, объектно-ориентированные файлы, поддержка управления правами и разные типы интерактивного медиа. AAC, который был стандартизован как дополнение к MPEG-2 (уровень 3), был также расширен и включен в MPEG-4.

История разработки стандартов

Первым на рынке появился стандарт MPEG-1. Он был разработан в 1992 году для компрессии видео на CD-ROM и лег в основу Video-CD. Качественные параметры видеоданных, обработанных MPEG-1, во многом аналогичны обычному VHS-видео, поэтому этот формат применяется в первую очередь там, где неудобно или непрактично использовать стандартные аналоговые видеоносители. Формат получил большое распространение в Азии и серьезно потеснил VHS-устройства. В стандарте MPEG-2 по сравнению с MPEG-1 добавлен многоканальный звук, увеличено разрешение изображения, улучшено качество кодирования. В результате, MPEG-2 получил широкое распространение в спутниковом телевещании и индустрии DVD. MPEG-3 должен был стать новым стандартом, но в итоге всего лишь немного расширил возможности MPEG-2. Поистине революционным является MPEG-4, разработка которого была официально завершена в 1998 году. Но так как MPEG-4 — это, по сути, набор инструментов, то они расширяются и дополняются. Последние подобные дополнения к стандарту были сделаны в мае этого года. Он стал расширением MPEG-1 и MPEG-2 и несет в себя много новаторских решений, далеко не все из которых пока нашли применение в устройствах и медиаконтенте.

Ключевые особенности 4-го стандарта

Стандарт MPEG-4 задает принципы работы с цифровым представлением медиаданных для трех областей: собственно интерактивного мультимедиа (включая продукты, распространяемые на оптических дисках и через Сеть), графических приложений (синтетического контента) и цифрового телевидения — DTV. MPEG состоит из трех частей: Audio, Video, System (объединение и синхронизация двух других). Фактически формат задает правила организации среды, причем среды объектно-ориентированной. Он имеет дело не просто с потоками и массивами медиаданных, а с медиаобъектами. При одном и том же битрейте и определённых условиях кодирования, качество изображения фильма в MPEG-4 может быть сравнимо или даже лучше, чем в случае применения MPEG-1 или MPEG-2. Алгоритм компрессии видео в MPEG-4 работает по той же схеме, что и в предыдущих форматах. При кодировании исходного изображения кодек сохраняет ключевые кадры, а вместо сохранения промежуточных — прогнозирует и сохраняет лишь информацию об изменениях в текущем кадре по отношению к предыдущему. Полученная таким образом информация помещается в файл. Компрессия звука чаще всего производится в формат MP3, Ogg Vorbis, WMA. Однако возможно использование любого кодека, вплоть до применяемого в DVD шестиканального AC-3.

  1. Краткое описание
    1. Разделяет картинку на различные элементы, называемые media objects (медиа объекты)
    2. Описывает структуру этих объектов и их взаимосвязи чтобы затем собрать их в видеозвуковую сцену
    3. Позволяет изменять сцену, что обеспечивает высокий уровень интерактивности для конечного пользователя
  2. Видеозвуковая сцена состоит из медиа объектов, которые объеденены в иархическую структуру:
    1. Неподвижные картинки (например фон)
    2. Видео объекты (говорящий человек)
    3. Аудио объекты (голос связанный с этим человеком)
    4. Текст связанный с данной сценой
    5. Синтетические объекты - объекты которых не было изначально в записываемой сцене, но которые туда добавляются при демонстрации конечному пользователю (например синтезируется говорящая голова)
    6. Текст связанный с головой из которого в конце синтезируется голос
  3. Такой способ представления данных позволяет:
    1. Перемещать и помещать медиа объекты в любое место сцены
    2. Трансформировать объекты, изменять геометрические размеры
    3. Собирать из отдельных объектов составной объект и проводить над ним какие-нибудь операции.
    4. Изменять текстуру объекта (например цвет), манипулировать объектом (заставить ящик передвигаться по сцене)
    5. Изменять точку наблюдения за сценой

В чём отличие MPEG-4 от предыдущих версий?

Стандарт MPEG-4 задает принципы работы с контентом (цифровым представлением медиа-данных) для трех областей: собственно интерактивного мультимедиа (включая продукты, распространяемые на оптических дисках и через Сеть), графических приложений (синтетического контента) и цифрового телевидения — DTV; фактически данный формат задает правила организации среды, причем среды объектно ориентированной. Он имеет дело не просто с потоками и массивами медиа-данных, а с медиа-объектами (ключевое понятие стандарта). В MPEG-4 определен двоичный язык описания объектов, классов и сцен — BIFS, который разработчики характеризуют как "расширение Си++".

Стандарт MPEG-4 представляет пользователям гибкие средства работы с мультимедийным контентом. Помимо работы с аудио и видео, формат позволяет работать с естественными и синтезированными компьютером 2D и 3D объектами, производить привязку их взаимного расположения и синхронизацию друг относительно друга, а также указывать их интерактивное взаимодействие с пользователем. Кроме того, формат обеспечивает доступ к мультимедийной информации через каналы различной пропускной способности.

Алгоритм компрессии видео в MPEG-4 работает по той же схеме, что и в предыдущих форматах. При кодировании исходного изображения кодек ищет и сохраняет ключевые кадры, на которых происходит смена сюжета. А вместо сохранения промежуточных кадров прогнозирует и сохраняет лишь информацию об изменениях в текущем кадре по отношению к предыдущему. Полученная таким образом информация сжимается по алгоритмам компрессии, аналогичным тем, что применяются в архиваторах. Компрессия звука чаще всего производится в формат MP3 или WMA. Однако возможно использование любого кодека, вплоть до применяемого в DVD шестиканального AC-3 потока (единственное требование — чтобы данный аудиокодек был установлен в системе). Кардинальное нововведение при компрессии видео в MPEG-4 заключается в следующем. В отличие от предыдущих форматов, которые делили изображение на прямоугольники, при обработке изображений кодек оперирует объектами с произвольной формой. К примеру, человек, двигающийся по комнате, будет воспринят как отдельный объект, перемещающийся относительно неподвижного объекта — заднего плана. Естественно, алгоритмы поиска и обработки подобных объектов требуют гораздо больше вычислительных ресурсов, нежели в случае MPEG-1/2. Но с учетом быстродействия современных компьютеров последнее обстоятельство нельзя рассматривать сегодня как крупное препятствие на пути широкого распространения формата MPEG4. Для сравнения — во времена выхода MPEG-2, в 1995 году, частота процессора новых PC составляла около 100 МГц. Сегодня эта цифра возросла в несколько десятков раз! Для простого пользователя наибольший интерес представляет именно хранение и воспроизведение видео на компьютере. Этот формат вполне можно назвать дешевой и как следствие более доступной альтернативой DVD в области развлечений.

Качество изображения MPEG-4 фильмов

Качество фильмов в формате MPEG-4 зависит от многих факторов, их можно условно разделить на три группы. Качество исходного материала. К примеру, если фильм с двух VideoCD (MPEG-1) компакт-дисков c разрешением 352*288 сжимается до одного диска в MPEG-4 или, что того хуже, с пиратской видеокассеты, то ни о каком приемлемом качестве не может быть и речи.


Параметры сжатия исходного видеоматериала: битрейт (поток данных, который проходит через декодер), размер изображения и другие, менее существенные. Значение этих параметров определяет прежде всего продолжительность фильма. Так, на один CD можно вместить фильм продолжительностью полтора часа, а можно исхитриться впихнуть и трехчасовой. При этом понятно, что в первом случае поток данных оказывается шире, а требуемая степень компрессии меньше. Следовательно, фильм будет сжат и записан на CD с меньшими потерями в качестве изображения. Оптимальный выбор параметров кодирования в MPEG-4 является строго индивидуальным и зависит от конкретного фильма. Поэтому без достаточного опыта в этом деле трудно добиться хорошего результата. Не секрет, что все фильмы в MPEG-4 имеют кустарное изготовление. Зачастую качество изображения очень низкое, а впечатление от просмотра фильма может быть полностью испорчено артефактами и постоянными рывками изображения. В формате DVD, напротив, фактически все диски имеют изображение и звук превосходного студийного качества.


Параметры декомпрессии сжатого видео, настройки видеокарты, монитора/телевизора и быстродействие компьютера, используемого для просмотра. Чем меньше быстродействие, тем больше будут заметны рывки изображения, выпадение кадров (особенно в динамичных сценах). На факторы первых двух групп по понятным причинам зритель никакого влияния оказать не может, поэтому мы их не будем рассматривать. Здесь остается только посоветовать тщательнее выбирать диски. Факторы третьей группы зависят всецело от пользователя и его компьютера.

DivX VS MPEG-4 ?

DivX — кодек, производящий компрессию/декомпрессию изображения, сжатого в стандарте MPEG-4. В стремлении вытеснить с рынка потокового видео конкурентов (к примеру Apple c его QuickTime) в Microsoft занялись разработкой кодека, позволяющего компрессировать видеопоток в формат MPEG-4. Оригинальный кодек DivX ;-) (<-- это смайлик ) 3.11 Alpha являлся взломанной версией MPEG-4 Version 3 (MP43c32.dll). Авторы патча, известные под прозвищами MaxMorice и Gej, опубликовали его в сентябре 1999 года на своем Web-сайте. Смайлик в названии появился неслучайно. В то время американская компания Circuit City пыталась продвигать на рынке видеосистемы Digital Video Express (DIVX) на основе Pay-per-View (оплата за просмотр). Бизнес-идея — продажа фильмов на компакт-дисках, стоимость которых была бы невысока, но для повторного просмотра необходимо было вносить плату. Тогда взломать систему защиты Digital Video Express было целью многих американских хакеров. До того как это удалось сделать, DivX исчезла с рынка по экономическим соображением, а французские программисты MaxMorice и Jerome «Gej» Rota увековечили ее в названии нового формата. В дальнейшем появлялись все новые и новые пропаченные версии кодека, где в качестве контейнера для видео и звуковой дорожки (основные причины несовместимости) планировалось использовать собственную разработку. По мнению DivX Networks, формат AVI предоставляет оптимальный вариант для хранилища, но требует небольших доработок. Велись переговоры по лицензированию и звукового формата. Параллельно независимой командой на основе OpenDivX был создан формат XviD, который менее популярен.

Софт для воспроизведения

В заголовке MPEG-4 видеофайла есть информация о том, каким кодеком он закодирован. Вариантов обычно два: либо это стандартный Microsoft MPEG-4, либо DivX. Существуют утилиты, позволяющие переправлять заголовок файла и таким образом обманывать программу-плеер.

WM Player

Windows Media Player

Данный плеер представляет собой приложение, использующее в своей работе компонент ActiveMovie. Собственно, возможностями последнего и определяется набор типов файлов, которые можно проигрывать с помощью этого плеера. Достоинства: относительно низкая загрузка процессора, достаточно удобный, не перегруженный интерфейс, входит в поставку c ОС Windows 98, Me, 2000. Недостатки: отсутствует возможность включения/отключения оверлеев, нет поддержки многоканального звука.

BS Player

BS Player
  • Удобный плеер с богатыми функциональными возможностями, среди них:
  • Встроенный собственный DirectShow фильтр для улучшения качества изображения;
  • Наложение на изображение информации о времени проигрывания и уровне звука;
  • Поддержка субтитров;
  • Возможность просмотра видео в замедленном 1/2X и ускоренном 2X режиме;
  • Поддержка многоканального звука;
  • Возможность (с рядом ограничений) включения/отключения вывода изображения через оверлей;
  • Многоязычный интерфейс. Есть поддержка русского;
  • Эмуляция основного меню DVD диска.

Кроме того, плеер позволяет делать скриншоты с фильма, даже при включенном оверлее. Можно принудительно изменять формат вывода изображения между 4:3, 9:16 и оригинальным. Единственным недостатком плеера является несколько более высокий уровень загрузки процессора по сравнению с WMP 6.4.


Части стандарта MPEG-4

  • Часть 1 (ISO/IEC 14496-1): Systems: Описывает синхронизацию и мультиплексирование видео и аудио. Например транспортный поток.
  • Часть 2 (ISO/IEC 14496-2): Visual: Описывает кодеки для видео (видео, статических текстур, синтетических изображений и т. д.). Один из нескольких «профилей» в Части 2 — это Advanced Simple Profile (ASP) — наиболее широко используемая часть стандарта MPEG-4.
  • Часть 3 (ISO/IEC 14496-3): Audio: Набор кодеков для сжатия звука и речи, включая Advanced Audio Coding (AAC) и несколько инструментов для обработки звука (речи).
  • Часть 4 (ISO/IEC 14496-4): Conformance: Описывает процедуру тестирования на совместимость частей стандарта.
  • Часть 5 (ISO/IEC 14496-5): Reference Software: Содержит программы (software) для демонстрации и более ясного описания других частей стандарта.
  • Часть 6 (ISO/IEC 14496-6): (Delivery Multimedia Integration Framework-DMIF).
  • Часть 7 (ISO/IEC 14496-7): Оптимизированное справочное программное обеспечение: содержит примеры того, как делать улучшенные реализации (например, в отношении части 5).
  • Часть 8 (ISO/IEC 14496-8): Формат передачи в IP-сетях: определяет способ переноса содержимого MPEG-4 в IP-сетях.
  • Часть 9 (ISO/IEC 14496-9): Справочное оборудование: предоставляет аппаратные схемы для демонстрации того, как реализовать другие части стандарта.
  • Часть 10 (ISO/IEC 14496-10): Улучшенное кодирование видео: кодек для видеосигналов, который также называется AVC и технически идентичен стандарту ITU-T H.264.
  • Часть 11 (ISO/IEC 14496-11): Описание сцены и механизм приложений, также называемый BIFS; Может использоваться для богатого интерактивного контента с несколькими профилями, включая 2D и 3D версии.
  • Часть 12 (ISO/IEC 14496-12): Формат файла базы данных ISO: формат файла для хранения медиаконтента.
  • Часть 13 (ISO/IEC 14496-13):Расширения управления интеллектуальной собственностью и защиты (IPMP).
  • Часть 14 (ISO/IEC 14496-14):Формат файла MPEG-4: указанный формат файла контейнера для контента MPEG-4, основанный на части 12.
  • Часть 15 (ISO/IEC 14496-15): Формат AVC-файла: для хранения видео части 10 на основе части 12.
  • Часть 16 (ISO/IEC 14496-16): Анимация, базирующаяся на Framework'е eXtension (AFX).
  • Часть 17 (ISO/IEC 14496-17): Формат субтитров.
  • Часть 18 (ISO/IEC 14496-18): Сжатие шрифтов и потоковая передача (для шрифтов OpenType).
  • Часть 19 (ISO/IEC 14496-19): Синтезируемый поток текстуры.
  • Часть 20 (ISO/IEC 14496-20):Легкое представление сцены (LASeR) (достиг стадии «FCD» в январе 2005 года, на момент 2008 года полностью закончен)
  • Часть 21 (ISO/IEC 14496-21):Графическая рамка MPEG-J eXtension (GFX) (еще не закончена - на этапе «FCD» в июле 2005 года, FDIS, январь 2006 года, полностью реализованы графические фрэймворки к концу 2009 года).
  • Часть 22 (ISO/IEC 14496-22): Спецификация Open Font Format Specification (OFFS) на основе OpenType.

Также внутри частей определены профили стандартов, поэтому реализация какой-то части стандарта ещё не означает полной поддержки этой части.

Лицензирование

В MPEG-4 содержатся патентованные технологии, которые требуют лицензирования в странах, признающих патенты на программное обеспечение. Патенты, покрывающие MPEG-4, принадлежат двум десяткам компаний. MPEG Licensing Authority может лицензировать пакет, необходимый для поддержки MPEG-4 от широкого спектра компаний (аудио лицензируется независимо). Осуществить лицензирование за один шаг сейчас невозможно.

Несколько источников в Интернете утверждают, что AT&T пытается возбудить иск против компании Apple по поводу нарушения патента MPEG-4. Это действие AT&T против Apple показывает, насколько сложно узнать, какие компании имеют патенты, покрывающие MPEG-4.

Контейнеры

  • OGG — создан компанией Xiph Foundation( создан на основе OGG, но не является официальным стандартом фонда Xiph.Org)
  • Matroska — файлы .mkv и .mka.
  • NUT — разработан группой MPlayer.

Видеокодеки

  • DivX — кодек, основанный на стандарте MPEG-4. Версия 3.11 сходна MPEG-4 и H.263, но имеет отличия, например, заголовок кадра. Версия 4 основана на MPEG-4 SP, версия 5 и выше — на MPEG-4 ASP.
  • x264 — H.264 (MPEG-4 part 10) реализация.
  • XVID — кодек MPEG-4 part 2, совместимый с DivX.
  • FFmpeg-кодеки — кодеки в библиотеке libavcodec из проекта FFmpeg (FFV1, Snow, MPEG-1, MPEG-2, MPEG-4 part 2, MSMPEG-4, H.264, WMV2, SVQ3, MJPEG, HuffYUV, Indeo и другие).
  • Tarkin — экспериментальный видеокодек, сжимающий с потерями, разрабатываемый Xiph.org Foundation и основанный на 3-D-вейвлет сжатии.
  • Lagarith — видеокодек без потерь.
  • Theora — основан на VP3, часть OGG Project.
  • Dirac — основанный на вейвлетах кодек, созданный BBC.
  • Huffyuv — кодек без потерь от BenRG.

Аудиокодеки

  • FLAC — сжатие без потерь.
  • iLBC — сжатие звука с низким битрейтом.
  • Musepack — сжатие с потерями; попытка воспроизвести формат MP3.
  • Speex — сжатие с низким битрейтом, в основном речи.
  • TTA — сжатие без потерь.
  • Vorbis — сжатие с потерями; разработан Xiph.org.
  • WavPack — сжатие с потерями/без потерь.

Cсылки

Описание форматов и кодеков MPEG-4 . [2017—2017]. Дата обновления: 23.04.2017.https://wiki.archlinux.org/index.php/wmii . (дата обращения: 23.04.2017).

Пользовательский FAQ по MPEG-4 . [2017—2017]. Дата обновления: 24.04.2017. http://www.ixbt.com/dvd/mpeg4-faq.shtml . (дата обращения: 24.04.2017).