Типы и виды графических, текстовых, аудио и видео форматов. Измерение звуковой волны. · Цифровая запись, когда реальные звуковые волны записываются и конвертируются в цифровые данные

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

хорошую работу на сайт">

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Введение

Multimedia - это подхваченный всеми термин, обозначающий интерактивный инструмент для работы с графикой, анимацией, звуком и видео. Мультимедиа привносит блеск в презентации, живопись и игры, и, кроме того, доставляет удовольствие при обучении. Она превращает компьютер из настольной системы с клавиатурой и монитором в некий «космический аппарат», укомплектованный динамиками, микрофоном, наушниками, джойстиками и компакт-дисками.

1. Что же такое мультимедиа?

программный мультимедиа графика звук

Мультимедиа позволяет работать на компьютере со всеми видами информации, а не только с текстом или обычными рисунками. Мультимедиа - это цифровая информация, имеющая более широкие возможности, чем другие ее виды.

ь Поскольку звуковая и графическая информация записывается в цифровой форме, она может копироваться без потери качества.

ь Цифровая информация может сжиматься до минимума для хранения.

ь Можно записать огромное количество информации на CD-ROM, а сам CD-ROM занимает очень мало места.

ь Интерактивные компьютерные программы, использующие цифровые медиасистемы, являются отличными средствами обучения.

Если вы покупаете компьютер со встроенными средствами мультимедиа или устанавливаете на свой компьютер, то вам необходимо разобраться в многообразии средств мультимедиа, а также познакомиться с существующими способами записи и воспроизведения. Существуют два основных вида систем мультимедиа:

o Системы воспроизведения . Эти системы, как правило включают многоскоростной дисковод CD-ROM, звуковую карту, динамики и видеосистему с относительно высоким разрешением. Не помешает также наличие карты декомпрессии, работающей с цифровой информацией.

o Авторские системы . (системы, используемые для создания файлов систем мультимедиа). Авторские системы, как правило, включают такие компоненты, как микрофоны и видеокамеры для записи звука и съемки видеоизображений. Они также высокоскоростные, емкие жесткие диски, способные хранить и обслуживать большие объемы информации, требующиеся для цифрового видео.

В 80-х годах персональный компьютер состоял из микропроцессора (CPU), клавиатуры, монитора, дисковода и принтера. Все, что вы могли сделать на компьютере, - это работать с текстом. Люди тратили очень много времени, оформляя письма, производя финансовые расчеты и просматривая базы данных.

Но теперь, когда появились такие графические пользовательские интерфейсы, как Windows95/98 (SE)/МЕ/NT/2 k., и значительно более мощные персональные компьютеры, начали появляться приложения, предоставляющие возможность использовать анимационные эффекты, звук и видео. В конце 1980 г. люди начали сочинять музыку на компьютере, комбинируя анимацию и звук, создавая захватывающие мультимедиа-презентации со звуком и движущимися картинками. Оборудование, однако, было дорогим, а результаты часто не оправдывали ожиданий. Windows3.1 и DOS не имели достаточно ресурсов для поддержки систем мультимедиа, поэтому картинки на экране двигались очень медленно.

2. Мультимедиа и Windows 95/9 8 (SE)/МЕ/NT/2k /XP

Благодаря Windows все преобразовалось. Она поддерживает средства значительно улучшающие работу с мультимедиа.

ь Windows95/98 (SE)/МЕ/NT/2k. является 32-разрядной, многозадачной, многопоточной операционной системой. Это означает, что Windows поддерживает выполнение нескольких задач одновременно, проигрывание мультимедиа-презентаций и работу пользователей в диалоговом режиме.

ь При установке Windows автоматически определяет конфигурацию мультимедиа устройств.

ь Приложения Windows поддерживают мультимедиа. Вы можете создавать составные документы, т.е. документы, включающие звук , видео, графику, диаграммы, картинки и другие элементы различных приложений.

ь Windows поддерживает форматы компакт-дисков Sony/Philips CD+ и Kodak PhotoCD, а также позволяет легко запускать программы и проигрывать диски с устройства CD-ROM.

ь Видеостандарт Windows широко поддерживается в компьютерной индустрии. Разработчики мультимедиа-продуктов могут спокойно распространять свою продукцию, зная, что она будет работать под Windows.

ь Мультимедиа-продукты, разработанные для Windows, как правило, являются продуктами высокого качества, так как Windows поддерживает большие видеоокна и 32-разрядная архитектура Windows улучшает прохождение данных.

ь Windows поддерживает интерфейс Sony VISCA. Это означает, что в приложениях вы можете использовать так называемые VCR-кнопки (VCR - английская аббревиатура от Video Cassette Recorder - видеомагнитофон, т.е. кнопки, функционально аналогичные кнопкам перемотки, воспроизведения и другим на аудио- и видеовоспроизводящих устройствах) при проигрывании лазерных дисков.

ь Качество игр в Windows значительно улучшено за счет нового программного графического интерфейса.

ь Windows поддерживает множество различных стандартных промышленных звуковых и видеоустройств компрессии информации при ее записи в файл, а также декомпрессии при воспроизведении (так называемых кодек-устройств). Кодек сокращает объем мультимедиа-файлов и позволяет распространять их в различных форматах.

Наиболее важным средством мультимедиа в последние несколько лет стало видео. Видео вмещает невероятное количество информации, которая может быть сжата перед перенесением ее с одного устройства на другое, например, из видеокамеры на жесткий диск через шину компьютера. Применение технологии сжатия аудио- и видеоинформации позволяет расширить рынок средств мультимедиа.

3. Системы мультимедиа

Дополнительными периферийными устройствами к компьютеру в середине 80-х годов были дисководы, сканеры, принтеры и коммуникационные средства типа модем. В 90-х годах появляется звуковые карты , видео-карты, дисководы CD-ROM и высокоскоростные коммуникационные средства, благодаря которым теперь вы можете связаться с информационной службой, передающей вам мультимедиа по проводам.

Ниже перечислены минимальные требования для запуска мультимедиа под Windows.

ь Процессор Intel 80486 (Для цифровых видеоприложений рекомендуется Pentium).

ь Шина PCI для передачи данных для контроллера диска и видеокарты.

ь Жесткий диск большого объем (от 300 Мбайт). Для высококачественных цифровых видеосистем требуется гигабайты памяти.

ь CD-ROM со скоростью не ниже 4-х с регулировкой звука на передней панели.

ь Звуковая карта , обеспечивающая частоты квантования 11,025; 22,05 и 44,1-кГц для стерео звучания. Также требуется многоголосные и многотембровые устройства, способные воспринимать на входе несколько источников, а на выходе представить стереозвучание.

ь Видеоаппаратуру, поддерживающую высокие разрешения монитора. Microsoft рекомендует для лучшего качества представления видео использовать VESA или PCI видеокарты. В последнее время стали популярны AGP адаптеры.

ь IBM-совместимый аналоговый порт джойстика.

ь MIDI-порт, поддерживающий установленные стандарты для ввода, вывода и передачи данных. Некоторые звуковые карты содержат MIDI-синтезаторы, но в общем случае вы подсоединяетесь к внешнему MIDI-синтезатору, по внешнему виду напоминающему клавиатуру.

MIDI (Musical Instrument Digital Interface - интерфейс цифровых музыкальных инструментов) является стандартом для записи нот и сопутствующей информации, связанной с проигрыванием музыки на электронном музыкальном устройстве. Реальный звук при этом не записывается.

Вышеперечисленные компоненты необходимы для воспроизведения и записи средствами мультимедиа. Однако, если вы хотите сами создавать мультимедиа-клипы, то вам могут потребоваться дополнительная аппаратура.

4. Типы и стандарты мультимедиа

Мультимедиа-информация храниться в виде файлов специального формата, содержащих звук, видеоизображения, или в файлах формата MIDI.

Аудиомедиа (звуковая медиа) хранится, в основном, в двух форматах, WAV и MIDI. Большинство WAV-файлов требует много дискового пространства, но они могут воспроизводиться с помощью любой звуковой карты. MIDI-файлы занимают значительно меньше места на диске, но могут проигрываться только на MIDI-совместимых устройствах. В настоящее время почти все карты способны воспроизводить MIDI-файлы.

Визуальное медиа - это анимационные файлы и видеофайлы.

Анимация. В Windows, если у вас есть соответствующее приложение, вы можете создавать изображения, перемещающиеся по экрану. Не существует стандартного формата анимационного файла, однако многие разработчики одновременно развивают производство как анимационных средств, так и воспроизводящей аппаратуры. Анимация может сопровождаться звуковыми файлами разных форматов.

Видео. Video for Windows - это видеостандарт для Windows. Вы можете записать фильм с видеокамеры или лазерного диска на жесткий диск компьютера и сохранить его как файл в формате AVI либо MPG. Сжатие требуется лишь для высококачественного видео и его эффективного хранения.

5. О звуковой мультимедиа

Приложения для записи и воспроизведения звука были одними из первых известных приложений мультимедиа для персонального компьютера. Добавив звуковую карту, вы сможете записывать сообщение, переданное голосом, сохранять его как файл на диске, переносить его на другой компьютер, где оно также может быть воспроизведено. Вы также можете записывать музыку и звук для компьютерных презентаций.

Существует два способа звукозаписи:

· Цифровая запись , когда реальные звуковые волны записываются и конвертируются в цифровые данные.

· MIDI апись , вообще говоря, является не реальным звуком, а записью нажатий на клавиши или другой операций, выполняемых на синтезаторах или MIDI-совместимых электромузыкальных устройствах. MIDI-файл является электронным эквивалентом игры на фортепиано.

6. Цифровая запись

Звуковая плата преобразует звук на выходе в цифровую информацию путем измерения звука тысячи раз в секунду. Цифровой звук хранится в файлах с расширением WAV. При записи звука аналого-цифровой преобразователь конвертирует звук в цифровые данные. При воспроизведении звука цифроаналоговый преобразователь конвертирует цифровые данные в аналог звуковой волны.

Звук представляет собой вибрации, которые формируют волну с соответствующими амплитудой и периодом, как это показано на рис. 1. Амплитуда выражает высоту волны, или громкость звука. Период - это расстояние между двумя звуковыми волнами. Наконец, частота показывает количество периодов в секунду и измеряется в герцах. Например, сто периодов в секунду - это 100 Гц. Человек может воспринимать звук с частотой от 20 до 20000 Гц, и вся выпускаемая звуковоспроизводящая и звукозаписывающая аппаратура рассчитана на этот диапазон частот.

Измерение звуковой волны

Для того чтобы записать звук и хранить его на цифровом устройстве типа вашего компьютера, производится квантование звука, т.е. разбиение звуковой волны на определенные интервалы по времени. Звуковая волна, показанная на рис. 2, была разбита на 16 интервалов. Если предположить, что продолжительность звуковой волны равна одной секунде, то ее частота квантования - 16 Гц.

Квантование волны при частоте квантования 16 Гц

Как правило, такая низкая частота квантования не используется. Даже цифровой звук с частотой квантования 100 или 1000 Гц не будет распознаваться при воспроизведении. Это происходит потому, что цифровое представление волны в данном случае не сглажено. Фильтрующая аппаратура сглаживает волну, однако наилучшим способом получения качественной цифровой записи является повышение частоты квантования. Следует учесть, что при этом увеличивается объем хранящихся данных, что потребует больше памяти на диске.

Стандартам мультимедиа соответствуют три типа частоты квантования: 11,025; 22,05; 44,1 кГц. Частота квантования зависит от записываемого звука: 11,025 кГц подходит для записи голоса, но для получения высококачественной записи требуется частота квантования 44,1 или 48 кГц. Однако повышение частоты квантования приводит к увеличению размера файла и требуемого пространства на диске для его хранения. Формула для расчета дискового пространства будет приведена ниже, но прежде необходимо разобраться с одной переменной - числом разрядов (бит), используемым для хранения информации о квантовании.

Каждый интервал содержит информацию о малом временном сегменте звука. Количество разрядов для записи каждого интервала определяет точность аппроксимации звуковой волны, однако увеличивает размер файла, в котором хранится цифровой звук. 4-разрядное разбиение на интервалы обеспечивает деление амплитуды звуковой волны по вертикали на 16 уровней, а 8-разрядное разбиение - на 256 уровней. Для высококачественной записи требуется 16-разрядное разбиение на интервалы по амплитуде, которое определяет 65536 уровней амплитуды.

Предшествующее обсуждение касалось сглаженной звуковой волны, но реальная волна не сглажена - она состоит из многих различных частот, которые вместе создают тембр звука. Тембр - это уникальный звук, присущий инструменту. Например, колебания струны и резонатор определяют звучание скрипки (уникальное звучание скрипки Страдивари является результатом добавления ценных веществ в ее полировку). Скрипка производит целый комплекс звуковых волн, как это показано на рис. 3.

Теперь вы видите важность повышения частоты квантования и разрядности звуковой платы при записи звука. Вам необходимо знать не только амплитуду каждого выбранного интервала, но и все, что происходит с волной за единицу времени. Повышение частоты квантования и разрядности звуковой платы обеспечивает качественную запись звука, однако, следует помнить, что это приводит к значительному увеличению дискового пространства, необходимого для хранения записываемого звука. К счастью, если вы записываете голос, то нет необходимости использовать большую частоту квантования и разрядность звуковой платы.

Реальные звуковые волны имеют весьма сложную форму и для получения их высококачественного цифрового представления требуется высокая частота квантования

Ниже приводится формула расчета требуемого дискового пространства для хранения цифрового звука:

на секунду

В табл. 1. приведено требуемое пространство на диске для хранения записи звука продолжительностью одна минута для каждой частоты квантования при разрядности 8 бит. Первая строка в таблице соответствует низкокачественной записи голоса, а последняя строка - стандартам, установленным для цифровых аудиокомпакт-дисков.

Требования по хранению звуковых файлов

Разрядность

Частота квантования

Байт для хранения

0,66 Мбайт/мин

1,32 Мбайт/мин

2,646 Мбайт/мин

5,292 Мбайт/мин

Заметим, что высокая частота квантования и разрядность не требуются, если звук был записан и проигрывается на оборудовании более низкого качества. Например, карманный микрофон записывает звук гораздо более низкого качества, чем запись при частоте квантования 44 кГц. Если у вас высококачественная запись, то для ее воспроизведения соответственно требуется аппаратура высокого качетва.

7. Звук и типы звуковых файлов

Звук - это физическое природное явление, распространяющееся посредством колебаний воздуха и, следовательно, можно сказать, что мы имеем дело только с волновыми характеристиками. Задачей преобразования звука в электронный вид является повторение всех его этих самых волновых характеристик. Но электронный сигнал не является аналоговым, и может записываться посредством коротких дискретных значений. Пусть они имеют малый интервал между собой и практически неощутимы, на первый взгляд для человеческого уха, но мы должны всегда иметь в виду, что имеем дело только с эмуляцией природного явления именуемого звуком.
Такая запись именуется импульсно-кодовой модуляцией и являет собой последовательную запись дискретных значений. Разрядность устройства, исчисляемая в битах, говорит о том сколькими значениями одновременно в одном записанном дискрете, берется звук. Чем больше разрядность, тем больше звук соответствует оригиналу.

Любой звуковой файл можно представить, чтобы Вам было наиболее понятно, как базу данных. Она имеет свою структуру, о параметрах которой указывается обычно вначале файла. Потом идет структурированный список значений по определенным полям. Иногда вместо значений стоят формулы, позволяющие уменьшать размер файла. Данные файлы могут читать только специализированные программы, в которые заложен блок чтения.

РСМ расшифровывается как pulse code modulation, что и является в переводе как импульсно-кодовая. Файлы именно с таким расширением встречаются довольно редко (я встречал только в программе 3D Audio). Но РСМ является основополагающей для всех звуковых файлов. Я бы не сказал, что это очень экономный метод для хранения данных на диске, но думаю, что от этого уже никогда точно не уйдешь, причем объемы современных винчестеров уже позволяют не обращать внимания на пару десятков мегабайт.

Изыскания по поводу экономного хранения звуковых данных на диске. Если Вы встречаете данную аббревиатуру, то знайте, что имеете дело с разностным РСМ. В основе данного метода лежит та вполне оправданная идея, что вычисления гораздо более громоздки по сравнению с тем, что можно просто указать значения разности.

Адаптивный DPCM. Согласитесь, что при указании просто значений разности может возникнуть проблема с тем, что есть очень маленькие и очень большие значения. В результате, какие бы супер-точные измерения не были все равно имеет место искажение действительности. Поэтому в адаптивном методе добавлен коэффициэнт масштабируемости.

Самое простое хранилище дискретных даннных. Я бы сказал прямое. Один из типов файлов семейства RIFF. Помимо обычных дискретных значений, битности, количества каналов и значений уровней громкости в wav может быть указано еще множество параметров, о которых Вы, скорее всего, и не подозревали - это: метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также есть место для того, чтобы Вы смогли разместить там текстовую информацию.

Resource Interchange File Format. Уникальная система хранения любых структурированных данных.

Эта технология хранения данных проистекает от Amiga-систем. Interchange File Format. Почти то же, что и RIFF, только имеются некоторые нюансы. Начнем с того, что система Amiga - одна из первых, в которой стали задумываться о программно-сэмплерной эмуляции музыкальных инструментов. В результате, в данном файле звук делится на две части: то, что должно звучать вначале и элемент того, что идет за началом. В результате, звучит начало один раз, за тем повторяется второй кусок столько раз, сколько Вам нужно и нота может звучать бесконечно долго.

Файл хранит в себе короткий образец звука, который потом можно использовать в качестве шаблона для инструмента. Проще говоря, прошитый в синтезатор сэмпл.

AIF или AIFF

Audio Interchange File Format. Данный формат распространен в системах Apple Macintosh и Silicon Graphics. Заключает в себе сочетание MOD и WAV.

AIFC или AIFF

Тот же AIFF, только с заданными параметрами сжатия (компрессии).

Опять же та же гонка за экономией места. Структура файла намного проще, чем в wav, но там указан метод кодирования данных. Файлы очень мало «весят», за счет чего получили довольно широкое распространение в Интернете. Чаще всего Вы можете встретить параметры?-Law 8 кГц - моно. Но есть и 16-битные стерео-файлы с частотами 22050 и 44100 Гц. Это звуковой формат предназначен для работы со звуком в рабочих системах SUN, Linux и FreeBCD.

Файл, хранящий в себе сообщения MIDI-системе, установленной на Вашем компьютере или в устройстве.

Самый скандальный формат за последнее время. Многие для объяснения параметров сжатия, которые в нем применяют, сравнивают его с jpeg для изображений. Там очень много наворотов в вычислениях, чего и не перечислишь, но коэффициент сжатия в 10-12 раз сказали о себе сами. Если говорят, что там есть качество, то могу сказать, что там его немного. Специалисты говорят о контурности звука как о самом большом недостатке данного формата. Действительно, если сравнивать музыку с изображением, то смысл остался, а мелкие нюансы ушли. Качество МР3 до сих пор вызывает много споров, но для «обычных немузыкальных» людей потери не ощутимы явно.

Хорошая альтернатива МР3, разве что менее распространенная. Есть и свои недостатки. Закодировать файл в VQF - процесс гораздо более долгий. К тому же, очень мало бесплатных программ, позволяющих работать с данным форматом файлов, что, собственно, и сказалось на его распространении.

Восьмибитный моно-формат от семейства SoundBlaster. Можно встретить в большом количестве старых программ, использующих звук (не музыкальных).

НСОМ

То же самое, что и VOC (восемь бит, моно), но только для Apple Macintosh.

Стандартный формат U-Law. 8 кГц, 8 бит, моно.

Real Audio или потоковая передача аудиоданных. Довольно распространенная система передачи звука в реальном времени через Интернет. Скорость передачи порядка 1 Кб в секунду. Полученный звук обладает следующими параметрами: 8 или 16 бит и 8 или 11 кГц.

Бывает двух видов. Один - это тот же AU для SUN и NeXT. Другой - это 8-мибитный моно-файл для РС и Маков с различной частотой дискретизации.

Существуют и другие типы звуковых файлов, но это, скорее всего, файлы различных программ для создания и обработки музыки. В основном, такие файлы читаются только той программой, в которой они были созданы.

8. Компрессия аудиоданных

Мультимедиа-информация состоит из огромного количества цифровых данных, которые необходимо хранить в сжатом виде. Windows включает в себя средства управления компрессией аудио- и видеоизображений, которые работают с одним или более модулями декомпрессии и называются кодеками (от Компрессия и ДЕКомпрессия). Большое количество программных кодеков поставляются с Windows. Когда вы записываете или воспроизводите звук или видеофайл, Windows автоматически использует кодек.

Многие звуковые и видеокарты имеют встроенные аппаратные кодеки. Windows сначала использует аппаратный кодек, поскольку он быстрее и не очень нагружает процессор. Если аппаратный кодек отсутствует, то Windows применяет программные кодеки. Если она не смогла найти кодек, на экране появится сообщение об ошибке, поскольку сжатый файл невозможно распаковать.

Программа управления компрессией аудиоданных (Audio Compression Manager, ACM) в Windows использует следующие кодеки для компрессии / декомпрессии аудиоданных.

· TrueSpeech Сodec . Кодек, ориентированный на голос, разработанный компанией DSP Group. Используйте этот кодек только при сжатии и передачи по сетям или телефонным линиям файлов, содержащих запись голоса. TrueSpeech производит компрессию данных не в реальном времени, в свою очередь, декомпрессия производится в реальном масштабе времени.

· Microsoft GSM Audio Codec . Кодек, производящий компрессию данных монохромных звуковых записей низкого качества в реальном масштабе времени. Используйте этот кодек при записи голосовых сообщений, вставленных в сообщения электронной почты (e-mail). Для записи голосовых сообщений вы можете использовать приложение Фонограф.

· Microsoft CCITT G.711 A-Law and U-Law Codec . Этот кодек обеспечивает совместимость телефонных стандартов в Европе и северной Америке. Он обеспечивает коэффициент сжатия данных 2:1.

· Microsoft ADPCM Codec . Этот кодек обеспечивает компрессию как в реальном, так и не в реальном масштабе времени, последняя используется пользователями авторских систем мультимедиа. Аудиофайлы лучше генерируются кодеком не в реальном времени масштабе времени.

· IMA ADPCM Codec . Этот кодек был рекомендован Interactive Multimedia Association для использования на различных платформах мультимедиа. Он осуществляет компрессию в реальном масштабе времени и подобен кодеку Microsoft ADPCM.

· Microsoft PCM converter . Этот конвертер позволяет проигрывать 16-разрядный звук на 8-разрядной звуковой карте. Вы также можете использовать этот кодек в случае, когда необходимо поддерживать частоту квантования 1 МГц для карты, поддерживающую другую частоту квантования.

9. Программное обеспечение по преобразованию цифровой записи

Существует множество программ-кодеков, разработанных специально для преобразований файлов с цифровой записью. Цель каждой такой программы одна - сжатие звукового файла с наименьшей потерей качества и наибольшей степенью сжатия. У каждой из них свои плюсы и минусы: у одних качество сжатия высоко, однако скорость этого сжатия желает лучшего, другие моментально кодируют но с потерей качества, кто же захочет слушать файл с любимой музыкальной композицией, которая кряхтит, свистит и шуршит как старая дедова пластинка.

Наиболее популярные программы-кодеки приведены ниже.

Voice

Программное обеспечение состоит из четырёх модулей, которые могут работать как на одном компьютере, так и на разных.
Первый модуль, работающий в среде Windows, отвечает за работу с внешней аппаратурой, производит непосредственно запись с телефонной (радио) линии и воспроизведение в телефонную (радио) линию звуковых файлов.

Диалоговое окно программы Voice

Второй программный модуль, отвечающий за сжатие звуковых файлов, использует в свой работе стандартные алгоритмы сжатия Wav-файлов. Используемые алгоритмы сжатия позволяют упаковывать поступающие сообщения до уровня 4Кбайт - 600 байт за секунду. Алгоритмы сжатия можно оперативно изменять в зависимости от требуемой степени сжатия и качества звучания.

Третий программный модуль отвечает за ведение базы данных (добавление разговоров в базу данных и автоматическое удаление из неё по мере их старения). В базе данных информация хранится в течение заданного отрезка времени, после чего она либо архивируется, либо автоматически удаляется.

Последний, четвёртый программный модуль предназначен для работы с базой данных: поиск разговоров, их прослушивание, перезапись и ручное удаление.

Все модули работают в 32х разрядных средах Windows. Всё программное обеспечение одновременно может работать как друг с другом, так и с другими Windows-приложениями.

Mpeg Encoder

Диалоговое окно программы mpeg Encoder

Один недостаток mpeg Encoder - уходит много времени на сжатие файла с цифровой записью. На обработку звукового файла продолжительностью около 3-5 минут уходит порядка 25-40 минут. Но ожидания стоят того - качество не отличается от оригинала.

Программа состоит только из одного диалогового окна, что упрощает работу. Не требуется каких-либо дополнительных знаний в области преобразований цифровой информации и т.п., вы указываете путь к исходящему файлу в поле SOURCE и в поле TARGET конечную папку, в которой будет находиться сжатый файл в формате mp3 (по умолчанию). Задаете частоту квантования, параметры качества - стерео или моно и… вперед! Смело жмем кнопку Encode.

LameBatch

LameBatch - это незатейливая оболочка, написанная с целью упрощения работы с командными строками mp3-кодеров, называющегося LAME от Mark Taylor и компании. Оболочки основана на простом ядре.

Диалоговое окно с параметрами программы LameBatch

Содержит всего две вкладки «Files» и «Settings», в последней вы указываете все нужные вам параметры сжатия.

Основные фишки:

ь Только одно окошко (без всплывающих окон непосредственно кодера).

ь Индивидуальные настройки кодирования каждого файла.

ь Возможность их изменения для других файлов во время кодирования одного.

ь Всяческая информация о ходе процесса.

ь Проверка файлов на допустимость формата.

ь Различные варианты сортировки очереди.

ь Незатейливое прописывание тэгов.

ь Возможность отложить работу на неопределенный срок.

ь Различная настройка папки для результатов.

ь Проверка перезаписи и доступного места.

ь Поддержка Drag and drop.

ь Встраивается в контекстное меню Explorer.

ь Выключение машины по окончании процедуры.

Последняя версия на сегодня это LameBatch 0.99c и выпущена 25 октября. При тестировании использовались LAME 3.35. LameBatch распространяется как халява, поэтому - никаких гарантий.

Список программ и их достоинства, и недостатки можно перечислять очень долго. Программ-кодеков в последнее время разработано много, стоит подключиться к сети Internet, набрать в строке поискового портала «programs&encode&multimedia» как сразу получишь список программ для обработки звуковых и не только файлов.

Заключение

Порассуждаем немного о сжатии звуковых файлов. Для чего это нужно, особо говорить не стоит, упомяну лишь то, что широко распространенные способы сжатия цифровых музыкальных данных в 11-14 раз позволили неимоверно толкнуть вперед программную и «железную» музыкальную индустрию, не говоря уже о том, что с качественной музыкой теперь в Internet проблем, в общем-то, нет. Найти можно практически любую композицию. (На самом деле, конечно же, далеко не любую. Попробуйте поискать что-нибудь нетривиальное - Билли Маккензи, например, или Берни Марсдена, вряд ли у вас что-нибудь получится. Найти можно преимущественно популярную музыку или классику жанра, да и то далеко не всю.

С момента начала своего бурного развития (около двух лет назад) открытая технология сжатия музыкальной (звуковой) информации качественных изменений технологии сжатия не претерпела. Другими словами, многочисленным поклонникам музыки приходится мириться с достаточно емкими файлами, т.к. никаких сдвигов на этом фронте не намечается. Сегодняшние пределы для сжатия без значительной потери качества составляют около 11-12 раз от оригинального размера музыкального файла. Как известно, на компакт-диске со стандартной частотой оцифровки 44 100 Гц (стерео, два байта на одно амплитудное значение) может уместиться до 74 минут звука - примерно по 10 Мбайт на минуту.

При средней длительности музыкальной композиции 4 минуты имеем чистого (несжатого) звука 40 Мбайт. Много. Очень много для Internet. Имея модем со скоростью 33,6 Кбайт/с и полный канал для скачивания (т.е. в идеале - 3,5 Кбайт/с) 40 Мбайт мы получим только через 4-5 часов (обычно эта цифра в 1,5-2 раза больше).

Применяя сжатие музыкального файла без потери его основных характеристик (стерео, частота дискретизации при оцифровке 44 100 Гц, 2 байта на выборку амплитуды), можно добиться уменьшения размера в 11-12 раз. Так что вместо 40 Мбайт получится всего 3,8-3,9 Мбайт. Это уже вполне приемлемо. Можно сжимать еще больше, но тогда ощутимо проигрываем в качестве: отличия от оригинала становятся слышимыми даже не меломану. Называемые здесь пределы - 11 или 12 раз - это уже подобранные и проверенные критерии качество / размер за всю недолгую историю использования программ-сжимателей звуковых файлов.

Литература

1. Том Шелдон. «Windows 95 проще простого» Диалектика. Киев. 1996 г.

2. А. Чижов. «Napster - панацея для MP3-меломана» Фантазия. 1999-2000 г.

Размещено на Allbest.ru

...

Подобные документы

    Понятие мультимедиа как интерактивных систем, обеспечивающих работу с неподвижными изображениями и движущимся видео, анимированной компьютерной графикой, текстом, речью и качественным звуком. Области применения сканера, веб-камеры, лазерной клавиатуры.

    контрольная работа , добавлен 12.01.2012

    Форматы и характеристики цифрового видео: частота кадра, экранное разрешение, глубина цвета, качество изображения. Типовый технологический процесс производства видеокомпонентов для мультимедиа продуктов с использованием программы miroVIDEO Capture.

    лекция , добавлен 30.04.2009

    Описания интерактивных систем, обеспечивающих работу с изображениями, движущимся видео и анимированной компьютерной графикой. Определение основных мультимедийных ресурсов сети Интернет. Преимущества и недостатки применения мультимедиа в образовании.

    курсовая работа , добавлен 17.01.2015

    Области применения мультимедиа. Основные носители и категории мультимедиа-продуктов. Звуковые карты, CD-ROM, видеокарты. Программные средства мультимедиа. Порядок разработки, функционирования и применения средств обработки информации разных типов.

    контрольная работа , добавлен 14.01.2015

    Разработка мультимедиа-программы для прослушивания аудио-файлов и просмотров видео. Описание меню для пользователей и для администраторов проекта. Создание форм для указанного приложения при помощи Visual Foxpro 9. Листинг программы и ее результаты.

    курсовая работа , добавлен 27.07.2013

    Общее представление о мультимедиа-технологиях. Цели применения продуктов, созданных в мультимедиа-технологиях. Мультимедийные ресурсы и средства разработки мультимедиа. Аппаратные средства, видео и анимация. Процесс создания мультимедийного проекта.

    курсовая работа , добавлен 25.06.2014

    Создание информационной мультимедиа системы (медиа-плеера) для презентации аудио-видео информации о факультете КТАС, представленной в специально отснятых и смонтированных avi-файлах. Разработка модуля пользовательского интерфейса, выходные данные.

    курсовая работа , добавлен 21.11.2014

    Потоковое мультимедиа - мультимедиа, которое непрерывно получается пользователем от провайдера потокового вещания. Попытки отображения мультимедиа информации на компьютерах. Разработка сетевых протоколов потокового вещания и развитие интернет технологий.

    курсовая работа , добавлен 21.12.2010

    Проблемы информационной безопасности в современных условиях. Особенности развития средств мультимедиа. Применение информационных технологий в процессах коммуникации. Разработка защитного технического, программного обеспечения от компьютерных преступлений.

    курсовая работа , добавлен 27.03.2015

    Потенциальные возможности компьютера. Широкое применение мультимедиа технологии. Понятие и виды мультимедиа. Интересные мультимедиа устройства. 3D очки, web-камеры, сканер, динамический диапазон, мультимедийная и виртуальная лазерная клавиатура.

Привет мои уважаемые читатели!
Знаете ли вы, что каждый файлик или документ находящийся на вашем ПК, будь то картинка, аудио фал или какой либо ролик имеют свое расширение, тоесть тип файла. Каждый тип файлов относится к соответствующей категории:

Вы можете кликнуть на любую категорию чтобы сразу перейти к ней.

Вспоминая себя годиков этак 3-5 назад, я и понятия не имел о том количестве типов файлов о которых знаю сейчас. Как и упоминал в статье Об Авторе, я получал высшее образование в академии ШАГ города Киева. Но перед тем как туда поступить, нужно было пройти собеседевонание и сдать небольшой тестовый экзамен. Так вот, одним из заданий экзамена было написать 5 – 7 типов файлов относящихся к изображениям с описанием их возникновения и свойств. Вы не поверите но кроме jpeg, gif и png ничего больше в голову не пришло, но даже зная эти типы файлов, я не знал как они отличаются и чем… . Печально не так ли? И это человек, который собирался стать web-дизайнером. Ну а чтобы вы не были такими же далекими от познаний элементарных типов файлов и могли при необходимости рассказать кому надо что это такое и с чем его едят я и пишу эту статью.
Существует просто огромное количество типов и расширений файлов, и все их описывать не хватит и дня. Поэтому я буду брать только самый используемые категории и конечно самые распространенные типы файлов относящиеся к этим категориям. Начнем пожалуй с аудио.

Рисунки, изображения.

Итак самими распространенными типами файлов изображения являются: JPEG, TIFF, GIF, RAW ну и часто встречаемый файл bmp. Все эти файлы относятся к Растровым изображениям, но есть еще файлы и Векторного изображения, такие как: ai, cdr, cmx, eps, fla. А теперь пару слов о растре и векторе.

Растровая графика – это графика в которой данные о рисунке хранятся в пикселях, где каждый пиксель имеет свое цветовое значение соответствующей его модели (RGB, CMYK, LAB, HSB). В основном это графика, которую используют на цифровых носителях. Она имеет так называемое свойство размытия при увеличении – потерю качества. Векторная графика – это графика имеющая математические данные, которые оперируют не точками, а геометрическими фигурами, которые и составляют собственно сам рисунок. Когда мы к такому рисунку применяем зум (увеличение), то такой рисунок практически перерисовывается заново, что не несет никакой потери качества.
Ну а теперь проведем небольшой экскурс по типам этих типов графики.
JPEG – расшифровывается как Joint Photographic Experts Group, тоесть название компании которая его и разработала. Этот файл имеет сжатость, при чем с небольшими потерями качества, он является самым распространенным графическим форматом на сегодня. Открыть его можно: любой просмотрщик или редактор графики, а также любой из существующих сейчас браузеров.
TIFF — Tagged Image File Format, что с английского звучит так — формат для хранения растровых графических изображений. Наверное один из самых распространенных типов файла которые используют в типографии, а также в факсах и сканерах. Так как и jpeg, можно открыть большинство графическими редакторами.
GIF – имеет значение Graphics Interchange Format File, легко может хранить в себе некую последовательность растровых изображений, что часто мы называем нимацией. Создается такой тип файла преимущественно программами для редактирования видео или графики. Используют формат в цыфровой рекламе, а также при визуальном оформлении видео. Открыть можно любым браузером, и программами для обработки и редактирования графики или видеомонтажа.
RAW Raw Image Data File, что в переводе значитя как необработанный. Это данные полученные с матрицы высококачественных фотоаппаратов не имеющие в себе никакой обработки и сжатия, имеют большой вес. Преимущество такого файла в его последующей обработке. Открывается и обрабатывается специальными программами или мощными редакторами типа Adobe Photoshop, JRiver Media Center или Rawstudio.
Ai – этот формат относится уже к векторам, создаваемый программой Adobe Illustrator. Тут важно учесть тот фактор, что файл созданный в более новой версии не откроется в более поздней, либо же откроется но с потерей некоторых данных. Этот формат создает высококачественные рисунки, но к сожалению плохо совместим с другими
Cdr – Этот векторный тип файлов относится к программе CorelDraw. Которая имеет не меньшую популярность чем тот же Иллюстратор. Как и в случае с Illustrator программа имеет много версий, и каждый формат новой версии не сможет быть открытым в более позней версии. Само качество сохранения рисунка в этом формате отличное, но тут есть подводные камни, а именно формат плохо читаем во многих аналогичных программах работающих с вектором.
Eps – Формат можно смело отнести к числу универсальных, так как с ним спокойно могут работать такие программы, как: Macromedia FreeHand, CorelDraw, Adobe Illustrator и многих других аналогов. В этого формата векторной графики, есть также свои версии, и тут уж надо быть внимательнвм, так как не каждая программа сможет открыть более новые версии этого расширения.
Wmf – Ну и как компания Microsoft может обойтись без собственной наработки в векторной графике. Этот тип векторной графики используется сугубо в Microsoft Windows. Хотя его может открыть и любая другая программа, но заморачиваться с ним не стоит, так как он не имеет того качества рисунка, который присутствует в выше изложенных примерах.

Видео-файлы:

Перейдем от графики к видео. Я уже писал статью о , в которой упоминал о форматах относящихся к видео.
VHS – отжыток прошлого, формат видео который использовали на видеокассетах. (Приятные воспоминания, когда всей оравой друзей у кого-то дома сидели и с упоением смотрели купленный боевик на кассете), ох было время, счас все не так и друзей меньше, с которыми можно вот так компанией посидеть возле ящика.
DV (Digital Video) – формат разработанный мировыми студиями записи видеозаписи. Это тоже кассетная серия, но уже более качественная и над которой работала не одна ведущая компания, такие как Panasonic, Philips, Hitachi.
AVCHD – формат записи видеофайлов высокой четкости и характеристики, таких параметров как 720p, 1080i и 1080p, носителями в данном случае служили диски Blu-Ray, а также карточки памяти. Все мы его знаем как HD видео или HD качество картинки. Это самый современный вид цифрового видео. Формат который стали использовать повсюду, и уже наверное нету такого человека, который бы незнал что такое DH качество видеофильма.
MPEG-1 – Формат сжатия для таких носителей, как CD. Видеоформат не производит высокого качества картинки и имеет расширение 352х240, смешно не правда ли. Увидеть его в наше время в действии ну очень большая редкость. Зато вы знаете что это такое.
MPEG-2 – Широкое распространение этот формат получил на дисках DVD, он позволяет отснимать HDD и Flash-камеры. Раньше этот формат применялся в некоторых видеорегистраторах, также его применяла компания AXIS Communications.
MPEG-4 – Формат видео сочетающий в себе известные кодеки: DivX, XviD, H.264 и др. Благодаря его сжатости, он обладает хорошей скоростью передачи данных. Ну и стоит упомянуть что его поддерживают большое количество DVD-плееров.
HD (High Definition) – Самый мощный в качестве видеоформат, имеющий два вида разрешений именуемых как: HD1(1280х720) и конечно HD2(1440х1080) соответственно. Но чтобы оценить это качество по достоинству, нужен широкоформатный дисплей ЖК-мониторов или телевизоров.
AVI Дорогие читатели, это вовсе не формат, как мы все привыкли думать, это разработка Microsoft – контейнер, который с легкостью может хранить в себе 4 потока, такие как: видео, аудио, текст и midi. Впечатляет, не так ли. Я уже молчу о том масштабе с которым его использует весь мир. А теперь открою маленький секрет. Вы наверное замечали что не всегда AVI файлы читаются вашим устройством, то звука нету, то видео нет, а звук есть. Так вот причина в том, что контейнер AVI может содержать в себе кодек, которого нету у вашего устройства чтения. Чтобы решить эту проблему советую скачать и установить себе на ПК сборку K-Lite Codec Pack. Навсегда забудете о своих проблемах.
WMV – Итог усердий компании Microsoft, этот видео-формат их собственная разработка, итог ролика обработанного в Movie Maker. В любой сборке Винды откроется без проблем, его легко кодировать в другой формат той же программой о которой я писал в посте Установка и настройка программы Format Factory.
MOV – Поговорили о формате Microsoft, пора упомянуть и Apple, вот формат MOV и является творением этой компании. По своей сути формат не плохой и может в себе содержать как графику, так и анимацию, а также 3D. Но есть у него недостаток, не всегда он воспроизводится стандартными проигрователями. Иногда приходится качать и устанавливать QuickTime Player.
MKV – Он пообен формату AVI, может ч легкостью в себе содержать аудио, видео, разные меню, текст и т.п. Правда есть одно существенное отличие его от AVI его код открыт и доступен для любого желающего. Хотя он не имеет такой популярности, как AVI, но у него неплохие перспективы.
3gp – Ну как тут не упомянуть о таком формате, ведь все мы знакомы с ним еще с первых наших телефонов, когда наличие 20 секундного ролика на мобиле говорило о твое крутости ярче любых слов. Вы правильно догадались, это и есть формат мобильных устройств. В котором все сжато и искажено до безобразия. Сегодня его можно встретить разве что на старых wap-сайтах.

А теперь о форматах применяемых в интернете:

FLV – Основной формат флеш видео для размещения и распространения видеороликов в интернете. Им пользуются такие площадки, как Ютюб, Рутюб, Яндекс видео, Гугл видео и многие другие.
SWF – результат анимации созданной с помощью программы Adobe Flash. Проигруется всеми браузерами с помощью установленного в них плагина Flash Player.
Если проводить параллель между FLY и SWF, то SWF — флеш-ролик, а вот FLV — это флеш-видео, ну как то так.
RAM, RM, RA – это уникальная разработка компании RealNetworks известной по скандалу за разработку программы способной лицензионные диски, которые защищены от перезаписей, копировать на ПК пользователя. Так вот этот формат используют для телетрансляции в сети, что конечно не может не радовать. С ее помощью мы можем смотреть IPTV.

Переходим к категории аудио форматов.

Что такое битрейт?! – это количество информации передаваемой заопределенный промежуток времени. Суть его принцыпа заключается в том, сколько информации мы можем уделить каждой секунде воспроизведения нашего аудио файла. Общепринято единицей измерения использовать Kbps или Mbps, второй вариант реже, сами понимаете почему. Перейдем теперь к форматам непосредственно.
WAV – это один из самих качественных форматов аудио, которые передают качество звука без сжатия и потерь. Правда есть в этом качестве и один недостаток, такие файлы занимают немало памяти, что не совсем целесообразно в сети для сайтов. Качество обычно будет от 192 Kbps до 320 Kbps.
WMA – разработка компании Microsoft с целью конкурировать всем известному формату mp3. Что с этого вышло вы можете наблюдать сами. У вас в телефоне все треки в формате WMA? Я так и знал. Хотя частично они смогли добиться малого объема файла и более нормального качества звука.
FLAC – формат для всех. Этот вид аудио файла воспринимается адекватно всеми без исключения платформами и носителями. Можно сравнить с принципом известного нам WinRAR, потому, что этот формат вначале сжимает файл, а при воспроизведении как бы распаковывает.
MIDI – Глобально отличается от своих собратьев. Это не просто звуки, а целый набор разных команд по звучанию тех или иных звуков. Нету ни одной звукозаписывающей студии, которая бы обходилась без этого формата. Есть просто шикарная статья на эту тему, где все разжовано по кусочкам, ценителям музыки советую прочесть .
MP3 – Тут как говорится комментарии излишни. Самый распространенный аудио формат, как в сети так и за ее пределами. Неоспорим тот факт, что это самый сжатый формат, и в этом плюс он занимает совсем немного места. Но там где сжатость там соответственно большая потеря качества и тонкости звука. При сжатии с трека вырезается все что почти неуловимо человеческим ухом, поэтому мы практически не видим разницы между им и тем же WAV.
AIFF – формат для машин работающих на Mac OS. Этот тип файла тоже работает без сжатия, соответственно не имеет потерь качества звучания, поэтому используется наряду с WAV и SDII в профессиональных аудио и видео приложениях.

Форматы текста и документов.

Doc – Самый распространенный формат известной программы от Microsoft Word, которая является частью пакета программ для Виндовс Microsoft Office. Его недостатком есть плохая совместимость с другими текстовыми редакторами, и даже между собой они не совсем совместимы в таких версиях как 2003, 2007 и 2010.
FB2 – Текстовый формат электронных книг, в последнее время набирает широкого масштаба и применяется во многих читалках. Одной из качественных читалок есть Cool Reader.
PDF – Очень распространенный документ. Формат который в себе может содержать как текст, так и графические элементы. Был разработан adobe systems. Поддерживает как растровую так и векторную графику, что является несомненным плюсом и удобством. Большинство программ по работе с текстом легко экспортируют данные в pdf документ.
RTF – Формат все той же компании adobe, хотя изначально он разрабатывался обеими компаниями Microsoft и Adobe. Строится форматирование текста с помощью метатэгового форматирования. Его может окрыть и сохранить WordPad, OpenOffice, TextEdit. Хотя массовости нету в этого формата.

С уважением AHDEPC .

Мультимедиа - это, в первую очередь, аудио и видео. Мультимедиа в приложении к Web-дизайну - это аудио- и видеоролики, размещенные на Web-страницах.

До недавних пор разместить на Web-странице аудио- или видеоролик можно было только с помощью громадного HTML-кода, дополнительных программ и "шаманских плясок" вокруг всего этого. Но сейчас, с появлением HTML 5 и поддерживающих его (хотя бы частично) Web-обозревателей, потребуется всего один тег. Какой? Очень простой, не сложнее уже знакомого нам тега !

Форматы файлов и форматы кодирования

Форматов мультимедийных файлов существует не меньше, чем форматов файлов графических. Как и в случае с интернет-графикой, Web-обозреватели поддерживают далеко не все мультимедийные форматы, а только немногие. (Хотелось бы автору посмотреть на Web-обозреватель, который поддерживает все форматы файлов - и на сам Web-обозреватель, и на его размеры...)

Но Web-обозревателю мало поддерживать только сам формат мультимедийных файлов . Он должен быть "знаком" и с форматом кодирования записанной в нем аудио- и (или) видеоинформации. В мире мультимедиа так - разные файлы одного формата могут хранить информацию, закодированную разными форматами. Более того, аудио- и видеодорожки мультимедийного файла практически всегда кодируются разными форматами.

Практически все форматы кодирования мультимедийных данных поддерживают их сжатие. Благодаря этому размер мультимедийных файлов значительно (иногда на несколько порядков) уменьшается, что благотворно сказывается на скорости их передачи по сети.

Перечислим и кратко опишем все форматы мультимедийных файлов , используемые в Web-дизайне и поддерживаемые Web-обозревателями.

- формат WAV (WAVe, волна) - "старожил" среди мультимедийных форматов. Был разработан Microsoft в самом начале 90-х годов прошлого века для хранения аудио-данных и применяется для этой цели до сих пор. Файлы такого формата имеют расширение wav.

- формат OGG - более новый формат . Был разработан около десяти лет назад некоммер-ческой организацией Xiph.org для хранения аудио- и видеоинформации. Файлы этого формата имеют расширения ogg (универсальное расширение), oga (аудио-файлы) и ogv (видеофайлы); последние два расширения встречаются редко.

- формат MP4 - также "новичок". Был разработан организацией Motion Picture Expert Group (Экспертная группа по вопросам движущегося изображения; также известна как MPEG) в 1998 году для хранения аудио- и видеоданных. Файлы этого формата имеют расширение mp4.

- формат QuickTime - формат очень старый, он старше даже WAV. Был разработан Apple в 1989 году для хранения аудио- и видеоданных. Файлы такого формата имеют расширение mov.
Теперь рассмотрим форматы кодирования аудио и видео, поддерживаемые современными Web-обозревателями.

- формат PCM (Pulse-Coded Modulation, импульсно-кодовая модуляция) - самый простой и самый старый формат кодирования. Он даже не поддерживает сжатие информации. Служит для кодирования аудиоданных.

- формат Vorbis - более современный формат кодирования. Был представлен организацией Xiph.org (разработчиком формата файла OGG) в 2002 году. Используется для кодирования аудиоданных.

- формат AAC (Advanced Audio Coding, развитое кодирование аудио) - не очень новый формат кодирования. Был разработан организацией Motion Picture Expert Group в 1997 году. Применяется для кодирования аудиоданных.

- формат Theora - пожалуй, самый "молодой" формат кодирования. Он также бы разработан организацией Xiph.org несколько лет назад. Используется для кодирования видеоданных.

- формат H.264 - тоже очень "молод". Был представлен организациями Motion Picture Expert Group и Video Coding Experts Group (Группа экспертов по кодированию видео) в 2003 году. Предназначен для кодирования видеоданных.

Почти все эти форматы являются открытыми. Исключения - формат файлов QuickTime, принадлежащий Apple, и формат кодирования H.264, защищенный более чем сотней патентов.

Осталось выяснить, какие сочетания форматов файлов и форматов кодирования используются в Web-дизайне и какие Web-обозреватели их поддерживают. По рывшись в Интернете и немного поэкспериментировав, автор свел эти данные в табл. 4.1.

Как видим, разные Web-обозреватели поддерживают различные форматы. Из-за этого у нас как у Web-дизайнеров могут быть проблемы...

Типы MIME

По сети передаются самые разные данные: Web-страницы, графические изображения, аудио- и видеофайлы, архивы, исполняемые файлы и пр. Эти данные предназначены разным программам. К тому же, с разными данными программа, принявшая их, может поступить по-разному. Так, Web-обозреватель при получении Web-страницы или графического изображения отобразит их на экране, а при получении архива или исполняемого файла - откроет или сохранит его на диске.

Всем передаваемым по сети данным присваивается особое обозначение, однозначно указывающее на их природу, - тип MIME (Multipurpose Internet Mail Extensions, многоцелевые расширения почты Интернета). Тип MIME присваивает данным программа, их отправляющая, например, Web-сервер. А принимающая программа (тот же Web-обозреватель) по типу MIME принятых данных определяет, поддерживает ли она эти данные, и, если поддерживает, что с ними делать.

Web-страница имеет тип MIME text/html. Графическое изображение формата GIF имеет тип MIME image/gif. Тип MIME исполняемого файла - application/ x-msdownload, а архива ZIP - application/x-zip-compressed. Свои типы MIME имеют и мультимедийные файлы .

Вот о мультимедийных файлах и их типах MIME мы и поговорим.

Ранее было сказано, что современные Web-обозреватели работают с очень ограниченным набором форматов мультимедийных файлов из нескольких десятков существующих. Более того, разные Web-обозреватели поддерживают различные форма ты. Поэтому Web-обозреватель должен определить, поддерживает ли он формат полученного файла, т. е. стоит ли его вообще загружать. Как это сделать, мы уже знаем - по типу MIME этого файла.

В табл. 4.2 перечислены типы MIME форматов мультимедийных файлов , поддерживаемых Web-обозревателями на данный момент.

Как видим, один формат файлов может иметь несколько типов MIME. Обычно выбирается самый первый из списка как самый предпочтительный.
Вооружившись необходимой теорией, приступим к практике. Сейчас мы выясним, как HTML 5 позволит нам поместить аудио или видео на Web-страницу.

В этой статье мы рассмотрим инструменты для конвертации видео и аудио, разберемся в форматах мультимедиа и выберем лучшие инструменты для преобразования файлов.

Хотим мы того или нет, но не может быть так, чтобы в мире цифровых развлечений целиком доминировал некий единственный формат. Тот же MP3 сегодня успешно заменяется OGG и AAC, AVI - MPG, FLV и проч. На самом деле, существенной проблемы в таком разнообразии нет.

Разделение форматов мультимедиа - это необходимость. У каждого формата - своя специфическая особенность, причина, по которой может или должен быть использован он, а не какой-либо другой. Зачастую все упирается в экономию - в нашем случае, экономию пространства жесткого диска. В каждом случае есть формат, наиболее выигрышный в данной ситуации и менее оптимальный. Сегодня мы сделаем следующее: во-первых, вспомним, какие мультимедиа форматы наиболее востребованы при конвертации видео/аудио и, во-вторых, рассмотрим необходимый набор . Подчеркиваем: мы рассматриваем только мультимедиа форматы - а именно звук и аудио.

Часть I. Форматы и кодеки для конвертации

Поскольку нельзя объять необъятное, мы затронем только самые распространенные и востребованные мультимедиа форматы, кодеки, дадим их краткое описание и пояснение, в каких случаях их лучше всего использовать. При описании мы также представим список программ, которые каким-либо образом связаны с данным форматом. Ссылки приводить не будем, все программы вы сможете найти на сайт .

Видеостандарты

MPEG -1

MPEG -1 - стандарт, принятый группой экспертов MPEG (Moving Picture Experts Group - группа экспертов в области видео). На данный момент видео в MPEG -1 используется в на Video CD (качество VCD наиболее близко к качеству VHS видеокассет).

Изначально использование MPEG -1 видео ограничено скоростью потока1.5 Мегабита/c и разрешением 352?240. Однако данный стандарт позволяет использовать любое разрешение вплоть до 4095?4095.

MPEG -2

Стандарт MPEG -2 используется для при вещании, включая спутниковое вещание и кабельное телевидение. Имеет жесткие ограничения по разрешению (не более 720 ? 576), частоте кадров (25 к/с и 29.97 к/с), битрейту и др.

MPEG -3

Стандарт кодирования аудио и видео для телевидения высокой четкости (HDTW - High-definition television) со скоростью передачи данных от 20 до 40 Mбит/с. Работа над MPEG -3 была прекращена после модификации MPEG -2 (когда стандарт MPEG -2 не хуже MPEG -3 стал справляться с обработкой видео).

Не следует путать MPEG -3 с музыкальным форматом MP3 (MPEG -1 Part 3 Layer 3/MPEG-1 Audio Layer 3).

MPEG -4

MPEG -4 используется для сжатия цифрового аудио и видео. Предназначен для вещания в Интернете (потоковое видео, видеотелефония), кодирования и записи фильмов на компакт-диски, (видеотелефон) и широковещания.

Видеокодеки

DivX (Digital video express)

Самый известный видеокодек для платформ Microsoft Windows и Mac OS X, которым сегодня сжимаются большинство фильмов. Сжатие позволяет разместить полуторачасовой видеоматериал на 1 - 2 CD. Распространяется он в двух версиях: DivX и DivX Pro. DivX бесплатный (AdWare), его можно использовать без ограничений, второй - платный. Приставка “Pro” стоит $19.99 вместе с дополнительными возможностями пакета и преимуществами перед бесплатной версией. Это:

Лучшая компрессия (около 25%) видео,
- поддержка технологии GMC (Global Motion Compensation), которая улучшает качество видео и немного улучшает степень сжатия,
- DivX Pro обеспечивает полную поддержку двунаправленного кодирования (B-frames),
- включает в себя дополнительный инструментарий для кодирования видео.

Программы для работы с DivX

DivX Player - официальный проигрыватель от создателей видеоформата DivX.

DivX Subtitle Displayer - программа для отображения субтитров при воспроизведении DivX видео.

DivFix - утилита для восстановления поврежденного DivX видео.

DivX AntiFreeze – некоторые видеоклипы имеют поврежденные кадры. AntiFreeze препятствует “замораживанию” видео.

Dr. DivX - программа для перегона видео с различных источников (из файла, с видеокамеры, ТВ и т.д.) в видеофайлы в формате DivX. Утилита умеет работать с MPEG1, MPEG2, MPEG4, AVI и WMV .

Библиотека преобразования видео стандарта MPEG -4, распространяется по GNU General Public License. В отличие от кодека DivX, который выпущен только для платформ Microsoft Windows и Mac OS X, Xvid - продукт кроссплатформенный (используется на всех платформах и операционных системах, для которых можно скомпилировать исходный код кодека).

Как можно заметить, название кодека - “перевертыш” от DivX. На практике, Xvid - это и есть альтернатива DivX. Кодек отличается быстрой скоростью работы и приемлемым качеством изображения. Настраивается как через сторонние программы, так и через собственное окно настроек.

Программы для работы с Xvid

На сегодня существует большое количество разновидностей (компиляций) Xvid, которые с одинаковым успехом позволяют просматривать, конвертировать видео на телефоны, диски и др. носители.

Koepi XviD - одна из таких компиляций.

Nic’s XviD - еще один популярная сборка, включающая Xvid.

Windows Media Video

Система кодирования, разработанная компанией Microsoft. Входит в мультимедийный пакет Windows Media. Существует в нескольких версиях: Microsoft MPEG -4 Video Codec, Windows Media Video 9 и др. Несмотря на то, что с DivX видео WMW конкурировать не может, он активно используется в разработке медиа- и игровых приложений под платформу Windows.

Программы для работы с WMV

Windows Media Encoder - кодек и оболочка для кодировщика.

Windows Media Video 9 VCM - аналогично с предыдущим, но не включает в состав графическую оболочку.

Ligos Indeo

Вначале кодек Ligos Indeo разрабатывался Intel, но затем был взят на доработку компанией Ligos. Сейчас кодек позволяет просматривать видео под разными битрейтами, соответственно, с адаптивным качеством. Ligos Indeo поддерживает процессорную инструкцию MMX (правда, у DivX поддерживаемых инструкций куда больше).

Программы для работы с Ligos Indeo

Intel Codec Installer - поставляет так называемый кодек I263, который делает возможным проигрывание электронных открыток и видео в формате Ligos Indeo.

Intel JPEG Library Video Codec (ijlvid) - специальный драйвер, основанный на библиотеке Intel JPEG , поддерживающий декомпрессию в RGB24 и компрессию форматов RGB24 и YUY2.

Intel Music Coder - благодаря этому пакету можно прослушивать видео формата AVI со звуком, кодированным в IMC .

Apple QuickTime

Этот бесплатный пакет кодеков достаточно известен не только пользователям продукции Apple. Доступен для загрузки с сайта Apple (www.apple.com) вместе с программой для воспроизведения видео в quicktime- формате, которая так и называется - QuickTime.

Программы для работы с Apple QuickTime

QuickTime - программа для воспроизведения файлов формата MOV /QT. К сожалению, портированная в Windows версия обладает множеством недостатков (неудобство интерфейса, неоправданная ресурсоемкость и т. п.).

QuickTime Alternative - альтернатива QuickTime. Пакет содержит кодеки и программы для воспроизведения видео в формате quicktime .

DScaler MPEG

Программы для работы с DScaler MPEG

GPL MPEG -1/2 DirectShow Decoder Filter , Stinky’s MPEG -2 Codec - позволяет проигрывать файлы формата MPEG -1 и MPEG -2 в Windows Media Player и др. плейерах.

Dscaler - программа для захвата и обработки видео MPEG формата.

TrueMotion VP6

TrueMotion VP6 - конкурент MPEG4 кодеков DivX и Xvid. На невысоких битрейтах даёт заметно лучшую картинку, чем последние. В последнее время многие видеоролики закодированы именно в VP6 и имеют формат FLV . Взамен TrueMotion VP6 предлагается усовершенствованная версия - VP7.

Программы для работы с VP6

Браузеры с поддержкой Flash, видеоплейеры.

Free FLV Converter и Any Video Converter - соответственно платный и бесплатный конвертеры из FLV в другие видеоформаты.

Совет. Если хотите, чтобы все вышеперечисленные пакеты были установлены на вашем компьютере вы и не желаете скачивать каждый кодек по-отдельности, загрузите и установите универсальный и бесплатный пакет K-Lite Pack (www.codecguide.com). Распространяется он в 5 версиях:

  • Basic - содержит в себе необходимый минимум: кодеки DivX и Xvid.
  • Standard - более расширен по сравнению с предыдущим пакетом. Позволяет проигрывать распространенные и не самые известные форматы.
  • Full - пакет, в наибольшей степени предназначенный для кодирования/декодирования видео. Включает все необходимые для этих операций инструменты.
  • Corporate - корпоративное решение. Очень похоже на пакет Full.
  • Mega - Full-версия плюс набор кодеков Real Alternative.

Видеоформаты

MPG

Основной формат MPEG . Файл с данным расширением содержит MPEG1 видео + MP2 (MPEG -1 layer 2) или реже MP1 аудио.

VOB

Формат MPEG файлов на DVD -Video дисках. Представляет собой тот же MPG , но с субтитрами и звуковой дорожкой не-MPEG формата (это может быть AC-3 аудио.

AVI

AVI (Audio Video Interleaved - Аудио + Видео + Слоёные) - формат, разработанный компанией Microsoft.Чаще всего применяется для хранения MPEG4 видео. В настоящий момент Microsoft рекомендует использовать вместо AVI формат ASF .

ASF

ASF (Active Streaming Format) - еще одна разработка Microsoft. Существует два варианта ASF - v1.0 и v2.0. С некоторого времени ASF файлы имеют расширения WMA или WMV .

MOV /QT

Формат разработан компанией Apple. QuickTime - рекомендованный формат для MPEG4. MOV файлы идут с расширением MPG или MP4. Видео и аудио в этих файлах - не что иное, как MPG и AAC .

RealMedia

Формат потокового вещания. Характеризуется, с одной стороны низким качеством изображения на высоких битрейтах и, с другой - хорошей степенью сжатия. Это позволяет воспроизводить музыку и видео в сети Интернет в “демонстрационном” качестве. Файлы формата RealMedia имеют расширение *.RM, *.RAM или *.RMVB.

Аудиоформаты (в сокращении)

ASF

ASF (Advanced Streaming Format, не путать с одноименным видеоформатом) - стандарт аудио для OC Mac. Большой размер файла и качество, приближенное к AudioCD.

FLAC (Free Lossless Audio Codec)

FLAC (Free Lossless Audio Codec) - сжатие звука до 50 процентов без потери качества звучания.

WAV

Стандартный формат для Windows. Звук хранится без потери качества и, соответственно, файл занимает много пространства на диске.

FLAC (англ. Free Lossless Audio Codec - свободный аудиокодек без потерь) - популярный свободный кодек для сжатия аудио. В отличие от кодеков с потерями Ogg Vorbis, MP3 и AAC , не удаляет никакой информации из аудиопотока и подходит как для прослушивания музыки на высококачественной звуковоспроизводящей аппаратуре, так и для аудиоколлекции. Поддерживается многими аудиоприложениями.

AIFF

Формат файлов для платформы Mac OS. Характеризуется высоким качеством звучания, поскольку не подвержен сжатию (т. н. формат loseless).

Monkey’s Audio - популярный формат кодирования цифрового звука без потерь. Распространяется бесплатно вместе с открытым исходным кодом и набором программного обеспечения для кодирования и воспроизведения, а также плагинами к популярным плеерам. Файлы Monkey’s Audio имеют расширения APE для хранения аудио и APL для хранения метаданных.

WMA (Windows Media Audio) - формат, разработанный компанией Microsoft для хранения и трансляции аудио-информации. Изначально формат WMA задумывался как альтернатива MP3, но на день Microsoft противопоставляет ему другому формату - AAC . Файлы, сжатые этим кодеком, примерно в четверть более объемные, чем OGG , хотя формат WMA характеризуется неплохой способностью сжатия, что позволяет ему на низких битрейтах «обходить» по качеству звучания MP3.

MP3 формат сжатия с потерями. Вкратце, алгоритм компрессии звука такой: звуковая информация, которую человек воспринять не может, из записи удаляется.

Объективно MP3 нельзя назвать “лучшим”, “оптимальным” форматом. Главное его достоинство - формат распространен настолько, что проблем с программной/аппаратной несовместимостью быть не может. Степень сжатия можно варьировать, в том числе в пределах одного файла. Интервал возможных значений битрейта составляет 8 - 320 кбит/c. Большая часть музыки, распространяемая в Интернете нелегальным способом, имеет битрейт от 128 до 256 (в редких случаях 320) kbps. Для ознакомительного слушания такого качества вполне хватает, но для хранения в аудиоколлекции мы порекомендуем использовать OGG или AAC . По соотношению размер/качество выигрывает AAC .

AAC

AAC (Advanced Audio Coding) - наиболее вероятная альтернатива MP3 (как еще говорят - “результат эволюции MP3-файлов ”). Формат продвигается компанией Apple - в частности, в известном онлайновом музыкальном магазине iTunes. Иногда AAC встречается и на других сервисах по продаже музыки.

При сжатии AAC теряет меньше, чем MP3, звуковой информации. В результате, при одинаковом размере AAC по качеству опережает MP3. Более того, в данном формате есть возможность сжимать аудио без потери качества (профиль ALAC ). Другие особенности по сравнению с MP3:

Частоты с 8 Гц до 96 кГц (MP3: 8 Гц - 48 кГц)
- До 48 звуковых каналов
- Большая эффективность кодирования при постоянном звуковом потоке
- Большая эффективность кодирования при изменяющемся звуковом потоке

Формат файлов:

M4A - незащищённый файл AAC ,
M4B - файл AAC , поддерживающий закладки (используется для аудиокниг и подкастов),
M4P - защищённый файл AAC . Используется в онлайн-магазинах для защиты файла от копирования.

OGG

Ogg Vorbis - относительно новый формат аудиокомпрессии (официально появившийся летом 2002 года). Поскольку лицензия, по которой он распространяется, полностью открыта, OGG “прижился” в качестве основного формата в среде Linux. OGG позволяет в достойном прослушивания качестве сжимать треки (8kHz-48.0kHz, 16+ бит, битрейт от 16 до 128 kbps на канал). Это ставит формат в один ряд с AAC , WMA и, разумеется, MP3. Психоакустическая модель, используемая в Vorbis, близка к MPEG Audio Layer III , но практическая реализация этой модели несколько иная. Поэтому при прослушивании OGG файлов можно заметить ощутимую разницу (как на на высоких, так и на низких битрейтах) по сравнению с другими форматами.

БЕЛОРУССКАЯ ГОСУДАРСТВЕННАЯ ПОЛИТЕХНИЧЕСКАЯ АКАДЕМИЯ

ПРИБОРОСТРОИТЕЛЬНЫЙ ФАКУЛЬТЕТ

Кафедра «ИНЖЕНЕРНАЯ МАТЕМАТИКА»

Подготовил студент: Бескаровайный А. Л.
Группа 113039

Руководитель работы: Анисимов В. Я.

Минск 2000
СОДЕРЖАНИЕ:

МУЛЬТИМЕДИА. ФОРМАТЫ ЗВУКОВЫХ ФАЙЛОВ.

Multimedia – это подхваченный всеми термин, обозначающий интерактивный инструмент для работы с графикой, анимацией, звуком и видео. Мультимедиа привносит блеск в презентации, живопись и игры, и, кроме того, доставляет удовольствие при обучении. Она превращает компьютер из настольной системы с клавиатурой и монитором в некий «космический аппарат», укомплектованный динамиками, микрофоном, наушниками, джойстиками и компакт-дисками.

Что же такое мультимедиа?

Мультимедиа позволяет работать на компьютере со всеми видами информации, а не только с текстом или обычными рисунками. Мультимедиа – это цифровая информация, имеющая более широкие возможности, чем другие ее виды.
    Поскольку звуковая и графическая информация записывается в цифровой форме, она может копироваться без потери качества.
    Цифровая информация может сжиматься до минимума для хранения.
    Можно записать огромное количество информации на CD-ROM, а сам CD-ROM занимает очень мало места.
    Интерактивные компьютерные программы, использующие цифровые медиасистемы, являются отличными средствами обучения.
Если вы покупаете компьютер со встроенными средствами мультимедиа или устанавливаете на свой компьютер, то вам необходимо разобраться в многообразии средств мультимедиа, а также познакомиться с существующими способами записи и воспроизведения. Существуют два основных вида систем мультимедиа:
    Системы воспроизведения. Эти системы, как правило включают многоскоростной дисковод CD-ROM, звуковую карту, динамики и видеосистему с относительно высоким разрешением. Не помешает также наличие карты декомпрессии, работающей с цифровой информацией.
    Авторские системы. (системы, используемые для создания файлов систем мультимедиа). Авторские системы, как правило, включают такие компоненты, как микрофоны и видеокамеры для записи звука и съемки видеоизображений. Они также высокоскоростные, емкие жесткие диски, способные хранить и обслуживать большие объемы информации, требующиеся для цифрового видео.
В 80-х годах персональный компьютер состоял из микропроцессора (CPU), клавиатуры, монитора, дисковода и принтера. Все, что вы могли сделать на компьютере, – это работать с текстом. Люди тратили очень много времени, оформляя письма, производя финансовые расчеты и просматривая базы данных.
Но теперь, когда появились такие графические пользовательские интерфейсы, как Windows95/98(SE)/МЕ/NT/2k. , и значительно более мощные персональные компьютеры, начали появляться приложения, предоставляющие возможность использовать анимационные эффекты, звук и видео. В конце 1980г. люди начали сочинять музыку на компьютере, комбинируя анимацию и звук, создавая захватывающие мультимедиа-презентации со звуком и движущимися картинками. Оборудование, однако, было дорогим, а результаты часто не оправдывали ожиданий. Windows3.1 и DOS не имели достаточно ресурсов для поддержки систем мультимедиа, поэтому картинки на экране двигались очень медленно.

Мультимедиа и Windows 95/98(SE)/МЕ/NT/2k/XP.

Благодаря Windows все преобразовалось. Она поддерживает средства значительно улучшающие работу с мультимедиа.
    Windows95/98(SE)/МЕ/NT/2k. является 32-разрядной, многозадачной, многопоточной операционной системой. Это означает, что Windows поддерживает выполнение нескольких задач одновременно, проигрывание мультимедиа-презентаций и работу пользователей в диалоговом режиме.
    При установке Windows автоматически определяет конфигурацию мультимедиа устройств.
    Приложения Windows поддерживают мультимедиа. Вы можете создавать составные документы, т.е. документы, включающие звук, видео, графику, диаграммы, картинки и другие элементы различных приложений.
    Windows поддерживает форматы компакт-дисков Sony/Philips CD+ и Kodak PhotoCD, а также позволяет легко запускать программы и проигрывать диски с устройства CD-ROM.
    Видеостандарт Windows широко поддерживается в компьютерной индустрии. Разработчики мультимедиа-продуктов могут спокойно распространять свою продукцию, зная, что она будет работать под Windows.
    Мультимедиа-продукты, разработанные для Windows, как правило, являются продуктами высокого качества, так как Windows поддерживает большие видеоокна и 32-разрядная архитектура Windows улучшает прохождение данных.
    Windows поддерживает интерфейс Sony VISCA. Это означает, что в приложениях вы можете использовать так называемые VCR-кнопки (VCR – английская аббревиатура от Video Cassette Recorder – видеомагнитофон, т.е. кнопки, функционально аналогичные кнопкам перемотки, воспроизведения и другим на аудио- и видеовоспроизводящих устройствах) при проигрывании лазерных дисков.
    Качество игр в Windows значительно улучшено за счет нового программного графического интерфейса.
    Windows поддерживает множество различных стандартных промышленных звуковых и видеоустройств компрессии информации при ее записи в файл, а также декомпрессии при воспроизведении (так называемых кодек-устройств). Кодек сокращает объем мультимедиа-файлов и позволяет распространять их в различных форматах.
Наиболее важным средством мультимедиа в последние несколько лет стало видео. Видео вмещает невероятное количество информации, которая может быть сжата перед перенесением ее с одного устройства на другое, например, из видеокамеры на жесткий диск через шину компьютера. Применение технологии сжатия аудио- и видеоинформации позволяет расширить рынок средств мультимедиа.

Системы мультимедиа

Дополнительными периферийными устройствами к компьютеру в середине 80-х годов были дисководы, сканеры, принтеры и коммуникационные средства типа модем. В 90-х годах появляется звуковые карты, видео-карты, дисководы CD-ROM и высокоскоростные коммуникационные средства, благодаря которым теперь вы можете связаться с информационной службой, передающей вам мультимедиа по проводам.
Ниже перечислены минимальные требования для запуска мультимедиа под Windows.
    Процессор Intel 80486 (Для цифровых видеоприложений рекомендуется Pentium).
    Шина PCI для передачи данных для контроллера диска и видеокарты.
    Жесткий диск большого объем (от 300 Мбайт). Для высококачественных цифровых видеосистем требуется гигабайты памяти.
    CD-ROM со скоростью не ниже 4-х с регулировкой звука на передней панели.
    Звуковая карта, обеспечивающая частоты квантования 11,025; 22,05 и 44,1-кГц для стерео звучания. Также требуется многоголосные и многотембровые устройства, способные воспринимать на входе несколько источников, а на выходе представить стереозвучание.
    Видеоаппаратуру, поддерживающую высокие разрешения монитора. Microsoft рекомендует для лучшего качества представления видео использовать VESA или PCI видеокарты. В последнее время стали популярны AGP адаптеры.
    IBM-совместимый аналоговый порт джойстика.
    MIDI-порт, поддерживающий установленные стандарты для ввода, вывода и передачи данных. Некоторые звуковые карты содержат MIDI-синтезаторы, но в общем случае вы подсоединяетесь к внешнему MIDI-синтезатору, по внешнему виду напоминающему клавиатуру.
MIDI (Musical Instrument Digital Interface – интерфейс цифровых музыкальных инструментов) является стандартом для записи нот и сопутствующей информации, связанной с проигрыванием музыки на электронном музыкальном устройстве. Реальный звук при этом не записывается.

Вышеперечисленные компоненты необходимы для воспроизведения и записи средствами мультимедиа. Однако, если вы хотите сами создавать мультимедиа-клипы, то вам могут потребоваться дополнительная аппаратура.

Типы и стандарты мультимедиа

Мультимедиа-информация храниться в виде файлов специального формата, содержащих звук, видеоизображения, или в файлах формата MIDI.

Аудиомедиа (звуковая медиа) хранится, в основном, в двух форматах, WAV и MIDI. Большинство WAV-файлов требует много дискового пространства, но они могут воспроизводиться с помощью любой звуковой карты. MIDI-файлы занимают значительно меньше места на диске, но могут проигрываться только на MIDI-совместимых устройствах. В настоящее время почти все карты способны воспроизводить MIDI-файлы.

Визуальное медиа – это анимационные файлы и видеофайлы.
Анимация. В Windows, если у вас есть соответствующее приложение, вы можете создавать изображения, перемещающиеся по экрану. Не существует стандартного формата анимационного файла, однако многие разработчики одновременно развивают производство как анимационных средств, так и воспроизводящей аппаратуры. Анимация может сопровождаться звуковыми файлами разных форматов.
Видео. Video for Windows – это видеостандарт для Windows. Вы можете записать фильм с видеокамеры или лазерного диска на жесткий диск компьютера и сохранить его как файл в формате AVI либо MPG. Сжатие требуется лишь для высококачественного видео и его эффективного хранения.

О звуковой мультимедиа

Приложения для записи и воспроизведения звука были одними из первых известных приложений мультимедиа для персонального компьютера. Добавив звуковую карту, вы сможете записывать сообщение, переданное голосом, сохранять его как файл на диске, переносить его на другой компьютер, где оно также может быть воспроизведено. Вы также можете записывать музыку и звук для компьютерных презентаций.
Существует два способа звукозаписи:
      Цифровая запись, когда реальные звуковые волны записываются и конвертируются в цифровые данные.
      MIDI-запись, вообще говоря, является не реальным звуком, а записью нажатий на клавиши или другой операций, выполняемых на синтезаторах или MIDI-совместимых электромузыкальных устройствах. MIDI-файл является электронным эквивалентом игры на фортепиано.

Цифровая запись

Звуковая плата преобразует звук на выходе в цифровую информацию путем измерения звука тысячи раз в секунду. Цифровой звук хранится в файлах с расширением WAV. При записи звука аналого-цифровой преобразователь конвертирует звук в цифровые данные. При воспроизведении звука цифроаналоговый преобразователь конвертирует цифровые данные в аналог звуковой волны.
Звук представляет собой вибрации, которые формируют волну с соответствующими амплитудой и периодом, как это показано на рис.1. Амплитуда выражает высоту волны, или громкость звука. Период – это расстояние между двумя звуковыми волнами. Наконец, частота показывает количество периодов в секунду и измеряется в герцах. Например, сто периодов в секунду – это 100 Гц. Человек может воспринимать звук с частотой от 20 до 20000 Гц, и вся выпускаемая звуковоспроизводящая и звукозаписывающая аппаратура рассчитана на этот диапазон частот.

Рис. 1. Измерение звуковой волны

Для того чтобы записать звук и хранить его на цифровом устройстве типа вашего компьютера, производится квантование звука, т.е. разбиение звуковой волны на определенные интервалы по времени. Звуковая волна, показанная на рис.2, была разбита на 16 интервалов. Если предположить, что продолжительность звуковой волны равна одной секунде, то ее частота квантования – 16 Гц.

Рис. 2. Квантование волны при частоте квантования 16 Гц
Как правило, такая низкая частота квантования не используется. Даже цифровой звук с частотой квантования 100 или 1000 Гц не будет распознаваться при воспроизведении. Это происходит потому, что цифровое представление волны в данном случае не сглажено. Фильтрующая аппаратура сглаживает волну, однако наилучшим способом получения качественной цифровой записи является повышение частоты квантования. Следует учесть, что при этом увеличивается объем хранящихся данных, что потребует больше памяти на диске.
Стандартам мультимедиа соответствуют три типа частоты квантования: 11,025; 22,05; 44,1 кГц. Частота квантования зависит от записываемого звука: 11,025 кГц подходит для записи голоса, но для получения высококачественной записи требуется частота квантования 44,1 или 48 кГц. Однако повышение частоты квантования приводит к увеличению размера файла и требуемого пространства на диске для его хранения. Формула для расчета дискового пространства будет приведена ниже, но прежде необходимо разобраться с одной переменной – числом разрядов (бит), используемым для хранения информации о квантовании.
Каждый интервал содержит информацию о малом временном сегменте звука. Количество разрядов для записи каждого интервала определяет точность аппроксимации звуковой волны, однако увеличивает размер файла, в котором хранится цифровой звук. 4-разрядное разбиение на интервалы обеспечивает деление амплитуды звуковой волны по вертикали на 16 уровней, а 8-разрядное разбиение – на 256 уровней. Для высококачественной записи требуется 16-разрядное разбиение на интервалы по амплитуде, которое определяет 65536 уровней амплитуды.
Предшествующее обсуждение касалось сглаженной звуковой волны, но реальная волна не сглажена – она состоит из многих различных частот, которые вместе создают тембр звука. Тембр – это уникальный звук, присущий инструменту. Например, колебания струны и резонатор определяют звучание скрипки (уникальное звучание скрипки Страдивари является результатом добавления ценных веществ в ее полировку). Скрипка производит целый комплекс звуковых волн, как это показано на рис. 3.
Теперь вы видите важность повышения частоты квантования и разрядности звуковой платы при записи звука. Вам необходимо знать не только амплитуду каждого выбранного интервала, но и все, что происходит с волной за единицу времени. Повышение частоты квантования и разрядности звуковой платы обеспечивает качественную запись звука, однако, следует помнить, что это приводит к значительному увеличению дискового пространства, необходимого для хранения записываемого звука. К счастью, если вы записываете голос, то нет необходимости использовать большую частоту квантования и разрядность звуковой платы.

Рис. 3. реальные звуковые волны имеют весьма сложную форму и для получения их высококачественного цифрового представления требуется высокая частота квантования

Ниже приводится формула расчета требуемого дискового пространства для хранения цифрового звука:

На секунду

В табл. 1. приведено требуемое пространство на диске для хранения записи звука продолжительностью одна минута для каждой частоты квантования при разрядности 8 бит. Первая строка в таблице соответствует низкокачественной записи голоса, а последняя строка – стандартам, установленным для цифровых аудиокомпакт-дисков.

Таблица 1. Требования по хранению звуковых файлов

Заметим, что высокая частота квантования и разрядность не требуются, если звук был записан и проигрывается на оборудовании более низкого качества. Например, карманный микрофон записывает звук гораздо более низкого качества, чем запись при частоте квантования 44 кГц. Если у вас высококачественная запись, то для ее воспроизведения соответственно требуется аппаратура высокого качетва.

Звук и типы звуковых файлов

Звук – это физическое природное явление, распространяющееся посредством колебаний воздуха и, следовательно, можно сказать, что мы имеем дело только с волновыми характеристиками. Задачей преобразования звука в электронный вид является повторение всех его этих самых волновых характеристик. Но электронный сигнал не является аналоговым, и может записываться посредством коротких дискретных значений. Пусть они имеют малый интервал между собой и практически неощутимы, на первый взгляд для человеческого уха, но мы должны всегда иметь в виду, что имеем дело только с эмуляцией природного явления именуемого звуком.
Такая запись именуется импульсно-кодовой модуляцией и являет собой последовательную запись дискретных значений. Разрядность устройства, исчисляемая в битах, говорит о том сколькими значениями одновременно в одном записанном дискрете, берется звук. Чем больше разрядность, тем больше звук соответствует оригиналу.
Любой звуковой файл можно представить, чтобы Вам было наиболее понятно, как базу данных. Она имеет свою структуру, о параметрах которой указывается обычно вначале файла. Потом идет структурированный список значений по определенным полям. Иногда вместо значений стоят формулы, позволяющие уменьшать размер файла. Данные файлы могут читать только специализированные программы, в которые заложен блок чтения.

РСМ
РСМ расшифровывается как pulse code modulation, что и является в переводе как импульсно-кодовая. Файлы именно с таким расширением встречаются довольно редко (я встречал только в программе 3D Audio). Но РСМ является основополагающей для всех звуковых файлов. Я бы не сказал, что это очень экономный метод для хранения данных на диске, но думаю, что от этого уже никогда точно не уйдешь, причем объемы современных винчестеров уже позволяют не обращать внимания на пару десятков мегабайт.
DPCM
Изыскания по поводу экономного хранения звуковых данных на диске. Если Вы встречаете данную аббревиатуру, то знайте, что имеете дело с разностным РСМ. В основе данного метода лежит та вполне оправданная идея, что вычисления гораздо более громоздки по сравнению с тем, что можно просто указать значения разности.
ADPCM
Адаптивный DPCM. Согласитесь, что при указании просто значений разности может возникнуть проблема с тем, что есть очень маленькие и очень большие значения. В результате, какие бы супер-точные измерения не были все равно имеет место искажение действительности. Поэтому в адаптивном методе добавлен коэффициэнт масштабируемости.
WAV
Самое простое хранилище дискретных даннных. Я бы сказал прямое. Один из типов файлов семейства RIFF. Помимо обычных дискретных значений, битности, количества каналов и значений уровней громкости в wav может быть указано еще множество параметров, о которых Вы, скорее всего, и не подозревали – это: метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также есть место для того, чтобы Вы смогли разместить там текстовую информацию.
RIFF
Resource Interchange File Format. Уникальная система хранения любых структурированных данных.
IFF
Эта технология хранения данных проистекает от Amiga-систем. Interchange File Format. Почти то же, что и RIFF, только имеются некоторые нюансы. Начнем с того, что система Amiga – одна из первых, в которой стали задумываться о программно-сэмплерной эмуляции музыкальных инструментов. В результате, в данном файле звук делится на две части: то, что должно звучать вначале и элемент того, что идет за началом. В результате, звучит начало один раз, за тем повторяется второй кусок столько раз, сколько Вам нужно и нота может звучать бесконечно долго.
MOD
Файл хранит в себе короткий образец звука, который потом можно использовать в качестве шаблона для инструмента. Проще говоря, прошитый в синтезатор сэмпл.
AIF или AIFF
Audio Interchange File Format. Данный формат распространен в системах Apple Macintosh и Silicon Graphics. Заключает в себе сочетание MOD и WAV.
AIFC или AIFF-С
Тот же AIFF, только с заданными параметрами сжатия (компрессии).
AU
Опять же та же гонка за экономией места. Структура файла намного проще, чем в wav, но там указан метод кодирования данных. Файлы очень мало "весят", за счет чего получили довольно широкое распространение в Интернете. Чаще всего Вы можете встретить параметры m-Law 8 кГц – моно. Но есть и 16-битные стерео-файлы с частотами 22050 и 44100 Гц. Это звуковой формат предназначен для работы со звуком в рабочих системах SUN, Linux и FreeBCD.
MID
Файл, хранящий в себе сообщения MIDI-системе, установленной на Вашем компьютере или в устройстве.
МР3
Самый скандальный формат за последнее время. Многие для объяснения параметров сжатия, которые в нем применяют, сравнивают его с jpeg для изображений. Там очень много наворотов в вычислениях, чего и не перечислишь, но коэффициент сжатия в 10-12 раз сказали о себе сами. Если говорят, что там есть качество, то могу сказать, что там его немного. Специалисты говорят о контурности звука как о самом большом недостатке данного формата. Действительно, если сравнивать музыку с изображением, то смысл остался, а мелкие нюансы ушли. Качество МР3 до сих пор вызывает много споров, но для "обычных немузыкальных" людей потери не ощутимы явно.
VQF
Хорошая альтернатива МР3, разве что менее распространенная. Есть и свои недостатки. Закодировать файл в VQF – процесс гораздо более долгий. К тому же, очень мало бесплатных программ, позволяющих работать с данным форматом файлов, что, собственно, и сказалось на его распространении.
VOC
Восьмибитный моно-формат от семейства SoundBlaster. Можно встретить в большом количестве старых программ, использующих звук (не музыкальных).
НСОМ
То же самое, что и VOC (восемь бит, моно), но только для Apple Macintosh.
UL
Стандартный формат U-Law. 8 кГц, 8 бит, моно.
RA
Real Audio или потоковая передача аудиоданных. Довольно распространенная система передачи звука в реальном времени через Интернет. Скорость передачи порядка 1 Кб в секунду. Полученный звук обладает следующими параметрами: 8 или 16 бит и 8 или 11 кГц.
SND
Бывает двух видов. Один – это тот же AU для SUN и NeXT. Другой – это 8-мибитный моно-файл для РС и Маков с различной частотой дискретизации.

Существуют и другие типы звуковых файлов, но это, скорее всего, файлы различных программ для создания и обработки музыки. В основном, такие файлы читаются только той программой, в которой они были созданы.

Компрессия аудиоданных

Мультимедиа-информация состоит из огромного количества цифровых данных, которые необходимо хранить в сжатом виде. Windows включает в себя средства управления компрессией аудио- и видеоизображений, которые работают с одним или более модулями декомпрессии и называются кодеками (от Компрессия и ДЕКомпрессия). Большое количество программных кодеков поставляются с Windows. Когда вы записываете или воспроизводите звук или видеофайл, Windows автоматически использует кодек.
Многие звуковые и видеокарты имеют встроенные аппаратные кодеки. Windows сначала использует аппаратный кодек, поскольку он быстрее и не очень нагружает процессор. Если аппаратный кодек отсутствует, то Windows применяет программные кодеки. Если она не смогла найти кодек, на экране появится сообщение об ошибке, поскольку сжатый файл невозможно распаковать.

Программа управления компрессией аудиоданных (Audio Compression Manager, ACM) в Windows использует следующие кодеки для компрессии/декомпрессии аудиоданных.

      TrueSpeech Сodec. Кодек, ориентированный на голос, разработанный компанией DSP Group. Используйте этот кодек только при сжатии и передачи по сетям или телефонным линиям файлов, содержащих запись голоса. TrueSpeech производит компрессию данных не в реальном времени, в свою очередь, декомпрессия производится в реальном масштабе времени.
      Microsoft GSM Audio Codec. Кодек, производящий компрессию данных монохромных звуковых записей низкого качества в реальном масштабе времени. Используйте этот кодек при записи голосовых сообщений, вставленных в сообщения электронной почты (e-mail). Для записи голосовых сообщений вы можете использовать приложение Фонограф.
      Microsoft CCITT G.711 A-Law and U-Law Codec. Этот кодек обеспечивает совместимость телефонных стандартов в Европе и северной Америке. Он обеспечивает коэффициент сжатия данных 2:1.
      Microsoft ADPCM Codec. Этот кодек обеспечивает компрессию как в реальном, так и не в реальном масштабе времени, последняя используется пользователями авторских систем мультимедиа. Аудиофайлы лучше генерируются кодеком не в реальном времени масштабе времени.
      IMA ADPCM Codec. Этот кодек был рекомендован Interactive Multimedia Association для использования на различных платформах мультимедиа. Он осуществляет компрессию в реальном масштабе времени и подобен кодеку Microsoft ADPCM.
      Microsoft PCM converter. Этот конвертер позволяет проигрывать 16-разрядный звук на 8-разрядной звуковой карте. Вы также можете использовать этот кодек в случае, когда необходимо поддерживать частоту квантования 1 МГц для карты, поддерживающую другую частоту квантования.

Программное обеспечение по преобразованию цифровой записи

Существует множество программ- кодеков, разработанных специально для преобразований файлов с цифровой записью. Цель каждой такой программы одна – сжатие звукового файла с наименьшей потерей качества и наибольшей степенью сжатия. У каждой из них свои плюсы и минусы: у одних качество сжатия высоко, однако скорость этого сжатия желает лучшего, другие моментально кодируют но с потерей качества, кто же захочет слушать файл с любимой музыкальной композицией, которая кряхтит, свистит и шуршит как старая дедова пластинка.
Наиболее популярные программы-кодеки приведены ниже.

Voice

Программное обеспечение состоит из четырёх модулей, которые могут работать как на одном компьютере, так и на разных.
Первый модуль, работающий в среде Windows, отвечает за работу с внешней аппаратурой, производит непосредственно запись с телефонной (радио) линии и воспроизведение в телефонную (радио) линию звуковых файлов.

Рис. 4. Диалоговое окно программы Voice

Второй программный модуль, отвечающий за сжатие звуковых файлов, использует в свой работе стандартные алгоритмы сжатия Wav-файлов. Используемые алгоритмы сжатия позволяют упаковывать поступающие сообщения до уровня 4Кбайт - 600байт за секунду. Алгоритмы сжатия можно оперативно изменять в зависимости от требуемой степени сжатия и качества звучания.
Третий программный модуль отвечает за ведение базы данных (добавление разговоров в базу данных и автоматическое удаление из неё по мере их старения). В базе данных информация хранится в течение заданного отрезка времени, после чего она либо архивируется, либо автоматически удаляется.
Последний, четвёртый программный модуль предназначен для работы с базой данных: поиск разговоров, их прослушивание, перезапись и ручное удаление.
Все модули работают в 32х разрядных средах Windows. Всё программное обеспечение одновременно может работать как друг с другом, так и с другими Windows-приложениями.

Mpeg Encoder

Одна из лучших программ-кодеков уходящего столетия.

Рис.5. Диалоговое окно программы mpeg Encoder

Один недостаток mpeg Encoder – уходит много времени на сжатие файла с цифровой записью. На обработку звукового файла продолжительностью около 3-5 минут уходит порядка 25-40 минут. Но ожидания стоят того – качество не отличается от оригинала.
Программа состоит только из одного диалогового окна, что упрощает работу. Не требуется каких-либо дополнительных знаний в области преобразований цифровой информации и т.п., вы указываете путь к исходящему файлу в поле SOURCE и в поле TARGET конечную папку, в которой будет находиться сжатый файл в формате mp3 (по умолчанию). Задаете частоту квантования, параметры качества – стерео или моно и… вперед! Смело жмем кнопку Encode.

LameBatch

LameBatch - это незатейливая оболочка, написанная с целью упрощения работы с командными строками mp3-кодеров, называющегося LAME от Mark Taylor и компании. Оболочки основана на простом ядре.

Рис. 6. Диалоговое окно с параметрами программы LameBatc h

Содержит всего две вкладки «Files» и «Settings», в последней вы указываете все нужные вам параметры сжатия.

Основные фишки:

    Только одно окошко (без всплывающих окон непосредственно кодера).
    Индивидуальные настройки кодирования каждого файла.
    Возможность их изменения для других файлов во время кодирования одного.
    Всяческая информация о ходе процесса.
    Проверка файлов на допустимость формата.
    Различные варианты сортировки очереди.
    Незатейливое прописывание тэгов.
    Возможность отложить работу на неопределенный срок.
    Различная настройка папки для результатов.
    Проверка перезаписи и доступного места.
    Поддержка Drag and drop.
    Встраивается в контекстное меню Explorer.
    Выключение машины по окончании процедуры.
Последняя версия на сегодня это LameBatch 0.99c и выпущена 25 октября. При тестировании использовались LAME 3.35. LameBatch распространяется как халява, поэтому - никаких гарантий.

Список программ и их достоинства, и недостатки можно перечислять очень долго. Программ-кодеков в последнее время разработано много, стоит подключиться к сети Internet, набрать в строке поискового портала «programs&encode&multimedia» как сразу получишь список программ для обработки звуковых и не только файлов.

Заключение

Порассуждаем немного о сжатии звуковых файлов. Для чего это нужно, особо говорить не стоит, упомяну лишь то, что широко распространенные способы сжатия цифровых музыкальных данных в 11–14 раз позволили неимоверно толкнуть вперед программную и «железную» музыкальную индустрию, не говоря уже о том, что с качественной музыкой теперь в Internet проблем, в общем-то, нет. Найти можно практически любую композицию. (На самом деле, конечно же, далеко не любую. Попробуйте поискать что-нибудь нетривиальное - Билли Маккензи, например, или Берни Марсдена, вряд ли у вас что-нибудь получится. Найти можно преимущественно популярную музыку или классику жанра, да и то далеко не всю.
С момента начала своего бурного развития (около двух лет назад) открытая технология сжатия музыкальной (звуковой) информации качественных изменений технологии сжатия не претерпела. Другими словами, многочисленным поклонникам музыки приходится мириться с достаточно емкими файлами, т. к. никаких сдвигов на этом фронте не намечается. Сегодняшние пределы для сжатия без значительной потери качества составляют около 11–12 раз от оригинального размера музыкального файла. Как известно, на компакт-диске со стандартной частотой оцифровки 44 100 Гц (стерео, два байта на одно амплитудное значение) может уместиться до 74 минут звука - примерно по 10 Мбайт на минуту.
При средней длительности музыкальной композиции 4 минуты имеем чистого (несжатого) звука 40 Мбайт. Много. Очень много для Internet. Имея модем со скоростью 33,6 Кбайт/с и полный канал для скачивания (т. е. в идеале - 3,5 Кбайт/с) 40 Мбайт мы получим только через 4–5 часов (обычно эта цифра в 1,5–2 раза больше).
Применяя сжатие музыкального файла без потери его основных характеристик (стерео, частота дискретизации при оцифровке 44 100 Гц, 2 байта на выборку амплитуды), можно добиться уменьшения размера в 11–12 раз. Так что вместо 40 Мбайт получится всего 3,8–3,9 Мбайт. Это уже вполне приемлемо. Можно сжимать еще больше, но тогда ощутимо проигрываем в качестве: отличия от оригинала становятся слышимыми даже не меломану. Называемые здесь пределы - 11 или 12 раз - это уже подобранные и проверенные критерии качество/размер за всю недолгую историю использования программ-сжимателей звуковых файлов.

Литература

    Том Шелдон. «Windows 95 проще простого»
Диалектика. Киев. 1996г.
    А. Чижов. «Napster - панацея для MP3-меломана»
Фантазия. 1999-2000г.
    Internet. Сайты:
      http://www.psf.by.ru
      http://www.submarine.ru
      http://www.nsk.su/~sibell
      http://www.sound_world.ru
      http://www.sulaco.org
Поиск материала осуществлялся поисковыми системами:
        yandex.ru
        rambler.ru
        altavista.com
        yahoo.com