Форматы звуковых файлов 4 основных. Аудио-форматы: виды и их описание

13.04.2019 Звуковые устройства

Является основным аудио форматом для многих и многих систем воспроизведения цифрового звука и используется как стандартный формат звуковых файлов в персональных компьютерах. К тому же, он имеет солидный набор спецификаций, изрядно пополнившийся за последнее время. Его полное название - Microsoft RIFF/WAVE - Resource Interchange File Format/Wave - формат файлов передачи ресурсов/волновая форма, и создан он был инженерами Microsoft и Intel. В свою очередь, WAV расшифровывается как Waveform Audio File Format.

WavPack (расширение.WV)

WavPack также включает уникальный «гибридный» режим, который предоставляет все преимущества сжатия без потерь с дополнительным бонусом: вместо создания одного файла, в этом режиме создается относительно небольшой файл высокого качества с потерей (.wv), который может проигрываться сам по себе, а также файл «коррекции» (.wvc), который (в комбинации с предыдущим.wv) позволяет полностью восстановить оригинал. Для некоторых пользователей это означает, что им никогда не придётся выбирать между сжатием без потерь и с потерей качества.

Формат имеет очень хорошую поддержку в проигрывателях. Помимо, разумеется, плагина для Winamp с официального сайта кодека http://www.wavpack.com можно закачать плагины для Adobe Audition (!) и Nero Burning Rom. Есть отличный плагин для XMMS – аналога Winamp для Linux. Кроме того существует проект по разработке DirectShow фильтров для WavPack – это позволит использовать формат в любой Windows-программе, в том числе и Windows Media Player. Скачать последнюю версию можно отсюда. Для WavPack существует фронтэнд от сторонних разработчиков. Его качаем тут.

С технической точки зрения также придраться не к чему. Поддерживается многоканальный звук, 32-битное разрешение аудиопотока, частота семплирования – до 192 кГц (!).

Формат, как и исходные коды программы для сжатия являются открытыми. К большому сожалению кодер скомпилирован лишь для платформы Windows, однако всегда остаётся возможность самостоятельно перекомпилировать доступные исходные коды для своей операционной системы.

Сайт, как и сам кодек регулярно обновляются, что не может не радовать.

DTS - Digital Theater System, по сути - это Dolby Digital, а точнее его конкурент. Формат DTS использует минимальный уровень сжатия, чем Dolby, так что фактически он звучит лучше, что доказывают на практике DVD диски, на которых записаны дорожки в DTS или в DD формате. DTS в домашних кинотеатрах используется максимальный битрейт 1,536 kbps (full bitrate), такой звук более качественный, чем AC-3 format от Dolby Digital. DTS - использует 6 свободных аудио дорожек и поддерживает систему распределения звука 7.1, при таком битрэйте DTS 4.0 - будет звучать также объемно, как и "Долби" 5.1.

Windows Media Audio (WMA)

Лицензируемый формат файла, разработанный компанией Microsoft для хранения и трансляции аудио-информации.

Номинально формат WMA характеризуется хорошей способностью сжатия, что позволяет ему «обходить» формат MP3 и конкурировать по параметрам с форматами Ogg Vorbis и AAC. Но как было показано независимыми тестами, а также при субъективной оценке качество форматов все таки не является однозначно эквивалетным, а преимущество даже перед MP3 однозначным, как это утверждается компанией Microsoft.

Кодек является частью комплекта Windows Media Audio. Он бесплатный, однако формат, равно как и программа для кодирования являются закрытыми. Разумеется, версия существует только для платформы Windows.

В принципе, WMA Lossless подеерживает все необходимые функции: теги, высокие частоты семплирования, многоканальный звук (включая 7.1), трансляцию аудио через сеть и т.д. Кроме того, встроенная поддержка декодера в Windows Media Player избавляет пользователя от необходимости скачивать что-либо из Интернета для воспроизведения музыкального файла.

MP3 - (формат кодирования звуковой дорожки MPEG) - лицензируемый формат файла для хранения аудио-информации.

Самый популярный формат сжатия на сегодняшний день. Формат МР3 (MPEG Layer 3) был разработан, после ряда промежуточных форматов, институтом Фраунхофера в Германии. Вообще то, формат.МР3 основан на обмане человеческого уха. После некоторых исследований выяснилось, что человеческому слуху свойственно адаптироваться к появлению новых звуков, что выражается в повышении порога слышимости. Поэтому одни звуки способны маскировать (то есть, делать субъективно неслышимыми) другие. Вот и в этом формате часть звуков, которые, как считает соответствующая теория, делаются неслышимыми, просто убираются из общего звучания. После чего получившийся «полуфабрикат» кодируется по методу Хоффмана. Обязательно следует учитывать то, что в формате МР3 программы, сжимающие звук из оригинального, не являются стандартизированными, то есть каждый грамотный программист может реализовать свою схему сжатия. А стандартам подчиняются только декодеры, что приводит к тому, что качество воспроизведения формата МР3 далеко не всегда зависит от плеера, проигрывающего этот файл. В связи с разными способностями и пристрастиями реализаторов различных кодеров, одни из них лучше справляются с симфонической музыкой, другие - с роком и металлом, третьи - с рэпом и рэйвом и так далее.

JointStereo, являющийся одной из особенностей МР3, означает, что вместо кодирования стерео как двух независимых каналов производится кодирование т.н. центрального канала и разницы, отличающей его от исходных стереоканалов. Довольно много составляющих звука в стереоканалах одинаковы, и их кодирование в общем канале позволяет высвободить дополнительную полосу для более подробного кодирования разницы, что приводит к некоторому улучшению качества.

Обязательно следует упомянуть и о Variable Bit Rate, или VBR. Это означает, что кодер изменяет степень сжатия «на лету», в зависимости от характера звука. Такой подход приводит к уменьшению итогового размера файла или, при увеличении требований к качеству, при том же размере файла позволяет добиться лучшего звучания.

Появившийся в 2001 году кодек MP3 Pro был создан компанией Coding Technologies совместно с Thomson Multimedia. В его основе лежит МР3. В нем используется технология SBR (Spectral Band Replication), за счет чего кодек обеспечивает хорошее качество на низких битрейтах. Однако качество кодирования на средних и высоких скоростях передачи данных уступает качеству почти всех других кодеков. В итоге MP3 Pro применяется больше для трансляций в интернете и демонстраций фрагментов новых музыкальных композиций.

Vorbis - свободный формат сжатия звука с потерями, официально появившийся летом 2002 года. Психоакустическая модель, используемая в Vorbis, по принципам действия близка к МР3 и подобным, однако математическая обработка и практическая реализация этой модели существенно отличаются, что позволило авторам объявить свой формат совершенно независимым от всех предшественников. Для хранения аудиоданных в формате Vorbis чаще всего применяется медиаконтейнер Ogg, такой файл обычно имеет расширение.ogg и называется двойным именем Ogg Vorbis.

На 2006 год распространён существенно меньше, чем MP3. По всевозможным оценкам является вторым по популярности форматом компрессии звука с потерями. Широко используется в компьютерных играх и в файлообменных сетях для передачи музыкальных произведений.

Vorbis применяет более качественную психоакустическую модель, чем его конкуренты, дающую лучшую чёткость воспроизведения при равной плотности потока.

Формат не ограничивает пользователя только двумя аудиоканалами (стерео - левый и правый). Он поддерживает до 255 отдельных каналов с частотой дискретизации до 192 кГц и разрядностью до 32 бит (чего не позволяет ни один другой формат сжатия с потерями), поэтому Vorbis великолепно подходит для кодирования 6-канального звука DVD-Audio.

К тому же, формат Vorbis - «sample accurate». Это гарантирует, что звуковые данные перед кодированием и после декодирования не будут иметь смещений, дополнительных или потерянных сэмплов. Это легко оценить, когда вы кодируете non-stop музыку (когда один трек постепенно переходит в другой) - в итоге сохранится целостность звука.

Формат изначально разрабатывался с возможностью потокового вещания. Это даёт формату достаточно полезный побочный эффект - в одном файле можно хранить несколько композиций с собственными тегами. При загрузке такого файла в плеер должны отобразиться все композиции, будто их загрузили из нескольких различных файлов.

Формат имеет гибкую систему тегов. Заголовок тегов легко расширяется и позволяет включать тексты любой длины и сложности (например, текст песни), перемежающиеся изображениями (например, фотография обложки альбома). Текстовые теги хранятся в UTF-8, что позволяет писать на нескольких языках одновременно и исключает возможные проблемы с кодировками.

Ogg Vorbis по умолчанию использует переменный битрейт, при этом значения последнего не ограничены какими-то жёсткими значениями, и он может варьироваться даже на 1 kbps. При этом стоит заметить, что форматом жёстко не ограничен максимальный битрейт, и при максимальных настройках кодирования он может варьировать от 400 kbps до 700 kbps. Такой же гибкостью обладает частота дискретизации - пользователям предоставляется любой выбор в пределах от 2 кГц до 192 кГц.

Vorbis был разработан сообществом «Xiphophorus» для того, чтобы заменить все платные запатентованные аудио форматы. Несмотря на то что это самый молодой формат из всех конкурентов МР3, Ogg Vorbis имеет полную поддержку на всех известных платформах (Microsoft Windows, GNU/Linux, MacOS, PocketPC, Palm, Symbian, DOS, FreeBSD, BeOS и др.), а также большое количество аппаратных реализаций. Популярность на сегодняшний день значительно превосходит все альтернативные решения.

FLAC (англ. Free Lossless Audio Codec - свободный аудиокодек без потерь) - популярный свободный кодек для сжатия аудио. В отличие от кодеков с потерями Ogg Vorbis, MP3 и AAC, не удаляет никакой информации из аудиопотока и подходит как для ежедневного прослушивания, так и для архивирования аудиоколлекции. На сегодня формат FLAC поддерживается многими аудиоприложениями.

FLAC является членом семейства кодеков, разрабатываемых Xiph.Org. К слову, в него же входит известный ogg vorbis – один из лучших lossy-алгоритмов сжатия музыки. В качестве контейнера для аудиоданных используется, разумеется, OGG (файлы с расширением.ogg) и ещё один open-source контейнер – Matroska (файлы с расширением.mka).

Сразу стоит отметить полную открытость как формата, так и алгоритма FLAC. Они не патентованы, поэтому могут совершенно безвозмездно использоваться в любых программах. Именно этим обусловлена широкая поддержка FLAC в проигрывателях – любой серьёзный плеер имеет плагин для FLAC. Кроме этого существуют аппаратные mp3-плееры с поддержкой кодека FLAC.

FLAC поддерживает теги собственного формата “FlacTags”. Есть возможность кодирования многоканального звука – серьёзное преимущество по сравнению с Monkey’s Audio. Формат поддерживает любые частоты семплирования в диапазоне от 1 Гц (!) до 65,535 Гц. Разрядность аудио от 4-х (!) до 32-х бит.

Считается, что в сравнении с остальными lossless-кодеками FLAC наиболее эффективно расходует ресурсы системы при раскодировании (воспроизведении) аудио. К сожалению, это достигается за счёт значительного повышения времени кодирования (сжатия).

Сайт FLAC регулярно обновляется, выходят новые версии кодека. Вообще, по активности развития FLAC безусловно лидирует. Вполне возможно, что в будущем это сделает его основным форматом.

AAC (англ. Advanced Audio Coding) - формат аудио-файла с меньшей потерей качества при кодировании, чем MP3 при одинаковых размерах. Формат также позволяет сжимать без потери качества исходника (профиль ALAC AAC).

AAC изначально создавался как преемник MP3 с улучшенным качеством кодирования. Формат AAC, официально известный как ISO/IEC 13818-7, вышел в свет в 1997 как новая, седьмая, часть семьи MPEG-2. Существует также формат AAC, известный как MPEG-4 Часть 3.

Этот тип файлов является стандартным для систем Apple Macintosh и систем обработки звука, построенных на его основе. Apple AIFF расшифровывается как Audio Interchange File Format - формат файла обмена звуком, он в чем-то схож с WAV. Его особенностью является то, что он позволяет размещать вместе со звуковой волной дополнительную информацию, в частности, самплы WaveTable (примеры звучания инструментов вместе с параметрами синтезатора), что улучшает качество итогового результата. Хотя в настоящее время компьютеры Apple способны воспроизводить файлы практически любых форматов, в том числе и МР3.

Иногда компании создают свои проприетарные форматы, которые поддерживают только их собственные плееры. Apple Lossless был создан одноименной компанией для плеера iPod в качестве альтернативы FLAC, используемом на других плеерах. Если вы не используете iPod, то можете никогда не столкнуться с этим форматом.

Monkey"s Audio (APE)

Monkey"s Audio или APE (от английского ape - обезьяна) – популярный формат кодирования цифрового звука без потерь. Распространяется бесплатно вместе с открытым исходным кодом и набором программного обеспечения для кодирования и воспроизведения, а также плагинами к популярным плеерам. Файлы Monkey’s Audio используют следующие расширения: .ape для хранения аудио и.apl для хранения метаданных. Несмотря на открытый исходный код, Monkey"s Audio не является свободным, так как его лицензия накладывает значительные ограничения на использование.

Средний битрейт в аудиофайле составляет 600-700 кбит/с; сравните с 128 кбит/с в Mp3. Среднее сжатие составляет 40-50 % в зависимости от жанра музыки: если классические или джазовые произведения сжимаются самым лучшим образом, то композиции в стиле trash-metal или что-то подобное «электронно шумовое» покажет наихудший результат. Для кодеков с потерями при приемлемом качестве сжатие составляет около 80 %.

Существуют четыре степени сжатия. Максимальная компрессия может показаться единственно верным решением, даже несмотря на довольно большое время сжатия. Однако нужно учитывать ещё и расход ресурсов системы, воспроизводящей файл, – для максимально сжатого файла он относительно высок.

Формат.APE обеспечивает поддержку тегов для поиска композиций в музыкальной коллекции. Ещё одним плюсом является проверка целостности файла при раскодировании. Поддерживается восстановление оригинального wav-файла из сжатого.APE.

Monkey’s Audio имеет графический фронтэнд под Windows, иначе говоря удобную оконную программу для управления процессом кодирования. Остальные кодеки требуют использования командной строки или фронтэндов сторонних разработчиков. Самое приятное, что фронтэнд Monkey’s Audio можно использовать и с другими кодеками – Rkau, Wavpack, Shorten и даже lossy-кодеками mp3 и ogg vorbis.

Немного о недостатках. Кодек Monkey’s Audio существует только под Windows. Однако на сайте написано, что «версии под Mac и Linux уже разрабатываются». К слову сказать, сам сайт не обновлялся достаточно давно, что не является хорошим признаком. Также отсутствует какая-либо поддержка среди производителей аппаратных плееров.

MIDI (англ. Musical Instrument Digital Interface - цифровой интерфейс музыкальных инструментов) - стандарт на аппаратуру и программное обеспечение, позволяющее воспроизводить (и записывать) музыку путем выполнения/записи специальных команд, а также формат файлов, содержащих такие команды. Воспроизводящее устройство или программа называется синтезатором (секвенсором) MIDI и фактически является автоматическим музыкальным инструментом.

В отличие от других форматов, хранит не оцифрованный звук, а наборы команд (проигрываемые ноты, ссылки на проигрываемые инструменты, значения изменяемых параметров звука), которые могут воспроизводиться по-разному в зависимости от устройства воспроизведения. Удобство формата MIDI как формата представления данных позволяет реализовывать устройства, производящие автоматическую аранжировку по заданным аккордам, а также приложения 3D-визуализации звука. Кроме того, такие файлы, как правило, имеют на несколько порядков меньший размер, чем оцифрованный звук сравнимого качества.

Статья взята с сайта cjcity.fdstar.ru

Как показали реальные полевые исследования – хорошая задумка составить рейтинг первой десятки лучших из лучших аудио форматов оказалась задачей в принципе невыполнимой.

Слишком разные условия соревнования для неравных участников. Кроме того, в наше благое дело помочь людям в выборе самого лучшего звукового продукта вмешиваются некие коррупционные схемы или лобби транснациональных корпораций в сфере аудио записи.

Самый популярный в мире формат MP3 попал в лидеры народной любви исключительно из-за многомиллиардных вливаний в промоушн. А если брать по качеству звучания то так себе. И даже в отношении сжатия и экономии дискового пространства тоже не самый высоко-компрессионный.

Поэтому было принято компромиссное решение – разделить подопытных на три группы и уже по группам вести сравнение и выявление лидеров.

Три типа аудио форматов

  • Без сжатия.
  • Сжатие без потерь.
  • Сжатие с потерями.

Форматы записи звука без сжатия демонстрируют все свое лучшее только на высококачественном, профессиональном звуковоспроизводящем оборудовании.

Если у вас в руках бюджетный планшет или смартфон – то в вашем гаджете будет звучать прекрасная музыка, но ее не услышите просто потому, что программно-аппаратный ресурс и динамики либо наушники не способны воспроизводить такого высокого качества звучания.

С другой стороны, если вы запустите звукозапись MP3 через профессиональные стереосистемы и усилители – вы услышите в динамиках такой шум и скрежет, что опять-таки такого рода использование окажется совершенно бессмысленным.

Рейтинг аудио по типу звуковоспроизводящего оборудования

  1. Для профессионального оборудования – форматы аудио без сжатия.
  2. Для полу-профессионального оборудования – форматы аудио со сжатием. Но без потерь.
  3. Для бюджетного оборудования – форматы аудио со сжатие и с потерями.

В первом случае оборудование настолько дорогое, что беспокоиться об экономии денег на носителях просто смешно.

Во втором случае обладатель устройства Apple за тысячу долларов тоже очевидно сможет себе позвонить потратить на пару сотен баксов на объемистую память.

В третьем случае, раз уже денег едва удалось наскрести на дешевенький смартфончик – то экономия на размерах хранимой музыки очень важна. Ну а слушать на телефоне симфонический оркестр в Hi-Fi все равно никто не собирается. Разве что закачать рингтон из классики для прикола, чтобы выглядеть крутым перцем в глазах помидорок.

На этом увертюра заканчивается, приступаем к изложению темы.

Сюда относятся несжатые форматы.

  • PCM – импульсно кодовая модуляция. Оригинальный аналоговый звук дискретируется “как есть”, без каких либо изменений.

PCM – наиболее распространенный формат записи звука, используемый на CD и DVD дисках. Многоканальное долби, сурраунд, при условии качественных динамиков звучание почти один-в-один с живым исполнением.

Если любите засесть перед домашним кинотеатром и погрузиться с сопереживание главным и второстепенным героям кинофильма – самое то.

WAV

Довольно древний формат, разработан аж в 1991 году. Ну, так старые мастера всегда думали о высоком качестве.

Многие считают WAV несжатым форматом. Но на самом деле – это контейнер и там могут содержаться в том числе и сжатые файлы.

В большинстве случаев WAV содержит несжатый звук в формате PCM. Поэтому и качество высокое. Но и на одну минуту записи тратится около 32MB памяти.

Достаточно хорошая совместимость по Windows и Mac.

AIFF

Аналог WAV от разработчиков Apple. Тоже контейнер и тоже содержит чаще всего звук в формате PCM. Хорошая совместимость с Windows.

Сжатые аудио форматы с потерями

Поистине народные форматы для всех.

MP3

По стандарту MPEG-1 Audio Layer 3. Появился еще в 1993 году и мгновенно завоевал всеобщую любовь именно своей экономичностью в потреблении памяти.

  • На одном CD можно хранить всю дискографию любимой группы.
  • Несколько дисков забросить в бардачок и можешь наслаждаться музыкой на всем пути из Калининграда во Владивосток.
  • Можно за это время прослушать все книги всех писателей, достойных чтобы их слушать.

Формат MP3 – это такой звуковой скопец, у которого вырезали все самое нехочу, зато начали проявляться способности к накопительству и экономии. Так и MP3 – ну очень экономичный формат.

Основное преимущество – поддерживается на всем, что только играет и поет.

AAC

Продвинутый способ аудио кодирования. Младший, но продвинутый брат MP3. Имеет слегка улучшенные звуковые характеристики и большую степень сжатия.

Применяется на Android, iOS, iTunes, YouTube, Nintendo и последних версиях PlayStation.

Тоже народный формат, но для немного более продвинутого народа. Что и отражено в названии.

OGG

В общем, это не формат, а контейнер и, по сути, название OGG ни о чем не говорит в отношении содержащегося в нем звука.

Однако чаше всего содержит кодек Vorbis.

  • Значительно улучшено качество звучания относительно других форматов звука с потерями при сжатии.
  • Предоставляется возможность при одинаковом качестве звучания записывать файлы с меньшим весом.

Еще более экономичный формат, чем MP3.

Проблема – формат OGG свободный, поэтому никто в его промоушн денег не вкладывает. Так что может поддерживается далеко не везде и могут возникнуть несовместимости.

Тогда придется конвертировать в MP3.

WMA

Проприетарный формат от Microsoft, поэтому, хотя является улучшенной версией MP3 и OGG – широкого применения не получил и не поддерживается на большинстве устройств и платформ.

Совет. Если есть возможность использовать WMA вместо MP3 – используйте первый. Экономичнее и приятнее на слух.


Для обладателей продвинутых, дорогостоящих устройств, брендовых мобильных и настольных компьютеров в комплектации с высококачественными наушниками и динамиками.

Недостатком таких форматов является то, что размеры файлов одинаковой по длительности записи будут примерно в два или три раза больше.

Однако хотя декларируется сжатие без потерь, не путайте с Hi-Fi аудиозаписями. Минимальные, пусть и заметные только для музыкантов потери все же есть.

FLAC

Свободный аудио кодек без потерь. Его преимущество в широкой популярности, почти что как у MP3.

  • Степень сжатия составляет до 60% исходного файла.
  • Поддерживается на большинстве программных платформ и устройств.

Может быть выгодной альтернативой при записи CD-дисков. Почти неотличимо по звучанию, но бонус в виде экономии почти половины дискового пространства.

ALAC

Формат для владельцев устройств бренда Apple, поскольку на других может и не поддерживаться.

Немного менее хорош, чем FLAC в отношении степени сжатия.

Но владельцам Apple просто не остается выбора – бесплатный формат FLAC не поддевается из принципа на iOS и iTunes.

WMA Lossless

Улучшенная версия вышеупомянутого WMA. Незначительно уступает FLAC и ALAC. Обладает существенным преимуществом перед ALAC ,так как WMA хорошо поддерживается на Windows и Mac.

Однако широкого распространения не имеет, поэтому если у вас в пользовании много разных устройств – вероятна несовместимость.

Вердикт

Ну вот, мы рассмотрели все самые известные, распространенные и имеющие лучшие параметры аудио форматы и вкратце рассказали об особенностях их использования.

Так что теперь вы сможете уверенно определиться– в каком случае и в какой формат лучше конвертировать ваши звукозаписи, музыку и аудиокниги.

Мы рассмотрим различные форматы звуковых файлов:

WAVE (.wav) - наиболее широко распространенный звуковой формат. Используется в OC Windows для хранения звуковых файлов. В его основе лежит формат RIFF (Resource Interchange File Format), позволяющий сохранять произвольные данные в структурированном виде. Для записи звука используются различные способы сжатия, поскольку звуковые файлы имеют большой объем. Самый простой способ сжатия - импульсно-кодовая модуляция (Pulse Code Modulation, PCM), но он не обеспечивает достаточно хорошего сжатия.

AU (.au,.snd) - формат звуковых файлов, используемый на рабочих станциях фирмы Sun (.au) и в операционной системе NeXT (.snd). Получил широкое распространение в сети Internet, на ранней стадии развития которой играл роль стандартного формата для звуковой информации.

MPEG-3 (.mp3) - формат звуковых файлов, один из наиболее популярных на сегодняшний день. Был разработан для сохранения звуков, отличных от человеческой речи. Используется для оцифровки музыкальных записей. Предшествующие версии формата: MP1 и MP2. При кодировании применяется психоакустическая компрессия, при которой из мелодии удаляются звуки, плохо воспринимаемые человеческим ухом. Ранние версии обеспечивают худшую компрессию, но менее требовательны к ресурсам компьютера при воспроизведении. Характеристики процессора напрямую влияют на качество звучания, - чем слабее процессор, тем больше искажения звука.

MIDI (.mid) - цифровой интерфейс музыкальных инструментов (Musical Instrument Digital Interface). Этот стандарт разработан в начале 80-х годов для электронных музыкальных инструментов и компьютеров. MIDI определяет обмен данными между музыкальными и звуковыми синтезаторами разных производителей. Интерфейс MIDI представляет собой протокол передачи музыкальных нот и мелодий. Но данные MIDI не являются цифровым звуком - это сокращенная форма записи музыки в числовой форме. MIDI-файл представляет собой последовательность команд, которыми записаны действия, например, нажатие клавиши на пианино или поворот регулятора. Эти команды, посылаемые на устройство воспроизведения MIDI-файлов, управляют звучанием, небольшое MIDI-сообщение может вызвать воспроизведение звука или последовательности звуков на музыкальном инструменте или синтезаторе, поэтому MIDI-файлы занимают меньший объём (единица звукового звучания в секунду), чем эквивалентные файлы оцифрованного звука.

MOD (.mod) - музыкальный формат, в нем хранятся образцы оцифрованного звука, которые можно затем использовать как шаблоны для индивидуальных нот. Файлы в этом формате начинаются с набора образцов звука, за которыми следуют ноты и информация о длительности. Каждая нота воспроизводится с помощью одного из приведенных в начале звуковых шаблонов. Такой файл относительно невелик и имеет структуру, базирующуюся на нотах. Это облегчает его редактирование с помощью программ, имитирующих традиционную музыкальную запись. Он, в отличие от MIDI-файла, полностью задает звук, что позволяет воспроизводить его на любой компьютерной платформе.



IFF (.iff) - Interchange File Format – формат, первоначально разработанный для компьютерной платформы Amiga. Сейчас также используется на компакт-дисках в форме CD-I. Его структура очень похожа на структуру формата RIFF.

AIFF (.aiff) - Audio Interchange File Format - формат для обмена звуковыми данными, используется на компьютерных платформах Silicon Graphics и Mac. Во многом напоминает формат Wave, однако в отличие от него позволяет использовать оцифрованный звук и шаблоны. Многие программы способны открывать файлы в этом формате.

RealAudio (.ra, .ram) - формат, разработанный для воспроизведения звука в Internet в реальном времени. Разработан фирмой Real Networks (www.real.com). Получающееся качество в лучшем случае соответствует посредственной аудиокассете, для качественной записи музыкальных произведений использование формата mp3 более предпочтительно.

4.3. MIDI и цифровой звук: достоинства и недостатки

Формат WAV E представляет собой один из многочисленных, но далеко не единственный формат для записи цифрового звука. В отличие от MIDI-данных данные цифрового звука действительно представляют звук, записанный в виде тысяч единиц, называемых квантами (samples). Цифровые данные представляют амплитуду (или громкость) звука в дискретные моменты времени. Звучание цифровых данных не зависит от устройства воспроизведения и поэтому их звучание всегда одинаково. Но за это приходится расплачиваться большими объемами звуковых файлов.

MIDI-данные по отношению к цифровым данным - то же самое, что и векторная графика по отношению к растровым изображениям. То есть MIDI-данные зависят от устройств воспроизведения звука, а цифровые данные не зависят. Так же как вид векторных графических изображений зависит от принтера или экрана монитора, так и звучание MIDI-файлов зависит от MIDI-устройства для воспроизведения этих файлов. Аналогично, звучание мелодии, сыгранной на концертном фортепиано, будет отличаться от звучания этой же мелодии на простом пианино. Цифровые данные, с другой стороны, идентичны и не зависят от системы воспроизведения. Стандарт MIDI в этом смысле аналогичен стандарту PostScript и позволяет управлять инструментами на понятном языке.

По сравнению с цифровым звуком MIDI имеет следующие преимущества:

§ MIDI-файлы занимают меньший объем памяти, и размер этих файлов не влияет на качество звучания. В среднем MIDI-файлы в 200 - 1000 раз меньше цифровых файлов и поэтому занимают малый объем в оперативной памяти, на дисках, и для них не требуется больших ресурсов центрального процессора.

§ В некоторых случаях звучание MIDI-файлов лучше, чем цифровых аудиофайлов. При этом источник звучания MIDI-файлов должен быть высокого качества.

§ Вы можете изменять длину MIDI-файлов, изменяя темп звучания и при этом сохраняя качество и громкость звучания. MIDI-данные можно легко редактировать, даже на уровне отдельных нот. Вы можете манипулировать небольшими сегментами MIDI-композиции (с точностью до миллисекунд), что невозможно в случае цифрового звука.

Основной недостаток MIDI-файла вытекает из его достоинств. Поскольку MIDI-данные не являются сами по себе звуком, то воспроизведение будет настолько точным, насколько устройство воспроизведения MIDI-данных идентично устройству, которое использовалось для создания исходного файла. Даже звук MIDI-инструмента в соответствии со стандартом General MIDI зависит от электронного устройства воспроизведения и используемого при этом метода. MIDI-звук не используют для воспроизведения речи.

Основное преимущество цифрового аудио перед MIDI-звучанием заключается в том, что качество воспроизведения цифрового звука всегда постоянно, и здесь MIDI-звучание уступает цифровому звучанию. Существуют две причины, по которым следует работать с цифровым звуком:

§ более широкий выбор программ и систем, которые поддерживают работу с цифровым звуком;

§ для подготовки и создания цифровых звуковых элементов не требуется знание музыкальной теории, чего не скажешь о MIDI-данных.

Cразу оговоримся, что статья говорит ТОЛЬКО об общих характеристиках и не будет включать в себя некоторые подробности. В будущем Лайфхакер проведёт собственное беспристрастное исследование. А сегодня попробуем обобщить уже так или иначе известный опыт.

Есть аналог и цифра.

Аналог - хорошо, но недолговечно и неудобно. Поэтому аналоговые носители, несмотря на высокие продажи винила, не вернутся.

Аудиоцифра может быть трёх основных типов:

  • в формате, не использующем сжатие;
  • в формате, использующем сжатие без потерь (lossless);
  • в формате, использующем сжатие с потерями (lossy).

На графиках - хороший AudioCD, сжатый OGG с переменным битрейтом 350 кбит/с и MP3 с использованием Lame. Чем ниже располагается график, тем ближе звучание к оригиналу. Получается очень интересная картина. Несмотря на то, что MP3 обладает явно срезанными высокими частотами, в отличие от OGG, в котором видно завал ниже 2 кГц.

Частотно-временное распределение звука говорит о не менее интересных вещах. При постоянном битрейте 320 кбит/с MP3 почти совпадает с оригинальной записью. Кажется, теперь всё встаёт на свои места. Но… На самом деле всё ещё больше запутывается.

Зачем вообще пользоваться lossy, когда есть доступный lossless

Здравый смысл.

Дело в том, что большая часть аналоговых записей не содержит того количества информации, которое необходимо было бы хранить в высококачественных форматах. Не стоит забывать, что родной частотой дискретизации для CD является 44,1 кГц, квантование - всего 16 бит.

Предыдущие графики неплохо демонстрируют высокую точность передачи MP3. А ведь для аудиокассеты, магнитной ленты (если, конечно, это не мастер-тейп) характеристики AudioCD недостижимы. Да и для массового студийного оборудования возможность записи аналогового звука, соответствующего AudioCD, появилась относительно недавно. Нет никакого смысла оцифровывать во FLAC (и тем более в WAV) концертную запись или пластинку из доцифровой эпохи, в особенности сделанные с магнитных носителей. Они не содержат тех спектров и того количества информации, которые могут хранить контейнеры без сжатия.

Что изменилось сегодня

Редкий звукорежиссёр делает цифровую мастер-запись (с которой затем производится размножение на физические носители), используя современные технологии на полную катушку. Поэтому шанс того, что 24-битный трек на самом деле всего лишь 16-битный, крайне высок.

Аналоговую высококачественную запись на высококачественном оборудовании сегодня встретить ещё сложнее - если только у фанатов подобного звучания. Таким, например, является Джек Уайт, экс-лидер группы White Stripes. При этом часть его записей относится к вариациям lo-fi, и искать там запредельные звуковые характеристики дорожки становится своеобразным удовольствием для гурманов.

Если представить себе идеальный исходник, то только тренированный слух или прослушивание на качественном аудиооборудовании позволит найти сжатый файл. И уже опираясь на это (и ), стоит сделать следующий вывод:

Необходимым и достаточным для среднеценового оборудования является AAC, в отсутствие которого (и при отсутствии исходников, которые можно кодировать в AAC) - MP3 с постоянным битрейтом 320 кбит/с, созданный при помощи кодека Lame 3.93 (рекомендуемые ключи при декодировании: —cbr -b320 -q0 -k -m s).

Исключение составляют записи, изначально полученные в высоком качестве, скажем, записанные на DVD-Audio, SACD, или записи, изначально собранные в DSD (или аналогичном формате) с высоким битрейтом.

Хотя кое-какие особенности у lossless есть. И о них мы расскажем в следующий раз.

Как правило, сегодня термином «аудио» обозначается все, что связано со звуком, будь то воспроизведение, обработка, сведение, мастеринг или прослушивание записей. Но мало кто знает, что аудио-форматы со времени своего возникновения постоянно претерпевали множество существенных изменений то в лучшую, то в худшую сторону. Беда в том, что по сравнению с начальными форматами, создатели новых форматов пытались улучшить качество звука, а это неизменно сказывалось на размере воспроизводимого файла. Уменьшение размера, наоборот, приводило к потере качества. Но так было не всегда.

Первый формат аудио в компьютерных играх

Самое первое упоминание о компьютерном звуке пошло от создания примитивных на тот момент игр, в которых саунд воспроизводился посредством системного динамика. Но как ни старались разработчики такого ПО (программного обеспечения), нужного качества, совместимого с бобинными или кассетными магнитофонами или пластинок, добиться так и не удалось.

Именно поэтому многие производители занялись поиском решения, как поменять формат аудио, чтобы звук был натуральным. Откровенно говоря, это и привело к дальнейшей конкуренции, которую мы имеем сейчас. Это касается не только воспроизводимого материала, но также и студийного звука, «живых» выступлений, качества или настройки основных параметров с точки зрения знаний физики, акустики и т. д.

Появление формата WAV

Считается, что первое полноценное качество аудио-форматов было связано с появлением стандарта и расширения файлов.wav (такое сокращение было образовано от английского слова «волна» или wave). Как раз-таки он и стал тем первенцем, который мог обрабатываться в компьютерных программах на профессиональном уровне.

Такие файлы уже имели свои характеристики: частоту дискретизации, глубину звука, битрейт и многое другое. Такой звук был совместим даже с тем, что можно было получить после обработки обычного звукового CD с помощью определенных инструментов типа обычного эквалайзера. Но размер был явно неоправданным. К примеру, трехминутный трек мог занимать от 20 до 50 Мб.

CD-диски

Формат аудио CD, точнее, расширение.cda, появилось практически в то же время.

В отличие от «волновых» файлов, сохраненных на винчестере, редактированию он не поддается. Его сегодня можно открыть в программе обработки звука, изменить формат аудио-перекодированием и сохранить в любом другом месте, кроме CD-диска.

Кодек MP3

С появлением кодека LAME MP3 Encoder музыкальная индустрия пережила настоящий шок, ведь «весили» такие файлы в десятки раз меньше, чем тот же файл WAV. Даже пятиминутная композиция при максимальном сжатии редко превышает размер в 5-7 Мб. Согласитесь, существенный прорыв, не говоря уже о том, позволяли не только корректировать вышеуказанные характеристики, но и некоторые дополнительные параметры в виде ID3-тегов, в которых содержалась информация, скажем, об исполнителе, названии альбома и треков, дате выпуска.

Такого типа стали наиболее популярными. Посмотрите, практически весь интернет заполнен именно этим универсальным форматом. В целом же, можно сказать, что формат аудио в MP3 стал настоящей революцией в звуке. Он остается одним из самых популярных и наиболее востребованных до сих пор, несмотря на то, что ему на смену идут и другие разновидности аудио. Но об этом несколько позже.

Файлы AIFF

Аудио-форматы имеют еще одну разновидность. Так называемый формат.aiff изначально был создан для применения на компьютерных системах Macintosh.

Только намного позднее произошла трансформация, которая предопределила совместимость звуковых форматов с их использование на платформах, различающихся между собой операционных систем.

Формат OGG

Музыка в формате аудио.ogg тоже встречается достаточно часто. Этот стандарт был разработан компанией Vorbis. Однако стоит заметить, что он имеет ряд существенных недостатков. Во-первых, это неоправданная нагрузка на системные ресурсы компьютера, несмотря на минимальный размер. Во-вторых, использование собственных кодеков и декодеров, которые система автоматически может и не устанавливать. К примеру, при работе в программе FL Studio Producer Edition (или XXL) в версиях ниже 9.x.x имелась папка с установочным файлом в формате.inf, который нужно было активировать для инсталляции после установки основного приложения вручную (иначе пресеты в таком формате просто не проигрывались).

Тем не менее сейчас аудио-форматы такого типа встречаются, а сам звук выглядит очень неплохим.

Стандарт AMR

Что касается этого формата, он, пожалуй, относится к самым низкопробным. Его возникновение связано с появлением первых неуклюжих мобильных телефонов, которые все еще не могли устанавливать на звонок мелодии в формате.mp3.

AMR тогда еще мог заменить натуральный звук с известной долей потери качества. Но это качество не идет ни в какое сравнение с тем, что предлагается более «продвинутыми» форматами.

MIDI

Как ни странно, MIDI тоже можно отнести к тому, что принято называть «аудио-форматы». Хоть и принято считать (а многие, собственно, так и думают до сих пор), что система MIDI это всего лишь набор команд, с этим можно поспорить. Расшифровка аббревиатуры MIDI - это Собственно, это система записи и редактирования неких нажатия клавиш, высоты тона, темпа, тональности, эффектов и т. д.

Тем не менее существуют файлы с расширением.mid или.midi, которые совершенно просто воспроизводятся в современных секвенсорах или студийных программах звукозаписи, используя стандартный набор звуков формата GM (General MIDI), GS (что то же самое) от компании Roland или XG (Extended MIDI) от корпорации Yamaha. В первых двух наборах присутствует 128 стандартных звуков, не считая эффектов, в третьем - почти втрое больше.

FLAC

Теперь мы подходим к одному из самых современных и уникальных форматов современности. Музыка в формате аудио FLAC сегодня получает все большее распространение. Связано это с качеством, на которое истинные меломаны обращают внимание, прежде всего.

Если разобраться, этот формат был создан на основе уже известного MP3. Вот только если ранее использовалось распределение на отдельные треки, в этом формате такого нет (до поры, до времени). Структура представляет собой один или два файла, один из которых является информационным. Воспроизвести такой формат могут только специализированные программные аудиоплееры. Самым известным можно назвать AIMP. Только в том случае, когда открывается основной файл, возникает и список дорожек, записанных в основном контейнере. В таком проигрывателе переключение между треками производится точно так же, как и в любом другом. Зато нет вероятности случайного удаления той или иной композиции (как уже говорилось, информация о них содержится в едином файле).

Совместимость форматов

Естественно, все форматы аудио сегодня совместимы между собой. Иными словами, любой стандартный домашний DVD-плеер или программный проигрыватель справится с этим без труда. То же самое относится и к программам обработки звука. Полупрофессиональные и профессиональные программы распознают все форматы, известные на сегодняшний день (даже несмотря на специфику операционных систем). Аудиоредакторы, секвенсоры, дополнительные модули типа VST, RTAS (для систем Windows) или AU (для Mac OS X) способны работать с такими форматами в так называемом кросс-платформенном режиме.

Преобразование форматов

Изменить аудио можно несколькими способами. К примеру, можно открыть «родной» формат, а сохранить файл в другом. Можно поступить еще проще. Для этого существуют специальные конверторы. В них можно просто загрузить из списка желаемый файл начального формата, а затем просто выбрать конечный. Как говорится, всего-то ничего.

Обработка качества звука

Другое дело, когда вопрос касается изменения некоторых частотных исходного файла. Тут без специализированных программных пакетов не обойтись. Именно с их помощью и можно изменить качество аудиофайлов. При этом можно поменять не только стандартную частоту дискретизации 44100 Гц, увеличив ее, скажем, до 96000 Гц, но и произвести настройку глубины от тех же 16 до 24 или 32 бит. И это мы уже не говорим о том, что можно настроить еще и битрейт, то есть, пропускную воспроизводимую способность, выраженную в килобитах в секунду. Стандартным значением считается 128 кбит/сек. Битрейт можно менять по своему усмотрению, однако наилучшее качество звука достигается на отметке 320 кбит/сек. Конечно, не каждый человек способен уловить разницу между стандартным звучанием и максимально выставленными характеристиками. Тем не менее, стоит один раз попробовать воспроизвести аудиотрек с разными данными на хорошей аппаратуре. Вот тут разница себя не заставит ждать.

Более того, кроме всех этих параметров, можно редактировать и многое другое. Чего только стоит использование программных эквалайзеров, лимитеров, компрессоров, кроссоверов, нормалайзеров, де-эссеров и т. д. и т. п. Каждый такой модуль позволяет настроить звук, как говорится, «под себя». И абсолютно все форматы, известные на сегодняшний день, программами такого типа и можно обрабатывать.

Итоговое сравнение

Попробуем сделать некое сравнение между используемыми форматами (хотя это еще далеко не все, что есть в мире звука).

Итак! Формат WAV хоть и «тяжеловесен», все равно может использоваться в качестве промежуточных файлов при последующем конвертировании в некоторых аудиореакторах. Форматы аудио-файлов такого типа чаще всего присутствуют при сохранении открытых проектов или при записи живых инструментов в студии. Понятно, что секвенсор потом обработает входящую информацию в виде звукового потока. А потом поменять формат аудио-файла или сохранить его в виде пресета или дорожки можно будет как угодно.

Форматы типа аудиодисков сегодня тоже неактуальны. Если взять в расчет AIFF или OGG, их лучше использовать в виртуальных студиях. О формате AMR вообще говорить не приходится. MIDI пригодится только музыкантам, знающим в этом толк.

Как считается, сегодня лучший аудио-формат - это все-таки FLAC. По мнению многих специалистов и музыкантов, он является не просто самым «продвинутым», но и даже революционным по сравнению с тем, что существовало или существует на сегодняшний день.

Однако стоит отметить, что и MP3 со счетов сбрасывать нельзя, ведь практически весь кодированный звук на тех же DVD-дисках или в MKV-файлах имеет именно этот формат. Разница только в версии кодека и декодера. Но и индустрия звука и видео в своем развитии на месте не стоит. Весьма вероятно, что мы скоро увидим и еще что-то новое.