В якому форматі краще слухати музику. три кити lossy

Зміст:

Anonim

Відразу обмовимося, що стаття говорить ТІЛЬКИ про загальні характеристики і не буде включати в себе деякі подробиці. В майбутньому Інфія проведе власне неупереджене дослідження. А сьогодні спробуємо узагальнити вже так чи інакше відомий досвід.

Є аналог і цифра.

Аналог - добре, але недовговічне і незручно. Тому аналогові носії, незважаючи на високі продажі вінілу, не повернуться.

Аудіоціфра може бути трьох основних типів:

  • в форматі, що не використовує стиснення;
  • в форматі, що використовує стиснення без втрат (lossless);
  • в форматі, що використовує стиснення з втратами (lossy).

На перший погляд, більш перспективні формати, що використовують стиснення без втрат. Це не завжди так, про що ми докладніше розповімо в одному з наступних матеріалів. Формати без стиснення не мають будь-якого сенсу, крім зберігання майстер-записів, необхідних при створенні аудіоконтенту. Вони легше відновлюються. Для зберігання і прослуховування домашніх записів зайві.

З безлічі параметрів цифрового аудіо користувача в першу чергу повинні хвилювати частота дискретизації (точність оцифровки аналогового сигналу за часом), розрядність (точність оцифровки по амплітуді - гучності), бітрейт (кількість міститься в файлі інформації в перерахунку на секунду).

Сьогодні поговоримо про lossy.

Для стисненого звуку дуже важливо поняття психоакустической моделі - уявлення вчених і інженерів про те, як людина сприймає звук. Вухо сприймає весь спектр надходять на нього акустичних хвиль. Однак обробляє сигнали мозок.

Довідкова величина чутного людиною діапазону становить від 16 Гц до 20 кГц, але одночасно чути і усвідомлювати всі вступники звуки він не здатний.

Слух дискретний, і його звукова сприйнятливість нелінійна.

Сучасні психоакустические моделі досить точно оцінюють людський слух і постійно поліпшуються. На ділі, не дивлячись на запевнення любителів музики, музикантів і аудиофилов, для середньостатистичного нетренованого слуху первісний вигляд MP3 в максимальній якості став гранично більш прийнятною. Винятки є, їх не може не бути. Але вони не завжди легко помітні при сліпому прослуховуванні.

Формати, що використовують психоакустические моделі стиснення

Таких форматів для стиснення аудіо з втратами досить багато. Найбільш поширені сьогодні такі.

OGG (Vorbis)

Взагалі, файл з розширенням *.ogg є «контейнером»: всередині можуть знаходитися кілька звукових записів з власними тегами і характеристиками. Найчастіше збережені в ньому файли стискаються кодеком Ogg Vorbis, хоча можуть використовуватися і інші, в тому числі MP3 або FLAC.

Як його основних переваг варто назвати великий діапазон можливих параметрів при кодуванні: частота дискретизації звуку може досягати 192 кГц, розрядність - 32 біт. За замовчуванням OGG використовує змінний бітрейт (хоча при відображенні властивостей це не вказується), який може досягати 1 000 кбіт / с.

MP3

На відміну від вільного OGG, MP3 розроблений дуже важливим для сучасної акустики Товариством Фраунгофера - об'єднанням інститутів прикладних досліджень Німеччини. У середовищі аудиофилов, до речі, це вкрай поважна контора, правда, визнаватися вони в цьому не люблять. Але за їх розробками пильно стежать.

На відміну від OGG, може мати як змінним (VBR), так і постійним бітрейтом (CBR). До речі, саме завдяки MP3 виявилося, що не всяка запис може бути якісно кодована зі змінним бітрейтом (причини дивіться вище, алгоритми кодування і їх результати в даному випадку можуть бути різні при кодуванні одного і того ж джерела).

З огляду на похилий вік MP3 має значні обмеження: розрядність може бути 16-24 біта, частота дискретизації виражається тільки в дискретних значеннях (8, 11, 025, 12, 16, 22, 05, 24, 32, 44, 1, 48), бітрейт обмежений 320 кбіт / с. До того ж у звичайній версії MP3 число каналів обмежена двома.

AAC

Ті ж граблі, тільки в профіль. Теж розробка Товариства Фраунгофера. Пізніша і використовує іншу психоакустичного модель, більш сучасну. Загальнодоступна інформація дозволяє зробити висновок: так, їм вдалося поліпшити власне творіння.

Навіть якщо спиратися на найпростіші цифри, AAC - більш гнучкий формат. Розрядність файлів, отриманих за допомогою цієї розробки, становить від 16 до 24, частота дискретизації теж при бажанні дозволить не втратити звукової картини і лежить в діапазоні 8-192 кГц. Потік даних взагалі наближається до таких у lossless-форматів (до 512 кбіт / с), при тому що максимальне число каналів AAC-файлів сягає 48.

Який формат варто назвати однозначно кращим

Якщо врахувати, що AAC - переосмислений через десяток років MP3, то вибір на його користь. При бажанні можна буде порівнювати тільки MP3 і OGG. Давайте подивимося на картинки, зроблені шановним Андрієм аспидових з ixbt.com:

На графіках - хороший AudioCD, стиснений OGG зі змінним бітрейтом 350 кбіт / с і MP3 з використанням Lame. Чим нижче розташовується графік, тим ближче звучання до оригіналу. Виходить дуже цікава картина. Незважаючи на те, що MP3 володіє явно зрізаними високими частотами, на відміну від OGG, в якому видно завал нижче 2 кГц.

Частотно-часовий розподіл звуку говорить про не менш цікаві речі. При постійному бітрейте 320 кбіт / с MP3 майже збігається з оригінальною записом. Здається, тепер все встає на свої місця. Але … Насправді все ще більше заплутується.

Навіщо взагалі користуватися lossy, коли є доступний lossless

Здоровий глузд.

Справа в тому, що велика частина аналогових записів не містить тієї кількості інформації, яке необхідно було б зберігати в високоякісних форматах. Не варто забувати, що рідний частотою дискретизації для CD є 44, 1 кГц, квантування - всього 16 біт.

Попередні графіки непогано демонструють високу точність передачі MP3. Але ж для аудіокасети, магнітної стрічки (якщо, звичайно, це не майстер-тейп) характеристики AudioCD недосяжні. Та й для масового студійного обладнання можливість запису аналогового звуку, відповідного AudioCD, з'явилася відносно недавно. Немає ніякого сенсу оцифровувати у FLAC (і тим більше в WAV) концертний запис або пластинку з доцифровую епохи, особливо зроблені з магнітних носіїв. Вони не містять тих спектрів і тієї кількості інформації, які можуть зберігати контейнери без стиснення.

Що змінилося сьогодні

Рідкісний звукорежисер робить цифрову майстер-запис (з якої потім проводиться розмноження на фізичні носії), використовуючи сучасні технології на повну котушку. Тому шанс того, що 24-бітний трек насправді всього лише 16-бітний, вкрай високий.

Аналогову високоякісний запис на високоякісному обладнанні сьогодні зустріти ще складніше - якщо тільки у фанатів подібного звучання. Таким, наприклад, є Джек Уайт, екс-лідер групи White Stripes. При цьому частина його записів відноситься до варіацій lo-fi, і шукати там позамежні звукові характеристики доріжки стає своєрідним задоволенням для гурманів.

Якщо уявити собі ідеальний исходник, то тільки тренований слух або прослуховування на якісному аудіообладнання дозволить знайти стислий файл. І вже спираючись на це (і не забуваючи про сприйняття), варто зробити наступний висновок:

Необхідною і достатньою для среднеценового обладнання є AAC, за відсутності якого (і при відсутності початкових кодів, які можна кодувати в AAC) - MP3 з постійним бітрейтом 320 кбіт / с, створений за допомогою кодека Lame 3.93 (рекомендовані ключі при декодуванні: -cbr -b320 -q0 -k -ms).

Виняток становлять записи, спочатку отримані в високій якості, скажімо, записані на DVD-Audio, SACD, або записи, спочатку зібрані в DSD (або аналогічному форматі) з високим бітрейтом.

Хоча деякі особливості у lossless є. І про них ми розповімо в наступний раз.

В якому форматі краще слухати музику. три кити lossy