Obsah
- 1 V jakém formátu je lepší poslouchat hudbu? Tři velryby ztracené
- 2 Testování ztrátových formátů (ztrátová komprese zvuku)
- 3 Test1: Srovnávací analýza pro 128 kbps
- 4 Test2: Srovnávací analýza pro 256 kbps
- 5 Test3: Srovnávací analýza pro 320 kbps
- 6 Srovnávací analýza MP3.
- 7 12 myšlenek na téma „Testování ztrátových formátů (ztrátová komprese zvuku)“
- 8 Napsat komentář Zrušit odpověď
- 9 Lossy – alternativa MP3
- 10 AAC
- 11 OGG
- 12 OPUS
- 13 WMA
V jakém formátu je lepší poslouchat hudbu? Tři velryby ztracené
Testování ztrátových formátů (ztrátová komprese zvuku)
Vrátil jsem se tedy k převodníku AIMP. Nyní s jeho pomocí můžeme převést naše kompozice do formátu, který nám vyhovuje. Jaký formát byste si měli vybrat pro použití ve své sbírce?
U bezztrátových formátů je vše jasné, bez ohledu na to, jak to zkroutíte, bez ohledu na to, jak to převedete, dostaneme původní kvalitu hudebního materiálu (pokud si nebudeme hrát s frekvencí a hloubkou vzorkování). Ale bezeztrátový má jednu významnou nevýhodu – hodně „váhy“. Ano, kapacita úložiště neustále roste a problémů s úložištěm je stále méně a méně. Ale jak přibývají příležitosti, rostou i naše požadavky. Chci mít velkou hudební sbírku na velkém pevném disku. Pokud vše uložíme bezeztrátově, opět narazíme na nedostatek místa. To je důvod, proč ztrátové formáty neztrácejí na popularitě.
Ztrátová komprese. Souhlas, zní to hrozivě. Pokud komprimujeme hudební skladbu, něco nenávratně ztratíme, nějakou část materiálu, nějaké noty. A někteří tvrdí, že kompozice ztratí duši.
Ano, na internetu je spousta recenzí a srovnání toho či onoho kodéru. Ale kontrola na vlastní pěst je vždy zajímavější. Kromě toho budeme provádět testy výhradně na AIMP, převádět skladby pomocí vestavěného převodníku a přehrávat je v samotném přehrávači. Pojďme zjistit, jakou část duše kompozice vybírá ten či onen kodér!
Konfigurace
- OS: Windows XP Pro SP3 Rus x86
- Způsob výstupu zvuku: DirectSound
Jak jsme zjistili v článku „Testování metod zvukového výstupu“, tato metoda poskytuje bitově přesný zvukový výstup. - Zvuková karta: Virtual Audio Streaming
Virtuální zvuková karta umožňuje eliminovat zvláštnosti hardwaru a implementaci ovladačů pro něj. Kromě toho pro nás bude snazší z něj kopírovat výstupní data - Nastavení přehrávače a OS: 44.1 kHz, 16 bitů/vzorek, hlasitost 100 %, ekvalizér a další efekty zakázány
- Přehrávač a převodník: AIMP 3.10.1027
Účastníci testu
- MP3
- WMA
- OGG Vorbis
- WavPack (hybridní režim)
Metodika testování
Pro měření jsem použil RightMark Audio Analyzer (RMAA). Vygeneroval testovací WAV soubor s následujícími charakteristikami: 44.1 kHz, 16 Bitů/vzorek (Kvalitní komprese takového testovacího souboru není problém pro žádný kodér. Proto jsem se rozhodl úkol zkomplikovat přidáním fragmentu stopy “ Yello – How How“ na konci souboru – kompozice s plným frekvenčním spektrem není snadné komprimovat. Tento fragment nijak neovlivní analýzu výsledného souboru). Výsledný soubor jsem pomocí konvertoru převedl do různých formátů se třemi nastaveními kvality: 128 kbps, 256 kbps a 320 kbps. Přehrál jsem tento soubor v přehrávači, nahrál výstupní signál přímo do souboru a analyzoval jej pomocí stejného RMAA.
Poznámka 1: Vzhledem k tomu, že převodník AIMP pro formát OGG implementuje pouze kompresní algoritmus VBR, bude se bitrate mírně lišit od hodnot uvedených v metodice testování.
Poznámka 2: Hybridní kompresní algoritmus WavPack, na rozdíl od konvenčního, má pouze několik technik pro snížení kvality zvuku za účelem zlepšení kompresního poměru. Na základě tohoto omezení nemůže kodér WavPack zaručit přesné zachování specifikovaného datového toku.
Zarazila mě plynulá frekvenční odezva formátu WMA. V tomto testu jsem se nerozhodl, komu dám dlaň: na jedné straně má OGG frekvenční rozsah až 20 kHz, na druhé má WMA dokonale plochou frekvenční odezvu až do mezní hodnoty 16 kHz.
V tomto testu se obraz vyrovnal. Frekvenční rozsah WMA se ukázal být v možnostech lidského ucha, MP3 je na tom trochu hůře – cutoff je na 19 kHz, ale zkreslení je nejnižší.
Při tomto kompresním poměru se charakteristiky ještě více přiblížily. Pouze WavPack vyčnívá z celkového obrazu díky míchání stereo kanálů.
Srovnávací analýza WMA.
Srovnávací analýza OGG.
Srovnávací analýza WavPack.
Závěry.
Hybridní kompresní algoritmus WavPack ukázal míchání stereo kanálů při všech nastaveních kvality. A ukázala to nejen měření, ale stejně dobře to slyší i uši. Ve skutečnosti při poslechu získáme zúžení stereo panorama, zvuk se nám bude zdát méně objemný.
U WMA často nemá smysl používat maximálně kvalitní kompresi. Při 256 kbps již vidíme plný výkon. Ale neříkám, že to platí pro všechny skladby.
MP3 vyžaduje maximální bitrate, teprve pak uvidíme skutečně maximální kvalitu výsledné skladby.
Co si tedy vybrat, kdo je lepší? WMA je méně náchylný k ořezávání než ostatní – sípání při maximální hlasitosti. OGG se i při nízkých bitratech snaží zachovat celé frekvenční spektrum původní kompozice. WavPack se snaží co nejvíce zachovat původní kvalitu. MP3 nabízí něco mezi. Při maximálním bitrate téměř neořezává frekvenční rozsah, má víceméně rovnoměrnou frekvenční odezvu a vnáší do původního signálu nejmenší zkreslení.
Jakkoli to může znít hrozně, moje volba je MP3 320 kbps.
Děkuji za pozornost. Prosím, nebuďte na mě příliš tvrdý, abych vyvozoval závěry.
Tento záznam byl publikován v sekci Testy a označen jako ztrátový, mp3, ogg, wavpack, wma, testy dne 26. dubna 2012 od Soolo .
12 myšlenek na téma „Testování ztrátových formátů (ztrátová komprese zvuku)“
- mdimon27. dubna 2012 v 13:02 Artem, díky za článek. Dále jsem zvolil MP3 320 kbps.
Ale rád bych slyšel více o AAS
http://ru.wikipedia.org/wiki/Advanced_Audio_Coding
- sólo Autor příspěvku 27. dubna 2012 v 14:16 Článek byl zamýšlen jako testování formátů, které jsou dostupné v AIMP konvertoru.
AAC tam ještě není, až se objeví, může být pokračování
- Black_AVP29. dubna 2012 v 22:48 No, zatím můžete použít kodek třetí strany, opravdu bych rád porovnal AAC s ostatními konkurenty a přehrávač tento formát podporuje.
Bylo by také zajímavé podívat se na výsledky srovnání stejných formátů při nízkých přenosových rychlostech 32-48 kbps a při nízkých vzorkovacích frekvencích – což se lépe hodí pro záznam řeči.
- sólo Autor příspěvku 27. dubna 2012 v 15:12 > Jaký kodek MP3 jste použili ve svém testu?
Použili jsme kodér z převodníku AIMP (lame) – vzal jsem verzi 3.99.3
- sólo Autor příspěvku 30. dubna 2012 v 22:51 Testy dávají zcela adekvátní obrázek. Nemluvím o číslech v tabulkách, ale o grafech. Jen je potřeba tyto grafy správně interpretovat.
Testování sluchu je nevděčný úkol. Zvuková paměť člověka je velmi krátkodobá. Při poslechu minutového testovacího zvukového fragmentu na konci zapomeneme, jak zněl začátek. Abyste si zapamatovali, jak konkrétní skladba zní, musíte ji poslouchat několik týdnů a teprve poté, když stejnou skladbu zahrajete v jiné kvalitě, uslyšíme rozdíl a budeme jej schopni popsat. No, takové testy také vyžadují vzorek lidí, asi 50 lidí, navíc nebude fungovat hodnocení ztrátovosti pomocí kritéria dobrý/špatný. Různé kodéry nám nabízejí zcela odlišné přístupy ke kompresi. Obecně platí, že byste měli vždy testovat objektivně a pomocí „syntetiky“ stačí vypracovat metodiku. Pomocí spektrálních grafů můžete zvuk zhruba popsat. WV – zúžení stereo panorama, OGG a WMA – ztráta tichých zvuků. MP3 – zhoršení detailů v nejvyšších frekvencích
- Audiophile1. května 2012 v 2:02 Kdo řekl, že to bude snadné? Ano, potřebujete dobře promyšlený algoritmus, hodně lidí a statistickou analýzu výsledků. Čistě pro sebe si můžete udělat slepý test s okamžitým přepínáním např. ve foobar2000: http://audiophilesoft.ru/publ/software/abx/4-1-0-37 A posoudit s dostatečnou mírou spolehlivosti stupeň slyšitelnosti určitých zkreslení , které jsou na grafu viditelné, nebudete moci – příliš velkou roli hraje dynamika, frekvenční a časové maskování, stejné křivky hlasitosti atd. A vzhledem k tomu, že právě na toto vše se kodér při posuzování složitosti materiálu a stanovení přesnosti kódování nutné k zajištění stanovené kvality opírá, není zde vůbec o čem mluvit.
- sólo Autor příspěvku 1. května 2012 v 12:08 Díky za info, ale jsem fanouškem grafů a čísel. Zda tato data brát vážně nebo ne, je osobní záležitostí čtenáře.
- vlad0013. ledna 2014 v 14:18 Tj. Když si jdu do obchodu řekněme koupit tapetu, mám se řídit tím, co je podle mých představ širší/užší, delší/kratší? Nebo máme stále rozhodovat o přesných údajích v číslech? Zde je to naprosto stejné, čísla uvádí sám výrobce (kdokoli), protože jde o objektivní hodnotu. Představte si, že by vlastnosti byly uvedeny ve tvaru: lepší, krásnější atd.?
Ale stojanové reproduktory, předpokládám, budou lepší než regálové, které se opět uvádějí v číslech např. od 100 Hz?
Muzikanti? Je nepravděpodobné, že hrají na „každodenní“ nástroje, možná se nedívají na čísla, ale my se podívat můžeme. To platí všude.
Napsat komentář Zrušit odpověď
Chcete -li přidat komentář, musíte být přihlášeni.
Lossy – alternativa MP3
Zdálo by se, že ještě před pár lety byla dominance MP3 na poli hudebních formátů zřejmá. Nicméně pro dnešek (podle studie z roku 2019) to už neplatí. Je pravda, že příslušná studie se zabývá nejen nezávislými audio formáty, ale také formáty komprese zvuku ve videu, ale obrázek je stále orientační. Na otázku „jaké audio kodeky používáte“ odpovědělo 88 % respondentů AAC, MP3 – 49 %. 8 % připadlo na OPUS a 7 % na VORBIS (OGG). To je o něco více než podíl nejoblíbenějšího bezztrátového formátu – FLAC (používá 6 % respondentů).
AAC
Jak jsme viděli výše, tento kodek vyšel z hlediska popularity na špici. Používají ho například tak populární platformy jako Apple Music a YouTube. Lidé poslouchají hudbu na Apple Music, sledují videa na YouTube – a to vše je AAC. Navíc: autor těchto řádků nedávno vyzkoušel bezplatnou verzi služby streamování klasické hudby IDAGIO a v jakém formátu je podle vás hudba (a také reklama na placenou verzi) doručována uživateli bezplatné verze? Vše ve stejném AAC. Mimochodem, pokud vidíte soubor s příponou .m4a, pak vězte, že pod touto příponou se „skrývá“ také ACC.
Formátu v jeho propagaci pomohlo, že původně vznikl jako vylepšený nástupce MP3, takže byl zařazen do rodiny formátů MPEG, čili se stal součástí standardu. Na vytvoření formátu se podílely již známé Bell Laboratories, Fraunhoferův institut a také společnosti SONY a Nokia. Samotná zkratka AAC znamená Addvanced Audio Coding, tedy Advanced Audio Coding. V čem tento pokrok spočívá?
Za prvé, toto je nejlepší poměr velikosti souboru a kvality (i když zde existují nuance, protože existuje několik alternativních možností kodeků od různých společností). Formát používá vylepšený algoritmus konverze signálu během kódování, který se po všech vylepšeních stal ještě efektivnější. Byly zavedeny nové funkce opravy chyb kódování. Formát se chová zcela odlišně v závislosti na tom, jaký účel je pro něj nastaven při kódování, přičemž kombinuje různé algoritmy. Jinými slovy, AAC se liší od AAC a možnosti doladění formátu jsou mnohem vyšší než u MP3 (které aktivně využívají velké hudební servery, které posluchačům nabízejí soubory převedené s optimálními parametry pro konkrétní žánr). Délka zakódovaného bloku informací se také může změnit.
Při porovnávání formátů AAC a MP3 si můžete všimnout následujícího: existuje více podporovaných vzorkovacích frekvencí (od 8 do 96 kHz) a také audio kanálů (až 48).
OGG
Formát ogg Vorbis je jedním z dlouholetých, ale stále relevantních konkurentů MP3. Mezi jeho inovace oproti MP3 patří prezentace stereo zvuku jako součtu „centrálních“ a „periferních“ kanálů (spíše než pravého a levého), možnost většího počtu kanálů, flexibilnější nastavení stupně komprese a vzorkovací frekvence). Konečně, toto je pokročilejší model komprese, který se výrazně liší od algoritmu MP3 (a poskytuje čistší zvuk téměř při všech bitratech).
To vše je zastíněno několika nevýhodami. První je „těžkost“ a pomalost samotného kodeku. Počítač musí dlouze přemýšlet, aby převedl zvuk na OGG. To znamená, že formát OGG není vhodný pro streamování zvuku. Všechny druhy populárních hudebních serverů tento formát obcházejí;
Pokud soubor neposloucháte v reálném čase, prosím. Dekódování signálu však také zatěžuje procesor více než v případě MP3. Pro počítač to není nic, ale u přenosných přehrávačů to může vést k o něco rychlejšímu vybíjení baterie.
Soubor zakódovaný v OGG s maximální kvalitou již „váží“ téměř stejně jako FLAC. To nedává moc smysl: je lepší použít formát bez ztráty dat. Proto se OGG obvykle nepoužívá při „maximálním“ nastavení. I zde však může formát přinést překvapení: jeho datový tok je „ve výchozím nastavení“ variabilní, takže při kompresi hudby v kvalitě přibližně odpovídající bitrate 320 kbps nelze vyloučit možnost průměrného výsledného bitrate kolem 280 nebo 380 .
Další nevýhodou je, že není tak široce podporován jako MP3. To je cena za svobodu a nezávislost formátu, i když pro nezávislý formát OGG dosáhl působivého úspěchu.
OPUS
S největší pravděpodobností jste se s tímto formátem již setkali, i když jste o tom dost možná nevěděli. Pokud jste někdy hráli PlayStation 4 nebo jste se dokonce jen setkali s hlasovými zprávami na VKontakte nebo WhatsApp, máte co do činění s opusem. Přemýšleli jste někdy, kolik váží stejné hlasové zprávy? Takže: váží velmi málo (bitová rychlost je často nižší než 20 kbps) a zní velmi dobře na tak ultra silnou kompresi.
Původně byl formát vytvořen pro potřeby hlasové komunikace: aby bylo možné data velmi rychle kódovat, přenášet po síti a zároveň zabírat málo místa. Na tomto problému pracovali odborníci ze Skypu a plodem jejich výzkumu byl zvukový kodek s názvem SILK. Autoři opusového kodeku si z tohoto vývoje vzali to nejlepší a doplnili jej o pokročilý psychoakustický algoritmus kodeku CELT, který umožnil kódovat nejen hlas, ale i hudbu. Po výrazném zpracování obou zdrojových kodeků vznikl OPUS. Upravené CELT a SILK uvnitř OPUS se chovají odlišně v závislosti na tom, jaký typ kódování souboru byl původně nastaven: hlas nebo hudba. Jak asi tušíte, hudba je kódována hlavně algoritmy CELT.
Pokud mluvíme konkrétně o kódování hudby, formát se ukazuje velmi dobře, zejména při relativně nízkých bitratech (128-196 kbit/s). Na nich produkuje kvalitu, která je výrazně vyšší než u konkurence. Zde mu může konkurovat snad jen ogg Vorbis, ale i ten má výrazné „ale“: opus dokáže transienty zakódovat ne o tolik přesněji, ale pro lidský sluch přirozeněji, bez notoricky známého efektu „reverzní ozvěny“. Jedná se vlastně o průlom v technologii, protože přechodové jevy už dlouho trápily ztrátové formáty komprese hudby.
OPUS kóduje basy méně přesně, což je i pro masového posluchače vcelku přijatelné: upřímně řečeno, většina reproduktorových soustav stejně nesvítí basovou přesností. Ale nejpřesněji zakódované frekvence jsou ty, které jsou nejlépe slyšitelné lidským uchem.
A konečně, hlavním rysem formátu je jeho univerzálnost. Dá se s ním zakódovat hlasová zpráva, audiokniha, hudební album. Navíc se zpočátku dobře hodí pro streamování – což se v roce 2020 ukázalo obzvlášť aktuální. Neznám statistiky využití audio kodeků pro letošní rok, ale téměř jistě se opus začal používat mnohem šířeji, protože formát umožňuje vzdálenou implementaci i těch nejodvážnějších audio projektů.
WMA
Naše povídání o MP3 konkurentech by bylo neúplné, kdybychom nezmínili další formát, který pomalu vchází do historie, ale který v ní kdysi hrál důležitou roli. Toto je Windows Media Audio (WMA) od společnosti Microsoft. Kodek měl podle jeho tvůrců konkurovat MP3 a dokonce i nekomprimovanému zvuku. Skutečné možnosti formátu se však ukázaly být mnohem skromnější, než jaké byly inzerovány, což vedlo k poměrně vytrvalému nepřátelskému přístupu k němu. Jednoduše řečeno, formát nesplnil očekávání posluchačů.
To však neznamená, že je formát sám o sobě špatný. Ve skutečnosti se WMA nikdy nestal formátem, který by poskytoval kvalitu blízkou CD, a to ani při ne nejmenší bitové rychlosti. Stále jej však podporuje velké množství zařízení a výsledky jeho používání znějí o něco lépe než MP3. A pokud vaše zařízení podporuje pouze tyto formáty (to se může stát zejména na starších zařízeních), pak má smysl se blíže podívat na duchovní dítě Mircosoftu.
Není možné nezmínit jednu velmi charakteristickou vlastnost, která je specificky vlastní algoritmu zpracování zvuku WMA. Jde takříkajíc o „selektivní redukci hluku“. Tvůrci formátu usoudili, že nemá smysl do záznamu ukládat informace podobné šumu, pokud je tento šum mnohem tišší než hlavní signál. Jinými slovy, v tichých částech záznamu nechává kodér šum téměř nedotčený (takže redukce šumu neovlivňuje tichý a citlivý signál), ale jak se úroveň záznamu zvyšuje, WMA začne čistit stále více šumu. na vysokých frekvencích. Navíc, čím hlasitější je signál, tím nižší frekvence potlačovač hluku „čistí“. A skutečně: proč plýtvat dalším prostorem kódováním již téměř neslyšitelného hluku? To vše je dobré, ale s jednou výjimkou: pokud do WMA přenesete velmi zašuměný soubor (například digitalizaci z demagnetizované audiokazety), pak se přechod mezi „tichou“ hlučnou částí a „hlasitou“ částí bez šumu být znatelný sluchem.
Kodek WMA poskytuje vylepšené „profesionální“ a „bezztrátové“ režimy, ale nerozšířily se.