Portál AbcLinuxu, 5. května 2025 21:37
V tomto članku si niečo povieme o komprimovaných zvukových formátoch a o samotnom prenose audio záznamu do počítača.
Začneme, ako inak, históriou. Pokračovať budeme štipkou teórie a postupne sa prepracujeme k nástrojom, ktoré nám uľahčujú samotné ripovanie.
Medzi komprimovanými zvukovými formátmi zaujímajú vedúce postavenie MP3 a Ogg Vorbis. S MP3 ste sa už určite každý stretli. Názov MP3 je odvodený od MPEG-Audio Layer3. Len pre zaujímavosť si môžeme uviesť formáty MP1, MP2, WMA, RealAudio. Na prehrávanie MP3 vám v pohode stačí aj staršie Pentium napr. P133, 16Mb pamäte a nejaký ten disk. Kvalita záznamu je vec diskutabilná, no osobne si myslím, že kvalita nie je rovnako dobrá ako pri CD, aj keď sa k nej môže v závislosti od zvolených parametrov kvalitnych enkóderov veľmi blížiť. Pri štandardnej kompresii 11:1 a dátovom toku 128 kbps možete z 8-10 hudobných CD dostať jedno MP3-kové.
Veľkost skladieb sa v priemere pohybuje medzi 2 - 6 MB, ktoré sa dajú sa prenášať bez problémov aj internetom. Povedať si musíme aj o relatívne novom formáte Ogg. Tento formát je takisto založený na stratovej kompresii. Autori tohoto zvukového formátu tvrdia, že je skutočne porovnateľný, ak nie lepší ako MP3. Formát Ogg je slobodný, čo je pre mnohých vyznávačov filozofie slobodného softvéru dôvodom pre jeho uprednostnenie. Cieĺom článku nie je porovnávanie, či už kvality alebo vlastností formátov, ale prezentovanie praktického návodu práce so zvukovými formátmi pod Linuxom.
Pred tým, ako prejdeme do praxe, si musíme povedať ešte o dvoch pojmoch. Digitálny nosič, v našom prípade zvukové CD, má vzorkovaciu frekvecniu 44,1 kHz. Vhodne zvoleným dátovým tokom kbps, čo je vlastne počet bitov za sekundu, môžeme spoľahlivo zrekonštruovať signál s frekvenciou nižšou ako je polovica vzorkovacej frekvencie, teda asi 22 kHz. Ľahko si môžeme vypočítať šírku pásma, teda bitrate, aby nám CD hralo online.
Frekvencia * vzorkovanie * počet_kanálov(stereo): 44000 * 16 * 2 = 1408000 = 1.408 Mbps. Keď si to vydelíme 128 kbps, dostávame číslo 11, čo je vlastne štandardný kompresný pomer. Z tohoto krátkeho výpočtu viďieť výhodu enkódovania do MP3, kde na samotné on-line prehrávanie budeme potrebovať 11x menšiu šírku pásma ako pri CD.
Po krátkom úvode môžeme prejsť ku konkrétnym aplikáciam a programom.
Najprv zostaneme na príkazovom riadku a v závere sa pozrieme aj na grafické
nadstavby, ktoré, ako uvidíme, používajú programy z príkazového riadku.
Programy, o ktorých bude reč, sa štandardne nachádzajú v moderných
distribúciach ako napr. Mandrake, Red Hat, Slackware a iné. Ľahko si ich
teda príkazom rpm
z balíčků, alebo ./configure
, make
, make install
zo zdrojákov
môžete doinštalovať.
Proces získania formátu .mp3 alebo .ogg zo zvukového CD prebieha v dvoch fázach:
Prvý program, ktorý si predstavíme, sa volá cdparanoia. Slúži k získanie *.wavu z CD. Uvedieme si pár príkladov práce s týmto skvelým nastrojom.
$cdparanoia -B
|
Služi na stiahnutie všetkých hudobných stôp z CD a ich uloženie do samostaných súborov.
$cdparanoia 1-3
|
Stiahne na disk 1. až 3. skladbu.
$cdparanoia -5:[1:01]
|
Stiahne na disk zvukové stopy od začiatku CD po 5. track jej prvú minútu a
prvú sekundu. Cdparanoia ma veľa ďaľších parametrov (pozri man
cdparanoia
.
Ďaľším programom s veľmi príznačným názvom je cdda2wav. Je súčasťou balíka cdrecord a nachádza sa tiež v každej novšej distribúcii. Jeho použitie je podobné ako v predchádzajúcom prípade.
$cdda2wav -B -D /dev/cdrom
|
Popis ostatných parametrov môžete nájsť v manuálových stránkach. Počas procesu sťahovania je prehľadným spôsobom vytvorený zoznam skladieb s ich dľžkou a umiestnením. Keď už máme svoje ubľúbené CD stiahnuté do formátu .wav, pristúpime k vlastnému enkódovaniu.
Poznáme dve základné techniky vzorkovania, a to s pevnou alebo premenlivou vzorkovaciou frekvenciou. Pri pevnom vzorkovaní je celý záznam uložený rovnakým dátovým tokom. Výhodnejšie je však používanie premenlivého vzorkovania (VBR - Variable Bit Rate), keď časti záznamu, ktoré neobsahujú vysoké frekvencie, ukladáme nižším dátovým tokom, teda nižšou vzorkovacou frekvenciou. Existuje aj priemerné vzorkovanie (AVG - Average Bit Rate), ktorého pointa je v použití určitého dátového toku v oblasti, ktorej sa enkóder môže pohybovať a meniť ho.
Enkóderov je vo svete Linuxu viacej. Zaleží iba od nás a od referencií, pre ktorý sa rozhodneme. My si popíšeme lame enkóder, ktorý dosahuje asi nejlepšie výsledky a je používateľsky aj najrozšírenejší. Samozrejme sú aj iné ako napr. BladeEnc. Program lame má veľa parametrov, ak chcete, môžete s týmto programom a jeho parametrami experimentovať.
Použitie programu je nasledovné:
$lame subor.wav subor.mp3
|
V tomto prípade sa použije štandardný datový tok 128 kbps.
$lame --alt-preset standard -b 64 subor.wav
|
Lame použije VBR a prehladne nás informuje o svojej činnosti formou výpisu.
$lame -q0 -abr 192 subor.wav
|
Týmto príkazom zachováme najvyššiu kvalitu (-q0
) s tým, že použijeme priemerný dátový tok.
$lame --r3mix -V9 subor.wav
|
Týmito prepínačmi sa lame snaží zachovať čo najvyššiu kvalitu.
Predpokladám, že každý z vás použitie príkazov zvládol a ma na disku uložený súbor/y.mp3. Teraz si povieme, ako pod Linuxom editovať ID3 tagy. Na editovanie ID3 tagov môžete použiť program id3ed. Veľmi dobrá pomôcka je aj utilita mp3info. Existujú aj parametre pre program lame, ktorými si môžete priamo pri enkódovaní nastaviť názov skladby, interpréta, album a ďaľšie. Sú to parametre --tt, --ta, --tl. Podrobnejšie man lame.
Pred tým, ako prejdeme k ozajstnej lahôdke, a to ku programu grip, grafickej nadstavbe vyššie popísaných programov, si povieme, ako z nášho súboru.wav spravíme subor.ogg. Formát Ogg Vorbis, okrem toho, že je širený pod licenciou (GPL - General Public Licence) má v porovnaní s mp3 aj ďaľšie výhody. Rovnakú kvalitu dosahuje už pri nižších Bit Rate, teda aj menšej veľkosti výsledného súboru. Ďaľšou výhodou je možnosť využitia viackanálového zvuku (kvadrofónia, viacjazyčné stopy). Formát ma lepšie definovanú jednoducho rozširiteľnú hlavičku pre komentáre o zvukovej stope. K nevýhodám patrí zatiaľ slabá podpora od výrobcov (minidisc atď). Teraz však už prejdeme k samotnému enkódovaniu programom oggenc.
Použitie:
$oggenc subor.wav subor.ogg
|
Najjednoduchšie.
$oggenc -q 9 subor.wav
|
Parameter sa môže udávať od 1 - 10 a udáva kvalitu. 10 je najvyššia.
$oggenc soubor.wav -b 256
|
Vysoko kvalitné enkódovanie.
Takisto ako pri lame si môžete definovaním vhodných parametrov už počas ripovania pomenovať skladbu jej autora atď. Aby ste sa však tomuto vyhli, použite nástroj grip a uvidíte, že život s Linuxom je zasa o niečo krajší.
Ak ho už máte nainštalovaný, spustíte ho jednoducho z príkazového riadku
príkazom grip
. Jedná sa o kvalitne prepracovaný nástroj a so slušným
helpom. Samozrejmosťou je spolupráca s CDDB serverom, treba nastaviť iba
správny proxy server. Vašou úlohou je iba vybrať skladby, použité programy
na ripovanie a zahajiť samotný proces. Po chvíľke čakania máte k dispozícii
ripnuté formáty z CD, ktoré si môžete prehrať napr. v XMMS.
sox
sox
, který jde rovnou použít jako mixer, stříhací pult a efekty. Pro zájemce je tu man sox
a man soxexam
. A pro přehrávání není potřeba pouštět nějaký grafický udělátko, ale pro vyzkoušení, nebo použití ve scriptu se výborně hodí play
z balíku sox
.
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.