Cele mai frecvente concepții greșite despre audio digital. Mp3 Sortarea în ordine a modurilor de compresie și a ratei de biți

Formatul de fișier MP3 este așa-numitul „ format deschis»Suportat de majoritatea producătorilor.

Formatul MP3 este unul dintre cele mai comune formate de codare audio digitală. O caracteristică a codificării audio MP3 este codificarea cu pierderi. Cu toate acestea, codarea se bazează pe un model special care ia în considerare particularitățile percepției auditive. Prin urmare, prezența pierderilor nu duce la degradarea catastrofală a sunetului.

Fișierele MP3 au devenit standardul de facto, iar redarea este susținută de majoritatea populare sisteme de operare, multe playere CD și DVD și alte dispozitive.

Interesant este faptul că standardul descrie formatul real de stocare și nu modul în care sunetul este codat. Ca urmare, există o mulțime de instrumente disponibile pentru redarea audio în format MP3.

Codecuri speciale sunt folosite pentru a codifica sunetul în format MP3.
Un codec audio poate fi unul dintre cele două tipuri - codec hardware și codec software.

Codificarea hardware se realizează folosind microcircuite speciale.
Codificarea software-ului se realizează utilizând programe speciale pentru computer.

Calitatea sunetului în format MP3 (toate celelalte lucruri fiind egale) depinde de raportul de compresie (citiți cantitatea de pierdere) și de programul de codificare. De aceea, jucătorii de marcă folosesc codecuri și sisteme de procesare semnal sonor de la mărci cunoscute, sunt semnificativ superioare în calitate de reproducere față de dispozitivele convenționale asamblate din ansambluri standard.

Calitatea redării reale depinde de mărimea fluxului de date de pe suportul media. Cantitatea de flux de date este uneori denumită lățime a fluxului. Există un termen special - bitrate. Debitul de date este definit în kilobiți pe secundă și este notat cu kbs, kbps, kb / s. Înregistrarea poate fi codificată în mai multe moduri - cu o rată de biți constantă și cu o rată de biți variabilă. Rata de biți variabilă ajută la păstrarea detaliilor prin creșterea cantității de date.

Pentru redare muzicală de înaltă calitate nu toate ratele de date sunt adecvate vezi Tabelul 1

Rată de biți și aplicații MP3

tabelul 1

Datele prezentate în Tabelul 1 pot servi doar ca orientare. Faptul este că la momentul apariției formatului MP3, calitatea echipamentelor audio de cerere în masă nu era foarte mare. Multe publicații de renume au susținut serios că un flux de date de 128 kb / s este suficient pentru reproducerea sunetului de înaltă calitate.

În prezent, o rată de biți de cel puțin 192 kb / s este considerată a fi de înaltă calitate. Mai mult, adoptarea pe scară largă a sistemelor Hi-Fi, Hi-End și home theater a dus la o schimbare masivă către reproducerea audio de înaltă calitate.

Prin urmare, defectele în reproducerea sunetului, imperceptibile pentru echipamentele bugetare din trecut, devin vizibile pentru „ascultătorul nepregătit” care folosește tehnologia modernă de înaltă calitate. Apropo, nivelul acestui „ascultător nepregătit” a crescut semnificativ.

În general, ideea de compresie (și mai ales de compresie cu pierderi) devine treptat învechită. Apărând în epocă suport de stocare scump și mic lățime de bandă canale de transmitere a datelor, ideea de comprimare a datelor a făcut o treabă excelentă în scopul său principal. Cu toate acestea, iubitorii de audio trec treptat la rate de biți mai mari (la compresie cu pierderi mai mici), sau chiar la formate de compresie „fără pierderi” sau chiar necomprimate.

Practicitatea formatelor comprimate, și în special formatul MP3, a dus la lansarea de playere MP3 compacte, dispuse pe cipuri de memorie sau pe hard disk-uri miniaturale.

Atunci când alegeți un anumit model al unui astfel de jucător, apare o întrebare legată de cantitatea de memorie a acestuia. Bineînțeles, utilizatorul dorește să estimeze în prealabil cantitatea de material muzical pe care o poate salva simultan pe playerul său MP3.

Datele aproximative privind volumul fișierelor și durata sunetului sunt colectate în Tabelul 2. Atunci când utilizați Tabelul 2, trebuie avut în vedere faptul că acestea sunt date aproximative care vă permit să estimați capacitatea de memorie necesară pentru playere sau suporturi amovibile.

Lungimea sunetului MP3 și raportul de compresie

masa 2

Bitrate,
kb / s

1 minut de înregistrare,
KB

Standard
Compoziție de 3 minute,
MB

Standard
Compoziție de 4 minute,
MB

Standard
Compoziție de 5 minute,
MB

Notă la tabelul 2
Raportul de compresie ridicat corespunde la 56 kb / s, compresia scăzută și calitatea înaltă a sunetului corespund 320 kb / s

Tabelul 3 oferă o estimare a lungimii totale a înregistrărilor muzicale - timpul de redare al playerului cu o anumită cantitate de memorie.

Durata totală de redare a playerului MP3, în funcție de cantitatea de memorie

Tabelul 3

Durata sunetului

Capacitate de memorie,
GB

Bitrate, kb / s

Minute
Ore

Minute
Ore

Minute
Ore

Minute
Ore

Minute
Ore

Minute
Ore

În măsura în care se poate aprecia din Tabelul 3, capacitatea de 8 GB este suficientă pentru a stoca înregistrări în format MP3 de cea mai înaltă calitate într-o cantitate adecvată pentru ascultare timp de 8 ore în fiecare zi timp de o săptămână (7 zile). Fără repetări! Cu greu cineva are într-adevăr o astfel de nevoie.

Chiar dacă acesta este cazul, puteți actualiza înregistrările de pe jucător nu mai mult de o dată pe săptămână.

Site web 2013. Toate drepturile rezervate.

Ne vedem pe web!

Cum să activați Wi-Fi pe un laptop Asus
Vista - cum să eliberați spațiu pe disc
Conexiune modem MTS 3G
Dimensiunea și calitatea fișierelor MP3
Metodologia și practica alegerii unui player MP3, partea 1
Metodologia și practica alegerii unui MP3 player partea 2
Vista - cum se deschide un prompt de comandă într-un folder
Cum se imprimă numele de fișiere dintr-un folder
Cum se salvează numele de fișiere ca text
Cum se copiază numele fișierelor în MS Excel
Lanternă USB cu LED
Dispozitiv și design pentru căști
Cum să alegi căștile?
Cum se păstrează inserțiile?
Puterea gadgeturilor - baterii
Dimensiunile cartelei SIM
Gadgeturi de alimentare - prize și prize
Alimentare pentru gadgeturi - adaptoare

În ultimii ani, formatul MP3 a devenit teribil de popular și popular. Pe orice tavă care vinde CD-uri pentru computer, puteți găsi cu ușurință mai mult de o duzină de discuri precum "Antologia completă a grupului XXX", iar în partea de jos o inscripție atât de modestă - MP3. Cel mai adesea, pentru o imagine completă, expresia la modă calitate CD apare pe coperte - adică calitate, precum cea a CD-ului audio. Este vorba despre asta și nu numai povestea noastră va fi mai departe - despre MP3, despre ce sunt acestea, despre calitatea sunetului în MP3.

Despre formatul MP3

Să începem cu o mică înțelegere a subiectului. Ce este oricum acest MP3?

MP3, mai mult nume corect MPEG-1 Layer 3 este un standard de compresie audio cu pierderi. În același timp, scopul principal la crearea standardului a fost acela de a asigura sunetul original cel mai „identic”, precum și de a reduce la minimum cantitatea de date stocate. Pentru aceasta a fost creat circuit original codificare - în prima etapă, sunetul digitalizat este împărțit în componente de frecvență, care trec printr-o serie de filtre.

Principala diferență între MP3 și standardele existente anterior este tocmai în filtrare. Dezvoltatorii standardului au creat un așa-numit model psihoacustic - un model care ia în considerare unele caracteristici ale auzului uman, iar pe baza acestui model aceste frecvențe sunt filtrate din semnalul audio, absența căruia auzul aproape nu observă. În a doua etapă, fluxul rezultat este codificat folosind algoritmul Huffman cu o tabelă statică. Rezultatul va fi fluxul MP3.

În plus, în fișierul MP3 pot fi adăugate și etichete ID3 (etichete care conțin numele unei melodii, artist, alte informații) și diverse informații despre servicii.

Moduri de compresie și rate de biți

Lățimea fluxului - Rata de biți determină câți biți sunt necesari pentru a codifica 1 secundă de muzică. Standardul MP3 reglează fluxurile de la 8kbit / s la 320kbit / s. Cel mai tipic bitrate este de 128kbit / s.

Pe baza fluxului, este ușor să calculăm cât va dura un minut de muzică - împărțiți viteza de biți la 8 (numărul de biți pe octet) și multiplicați cu 60 (secunde pe minut) - obținem numărul de kilobyți. Pentru fluxul deja menționat de 128kbit / s, acesta va fi 128/8 * 60 \u003d 960 kilobyte, sau aproximativ un megabyte pe minut de înregistrare.

Este destul de firesc ca cu cât rata de biți să fie mai mare, cu atât mai multe detalii ale sunetului pot fi păstrate, cu atât sună mai realist. În alegerea ratei de biți atunci când codificați, trebuie să sacrificați ceva - fie calitate în favoarea dimensiunilor mici, fie dimensiune în favoarea calității.

Cel mai simplu mod de compresie MP3 este Constant BitRate (CBR). Anterior, pe ansamblurile MP3, rata de biți deja menționată de 128kbit / s era utilizată aproape 100% - și în același timp, inscripția de calitate CD era prezentă pe discuri. Sincer vorbind, aceasta este doar o minciună flagrantă. În practică, este imposibil să se distingă sunetul unui astfel de MP3 de sunetul unui CD audio doar pe cea mai ieftină acustică.

Nivelul de calitate la un bitrate de 128kbit / s este de aproximativ nivelul sonor al unui magnetofon pe cea mai proaspătă bandă, poate puțin mai bună. Puteți adăuga, de asemenea, că această rată de biți este răspândită în înregistrările disponibile pe Internet.

Pentru a simplifica analiza ratelor de biți mai mari, voi scrie grila lor: 128kbit / s, 160kbit / s, 192kbit / s, 224kbit / s, 256kbit / s, 320kbit / s. Deci, bitrate-urile de 160 și 192kbit / s sunt deja semnificativ mai bune la calitate decât 128kbit / s, dar fișierele rezultate nu sunt încă atât de mari. „Artefactele” (defecte) ale codecului sunt aproape invizibile (cel puțin în sistemul meu).

Nu am întâlnit niciodată un bitrate de 224 în forma sa pură, așa că nu pot spune nimic despre calitatea sa, dar ar trebui să fie mai mare decât la pasul anterior al scării bitrate. În plus, nu am dat peste recenzii care au acoperit și acest bitrate. Se pare că acest lucru este cumva legat de faptul că următoarea rată de biți 256kbit / s este recunoscută în ceea ce privește acuratețea transmisiei sunetului, absența aproape completă a distorsiunii. În instrucțiunile pentru codecul Lame, acest bitrate este denumit chiar și Studio Quality. Iar plafonul în sine - 320kbit / s este destinat celor care apreciază cel mai mult calitatea sau pentru proprietarii de echipamente Hi-Fi sau chiar Hi-End de înaltă calitate.

Acum să trecem la o problemă puțin mai complexă - modul variabil de biți (VBR, Variable BitRate). Aici conceptul de rată de biți este foarte vag, codecurile „pentru utilizator” folosind în general doar controlul calității (ca în Xing Audio Catalyst, de exemplu). Altele (Lame) vă permit să setați opțiuni suplimentare - rate de biți minime și maxime, din nou de calitate.

Când codifică VBR, codecul însuși alege bitrate-ul dorit, pe baza parametrilor setați la acesta, iar în timpul fragmentului codificat, bitrate-ul se poate modifica. Pentru a estima rata de biți necesară, se folosește modelul psihoacustic deja menționat. Cu toate acestea, modelul (deoarece nu este perfect, nimic în lumea noastră nu este perfect) arată uneori rezultate incorecte. Acest lucru duce la o subestimare și, în consecință, la o scădere a calității sunetului efectiv audibil.

Dezvoltatorii de codec Lame recomandă, în acest caz, să stabilească pragul minim al ratei de biți pentru a evita rezultate foarte proaste. VBR include, de asemenea, codificarea ABR (Media BitRate), rata de biți medie. ÎN timpuri recente numai recenziile pozitive despre acest mod se aud în recenzii, în special ABR la 256kbit / s. Acest mod funcționează în același mod ca și VBR, cu excepția faptului că codecul aderă la valoarea de referință medie. ÎN în prezent Știu doar un codec care are un mod ABR - este Lame.

Selecție codec

Destul de recent, un utilizator care dorea să obțină MP3 de calitate decentă nu a avut o alegere foarte mare - acesta este un codec bazat pe ISO (bazat pe codecul unui eșantion de codec MP3 emis de Organizația Internațională pentru Standarde) sau un codec de la IIS Fraunhofer (un institut care dezvoltă MP3). Plus codecuri în produsele Xing.

Dupa citit recenzii diferite, și după ce am făcut o mică cercetare a mea, am ajuns la concluzia că ramura produselor Xing este ... este mai bine să nu le folosești. Chiar și în versiunile relativ noi, toate produsele lor care sunt capabile să creeze MP3 cu instrumente încorporate o fac cât mai slab posibil.

Există, de asemenea, o mulțime de obiecte de artizanat „pionier” realizate pe codecul furat de la Xing (aproape toate conțin fișierul tompg.exe). Pentru o lungă perioadă de timp principalul lor avantaj era viteza (în detrimentul calității), dar astăzi codecul Lame prezintă o viteză comparabilă la o calitate superioară. În plus, produsele Xing costă în general bani, în timp ce Lame este gratuit prin definiție.

Apoi, voi trece prin produsele IIS Fraunhofer. Toate programele lor gratuite de compresie MP3 sunt versiuni foarte reduse ale propriilor produse comerciale. Apoi, toate codecurile lor nu au evoluat mult timp și nu conțin instrumente noi, suport pentru VBR / ABR, în plus, nu diferă în ceea ce privește performanța specială. Singura lor utilizare justificată este compresia la rate de biți sub 128kbit / s - au fost special optimizate pentru rate de biți reduse (în unele locuri, totuși, încălcând standardul).

Diverse codec-uri bazate pe ISO suferă în principiu de același dezavantaj - compresie de calitate scăzută la rate de biți sub 192kbit / s. În plus, majoritatea dintre ele (inclusiv BladeEnc) sunt destul de lente.

În opinia mea, cea mai bună opțiune este codecul Lame. Început ca un codec ISO gratuit, a crescut în timpul dezvoltării și este folosit acum ca referință pentru MP3 atunci când se compară MP3 cu alte formate. Cu puțin peste un an în urmă, proiectul Lame a scăpat în cele din urmă de codul ISO și acum poate fi considerat un codec complet independent.

Dezvoltarea codecului este destul de intensă, este actualizată constant, bug-urile sunt remediate. În plus, este posibil să utilizați Lame nu numai sub Windows, ci și sub diferite variante ale sistemelor Unix, funcționează și în DOS pur. Din nou, complet gratuit, disponibil sursă (pentru cei cărora le place să exploreze), binare deja compilate (.exe și.dll), optimizate pentru diferite procesoare, sunt disponibile de pe mai multe site-uri.

Există, de asemenea, o versiune ușor decupată a Lame - codificatorul GOGO-no-coda, care arată rezultate fantastice în viteză (de două ori mai rapidă decât Lame-ul deja rapid).

Deci, ce bitrate și ce mod ar trebui să utilizați?

Având în vedere toate cele de mai sus, aș recomanda arhivarea MP3-urilor cu 320Kbit / s, modul CBR sau 256kbit / s, ABR. Primul, în opinia mea, este oarecum preferabil, deoarece veți obține cea mai înaltă calitate disponibilă în format. Pentru înregistrări „ascultați și ștergeți” este rezonabil să utilizați ABR 192kbit / s.

Și încă un lucru - este mai bine să nu folosiți rate de biți sub 192kbit / s pentru orice stocare îndelungată - cu excepția cazului în care înregistrarea cu care a fost realizat MP3-ul este întotdeauna la îndemână (deși amintiți-vă că înregistrarea cu bandă analogică se degradează în timp) ...

Foarte des argumentul pe care îl aud în favoarea ratei de biți scăzute și a compresiei „strâmbe” este „Am o acustică proastă și încă nu aud diferența”. Totul se poate schimba sau va trebui să vă folosiți arhiva pe un hardware decent și nu veți putea ajunge la înregistrarea originală. Răspunsul nu este absolut extravagant, pot cita un caz din propria mea practică.

În orașul nostru Pavlovo a existat odată un mic club în care se cânta muzică de pe computer (MP3 cu o rată de biți de cel mult 160kbit / s). Apoi, clubul a murit în siguranță, iar computerul cu arhivele muzicale s-a mutat la o altă companie implicată în organizarea de evenimente publice. Imaginați-vă că și-au propus să cânte această muzică în partea de jos a orașului! Groaza când, pe o acustică mai mult sau mai puțin decentă, puteai auzi toate defectele introduse de ambalare la un bitrate atât de mic. Sunetul era mai rău decât de la casetofonul lor bine purtat cu casete jumătate mestecate. Ar fi înțelept să evităm să repetăm \u200b\u200bgreșelile altora, nu?

Testați hardware și software

Computer: Athlon TB 650MHz, M / B Acorp 7KTA 100MHz FSB, 128Mb RAM PC-133, HDD Quantum 40Gb 5400rpm, SoundBlaster 16 Vibra, codec AC97.
Sistem audio: amplificator Radiotehnika U-7111, pereche de boxe Radiotehnika S-90B.
Software: SO Windows98 SE, Winamp 2.75, Eac 0.9pb11, Lame 3.90a, GOGO-no-coda 3.07a

Rata de biți este indicată ca una dintre caracteristicile principale ale înregistrărilor video și audio. Majoritatea utilizatorilor sunt obișnuiți să creadă că aceasta determină calitatea fișierului descărcat. Dar ce sunt bitrate-urile și cum caracterizează de fapt fișierele muzicale și videoclipurile? Să aruncăm o privire mai atentă la acest lucru.

Ce sunt ratele de biți?

Rata de biți este o valoare care afișează numărul de unități de informații (megabiți sau kilobiți) care se încadrează într-o secundă de redare a fișierului. În consecință, este măsurată în megabiți pe secundă (Mbps) sau kilobiți pe secundă (Kbps). În caz contrar, rata de biți poate fi descrisă ca lățime de bandă. Această caracteristică este importantă pentru cei care doresc să convertească fișiere, deoarece pentru aceeași durată, o rată de biți mai mare va crește dimensiunea fișierului. Pe lângă dimensiune, se schimbă și calitatea sunetului. Reducerea dimensiunii în timp ce scăderea bitrate-ului se numește compresie.

Un fișier muzical obișnuit este un fișier audio comprimat într-o asemenea măsură încât un disc standard poate conține până la 12 ore de muzică. În același timp, calitatea rămâne destul de ridicată datorită compresiei psihoacustice: sunetele cu acele frecvențe și niveluri de volum care nu sunt captate de urechea umană sunt eliminate din întreaga gamă. Sunetele selectate sunt formate în blocuri discrete numite cadre. Cadrele au aceeași durată și sunt comprimate în conformitate cu algoritmul specificat. Când se redă muzică, semnalul este recreat din blocurile decodate într-o secvență specifică.

Care este compresia frecvent utilizată?

Rata de biți audio este cel mai adesea de 256 Kbps. Cu această valoare, înregistrarea audio este comprimată de aproximativ 6 ori, astfel încât să poată fi înregistrată de 6 ori mai multă muzică pe un disc decât înainte de comprimare. Dacă rata de biți este redusă la 128 Kbps, atunci un disc se va potrivi de 12 ori mai multă muzică, dar calitatea sunetului va fi semnificativ mai mică. Muzica înregistrată la 128 Kbps este oferită cel mai adesea pentru ascultare pe internet, deoarece în căutarea creșterii vitezei de încărcare a paginilor, proprietarii de resurse fac sacrificii. Mulți utilizatori observă că calitatea sa este departe de a fi ideală.

Acum că a devenit clar ce sunt bitrate-urile, este timpul să stabilim nivelul lor optim. Amatorii și profesioniștii argumentează la nesfârșit cu privire la modul în care rata de biți afectează calitatea sunetului și dacă este deloc. Pe albumele muzicale, de regulă, este indicată rata de biți. Același disc, înregistrat la 128 Kbps și 256 Kbps, va diferi ca preț la jumătate.

Rată de biți optimă pentru diferite condiții de ascultare

Pentru mulți oameni, compresia de douăsprezece ori nu dăunează, în timp ce alții susțin că nu pot asculta muzică la o rată de biți mai mică de 320 Kbps. Paradoxal, ambii au dreptate. Faptul este că, în cele din urmă, calitatea reproducerii depinde nu de condițiile de reproducere, ci chiar de tipul de muzică.

De exemplu, o melodie este redată pe un magnetofon instalat într-o mașină de uz casnic. În acest caz, calitatea la 192 Kbps va fi suficientă. O rată de biți mai mare va îmbunătăți calitatea sunetului, dar diferența nu va fi vizibilă din cauza nivelului ridicat de zgomot în timpul călătoriei. Dacă muzica continuă computer de acasă sau un player portabil, este necesar cel puțin 256 Kbps. Dacă semnalul nu suferă modificări, acesta este transmis către dispozitive externe și afișat pe difuzoare importate scumpe, atunci ar trebui să recurgeți la compresia minimă, dacă este posibil. Este posibil la un bitrate de 320 Kbps.

Rată de biți optimă pentru diferite stiluri de muzică

Nu este necesară întotdeauna o muzică cu bitrate ridicat. Muzica populară sună de obicei suficient de bine la 192-256 Kbps. Se poate seta o calitate superioară, dar nu are rost în acest sens: melodiile pop au o durată scurtă de timp, astfel încât economisirea spațiului pe disc ar trebui să fie o prioritate. În plus, calitatea înregistrărilor originale este, de asemenea, mediocru, deci creșterea ratei de biți nu poate afecta calitatea fișierului redat în niciun fel. Pentru a asculta în transport și la petreceri informale, calitatea medie este destul de suficientă.

Dacă vorbim despre muzica clasica, lucrări ale unor trupe legendare de rock sau melodii rare de autor, atunci calitatea ar trebui să fie mai presus de toate. Când achiziționați o astfel de muzică, trebuie să vă uitați la rata de biți indicată pe ambalajul discului. Dacă piesa este descărcată de pe Internet, atunci aceste informații ar trebui să fie prezente pe pagina de descărcare. În plus, rata de biți este afișată în player în timpul redării.

Ratele de biți video

Mai sus, am vorbit despre care sunt ratele de biți ale înregistrărilor audio. Dar ce este bitrate-ul video? Având în vedere că videoclipul este redat ca o secvență de sunete și imagini, definiția bitrate-ului va fi aceeași. Prezența filmărilor face ca fișierul să fie mai greu, dar în cele din urmă imaginile pentru procesor sunt aceleași zerouri și aceleași ca și sunetele. Principiul criptării informațiilor este același pentru toate tipurile de fișiere.

Care este una dintre cele mai frecvente și profund înrădăcinate concepții greșite în lumea iubitorilor de muzică?

Salvați și citiți mai târziu -

Aproximativ. traducere: Aceasta este o traducere a celei de-a doua (din patru) părți a unui articol extins al lui Christopher "Monty" Montgomery (creatorul Ogg Free Software și Vorbis) despre ceea ce el crede că este una dintre cele mai frecvente și profund înrădăcinate concepții greșite din lumea muzicii .

192 kHz este considerat dăunător

Fișierele muzicale digitale de 192 kHz nu oferă niciun beneficiu, dar au totuși un anumit impact. În practică, se dovedește că calitatea reproducerii lor este puțin mai proastă, iar undele ultrasonice apar în timpul reproducerii.

Atât convertoarele audio, cât și amplificatoarele de putere sunt susceptibile la distorsiuni, iar distorsiunea tinde să se acumuleze rapid la înalt și jos frecvențe joase... Dacă același difuzor reproduce ultrasunetele împreună cu frecvențele din gama sonoră, atunci orice caracteristică neliniară va schimba o parte a gamei ultrasonice în spectrul sonor sub forma unor distorsiuni neliniare necontrolate aleatorii care acoperă întreaga gamă audio sonoră. Neliniaritatea unui amplificator de putere va avea același efect. Aceste efecte sunt greu de observat, dar testele au confirmat că ambele tipuri de distorsiuni pot fi auzite.

Graficul de mai sus arată distorsiunea rezultată din intermodularea sunetului la 30 kHz și 33 kHz într-un amplificator teoretic cu o distorsiune armonică constantă (THD) de aproximativ 0,09%. Distorsiunea este vizibilă pe întregul spectru, chiar și la frecvențe mai mici.

Undele ultrasonice inaudibile contribuie la distorsiunea intermodulației în domeniul sonor (zona albastru deschis). Sistemele care nu sunt concepute pentru a reproduce ultrasunetele au de obicei niveluri mai ridicate de distorsiuni, în jur de 20 kHz, contribuind în continuare la intermodulare. Extinderea gamei de frecvențe pentru a include ultrasunete necesită compromisuri care vor reduce zgomotul și activitatea de distorsiune în cadrul spectrului sonor, dar în orice caz, reproducerea inutilă a componentei ultrasonice va degrada calitatea reproducerii.

Există mai multe modalități de a evita distorsiunile suplimentare:

  1. Un difuzor numai cu ultrasunete, un amplificator și un separator de spectru de semnal pentru a separa și a reproduce independent ultrasunetele pe care nu le puteți auzi, astfel încât să nu afecteze alte sunete.
  2. Amplificatoare și traductoare concepute pentru a reproduce un spectru mai larg de frecvențe, astfel încât ultrasunetele să nu provoace distorsiuni armonice sonore. Datorită costurilor suplimentare și complexității execuției, suplimentar gama de frecvență va scădea calitatea reproducerii în partea sonoră a spectrului.
  3. Boxe și amplificatoare bine concepute, care nu reproduc deloc ultrasunetele.
  4. Pentru început, nu este nevoie să codificați o gamă atât de largă de frecvențe. Nu puteți (și nu ar trebui) să auziți distorsiunea armonică ultrasonică în banda de frecvență sonoră dacă nu există o componentă ultrasonică.

Toate aceste metode vizează rezolvarea unei probleme, dar numai metoda 4 are sens.

Dacă sunteți interesat de capacitățile propriului dvs. sistem, următoarele exemple conțin: 30 kHz și 33 kHz audio în format WAV 24/96, o versiune mai lungă în format FLAC, mai multe melodii și felierea melodiilor obișnuite la 24 kHz, astfel încât acestea se încadrează complet în gama cu ultrasunete de la 24 kHz la 46 kHz.

Teste pentru măsurarea distorsiunii armonice:

  • 30 kHz audio + 33 kHz audio (24 biți / 96 kHz)
  • Tonuri de apel 26 kHz - 48 kHz (24 biți / 96 kHz)
  • Tonuri de apel 26 kHz - 96 kHz (24 biți / 192 kHz)
  • Tăiat din melodii reduse la 24 kHz (24 bit / 96 kHz WAV) (versiunea originală tăiată) (16 bit / 44,1 kHz WAV)

Să presupunem că sistemul dvs. este capabil să redea toate formatele cu rate de eșantionare de 96 kHz. Când redați fișierele de mai sus, nu ar trebui să auziți nimic, fără zgomot, fără fluier, fără clicuri sau alte sunete. Dacă auzi ceva, atunci sistemul tău are caracteristică neliniară și provoacă distorsiuni sonore neliniare ale ultrasunetelor. Aveți grijă când măriți volumul, dacă intrați în zona de decupare digitală sau analogică, chiar și ușoară, poate provoca zgomot puternic de intermodulare.

În general, nu este un fapt faptul că distorsiunea armonică de la ultrasunete va fi audibilă pe un anumit sistem. Distorsiunea introdusă poate fi atât nesemnificativă, cât și destul de vizibilă. În orice caz, componenta cu ultrasunete nu este niciodată un merit, iar în multe sisteme audio va duce la o scădere puternică a calității reproducerii sunetului. În sistemele pe care nu le dăunează, capacitatea de a procesa ultrasunetele poate fi păstrată sau, în schimb, resursele pot fi utilizate pentru a îmbunătăți calitatea sunetului intervalului sonor.

Înțelegerea greșită a procesului de eșantionare

Teoria eșantionării este adesea de neînțeles fără contextul procesării semnalului. Și nu este surprinzător faptul că majoritatea oamenilor, chiar și doctorii geniali din alte domenii, nu o înțeleg de obicei. De asemenea, nu este surprinzător faptul că mulți oameni nici măcar nu își dau seama că greșesc.

Semnalele eșantionate sunt adesea descrise ca o scară zimțată ca cea de mai sus (în roșu), care arată ca o aproximare aproximativă a semnalului original. Cu toate acestea, această reprezentare este precisă din punct de vedere matematic și, atunci când este convertită într-un semnal analog, graficul său devine neted (linia albastră din figură).

Cea mai comună concepție greșită este că eșantionarea este un proces brut și duce la pierderea informațiilor. Semnalul discret este adesea descris ca o replică zimțată, unghiulară, a formei de undă perfect netede originale. Dacă credeți că da, atunci puteți presupune că cu cât rata de eșantionare este mai mare (și cu cât sunt mai mulți biți pe eșantion), cu atât pașii vor fi mai mici și cu atât aproximarea va fi mai precisă. Semnalul digital va semăna din ce în ce mai mult cu forma analogică până când își va lua forma la o rată de eșantionare care se apropie de infinit.

La fel, o mulțime de oameni care procesează semnalele non-digitale se vor uita la imaginea de mai jos și vor spune „Ugh!” Se poate părea că semnalul discret nu reprezintă bine frecvențele înalte ale formei de undă analogice sau, cu alte cuvinte, pe măsură ce frecvența sunetului crește, calitatea eșantionării scade și răspunsul în frecvență se degradează sau devine sensibil la faza semnalului de intrare.

Arată doar așa. Aceste convingeri sunt greșite!

Comentariu din 04/04/2013: Ca răspuns la toate mesajele legate de semnalele digitale și pașii pe care i-am primit, voi arăta comportamentul real al semnalului digital pe echipamentele reale în videoclipul nostru Digital Show & Tell, astfel încât să nu puteți lua cuvântul meu pentru asta.

Toate semnalele sub frecvența Nyquist (jumătate din rata de eșantionare) vor fi capturate perfect și complet în timpul eșantionării, iar pentru aceasta nu este necesară o rată de eșantionare infinit de mare. Eșantionarea nu afectează răspunsul în frecvență sau faza. Semnalul analogic poate fi recuperat fără pierderi - la fel de lin și sincron ca originalul.

Nu poți să te certi cu matematica, dar care este dificultatea? Cea mai faimoasă este cerința de limitare a benzii. Semnalele peste frecvența Nyquist trebuie filtrate înainte de eșantionare pentru a evita distorsionarea aliasing. Infamul filtru anti-aliasing acționează ca acest filtru. Suprimarea zgomotului de eșantionare, în practică, nu poate fi perfectă, dar tehnologiile moderne vă permit să vă apropiați de rezultatul ideal. Și ajungem la eșantionare.

Supraeșantionarea

Ratele de eșantionare peste 48 kHz nu sunt relevante pentru sunetul de înaltă fidelitate, dar sunt necesare pentru unele tehnologii moderne. Cel mai semnificativ dintre acestea este supra-eșantionarea (eșantionarea).

Ideea de eșantionare este simplă și elegantă. Vă puteți aminti din videoclipul meu „Digital Media. A Guide for Beginner Geeks ”, potrivit căruia ratele de eșantionare ridicate oferă un decalaj mult mai mare între cea mai mare frecvență de care ne interesează (20 kHz) și frecvența Nyquist (jumătate din rata de eșantionare). Acest lucru permite utilizarea unor filtre anti-aliasing mai simple și mai robuste și îmbunătățește fidelitatea. Acest spațiu suplimentar între 20 kHz și frecvența Nyquist este în esență doar un amortizor pentru filtrul analogic.

Figura de mai sus prezintă diagrame din videoclipul „Digital Media. Un ghid pentru începători, care ilustrează lățimile de bandă de tranziție pentru un DAC sau ADC la 48 kHz (stânga) și 96 kHz (dreapta).

Este doar jumătate din luptă pentru că filtre digitale au mai puține limitări practice decât cele analogice și putem completa anti-aliasing-ul cu o mai mare precizie și eficiență. Semnalul uscat de înaltă frecvență trece printr-un filtru digital anti-aliasing, care nu are nicio problemă în plasarea benzii de tranziție a filtrului în spații înguste. După finalizarea netezirii, segmentele discrete suplimentare din spațiul de amortizare sunt pliate pur și simplu înapoi. Semnalul supra-eșantionat este redat în ordine inversă.

Aceasta înseamnă că semnalele cu o rată de eșantionare scăzută (44,1 kHz sau 48 kHz) pot avea aceeași fidelitate, răspuns neted și aliasing scăzut ca semnalele cu o rată de eșantionare de 192 kHz sau mai mare, dar niciunul dintre ele nu va apărea. cauzând distorsiuni de intermodulare, mărire a fișierului). Aproape toate DAC-urile și ADC-urile moderne sunt supra-probate la viteze foarte mari și puțini oameni știu despre asta, deoarece se întâmplă automat în interiorul dispozitivului.

DAC-urile și ADC-urile nu au fost întotdeauna capabile să reșantioneze. Acum 30 de ani, unele console de înregistrare foloseau rate de eșantionare ridicate pentru înregistrarea sunetului folosind doar filtre analogice. Acest semnal de înaltă frecvență a fost apoi folosit pentru a crea discuri master. Anti-aliasing digital și decimare (eșantionare la o rată mai mică pentru CD și DAT) au avut loc în ultimul pas al creării înregistrării. Acesta ar putea fi unul dintre primele motive pentru care ratele de eșantionare de 96 kHz și 192 kHz au ajuns să fie asociate cu producția de înregistrări sonore profesionale.

16 biți versus 24 biți

Ok, acum știm că salvarea muzicii la 192 kHz nu are sens. Subiectul este închis. Dar ce zici de audio pe 16 biți și pe 24 de biți? Care e mai bun?

Audio PCM pe 16 biți într-adevăr nu acoperă pe deplin gama dinamică teoretică pe care o ființă umană o poate auzi în condiții ideale. Există (și vor exista întotdeauna) motive pentru a utiliza mai mult de 16 biți pentru înregistrarea audio.

Niciunul dintre aceste motive nu are legătură cu redarea audio - în această situație, sunetul pe 24 de biți este la fel de inutil ca eșantionarea la 192 kHz. Vestea bună este că utilizarea cuantificării pe 24 de biți nu afectează calitatea sunetului, pur și simplu nu o înrăutățește și ocupă spațiu suplimentar.

Note pentru partea 2

6. Multe dintre sistemele care nu pot reda eșantioane de 96 kHz nu vor refuza să le redea, dar le vor descompune în liniște până la 48 kHz. În acest caz, sunetul nu va fi reprodus deloc și nimic nu va fi înregistrat pe înregistrare, indiferent de gradul de neliniaritate al sistemului.

7. Supraeșantionarea nu este singura modalitate de a face față ratelor ridicate de eșantionare în procesarea semnalului. Există mai multe moduri teoretice de a obține un sunet cu frecvență de eșantionare limitată la lățime de bandă și de a evita decimarea, chiar dacă ulterior este eșantionat pentru înregistrarea pe discuri. Nu este încă clar dacă astfel de metode sunt utilizate în practică, deoarece evoluțiile celor mai multe atitudini profesionale sunt păstrate secrete.

8. Nu contează dacă s-a întâmplat istoric sau nu, dar mulți experți folosesc astăzi rezoluții înaltedeoarece se crede din greșeală că sunetul cu conținut stocat în afara 20 kHz sună mai bine. La fel ca și consumatorii.

Acest articol a fost citit de 33.932 de ori