upsampling? 192kHz? 24bit? CD?

K

knutinh

Gjest
I utgangspunktet tenkt å være en samletråd med oppklarende og etterretterlig informasjon om områder som det hersker mange meninger og misforståelser om i hifi-kretser. Grunnen til at jeg ikke starter tråden i tech-hjørnet er at nivået bør være slik at menig-mann både kan forstå argumentene og være med i diskusjonen (altså en pedagogisk utfordring til de av oss som mener å ha innsikt i temaet).

Hva er PCM (Pulse Code Modulation)? Hvilke av dagens lydsystemer benytter det, og hvilke gjør det ikke? Hvilke styrker og svakheter har PCM? Hva kan vi slå fast med teoretisk tyngde? Hvor skiller praksis seg fra teori? Kan vi tegne grafer eller trekke analogier til f.eks bilder som gjør konseptene lettere å forstå?

Dette er en utfordring til folk som Løkken og snickers m.fl. om å sy sammen en tråd som har nytteverdi utover å understreke egen fortreffelig kompetanse :)

PCM og samplerate
Vi hører ofte om CD at det opererer med 44100 samples per sekund (sampleraten) og 16 bits per sample. Hva innebærer dette egentlig? Sampleraten og bit-bredden kan analyseres separat i de fleste tilfeller som to prosesser. Den ene plukker ut den instantane, analoge verdien av en kurveform 44100 ganger per sekund. Den andre tar denne analoge verdien og gjør den om til en digital verdi som datamaskiner kan forholde seg til. Dermed har vi et system som er digitalt, diskret i tid og amplitude.

Dette er en stor forskjell fra f.eks platespillere som har en kontinuerlig kurveform med uendelig mange amplitude-nivåer og uendelig høy tidsoppløsning (prinsippielt - i praksis er disse systemene begrenset av fysiske faktorer). Jeg skal ikke starte noen stor debatt rundt hva som er "best" av CD og LP, men jeg ser allerede nå LP-tilhengere fnyse av at CD bare inneholder "små biter av musikken".

Til å hjelpe oss her har vi en kompis ved navn Harry Nyquist, en svenske som emigrerte til USA og jobbet ved AT&T og Bell labs etter å ha tatt en Ph.D i fysikk ved Yale i 1917. Han publiserte et mye omtalt paper i 1928 som skulle danne grunnlaget for moderne samplings-teori, "Certain topics in Telegraph Transmission Theory" som skulle bli kjent som Nyquist-Shannons samplingsteorem.
(kilde: http://en.wikipedia.org/wiki/Harry_Nyquist)

I korte trekk går dette ut på at ved å garantere at signalet inn til en opptaker i et platestudio inneholder frekvenser mellom 0 og 22.050kHz (altså halvparten av 44100) så kan man faktisk garantere at samme signal kommer ut - i alle fall i teorien, og dette forutsetter et uendelig antall bits. Men resultatet er tett opp til praksis, og strider så mye med intuisjonen at det er verdt å tenke litt over. Altså kan man fjerne nesten hele kurveformen med unntak av noen "samples", og likevel rekonstruere kurveformen eksakt i CD-spilleren.

Nøkkelen til at dette er mulig er et filter som må begrense høyere frekvenser i signalet inn til A/D konverteren. Dette må gjøres for å unngå aliasing, og betyr at man legger en øvre grense på hvor mye informasjon som er i kurveformen. En analog kurveform med begrenset informasjon kan også representeres av en endelig rekke tall.

For å se hva aliasing er kan man se på gamle wester-filmer med vogn-hjul. Når vogna akselerer ser man at hjulet går fortere og fortere rundt - før det plutselig begynner å stoppe og går baklengs. Dette er en illusjon som skyldes at filmer består av 24 bilder per sekund. Når hjulet begynner å snurre fort i forhold til dette tallet får vi aliasing siden vi bryter nyquist-kriteriet.

"Greit nok at en CD kan lagre sinuser med 20kHz frekvens, men musikk består ikke av sinuser, den har over- og undertoner. Derfor vil ikke en trekant/firkant-kurveform med grunnharmonisk 20kHz bli korrekt representert."
For det første snakker vi om overharmoniske, ikke underharmoniske. Dessuten vil en firkant bli korrekt representert opp til en øvre frekvens gitt av analogfilteret. Digitale systemer ser ikke forskjell på om en frekvenskomponent er en grunntone eller en overharmonisk. Hvis man krever at en firkant skal gjengis opp til 100kHz er det naturlig å kreve at også sinuser skal gjengis opp til 100kHz. Forskning har så langt ikke vist noe springende behov for lyd over 20kHz, men uansett er nyere formater i stand til å gå betydelig lengre opp i frekvens.

PCM og bits
Vi kan være enige om at en CD har ca 650MB lagringsplass. For å få musikk inn på denne plassen, har vi samplet en analog kurveform. Dessuten må vi kvantisere hvert enkelt sample til en avrundet verdi som kan representeres med et tall. Som de fleste sikkert vet har CD 16 bits. Det betyr at et analogt signal med amplitude (f.eks) +/- 1 Volt kan representeres med 65536 diskrete kvantiserings-verdier. Hvis den analoge verdien faller i mellom to kvantiserings-verdier, må vi avrunde til nærmeste lovlige verdi. Dette er rollen til en kvantiserer.

Dette betyr at vi kaster informasjon, og i motsetning til tids-sampling kan vi ikke hente dette tilbake. Ingen "interpolering" eller smart dsp kan si med sikkerhet hva verdien var (prøv å få en venn til å tenke på et tall med en desimal, få han til å si den avrundede verdien, og gjett så hva det opprinnelige tallet var. Fikk du det til?)

Blant ingeniører er det vanlig å anta at feilen man gjør ved kvantisering er det samme som å legge til støy. Dette er en forenkling av virkeligheten som kan lede til store misforståelser, men ofte fungerer den bra nok. I så fall kan vi si at en CD har et betydelig lavere støy enn f.eks et telefonsystem (som opererer med ca 8 bit).

I praksis finnes det andre, ikke-ideelle kilder til støy (som termisk støy i analoge komponenter), og dette gjør at ingen audiosystemer har "ekte" 24-bits oppløsning, uansett hva reklamebrosjyrer måtte påstå.

PCM og upsampling
upsampling er på mange måter et oppkonstruert begrep avledet av sample-rate-konvertering(SRC). Prosessen er godt beskrevet i litteraturen, og handler om å gå fra en sample-rate til en annen. Typisk kan det være en "upsampling" CD-spiller som gir 96kHz eller tilogmed 192kHz fra en CD-plate. Dette må da vel være bra? Se punktene over. En CD-plate er begrenset til 22.05kHz i utgangspunktet. Altså finnes det ingen informasjon over denne frekvensen.

"Jammen, boksen min gjenskaper denne tapte informasjonen!". Det som er tapt er tapt. Prøv å gjenskape siste halvdel av dette innlegget ved å lese bare første (vel, kanskje jeg repeterer meg selv...)

"Jammen, boksen min gjør at jeg bedre får utnyttet min kostbare D/A konverter". Ikke umulig, men en god D/A-konverter "re-sampler" gjerne signalet uansett til en høyere rate for å gjøre mer nøyaktig konvertering (dette er tilpasning til praktiske problemer som linearitet i kretser). Hvorfor blande seg opp i det en D/A designer sannsynligvis vet best?

mvh
Knut
(to be continued)
 

Wodger

Hi-Fi entusiast
Ble medlem
08.03.2005
Innlegg
102
Antall liker
0
Torget vurderinger
1
Flott tiltak knutinh!
 
K

knutinh

Gjest
Forslag til stoff som mangler? Jeg synes forholdet mellom tid og frekvens er et tema som mange synes er vanskelig, men det egner seg kanskje bedre som et eget tema.

-k
 
N

nb

Gjest
Forslag til stoff som mangler? Jeg synes forholdet mellom tid og frekvens er et tema som mange synes er vanskelig, men det egner seg kanskje bedre som et eget tema.

-k

Fourier til folket! Kjør på, dette er et bra initiativ. En frekk liten fourier kunne jo også parkere oppfatningen som hyppig forekommer av at alt dette teoripjattet er "noe man har lært på VKII elektro"  ;D
 
K

kbwh

Gjest
Kjempeinitiativ dette
Men i motsetning til trådstarter mener jeg tråden hører til i tech-hjørnet. Da ville det være tydeligere for de uinvide hvordan de kunne bli innvidd trur eg.
 
K

knutinh

Gjest
Fourier til folket! Kjør på, dette er et bra initiativ. En frekk liten fourier kunne jo også parkere oppfatningen som hyppig forekommer av at alt dette teoripjattet er "noe man har lært på VKII elektro"  ;D
Jeg tenkte ikke på en teoretisk utledning av fourier.

Men en nyttig bit informasjon er at det ikke finnes noen separate "tidsrom" og "frekvens/faserom". Dette er to måter å analysere samme fenomen på. Det betyr at utsagn som "equalizer fungerer bare på frekvenser, ikke i tid" streng tatt er feil. For å kunne gjøre noe som helst i frekvens (f.eks dempe høye frekvenser), må man sammenligne amplituden "nå" med forsinkede, tidligere verdier. Dette kan gjøres med analoge eller digitale kretser.

Det som derimot er rett er at forskjellige fenomen lettere lar seg analysere i på den ene eller den andre måten. Dessuten er den menneskelige hørselen nærmere en frekvens-analysator enn en amplitude/tid-analysator (selv om den har delvis hybrid oppførsel).

mvh
Knut
 
K

knutinh

Gjest
Jeg har fått flere forespørsler om å flytte denne til tech-hjørnet. Men målgruppen for denne tråden leser ikke tech-hjørnet (det er i alle fall min hypotese).

mvh
Knut
 

GFE

Overivrig entusiast
Ble medlem
27.09.2003
Innlegg
830
Antall liker
3
Jeg har fått flere forespørsler om å flytte denne til tech-hjørnet. Men målgruppen for denne tråden leser ikke tech-hjørnet (det er i alle fall min hypotese).

mvh
Knut

Hei Knut,

Enig med deg om dette, blir mer lest på "hoved siden" og treffer sikkert bedre.
Videre er det fint å se at noen med kunnskap legger så mye arbeid i å forklare slik du har gjort her.

Mvh
Geir :)
 
K

knutinh

Gjest
Er det andre ting vi kunne ha tatt opp i samme slengen, uten å repetere det Ivar har gjort på tech-hjørnet?
-k
 
N

nb

Gjest
Hva med et aggregat av det du/Ivar har skrevet om feilkorreksjonsmekanismene til CD-mediet, her er det også en del misoppfatninger.
 

jetman

Overivrig entusiast
Ble medlem
20.12.2005
Innlegg
873
Antall liker
0
Fint dette her, knutinh, men kanskje du kan beskrive/forklare hvorfor konstruktørene velger å gjøre dette? Slik jeg leser det du har skrevet finnes der ingen teoretiske rasjonelle grunner for å feks. upsample. Søkte litt på nettet og i flere artikler ser jeg nevnt at det er filtreringsprosessen som er hovedårsaken. Ved å upsample kan man designe et filter som ikke kutter brått av ved 20khz og dette kan være gunstig for lyden. Jeg vet ikke hva som er "riktig", men dette er hva som skrives:

"Whether we upsample or oversample, the effect on the spectrum of our audio signal is similar. Instead of our signal of interest occupying almost our entire bandwidth all the way up to fs/2 (22.05 kHz), it now only occupies 1/8 th of that. This allows us the use of a very simple analysis filter at the head of our processing chain, the internal digital filters, or the reconstruction filter at the end of the chain. Both the processes of upsampling and oversampling give us this benefit. Without increasing the sample rate, we would need to design a very sharp filter that would have to cutoff at just past 20kHz and be 80-100dB down at 22kHz. Such a filter is not only very difficult and expensive to implement, but may sacrifice some of the audible spectrum in its rolloff. If we examine the spectrum at the increased rate, we can see that the filter can roll off gently well past 22kHz and as long as it is down in the cutoff region at 176.4kHz, the image created by the sampling process will easily be removed. The analog filter after the D/A converter is responsible for removing the audio signal's image as well as the frequency spurs caused by the DACs integration steps. An analog filter with a smooth roll off will have nicer phase characteristics as well."

http://www.audioholics.com/techtips/specsformats/upsamplingvsoversampling1.php
 
K

knutinh

Gjest
Fint dette her, knutinh, men kanskje du kan beskrive/forklare hvorfor konstruktørene velger å gjøre dette? Slik jeg leser det du har skrevet finnes der ingen teoretiske rasjonelle grunner for å feks. upsample.
Da har jeg uttalt meg uklart. Det finnes veldig gode grunner for å oppsample, men da som et ledd i D/A konverter design. En oppsamplende D/A konverter forflytter egentlig bare kompleksitet fra det analoge domenet (analogt filter) til det digitale (digitalt filter). Såvidt jeg vet gjør de fleste D/A konvertere dette i dag hvis du påtrykker et 44.1 kHz signal, så grunnen til å kjøpe en ekstern boks til 10.000 som gjør mer eller mindre samme operasjon er for meg uforståelig.

-k
 

jetman

Overivrig entusiast
Ble medlem
20.12.2005
Innlegg
873
Antall liker
0
Da har jeg uttalt meg uklart. Det finnes veldig gode grunner for å oppsample, men da som et ledd i D/A konverter design. En oppsamplende D/A konverter forflytter egentlig bare kompleksitet fra det analoge domenet (analogt filter) til det digitale (digitalt filter). Såvidt jeg vet gjør de fleste D/A konvertere dette i dag hvis du påtrykker et 44.1 kHz signal, så grunnen til å kjøpe en ekstern boks til 10.000 som gjør mer eller mindre samme operasjon er for meg uforståelig.

-k

Ok. Jeg klarte ikke lese det ut av det du skrev. (Og siden dette ikke er techhjørnet er jeg definitivt i målgruppen ;) )
 

Wodger

Hi-Fi entusiast
Ble medlem
08.03.2005
Innlegg
102
Antall liker
0
Torget vurderinger
1
Et par korte spørsmål for å være helt sikker på at jeg har forstått dette riktig:

- Det finnes altså ikke bruddstykker av informasjon i en sampling av en lyd med en gitt frekvens (f.eks. 22khz) som kan brukes til å gjenskape en lyd med høyere frekvens (f.eks. 30khz)?

- Jeg har aldri tenkt så mye over sammenhengen mellom lydfrekvens og samplefrekvens, men forstår jeg deg riktig så vil en samplefrekvens på 44,1khz (i teorien) gi en 100% korrekt representasjon av en lyd på 22,05khz?
 
K

knutinh

Gjest
Et par korte spørsmål for å være helt sikker på at jeg har forstått dette riktig:

- Det finnes altså ikke bruddstykker av informasjon i en sampling av en lyd med en gitt frekvens (f.eks. 22khz) som kan brukes til å gjenskape en lyd med høyere frekvens (f.eks. 30khz)?
Det er min mening ja. Man kan alltids gjette (kanskje man kan gjøre et "educated guess"), men man kan aldri gjenskape høyere frekvenser med sikkerhet.
- Jeg har aldri tenkt så mye over sammenhengen mellom lydfrekvens og samplefrekvens, men forstår jeg deg riktig så vil en samplefrekvens på 44,1khz (i teorien) gi en 100% korrekt representasjon av en lyd på 22,05khz?
Hvis du har uendelig antall bits, uendelig gode filtre etc. I praksis har du en "nært korrekt representasjon" fra 0 Hz og opp til f.eks 20kHz eller 22kHz, for så å gradvis degradere.

-k

-k
 
Topp Bunn