K
knutinh
Gjest
I utgangspunktet tenkt å være en samletråd med oppklarende og etterretterlig informasjon om områder som det hersker mange meninger og misforståelser om i hifi-kretser. Grunnen til at jeg ikke starter tråden i tech-hjørnet er at nivået bør være slik at menig-mann både kan forstå argumentene og være med i diskusjonen (altså en pedagogisk utfordring til de av oss som mener å ha innsikt i temaet).
Hva er PCM (Pulse Code Modulation)? Hvilke av dagens lydsystemer benytter det, og hvilke gjør det ikke? Hvilke styrker og svakheter har PCM? Hva kan vi slå fast med teoretisk tyngde? Hvor skiller praksis seg fra teori? Kan vi tegne grafer eller trekke analogier til f.eks bilder som gjør konseptene lettere å forstå?
Dette er en utfordring til folk som Løkken og snickers m.fl. om å sy sammen en tråd som har nytteverdi utover å understreke egen fortreffelig kompetanse
PCM og samplerate
Vi hører ofte om CD at det opererer med 44100 samples per sekund (sampleraten) og 16 bits per sample. Hva innebærer dette egentlig? Sampleraten og bit-bredden kan analyseres separat i de fleste tilfeller som to prosesser. Den ene plukker ut den instantane, analoge verdien av en kurveform 44100 ganger per sekund. Den andre tar denne analoge verdien og gjør den om til en digital verdi som datamaskiner kan forholde seg til. Dermed har vi et system som er digitalt, diskret i tid og amplitude.
Dette er en stor forskjell fra f.eks platespillere som har en kontinuerlig kurveform med uendelig mange amplitude-nivåer og uendelig høy tidsoppløsning (prinsippielt - i praksis er disse systemene begrenset av fysiske faktorer). Jeg skal ikke starte noen stor debatt rundt hva som er "best" av CD og LP, men jeg ser allerede nå LP-tilhengere fnyse av at CD bare inneholder "små biter av musikken".
Til å hjelpe oss her har vi en kompis ved navn Harry Nyquist, en svenske som emigrerte til USA og jobbet ved AT&T og Bell labs etter å ha tatt en Ph.D i fysikk ved Yale i 1917. Han publiserte et mye omtalt paper i 1928 som skulle danne grunnlaget for moderne samplings-teori, "Certain topics in Telegraph Transmission Theory" som skulle bli kjent som Nyquist-Shannons samplingsteorem.
(kilde: http://en.wikipedia.org/wiki/Harry_Nyquist)
I korte trekk går dette ut på at ved å garantere at signalet inn til en opptaker i et platestudio inneholder frekvenser mellom 0 og 22.050kHz (altså halvparten av 44100) så kan man faktisk garantere at samme signal kommer ut - i alle fall i teorien, og dette forutsetter et uendelig antall bits. Men resultatet er tett opp til praksis, og strider så mye med intuisjonen at det er verdt å tenke litt over. Altså kan man fjerne nesten hele kurveformen med unntak av noen "samples", og likevel rekonstruere kurveformen eksakt i CD-spilleren.
Nøkkelen til at dette er mulig er et filter som må begrense høyere frekvenser i signalet inn til A/D konverteren. Dette må gjøres for å unngå aliasing, og betyr at man legger en øvre grense på hvor mye informasjon som er i kurveformen. En analog kurveform med begrenset informasjon kan også representeres av en endelig rekke tall.
For å se hva aliasing er kan man se på gamle wester-filmer med vogn-hjul. Når vogna akselerer ser man at hjulet går fortere og fortere rundt - før det plutselig begynner å stoppe og går baklengs. Dette er en illusjon som skyldes at filmer består av 24 bilder per sekund. Når hjulet begynner å snurre fort i forhold til dette tallet får vi aliasing siden vi bryter nyquist-kriteriet.
"Greit nok at en CD kan lagre sinuser med 20kHz frekvens, men musikk består ikke av sinuser, den har over- og undertoner. Derfor vil ikke en trekant/firkant-kurveform med grunnharmonisk 20kHz bli korrekt representert."
For det første snakker vi om overharmoniske, ikke underharmoniske. Dessuten vil en firkant bli korrekt representert opp til en øvre frekvens gitt av analogfilteret. Digitale systemer ser ikke forskjell på om en frekvenskomponent er en grunntone eller en overharmonisk. Hvis man krever at en firkant skal gjengis opp til 100kHz er det naturlig å kreve at også sinuser skal gjengis opp til 100kHz. Forskning har så langt ikke vist noe springende behov for lyd over 20kHz, men uansett er nyere formater i stand til å gå betydelig lengre opp i frekvens.
PCM og bits
Vi kan være enige om at en CD har ca 650MB lagringsplass. For å få musikk inn på denne plassen, har vi samplet en analog kurveform. Dessuten må vi kvantisere hvert enkelt sample til en avrundet verdi som kan representeres med et tall. Som de fleste sikkert vet har CD 16 bits. Det betyr at et analogt signal med amplitude (f.eks) +/- 1 Volt kan representeres med 65536 diskrete kvantiserings-verdier. Hvis den analoge verdien faller i mellom to kvantiserings-verdier, må vi avrunde til nærmeste lovlige verdi. Dette er rollen til en kvantiserer.
Dette betyr at vi kaster informasjon, og i motsetning til tids-sampling kan vi ikke hente dette tilbake. Ingen "interpolering" eller smart dsp kan si med sikkerhet hva verdien var (prøv å få en venn til å tenke på et tall med en desimal, få han til å si den avrundede verdien, og gjett så hva det opprinnelige tallet var. Fikk du det til?)
Blant ingeniører er det vanlig å anta at feilen man gjør ved kvantisering er det samme som å legge til støy. Dette er en forenkling av virkeligheten som kan lede til store misforståelser, men ofte fungerer den bra nok. I så fall kan vi si at en CD har et betydelig lavere støy enn f.eks et telefonsystem (som opererer med ca 8 bit).
I praksis finnes det andre, ikke-ideelle kilder til støy (som termisk støy i analoge komponenter), og dette gjør at ingen audiosystemer har "ekte" 24-bits oppløsning, uansett hva reklamebrosjyrer måtte påstå.
PCM og upsampling
upsampling er på mange måter et oppkonstruert begrep avledet av sample-rate-konvertering(SRC). Prosessen er godt beskrevet i litteraturen, og handler om å gå fra en sample-rate til en annen. Typisk kan det være en "upsampling" CD-spiller som gir 96kHz eller tilogmed 192kHz fra en CD-plate. Dette må da vel være bra? Se punktene over. En CD-plate er begrenset til 22.05kHz i utgangspunktet. Altså finnes det ingen informasjon over denne frekvensen.
"Jammen, boksen min gjenskaper denne tapte informasjonen!". Det som er tapt er tapt. Prøv å gjenskape siste halvdel av dette innlegget ved å lese bare første (vel, kanskje jeg repeterer meg selv...)
"Jammen, boksen min gjør at jeg bedre får utnyttet min kostbare D/A konverter". Ikke umulig, men en god D/A-konverter "re-sampler" gjerne signalet uansett til en høyere rate for å gjøre mer nøyaktig konvertering (dette er tilpasning til praktiske problemer som linearitet i kretser). Hvorfor blande seg opp i det en D/A designer sannsynligvis vet best?
mvh
Knut
(to be continued)
Hva er PCM (Pulse Code Modulation)? Hvilke av dagens lydsystemer benytter det, og hvilke gjør det ikke? Hvilke styrker og svakheter har PCM? Hva kan vi slå fast med teoretisk tyngde? Hvor skiller praksis seg fra teori? Kan vi tegne grafer eller trekke analogier til f.eks bilder som gjør konseptene lettere å forstå?
Dette er en utfordring til folk som Løkken og snickers m.fl. om å sy sammen en tråd som har nytteverdi utover å understreke egen fortreffelig kompetanse
PCM og samplerate
Vi hører ofte om CD at det opererer med 44100 samples per sekund (sampleraten) og 16 bits per sample. Hva innebærer dette egentlig? Sampleraten og bit-bredden kan analyseres separat i de fleste tilfeller som to prosesser. Den ene plukker ut den instantane, analoge verdien av en kurveform 44100 ganger per sekund. Den andre tar denne analoge verdien og gjør den om til en digital verdi som datamaskiner kan forholde seg til. Dermed har vi et system som er digitalt, diskret i tid og amplitude.
Dette er en stor forskjell fra f.eks platespillere som har en kontinuerlig kurveform med uendelig mange amplitude-nivåer og uendelig høy tidsoppløsning (prinsippielt - i praksis er disse systemene begrenset av fysiske faktorer). Jeg skal ikke starte noen stor debatt rundt hva som er "best" av CD og LP, men jeg ser allerede nå LP-tilhengere fnyse av at CD bare inneholder "små biter av musikken".
Til å hjelpe oss her har vi en kompis ved navn Harry Nyquist, en svenske som emigrerte til USA og jobbet ved AT&T og Bell labs etter å ha tatt en Ph.D i fysikk ved Yale i 1917. Han publiserte et mye omtalt paper i 1928 som skulle danne grunnlaget for moderne samplings-teori, "Certain topics in Telegraph Transmission Theory" som skulle bli kjent som Nyquist-Shannons samplingsteorem.
(kilde: http://en.wikipedia.org/wiki/Harry_Nyquist)
I korte trekk går dette ut på at ved å garantere at signalet inn til en opptaker i et platestudio inneholder frekvenser mellom 0 og 22.050kHz (altså halvparten av 44100) så kan man faktisk garantere at samme signal kommer ut - i alle fall i teorien, og dette forutsetter et uendelig antall bits. Men resultatet er tett opp til praksis, og strider så mye med intuisjonen at det er verdt å tenke litt over. Altså kan man fjerne nesten hele kurveformen med unntak av noen "samples", og likevel rekonstruere kurveformen eksakt i CD-spilleren.
Nøkkelen til at dette er mulig er et filter som må begrense høyere frekvenser i signalet inn til A/D konverteren. Dette må gjøres for å unngå aliasing, og betyr at man legger en øvre grense på hvor mye informasjon som er i kurveformen. En analog kurveform med begrenset informasjon kan også representeres av en endelig rekke tall.
For å se hva aliasing er kan man se på gamle wester-filmer med vogn-hjul. Når vogna akselerer ser man at hjulet går fortere og fortere rundt - før det plutselig begynner å stoppe og går baklengs. Dette er en illusjon som skyldes at filmer består av 24 bilder per sekund. Når hjulet begynner å snurre fort i forhold til dette tallet får vi aliasing siden vi bryter nyquist-kriteriet.
"Greit nok at en CD kan lagre sinuser med 20kHz frekvens, men musikk består ikke av sinuser, den har over- og undertoner. Derfor vil ikke en trekant/firkant-kurveform med grunnharmonisk 20kHz bli korrekt representert."
For det første snakker vi om overharmoniske, ikke underharmoniske. Dessuten vil en firkant bli korrekt representert opp til en øvre frekvens gitt av analogfilteret. Digitale systemer ser ikke forskjell på om en frekvenskomponent er en grunntone eller en overharmonisk. Hvis man krever at en firkant skal gjengis opp til 100kHz er det naturlig å kreve at også sinuser skal gjengis opp til 100kHz. Forskning har så langt ikke vist noe springende behov for lyd over 20kHz, men uansett er nyere formater i stand til å gå betydelig lengre opp i frekvens.
PCM og bits
Vi kan være enige om at en CD har ca 650MB lagringsplass. For å få musikk inn på denne plassen, har vi samplet en analog kurveform. Dessuten må vi kvantisere hvert enkelt sample til en avrundet verdi som kan representeres med et tall. Som de fleste sikkert vet har CD 16 bits. Det betyr at et analogt signal med amplitude (f.eks) +/- 1 Volt kan representeres med 65536 diskrete kvantiserings-verdier. Hvis den analoge verdien faller i mellom to kvantiserings-verdier, må vi avrunde til nærmeste lovlige verdi. Dette er rollen til en kvantiserer.
Dette betyr at vi kaster informasjon, og i motsetning til tids-sampling kan vi ikke hente dette tilbake. Ingen "interpolering" eller smart dsp kan si med sikkerhet hva verdien var (prøv å få en venn til å tenke på et tall med en desimal, få han til å si den avrundede verdien, og gjett så hva det opprinnelige tallet var. Fikk du det til?)
Blant ingeniører er det vanlig å anta at feilen man gjør ved kvantisering er det samme som å legge til støy. Dette er en forenkling av virkeligheten som kan lede til store misforståelser, men ofte fungerer den bra nok. I så fall kan vi si at en CD har et betydelig lavere støy enn f.eks et telefonsystem (som opererer med ca 8 bit).
I praksis finnes det andre, ikke-ideelle kilder til støy (som termisk støy i analoge komponenter), og dette gjør at ingen audiosystemer har "ekte" 24-bits oppløsning, uansett hva reklamebrosjyrer måtte påstå.
PCM og upsampling
upsampling er på mange måter et oppkonstruert begrep avledet av sample-rate-konvertering(SRC). Prosessen er godt beskrevet i litteraturen, og handler om å gå fra en sample-rate til en annen. Typisk kan det være en "upsampling" CD-spiller som gir 96kHz eller tilogmed 192kHz fra en CD-plate. Dette må da vel være bra? Se punktene over. En CD-plate er begrenset til 22.05kHz i utgangspunktet. Altså finnes det ingen informasjon over denne frekvensen.
"Jammen, boksen min gjenskaper denne tapte informasjonen!". Det som er tapt er tapt. Prøv å gjenskape siste halvdel av dette innlegget ved å lese bare første (vel, kanskje jeg repeterer meg selv...)
"Jammen, boksen min gjør at jeg bedre får utnyttet min kostbare D/A konverter". Ikke umulig, men en god D/A-konverter "re-sampler" gjerne signalet uansett til en høyere rate for å gjøre mer nøyaktig konvertering (dette er tilpasning til praktiske problemer som linearitet i kretser). Hvorfor blande seg opp i det en D/A designer sannsynligvis vet best?
mvh
Knut
(to be continued)