DXD, DSD, SACD og samplingfrekvens

Hans_Peter · 30.11.2006

En tid tilbake medførte lanseringen av Mozart med Trondheimsolistene og Marianne Thorsen på SACD diskusjon rundt samplingfrekvens og oppløsning i det digitale domenet. Som tekniker på denne produksjonen synes jeg diskusjonen rundt dette temaet er interessant og vil gjerne dele min oppfatning med forumet. Først ble det noe feilaktig hevdet at mikrofonene vi benyttet på denne produksjonen har et frekvensområde opp til 20khz. Om man ser nærmere på spesifikasjonene ser man at dette er innenfor +/-2db. Går man utenfor disse grensene har man fremdeles bare mistet 7db ved 40khz. Dette innebærer at det er masse informasjon som gjengis av mikrofonene langt utenfor det frekvensområdet men umiddelbart kan høre. Når det gjelder samplingfrekvens så er det en del andre hensyn som gjør DXD så bra. Selv om øret i seg selv ikke er bra på å oppfatte lyd over 20khz viser det seg at vår oppfatning av rom i svært stor grad styres av signalets impulsrespons. Den store fordelen ved å sample ved så høye frekvenser som DXD (352,8khz) er at man ikke lenger behøver et anti aliasing filter. Da en kort impuls av natur trenger stor båndbredde for å gjenskapes korrekt er overflødiggjøringen av et anti aliasing filter en stor fordel. Det er min påstand at den økte oppfatningen av rom og definisjon lyttere oppfatter på opptak gjort i DXD nettopp forårsakes av kraftig forbedret impulsrespons mer enn av den økte båndbredden signalet har.

knutinh · 30.11.2006

Først:
Velkommen hit. Det er alltid gøy å høre fra den andre siden av gjerdet

Du vet kanskje at båndbredden er gitt av impulsresponsen?

Hva som er viktigst av stor, flat båndbredde (og dermed komplisert filtrering) og raskere fallende frekvensrespons (og dermed kortere filter) er vel et åpent spørsmål, og hører egentlig ikke hjemme i DSD vs PCM debatten.

Det å ha flatest mulig respons og størst mulig båndbredde innen +/- 3dB har vært et viktig salgsargument og muligens har noen ingeniører stirret litt for mye på frekvensrespons-plot. Ved å bruke lineær-fase FIR filtre kan man oppnå veldig mye med frekvensresponsen, men man kan få problemer med pre-echo etc.

Det er ved bruk av PCM fullt mulig å sample ved 192kHz med et slakt filter fra 20kHz og opp for å gi en respons som bedre ligner på SACD. Evt kan man jo koble inn en støygenerator ved 30kHz og opp for å få bildet fullendt.

Hva mener du med at følelsen av rom forbedres av god impulsrespons? Sikter du til ITD (Interaural Time Difference) eller noe i den gata? Finnes det referanser på dette? (jeg bare etterspør mer info, jeg kritiserer ikke ditt utsagn).

Det er min påstand at DSD er et format som aldri burde ha sett dagens lys da det ikke kan rettferdiggjøres ut fra rent tekniske årsaker, og fordi det gir massive ulemper/utskiftning av utstyr som ikke lett lar seg integrere.

Det er videre min påstand (ubegrunnet) at PCM fint lar deg utnytte alt potensialet som finnes i dagens A/D og D/A-teknologi. Så lenge man har et format som representerer alle detaljer og skavanker som A/D og D/A kan by på så ser jeg ikke poenger med å bytte den ut. Hvorvidt man ønsker å prioritere bratte eller slakke filtre er et helt separat design-issue som jeg ikke ønsker å komme inn på.

En ting som interesserer meg er blindtesting av realtime [A/D] -> [DSD] -> [D/A] vs [A/D] -> [PCM] -> [D/A] for live kilde. Magefølelsen min sier at det er lite å snakke om så lenge alt gjøres korrekt.

-k

Portal · 30.11.2006

Jeg antar dere brukte trykkgradientmikrofoner, og selv om produsentene som regel ikke viser responsen til disse lenger opp i frekvensplottet, er det vel en kjennsgjerning at disse som regel har en særdeles grisete respons over 20 KHz, siden bølgelengder da blir i den størrelsesorden at lufttrykk på forsiden og baksiden av mikrofonmembranen kansellerer og forsterker membranbevegelsen (les: kamfilter). Resultatet blir jo at det mikrofonene fanger opp ikke er i nærheten av realistisk, hvis man ser for seg at lydbølger over 20KHz i det hele tatt kan oppfattes av mennesker?

Hvor mange spor tillater DXD-systemet deres (er det Pyramix dere bruker)?

Espen R · 30.11.2006

Først vil jeg ønske Hans Peter velkommen til Hifisentralen. Det er virkelig flott at folk relatert til den profesjonelle delen av bransjen tar seg tid til å poste på dette forum. Glimrende!

Mens visse andre folk her på forumet er veldig opphengt i tall, målinger, diagrammer og tekniske spesifikasjoner er jeg veldig opptatt av hva jeg faktisk hører. Og dette målt opp mot levende akustisk musikk som referanse.

Spørsmål:1) Forstår det slik at Pentatone innspiller i DSD formatet. Hvorfor innspiller ikke Lindberg lyd i DSD, men har valgt DXD, har dette med at DSD er et format som er vanskelig å redigere og prossesere i, og hvordan løser så Pentatone dette ?
2) Etter at innspillingen er gjort i DXD, og denne skal overføres til DSD/SACD, er det nok informasjon i SACD formatet til at all godlyden fra DXD masteren bevares, eller er det noe som går tapt mellom DXD og DSD overførselen ?
3) For å få fastslått en gang for alle: Knutinh mener at CD formatet på 16/44.1 er tilstrekkelig til å gjenskape all hørbar lydlig informasjon som ligger på en DXD studiomaster, en DSD studiomaster eller en høyoppløselig analogmaster, så fremst overførselen er optimal og vi snakker om 2 kanaler. Stemmer dette? Hvis dere hører forskjell på en DSD studiomaster og den ferdige 16/44.1 produksjonsmasteren for CD, kan du beskrive disse lydlige forskjellene?

Mvh
Espen

Hans_Peter · 30.11.2006

Takk for mottakelsen. Veldig fint med et forum der man kan utveksle erfaringer og synse vidt og bredt. Mange spørsmål her så jeg får ta dem etter hvert.
Først vil jeg si at det inbyrdes forholdet mellom impulsrespons og båndbredde er logisk og nettopp grunnlaget for at jeg har blitt tilhenger av stor båndbredde. En impuls på 3µs vil 49% av amplituden bli gjengitt ved 192khz mens man i DXD vil få gjengitt 88%. Som tekniker er jeg er ikke veldig opptatt av tall og målinger men veldig opptatt av alt som gir meg en klar følelse av forbedring. Vi har hele det siste året gjort alle våre produksjoner med det samme tekniske utstyret, DPA 130V mikrofoner, Millennia Media forsterkere, SphynxII konverter til en Pyramix DAW. Det eneste vi endret på Mozart innspillingen var å gjøre den i DXD i stedet for 88,2khz 24bit. Når vi så hører på resultatet er jeg ikke i tvil om at det er noe med denne produksjonen som gjør at den låter så godt som den gjør. Det er nærliggende å gi formatet en del av æren her sammen med en ellers kompromissløs kvalitet i alt fra musikere og opptaksrom frem til den ferdige SACD'en.
Når det gjelder format er DXD et PCM-format der vi tar opp med 24bit oppløsning, men der all all prossessering foregår i 32bit floating point for å beholde en best mulig oppløsning gjennom redigering og balansering.
Jeg er ikke enig i at DSD formatet ikke burde sett dagens lys. Formatet ble utviklet av Sony for å digitalisere analoge bånd. Ideen var å lage et format som beholdt kvaliteten på orginalen men gjennom sitt 1-bit format tok relativt lite dataplass. For dette formålet passet formatet perfekt. Senere ble det plukket opp og lansert som et konsumentformat for avspilling av audio, også i flere kanaler, nettopp på grunn av sin effektive datautnyttelse.
Som produksjonsformat egner det seg, til tross for sin båndbredde og dynamikk, dårlig da 1-bit strukturen gjør at formatet ikke kan redigeres eller dynamisk behandles på noen måte. Dette gjør at de som gjør sine opptak i DSD må konvertere de områdene der de ønsker å gjøre noen som helst endringer til PCM, for så igjen å konverteres tilbake til DSD. Da vi som produksjonsselskap søker en kortest mulig vei mellom mikrofon og konsument har vi nettopp på grunn av dette valgt å ikke gjøre våre opptak i DSD. DSD var da heller aldri ment å skulle bli et profesjonelt produksjonsformat.
Når det gjelder bruk av mikrofoner er dette valg som må gjøres for hver enkelt produksjon basert på en mengde parametre. På Mozart innspillingen er alle de mest signifikante mikrofonene kuler som ikke har trykkgradientenes svakheter ved høye frekvenser.
Når vi som siste skritt i en produksjon lager datafilen som er den som til slutt legges på SACD'en, bygges den opp gjennom en algoritme som en moderne kraftig dualcore PC bruker 8 timer på. Vi har hentet tilbake denne filen og sammenlignet den direkte mot den opprinnelige DXD-filen uten å kunne sette fingeren på noen opplagte forskjeller.
Når det gjelder forskjellen mellom 16bit/44,1khz og stereosporet på SACD'en er det litt vanskelig å si. Det er snarere små nyanser med følelse av luftighet, definisjon og plassering. Jeg er den første til å innrømme at man nok må ha et musikkanlegg over gjennomsnittet for å høre disse forskjellene på de to stereovariantene. Surround derimot gir en helt fantastisk opplevelse.

Espen R · 30.11.2006

Jeg tror jeg har et stereoanlegg over middels kvalitet og DXD innspillingen var den av 2L's innspillinger som jeg registrerte størst forskjell mellom CD og SACD sjiktet (2 kanals). Jeg benytter Klasse A forsterkere til disse 2 kanaler. Hvis jeg skulle benytte klasse A til 5 kanaler hadde det blitt fryktelig varmt i stua mi. Klasse D er ikke brukbart, ennå!

Espen R · 30.11.2006

DXD blir i mine ører målt opp mot det beste av analoge innspillinger. Mastering tekniker Doug Sax sa i et intervju for en stund siden at digital har problemer når det skjer veldig mye i lydbildet samtidig, spesielt i kraftige partier i musikken, det er som om dynamikken i musikken "klemmes sammens". Dette har jeg også mang en gang registrert med digital, men der synes DXD å være "on pair" med skikkelig god analog. Analog er nesten alltid "easy to the ears", altså ikke-trettende å lytte til. Også her viser DXD i mine ører å være et klart fremskritt og på linje med analog.

Ivar_Loekken · 01.12.2006

Jeg er ikke enig i at DSD formatet ikke burde sett dagens lys. Formatet ble utviklet av Sony for å digitalisere analoge bånd. Ideen var å lage et format som beholdt kvaliteten på orginalen men gjennom sitt 1-bit format tok relativt lite dataplass. For dette formålet passet formatet perfekt.

Nuvel, DSDs nominelle datarate er 2.822Mbps pr. kanal, mens 24/96 tar 2.306Mbps. Dataplass er heller ikke et stort problem i dag. Da DSD ble utviklet på starten av 90-tallet, kom man frem til aktuelle spesifikasjon mest fordi "bitstream" (1-bit) AD- og DA-konvertering var de facto standard for høyoppløsningssignaler med lav samplerate på den tiden. Ved å lagre data i et 1-bit format kunne man da unngå å desimere fra 1/2822 til 24/96 etter AD og modulere tilbake fra 24/96 til 1/2822 før DA. Det ble også ettertrykkelig fremhevet i Sonys reklamemateriell fra den tiden.

Problemet er imidlertid at "bitstream" AD- og DA-omformere for lengst har nådd sin fundamentale ytelsesgrense og for ganske mange år siden ble passé i en teknologisk kontekst. SoTA konvertere anno 2006 bruker typisk 5/2822 eller deromkring, 4-6 bit er standard. LPCM har ikke den samme fundamentale ytelsesgrensen som DSD, fordi man teoretisk bare kan fortsette å skalere opp ordbredde og samplerate i det uendelige ettersom teknologien utvikler seg.

knutinh · 01.12.2006

Det er umulig å føre denne debatten for ethvert teknisk argument blir møtt med praktisk-subjektive argumenter.

Samtidig brukes tekniske argumenter av den subjektive siden når disse finner det opportunt uten å ønske å besvare kritikk.

-k

kbwh · 01.12.2006

Det er interressant å følge den tekniske diskusjonen.

knutinh · 01.12.2006

Generelt om båndbreddebehov:
Et annet spørsmål siden du brakte 40kHz opp på banen:
1. Mikrofonen har i følge deg -7dB@40kHz, målt v/1m i anechoic chamber går jeg ut ifra.

2. Hva er avstanden til mikrofonen? Siden vi snakker audiofil så går jeg ut ifra at dere ikke bruker en haug av instrument-mikker? http://www.earthworksaudio.com/tech/hf_sound.pdf ved en avstand på 22meter og "normal" luftfuktighet så vil en direktebølge på 40kHz ha tapt seg 6dB relativt lavfrekvens.

3. Hva estimerer du kildens (utøverenes) output ved 40kHZ til å være? Det er bare få instrumenter som har signifikant output v/40kHz til å begynne med. Muted trompet og cymbal er vel noen av disse.

Hva er den subjektive fordelen med å redusere impulsresponsens lengde ved opptak av instrument uten variasjon innenfor tidsvinduet hvor impulsresponsen brer seg?

4. Hva er typisk frekvensrespons ute i stuene til folk flest? Hva er tapet ved 40kHz for dine studiomonitorer?

5. Hva er sjansen for at jeg kan oppfatte forskjellen mellom uendelig båndbredde materiale, og materiale som er "pent" lavpassfiltrert over 20 kHz?

6. Ivar kan sikkert svare på hva SNR for SACD er ved 40kHz.

Som konklusjon:
Hvis man ikke har en hel kjede fra utøver til lytter som kan produsere/reprodusere/oppfatte 40kHz, hva er da egentlig poenget med å ha enkelt-ledd som gjør det?

-k

knutinh · 01.12.2006

Henviser ellers til denne:
"SACD med 192/24 PCM ut? "
http://www.hifisentralen.no/cgi/yab...fi1;action=display;num=1161766886;start=16#16

-k

nma · 01.12.2006

Spørsmål:1) Forstår det slik at Pentatone innspiller i DSD formatet. Hvorfor innspiller ikke Lindberg lyd i DSD, men har valgt DXD, har dette med at DSD er et format som er vanskelig å redigere og prossesere i, og hvordan løser så Pentatone dette ?

De konverterer til PCM, dette visste du da!

3) For å få fastslått en gang for alle: Knutinh mener at CD formatet på 16/44.1 er tilstrekkelig til å gjenskape all hørbar lydlig informasjon som ligger på en DXD studiomaster, en DSD studiomaster eller en høyoppløselig analogmaster, så fremst overførselen er optimal og vi snakker om 2 kanaler. Stemmer dette? Hvis dere hører forskjell på en DSD studiomaster og den ferdige 16/44.1 produksjonsmasteren for CD, kan du beskrive disse lydlige forskjellene?

Jeg gjetter helt vilt, og det er jo ulovlig på tech-hjørnet, men en god DAC/CDspiller som er optimalisert for 16 bits formatet, kommer ganske nærme. Problemet er vel at 16 bits er akkurat er litt for lite for å oppnå en i praksis transparent konvertering. Hadde bare CD'en vært 20bits.. I tilleg hadde man jo sluppet mye av dither problematikken også..

knutinh · 02.12.2006

3) For å få fastslått en gang for alle: Knutinh mener at CD formatet på 16/44.1 er tilstrekkelig til å gjenskape all hørbar lydlig informasjon som ligger på en DXD studiomaster, en DSD studiomaster eller en høyoppløselig analogmaster, så fremst overførselen er optimal og vi snakker om 2 kanaler. Stemmer dette? Hvis dere hører forskjell på en DSD studiomaster og den ferdige 16/44.1 produksjonsmasteren for CD, kan du beskrive disse lydlige forskjellene?

Mvh
Espen

Vi får håpe vi blir noe klokere på akkurat det når vi tar den testen vi har snakket om Espen.

For ordens skyld er jeg skeptiker, ikke motstander av all fremgang. Det blir påstått av enkelte hifi-interesserte, musikk-produsenter og brunevareindustrien at SACD byr på helt uante fordeler fordi det:
1. er hirez
2. er bedre enn PCM

Jeg tillater meg å stille spørsmålstegn ved hvordan man kommer fram til denne konklusjonen. For de fleste hifi-interesserte har man bare mulighet til å sammenligne CD med SACD og den opplagte svakheten da er at man sammeligner to potensielt forskjellige mastre og to standarder for musikk-overføring samtidig.

Hvis du skal sammenligne blyfri og høyoktan må du bruke to like biler. Å fylle blyfri på en lada og høyoktan på en ferrari betyr ikke at høyoktan nødvendigvis er bedre enn blyfri.

Det er ellers rart at "komprimerende" egenskaper ved SACD trekkes fram som en fordel, når enhver lossy kompresjon av PCM er et onde som må bekjempes med boikott-kampanjer landet over.

Hvis høyoppløst PCM greier å hente ut all informasjon (og støy) som de beste av A/D og D/A-konvertere greier å generere, og samtidig kan lossless eller lossy komprimeres i så lave rater man bare måtte ønske så ser jeg ikke hensikten med SACD med mindre man:
1. Er plateselskap og ønsker å pushe et format som er vanskelig å kopiere og redistribuere
2. Er produsent av studio/konsumenthardware og ønsker å pushe nye bokser
3. Som Espen, mener at det rett og slett finnes flere gode innspillinger på SACD enn konkurentene

-k

Hans_Peter · 02.12.2006

1. Jeg bragte 40khz på banen konkret fordi dette er typisk gjengivelse med en mikrofon jeg bruker mye nettopp på grunn av dens gode egenskaper i vår type applikasjoner.

2. Når det gjelder frekvenstap på avstand har jeg aldri satt mikrofoner noe i nærheten av 22m fra kilden jeg ønsker å ta opp. Normalt sett vil avstanden være mellom 0,5 og 5 meter avhengig av hva vi tar opp. Fra et rent audiofilt utgangspunkt vil jeg bruke færrest mulig mikrofoner.

3. Hva slags output et instrument har ved 40khz er individuelt og avhengig av så mange faktorer at det er meningsløst å forsøke å gjette. Jeg regner likevel med at instrumenter fiolin og piano har betydelig signal rundt 40khz.

Da alle lyder kan plukkes ned til å være en sum av sinustoner med forskjellig amplitude og bølgelengde anser jeg impulsrespons for å være avgjørende for å gjengi et instruments fulle frekvensspekter med fargingen det får fra rommet det spilles i.

4. Hva folk hører på musikk på hjemme er så mangt.
Våre studiomonitorer er linjære til 30khz.

5. Det vet jeg ikke.

Vi gjør våre SACD produksjoner for de som har investert i anlegg som kan gjengi SACD'ens dynamiske og frekvensmessige potensiale i 2 eller 5(.1) kanaler. Andre vil få en fullgod opplevelse med CD'en. Det er nettopp dette som er så genialt med en hybrid SACD. Som tekniker i et produksjonsselskap er det min oppgave og mitt ønske å formidle en musikalsk opplevelse til lytteren. For å få til dette har vi funnet at surround på SACD er det formatet som på best måte gjør dette. Ved lytting til identisk kildemateriale i hhv 44,1/16 og DSD mener vi at det også i stereo er en bedre teknisk kvalitet på DSD materialet.

nma · 02.12.2006

Er det slik at CD-laget blir generert utifra SACD materialet vha Super Bit Mapping, eller gjøres dette utifra DXD vha av en annen dithering prosess?

knutinh · 02.12.2006

1. Jeg bragte 40khz på banen konkret fordi dette er typisk gjengivelse med en mikrofon jeg bruker mye nettopp på grunn av dens gode egenskaper i vår type applikasjoner.

2. Når det gjelder frekvenstap på avstand har jeg aldri satt mikrofoner noe i nærheten av 22m fra kilden jeg ønsker å ta opp. Normalt sett vil avstanden være mellom 0,5 og 5 meter avhengig av hva vi tar opp. Fra et rent audiofilt utgangspunkt vil jeg bruke færrest mulig mikrofoner.

Greit

3. Hva slags output et instrument har ved 40khz er individuelt og avhengig av så mange faktorer at det er meningsløst å forsøke å gjette. Jeg regner likevel med at instrumenter fiolin og piano har betydelig signal rundt 40khz.

http://www.cco.caltech.edu/~boyk/spectra/spectra.htm
Her er en karsom har målt litt.

Sort trace: Trompet med Harman mute, Aco 7016 mic, 4 fot avstand, mikrofon vinklet mot "bell" vinklet 20 grader ned. Blå trace: bakgrunnsstøy.
Vi ser at 40kHz ligger på noe rundt -45dB i forhol til peak på litt under 2kHz.

"

Kode:

Instruments With Harmonics
Første kolonne: Fig.   
Andrekolonne: Instrument         
Tredje kolonne: SPL(dB)     
Fjerde kolonne: Harmonics Visible To What Freq.?
Femte kolonne: Percentage of Power Above 20 kHz

1. Trumpet (Harmon mute)     96.     >50 kHz         0.5
2. Trumpet (Harmon mute)     76.     >80  "          2.
3. Trumpet (straight mute)   83.     >85  "          0.7
4. French horn (bell up)    113.     >90  "          0.03
5. French horn (mute)        99.     >65  "          0.05
6. French horn              105.     >55  "          0.1
7. Violin (double-stop)      87.     >50  "          0.04
8. Violin (sul ponticello)   77.     >35  "          0.02
9. Oboe                      84.     >40  "          0.01

  
Instruments Without Harmonics 

Første kolonne: Fig.   
Andrekolonne: Instrument         
Tredje kolonne: SPL(dB)     
Fjerde kolonne: 10 dB Above BKgnd to what freq. ?
Femte kolonne: Percentage of Power Above 20 kHz

10. Speech Sibilant          72.     >40 kHz         1.7
11. Claves                  104.    >102  "          3.8
12. Rimshot                  73.     >90  "          6.
13. Crash Cymbal            108.    >102  "         40.
14. Triangle                 96.     >90  "          1.
15. Keys jangling            71.     >60  "         68.
16. Piano                   111.     >70  "          0.02

"
Vi ser at fiolon i disse målingene har mellom 0,02 og 0,04 prosent av sin effekt over 20kHz og at harmoniske er synlige i spekteret til over 35/40kHz.

Vi ser at piano i disse målingene har 0.02 prosent av sin utput over 20kHz, og synlige harmoniske til over 70kHz.

Sannsynligvis vil man med "uendelig" presisjon målinger finne uendelig høye frekvenskomponenter som er uendelig svak... Spørsmålet er hvor man skal sette grensen, om det normalt er andre komponenter som setter begrensninger i SNR som gjør at selv 0.02% utstrålt effekt drukner i støygulvet til mikrofoner.

Da alle lyder kan plukkes ned til å være en sum av sinustoner med forskjellig amplitude og bølgelengde anser jeg impulsrespons for å være avgjørende for å gjengi et instruments fulle frekvensspekter med fargingen det får fra rommet det spilles i.

Hva sier du egentlig her? Tid og frekvens er dualer. En gitt impulsrespons muliggjør gjengivelse av et gitt overtonespekter innenfor gitte toleranser. F.eks -3dB, 40kHz med maksimalt Y grader fasedreining. Hvis man har oppgitt dette trenger man normalt ikke tenke på impulsrespons, eller motsatt. Det er snakk om to matematiske metoder for å analysere samme fysiske virkelighet.

For fenomener som romklang er det betydelig enklere for våre sinn å forstå det lineære systemet som en kompleks impulsrespons, men i tilfellet RLC-krets er det for mange enklere å forstå systemet i form at en frekvens- og fase-respons.

Vi gjør våre SACD produksjoner for de som har investert i anlegg som kan gjengi SACD'ens dynamiske og frekvensmessige potensiale i 2 eller 5(.1) kanaler. Andre vil få en fullgod opplevelse med CD'en. Det er nettopp dette som er så genialt med en hybrid SACD.

Helt enig. I dag har vel de fleste konsumenter en DVD-spiller som håndterer 24/96 stereoformater, så bakoverkompatibliteten med CD blir vel bare mindre og mindre relevant?

Ved lytting til identisk kildemateriale i hhv 44,1/16 og DSD mener vi at det også i stereo er en bedre teknisk kvalitet på DSD materialet.

Hvilken metodikk har dere brukt for å komme til denne konklusjonen?

-k

Bx · 02.12.2006

Knutinh,

Jeg er enig i mange av dine CD-betraktninger. I hvert fall et stykke på vei.

Men tror du ikke:

1) At 96 dB er i minste laget til å realistisk gjengi musikk - som live kan ha et mye større spenn.

Selv om det er mulig å lage god lyd på 16 bit, så antar jeg at det er enklere å mixe ned til avspillinsformatet med dynamikken i behold dersom man har noe mer enn 16 bit til rådighet.

2) At en lavpassfiltrering under 22050 Hz kan medføre visse kompromisser i det hørbare området?

Det blir vel en avveining mellom to onder: Fasedreining eller aliasing? Dette blir enklere om man kan legge aliasfilteret noen oktaver over det hørbare området eller hva Knutinh?

Men viktigere en bits og samplingfrekvens er jo hva som blir gjort på veien fra mikrofonen til skiva. Det er ikke alle som har samme dedikasjon til lydkvalitet som Lindberg Lyd, og det hjelper ikke med verdens beste format om man ønsker å vinne loudnesskrigen.

Noen burde lage en sertifisert lydstandard - der det blant annet var klare kjøreregler hva angår komprimering, hengekøyemixing, jitter og annet svineri. De har jo fått det til på filmfronten (THX), så hvorfor ikke på musikkfronten?

Espen R · 02.12.2006

3. Som Espen, mener at det rett og slett finnes flere gode innspillinger på SACD enn konkurentene
-k

Svar: Det er altfor få gode innspillinger på SACD, desverre. Hadde flere av de som er opptatt av god lyd støttet SACD hadde flere tilttler vært tilgjengelig.

Knut, jeg orker ikke kjøre flere SACD runder med deg, vi går bare i ring. Men poenget mitt er at SACD er et alternativ nå, her i dag, for de som er lysten på bedre lyd enn det CD i praksis i dag har å tilby, i 2 eller 5 kanaler.

Morten/ Hans Peter: Jeg tror ikke dere skal overvurdere markedet for SACD. Jeg har vært medlem her på HiFisentralen siden 2002, og i løpet av denne tiden har jeg ikke merket noe særlig entusiasme for formatet blant det store flertallet av medlemmene. Tvertimot, har det bygd seg opp en antipropaganda mot formatet og Sony/Philips med holdninger som at "Sony skal ikke klare å lure meg til å kjøpe alle platene en gang til". I tillegg har flere teoretikere her på sentralen, som ikke har særlig praktisk erfaring med SACD, kjørt en knallhard anti-SACD propaganda.

Jeg bare lurer på om alle blir fornøyde den dagen hverken SACD eller noe annet bedre alternativ til overkomprimerte CD'er finnes.

Portal · 02.12.2006

1) At 96 dB er i minste laget til å realistisk gjengi musikk - som live kan ha et mye større spenn.

96 dB dekker hele området fra såvidt hørbart til smertefullt høyt. Hvorfor trenger du mer dynamikk i sluttmediet enn det?

Hvor mye vil du ha? Fra dønn stillhet til du begynner å blø fra ørene? Eller helt til kraniet ditt imploderer? ;D

knutinh · 03.12.2006

1) At 96 dB er i minste laget til å realistisk gjengi musikk - som live kan ha et mye større spenn.

Selv om det er mulig å lage god lyd på 16 bit, så antar jeg at det er enklere å mixe ned til avspillinsformatet med dynamikken i behold dersom man har noe mer enn 16 bit til rådighet.

Det har vært kjørt blindtester av forskjellige ord-bredder på www.hydrogenaudio.org og folk har etterpurt kildemateriale og teorier om hva som skal til for å høre forskjell på 16bit og 24 bit når alt er gjort rett.

Jeg tror konklusjonen så langt er at det er svært vanskelig så lenge man holder seg til repeterbare metoder. Det betyr selvsagt ikke at det _aldri_ kan ha noen betydning for enkelte kildematerialer, lyttere og gjengivelses-kjeder.

Hvis du f.eks sier at et parti av musikken skal være pianissimo i n-te potens og 60dB lavere enn forrige parti, og brukeren finner ut at han skal kompensere med å skru opp volumet (manuell dynamikk-kompresjon) så er det bare fantasien som setter grenser for hva vi trenger.

Jeg mener at A/D D/A teknologi stadig blir bedre, lagringsplass blir stadig bedre, og studioer har lenge jobbet i høyere oppløsning enn CD. Uansett om det er en teknisk grunn eller ikke, så er det ingen praktisk grunn til å unngå 24 bit i neste format.

Uansett er jo som regel problemet at lydteknikerene gjerne må ha kildemateriale i 24 bit, men de velger å legge seg på en bevisst dynamikk-profil som krever bare 12 bit. Da har det lite å i hvordan man til slutt distribuerer musikken.

Sistnevnte fenomen er hva jeg bryr meg om, ikke økninger i oppløsningen til distribusjonsformat som veldig vanskelig lar seg dokumentere hørbart.

2) At en lavpassfiltrering under 22050 Hz kan medføre visse kompromisser i det hørbare området?

Det blir vel en avveining mellom to onder: Fasedreining eller aliasing? Dette blir enklere om man kan legge aliasfilteret noen oktaver over det hørbare området eller hva Knutinh?

Det stemmer, men man oppnår det samme med å oversample et 44.1 signal i D/A-konverter.

Det å designe et filter innen gitte spesifikasjoner er noe som folk som Ivar tross alt har jobbet ganske lenge med. Inntoget av billige, kraftige digitale kretser gjør at man kan realisere svært kraftige filtre

Det kan brukes til å kompensere for lav samplerate, billlig analog-filter etc. Kravet til flathet i passbånd, undertrykking av stopp-bånd og bredden av overgangssonen er ledd i designet av alle filter, men hva som er mest fornuftig ut fra menneskets hørsel vet jeg ikke. Jeg ville vel sagt at undertrykking av speilede frekvenskomponenter var veldig viktig, at endel fasedreining var noe jeg kunne leve med, at CD-spilleren gjerne kunne starte overgangssonen ved 18kHz i stedetfor 20kHz hvis det gav andre lydmessige fordeler, at pre-echo (v langt FIR-filter) var noe som måtte kontrolleres, og at litt rippel i passbåndet neppe er noe problem gitt de store variasjonene som høyttaler/rom uansett innfører.

Noen burde lage en sertifisert lydstandard - der det blant annet var klare kjøreregler hva angår komprimering, hengekøyemixing, jitter og annet svineri. De har jo fått det til på filmfronten (THX), så hvorfor ikke på musikkfronten?

EU-standard for ReplayGain for alle CD-er, nedlastet musikk og avspillerenheter (på pr default) som gjør at alle låter høres like høye ut.

-k

knutinh · 03.12.2006

Svar: Det er altfor få gode innspillinger på SACD, desverre. Hadde flere av de som er opptatt av god lyd støttet SACD hadde flere tilttler vært tilgjengelig.

Knut, jeg orker ikke kjøre flere SACD runder med deg, vi går bare i ring. Men poenget mitt er at SACD er et alternativ nå, her i dag, for de som er lysten på bedre lyd enn det CD i praksis i dag har å tilby, i 2 eller 5 kanaler.
...
I tillegg har flere teoretikere her på sentralen, som ikke har særlig praktisk erfaring med SACD, kjørt en knallhard anti-SACD propaganda.
...
Jeg bare lurer på om alle blir fornøyde den dagen hverken SACD eller noe annet bedre alternativ til overkomprimerte CD'er finnes.

Jeg kan bare svare for min egen del:
Jeg blir fornøyd når folk argumenterer for og imot formater basert på tekniske vurderinger og sikker empiri (blindtest). Selvsagt vil mange ha innspill også utenom disse men jeg håper at man kan bli enige om hva som faktisk skjer i stedetfor en smørje av "personlige fysikalske lover" og personangrep.

Jeg har ramset opp mine positive og negative innspill til formatet SACD utallige ganger her på forumet. Andre mennesker vektlegger selvsagt forskjellig fra meg og gjør seg opp en mer eller mindre forskjellig totalvurdering, det skulle bare mangle.

Jeg synes ikke det er noe poeng å framstille dette som et ondt komplott av konspiratoriske folk her på forumet som vil ødelegge SACDs framtid her i landet. Det tror jeg er å tillegge meg for mye makt. Jeg blir fornøyd når det kommer vellydende og dynamisk materiale i de flestesammenhenger uansett om det er mp3, CD, DAB, SACD, DVD-A, BluRay-A, HD-DVD-A eller hva nå fremtidens format blir. Og jeg tror ikke at nøkkelen ligger i bits men i gulrot og pisk til mastering-teknikere.

-k

knutinh · 09.12.2006

http://sjeng.org/ftp/SACD.pdf

Audio Engineering Society
Convention Paper 5395

Presented at the 110th Convention
2001 May 1215 Amsterdam, The Netherlands

Why 1-Bit Sigma-Delta Conversion is Unsuitable
for High-Quality Applications

by
Stanley P. Lipshitz and John Vanderkooy
Audio Research Group, University of Waterloo
Waterloo, Ontario N2L 3G1, Canada

ABSTRACT
Single-stage, 1-bit sigma-delta converters are in principle imperfectible. We prove this fact. The reason, simply
stated, is that, when properly dithered, they are in constant overload. Prevention of overload allows only partial
dithering to be performed. The consequence is that distortion, limit cycles, instability, and noise modulation can
never be totally avoided. We demonstrate these effects, and using coherent averaging techniques, are able to display
the consequent profusion of nonlinear artefacts which are usually hidden in the noise floor. Recording, editing,
storage, or conversion systems using single-stage, 1-bit sigma-delta modulators, are thus inimical to audio of the
highest quality. In contrast, multi-bit sigma-delta converters, which output linear PCM code, are in principle
infinitely perfectible. (Here, multi-bit refers to at least two bits in the converter.) They can be properly dithered so
as to guarantee the absence of all distortion, limit cycles, and noise modulation. The audio industry is misguided if
it adopts 1-bit sigma-delta conversion as the basis for any high-quality processing, archiving, or distribution format
to replace multi-bit, linear PCM.

...
In light of the above, it is with alarm that we note the adoption of the
single-stage, 1-bit sigma-delta converter architecture as the encoding
standard for a next-generation (and supposedly higher-quality)
consumer digital audio format. We refer, of course, to the Direct
Stream Digital (DSD)1 encoding which forms the basis of the Super
Audio CD2 format introduced recently by Philips and Sony (see, for
example, [5] and [6]). The original intention to have the digital audio
data at every stage of the processing from the original analogueto-
digital conversion, through all the editing and mastering
operations stored in the DSD 1-bit format has apparently now
been abandoned. This was a wise decision. The conversion to the
final 1-bit DSD format, however, still represents a required, and quite
unnecessary, degradation of the quality of the audio signal. Every
single 1-bit data conversion entails an inevitable loss of signal quality
in a way which need not occur with multi-bit, linear PCM.
...

4. CONCLUDING REMARKS
Some final comments and speculations can be made:

MASH-type multi-stage converters, using multi-bit
quantization at the first-stage, are not subject to the same
criticism as the single-stage 1-bit sigma-delta converter,
provided that their quantizers do not overload.

The repeated 1-bit sigma-delta reconversions entailed by a
misguided desire to store the data in DSD format after each
intermediate processing stage, would result in the accumulation
of significantly greater noise and nonlinear artefacts than would
occur with any of the dithered multi-bit systems under
corresponding conditions. This is not a trivial matter, because
each signal processing operation (even a trivial one, such as a
gain change) results in the 1-bit DSD data stream turning into a
multi-bit data stream!

Because of the insoluble theoretical problems discussed in this
paper, we are unaware of any way to generate a Super Audio
CD test disc which is both distortion-free and has a constant,
signal-independent noise floor! In the multi-bit domain, this is
easily done using standard dithering methods. Indeed, the
measurement standards for PCM-based audio, developed by the
Audio Engineering Society, mandate the use of TPDF dither.
This is an impossibility for 1-bit digital audio.

The amount of negative feedback used in a 1-bit sigma-delta
modulator striving to straighten its quantizer transfer
characteristic, and simultaneously achieve a signal-to-noise
ratio of 120 dB, far exceeds anything ever used before in highquality
audio design. Ironically, while a part of the industry
mistakenly espouses low feedback for top quality, what we
have here is the exact opposite touted as being even better!

Since it is the high amount of negative feedback at low
frequencies that reduces the 1-bit distortion products to low
levels in the audio band, it is not unexpected that we find the
distortion products rising at high frequencies, where the
corrective negative feedback has actually turned into positive
feedback!

The high levels of ultrasonic noise and spuriae produced by an
inadequately-filtered 1-bit sigma-delta converter pose a problem for audio amplifiers and loudspeakers, which can
generate nonlinear distortion products in the baseband when
subjected to this type of indignity. One wonders how many of
the perceived differences noted in Super Audio CD listening
comparisons might be due to such nonlinear effects.

Just as it might be true that one can perceive ultrasonic signals
that are correlated with the baseband signal, so too might the
low-level, but correlated, distortion products that we have
shown to exist within the baseband be perceptible, even though
they would normally be thought to be below audibility. Further
research is needed here.

Since the Gerzon/Craven noise-shaping theorem implies
equal areas above and below the unshaped noise floor on a
logarithmic vertical axis, it follows that there will always be a
net increase in the total noise power as a result of noise
shaping, if the theoretical curve is adhered to. Since the total
output power of a 1-bit shaper is constant, it follows that, even
in the absence of signal, the noise PSD of a 1-bit noise shaper
cannot follow the theoretically-prescribed curve. Its total
output noise power must be less than the curve predicts. Then,
if an input signal is added, the noise power at the output must
drop even further, so causing further noise PSD changes.

As a general principle, it is undesirable to repeatedly noiseshape
a signal as it progresses through various processing
stages, since the total high-frequency noise power keeps
accumulating. This means that a signal should ideally always
be kept at a wordlength at least as long as that required to
preserve the signals baseband noise floor, irrespective of the
incoming wordlength. Thus a signal with 120 dB baseband
signal-to-noise ratio, should never be processed and stored with
less than a 24-bit wordlength all the way through to the final
digital-to-analogue conversion, whether it is a shaped 1-bit
DSD signal, a shaped 8-bit signal as envisaged in Example (c)
of Section 3, or an unshaped 20- or 24-bit signal. This
principle should apply to both consumer and professional
digital audio. Noise shaping should only be used when storage
or transmission limitations require data rates to be reduced.
(Parenthetically, it seems perverse of DSD to unnecessarily go
in the opposite direction by actually increasing the data rate!)

That the 1-bit converter is quite aberrant can also be gleaned
from the following arguments. The classical model for the
quantization error E of an undithered multi-bit quantizer
postulates that it has a power of Ä2/12. The error power of a 1-
bit quantizer is (Ä/2)2 = Ä2/4 under no-signal conditions three
times too large. This error power is, moreover, independent of
whether or not the 1-bit quantizer is dithered. [Interestingly, a
TPDF-dithered multi-bit quantizers error power is also Ä2/4 (=
3Ä2/12).] We have already noted (in Section 3) that the 1-bit
quantizers noise power must drop in the presence of any
input signal, since its total output power is absolutely constant,
thus unavoidably causing noise modulation. We now see that,
when outputting any signal, its error power must be less than
the Ä2/4 error power of a TPDF-dithered multi-bit quantizer. In
addition, its error power spectrum is only approximately white,
while that of the TPDF-dithered multi-bit quantizer is truly
white, as guaranteed by dither theory ([3], [4]). Hence, when
modulated, its noise spectrum would be expected, on average,
to lie below, and parallel to, that of the corresponding TPDFdithered
multi-bit quantizer. (Were the spectrum of E truly
white for the 1-bit quantizer, the two curves would be exactly
parallel, for the output error is just E as shaped by the linear
filter {1 . H}.) This is confirmed by what we found in Section
2, and can be clearly exhibited by overlaying the upper curves
of Figs 9 and 10. This is done in Fig. 17, where in each case
the input to the Lip7ZP shaper is two half-full-scale (i.e., Ä/8
amplitude each) sine-waves on FFT bins 32 and 48. Note too
the considerable discrepancy between the shapes of the upper
TPDF-dithered noise curve (which is the intended noise curve) and the lower noise curve, which is that actually delivered by
the undithered 1-bit sigma-delta modulator.

nex_86 · 09.12.2006

Interessant artikkel knut!

knutinh · 09.12.2006

Vi kan sette fram en rekke argumenter for og imot SACD/DSD. Avhengig av egne prioriteringer så kan man vekte disse argumentene forskjellig og komme til en forskjellig konklusjon. For å kunne si på generelt grunnlag at SACD er ensidig positivt eller ensidig negativt må man imidlertid vise at SACD gjør det ensidig bra eller ensidig dårlig på alle dise argumentene (og andre argumenter som måtte komme opp):

1. Lydkvalitet. Teknisk sett, er lydkvaliteten i en SACD/DSD reproduksjonskjede bedre perseptuelt, målbart eller teoretisk sammenlignet med CD og DVD-A? Etter min mening viser paperet over at DSD ikke er en teknisk bedre løsning enn DVD-A. Hva som er perseptuelt nødvendig og fordelaktig er et ubesvart spørsmål.

2. Lydkvalitet. Praktisk, er det slik at uavhengig av SACD sine eventuelle svakheter eller fordeler teknisk sett, at innspillinger ofte av diverse årsaker likevel er bedre på SACD? Jeg vet ikke, det er meget mulig. Da kan det f.eks skyldes at SACD-kjøperen er et mer eksklusivt og lyd-interessert publikum som gjør at man tar seg ekstra flid, eller ignorerer kravet om "høyest mulig lydnivå".

3. Lydkvalitet. Er det slik at egenskaper ved SACD fremmer gode produksjoner? For det første er det fordyrende og kvalitetsdegraderende å lage produksjoner med moderne teknikker ved å benytte DSD ende-til-ende! Moderne studioteknikk krever ulineær redigering, og digital signalbehandling i mange ledd, på et best mulig kvalitet signal slik at evt degradasjon blir ubetydelig i forhold til andre bidrag. DXD er såvidt jeg forstår et "PCM-format" som er spesielt tilpasset samplingsraten på SACD. Man kan like gjerne benytte høy rate og høy ord-bredde PCM i opptak og produksjon for så å distribuere på så høy oppløsning som mulig/ønsket i PCM-systemet, for å slippe en kvalitetssenkning i DSD-systemet.

Om lydteknikere blir inspirert på andre måter til å "skru mer rett" kan jeg ikke uttale meg om.

4. Ergonomi, økonomi, etc. I dag er vel SACD-plater og spillere praktisk talt ikke dyrere enn CD-er slik at dette ikke er et argument imot. Men i mine øyne er det viktig at brukervennligheten er lavere enn CD. Jeg kan aldri bruke en HTPC/slimbox-løsning enkelt og med full kvalitet. Om 20 år når formatet forsvinner kan jeg ikke enkelt ta en tapsfri backup av platene mine, jeg må gjøre det på samme måte som de som analogt "ripper" vinylsamlingen sin. Knapt ergonomisk...

5. Utvalg. SACD leder vel suverent på utvalgssiden kontra DVD-A. Men begge er dverger i forhold til CD og selv Vinyl. De har blitt nisjeformater for spesielt interesserte og det er mildt sagt ingen selvfølge at jeg kan finne yndlingsartisten min på hverken SACD eller DVD-A. Lite tyder på at dette vil endre seg.

6. Alternativer? Vi snakker vel først og fremst om CD, men også Vinyl og DVD-A som er andre nisje-formater. Kanskje endrer dette seg med Blu-Ray og HD-DVD hvis disse får popularitet innen video-segmentet og bransjen prøver seg på en lignende vri som de gjorde da SACD og DVD-A ble basert på DVD-teknologi. La oss håpe at de da velger teknologi ut ifra hva "ingeniørene på lab-en" sier, og ikke hva dress-kledde marketing og "consumer relations & copyright law"-mennesker sier. Det er min (ikke underbygde) overbevisning at den eneste grunnen til at SACD overhodet ble lansert var et ønske om å få et nytt format med fornyede lisensinntekter til Sony/Philips etter at de ble skjøvet ut i kulden av DVD-gjengen etter å ha stått alene bak CD-formatet. Dessuten virket nok et grunnleggende nytt sampleformat med svært sikre kopi-beskyttelse som en forlokkende måte å sikre seg mot all uønsket bruk, også av kinesiske no-name-produsenter som gjerne vil lage kompatible avspillere/piratdisker uten å betale lisenser. Husk at en SACD-spiller ikke fysisk kan avspille andre plater enn de signert ut fra to fabrikker på verdensbasis.

Hvis noen skulle ha et romantisk forhold til Sony som et idealistisk foretak kun opptatt av kundenes velvære så er det opplysende å goggle på "Sony rootkit" for å se hva Sony med viten og vilje installerer på lovlige kunders PC-er.

-k

Espen R · 09.12.2006

Interessant artikkel knut!

Denne artikkelen har knut og Ivar nå i flere år, med jevne mellomrom presentert her på sentralen, gammelt nytt.

Espen R · 09.12.2006

5. Utvalg. SACD leder vel suverent på utvalgssiden kontra DVD-A. Men begge er dverger i forhold til CD og selv Vinyl. De har blitt nisjeformater for spesielt interesserte og det er mildt sagt ingen selvfølge at jeg kan finne yndlingsartisten min på hverken SACD eller DVD-A. Lite tyder på at dette vil endre seg.

...nei, du prøver jo så godt du kan å drepe all entusiasme for high-rez digital.

Tror neppe du klarer å hisse på deg Hans Peter eller Morten, selv om du prøver hardt.

knutinh · 10.12.2006

Denne artikkelen har knut og Ivar nå i flere år, med jevne mellomrom presentert her på sentralen, gammelt nytt.

Stilt ovenfor slike vektige argumenter så innser jeg plutselig at jeg har tatt helt feil og at du har forstått DSD. Jeg takker for at du har "skjært igjennom" ovenfor overdreven akademisk problematisering og sett hva saken dreier seg om: peer-reviewed paper som har stått i AES i 2001 er selvsagt uinteressant hvis de har vært brakt på banen noensinne før, og eventuelle kritikkere av SACD må selvsagt sette seg ned og skrive nye paper for at det skal ha interesse for leserne på hifisentralen

mvh
Knut

Portal · 10.12.2006

...nei, du prøver jo så godt du kan å drepe all entusiasme for high-rez digital.

Hva er poenget med å bruke masse DSP-kraft på "hi-rez" dersom det ikke har noe for seg lydmessig? Er det formatet som er fordelaktig, eller opptaks- og prosesseringsteknikkene?

Multikanal · 10.12.2006

Hei
Skal ikke uttale meg om den tekniske biten,men lydmessig synest jeg SACD er bedre enn CD.Grunnen kan vel bl.a være at CD'ene ofte er mer komprimert enn tilsverende SACD,også på samme disc.Dette gjelder stereo,men dersom mar liker multikanalsmusikk som meg,så er jo valget enda lettere. ;D
Utvalget både på SACD og DVD-A synest jeg er godt etter min smak.Har totalt ca. 500 titler i alle sjangre.

MVH

Morten_Lindberg · 20.12.2006

Peter Scheelke, som har konstruert våre konvertere, argumenterer her godt for hvorfor DXD er godt egnet som produksjonsformat:

http://www.sa-cd.net/showthread/18108//y?page=first

knutinh · 20.12.2006

http://www.hydrogenaudio.org/forums/index.php?showtopic=40134&st=125#
"Hello Kees de Visser,

If you want to run a very serious test about high definition digital formats, here are some things that I thought about.

Documentation.

You first have to learn about the similar tests that have already been done. Here is all that I have got in my links :

http://www.hydrogenaudio.org/forums/index....ndpost&p=372649

http://www.hydrogenaudio.org/forums/index....40&#entry374740

The first thing to notice is that this kind of test have already been done, and that it is very difficult to get any success.

Basic training.

Start with very low definition material. You can get some samples of low definition audio here : http://ff123.net/samples.html
Usually, it is hard to distinguish between 15 bits and 16 bits of resolution, and between a lowpass of 15 khz and a lowpass of 16 kHz !

Choice of sonic material

However, a sample was found where a 16 kHz lowpass was easily audible. I didn't keep the link but I'm sure that someone here have got it. Thus the samples used for the test are very important. The listener can fail to distinguish between the formats just because the presented material is not critical.

For the bit depth, you need very dynamic material. The "rach" sample in the above page contains no silence. I think that a critical sample should. I'm not used to classical music, but in the few CD that I've got, there is the recording of Grieg's Peer Gynt directed by Neeme Jarvi, (Deutsche Gramophon). The RMS level of the first instrument of the track "I Dovregubbens Hall" is -60 dB, while the end of the track is clipping ! This recording have a resolution of 14 bits, and the quantisation noise is very audible at the beginning of the track.

For the sample rate, since only Oohashi claims to have got significant results, why not include similar instruments ? The "gamelan" that was used is a set of metallic percussions (metallophons). James Johnston ( http://www.skepticforum.com/viewtopic.php?...der=asc&start=0 ) cites this class of instruments (bells, glockenspiel...) as very sensitive to phase shift, and capable of producing hypersonic intermodulation directly in air, regardless of recording.

Scope

What is the question that this test is to answer ? Are you going to compare sample rates ? Bit depths ? DSD ? Analog vs digital ? Online or recorded on CD ? On tape ? Commerical formats ?...

Result analysis

The classical statistic evaluation (ABX) doesn't seem to fit this kind of tests. The NHK test, the Detmold tests, Julian Dunn et al's tests about pressed CD all make the same mistake. They evaluate the individual statistical significance, then say "this result is significant, this one is not". This is mathematical nonsense ! Statistical significance can only be applied to one hypothesis, not to individual results.
There are other methods (Anova, Tukey...) more suited to listening tests with many people, but I don't think that they work well for this kind of test, because you don't want to know if the group can hear a difference, but if one people at least in the group can hear a difference.

I've got a solution for this kind of hypothesis, but it might require quite a lot of trials for everyone. I'll got it together in the next days. I set it up for my interconnect blind listening test, but the only written description of it is in a french forum, scattered in several posts, with some mistakes and corrections.

Basically, it just consists in letting people perform ABX tests (or similar tests), each one with its individual p value, and then compute the P value of the following event : "one people at least get an individual result equal or inferior to p by chance".
It has the advantage that listeners can communicate, and help each other, without affecting the significance of the final result. And it let the possibility for anyone to get a significant result, while usual statistical evaluations dismiss individual successes as non representative.

Protocol

The ABX protocol is not required in itself. You can choose A/B, AXY, XY, or anything you want, as long as it is randomized. If the randomization does not lead to a binary choice with equal probabilities, the individual p values will have to be recalculated from the right formula, since the one that is used for ABX won't be correct anymore. It is however correct for any protocol that leads to choose between two options of equal probabilities. For example "X=A or X=B", or "A was first or B was first", or also "X was the same as Y,or X was not the same as Y". Just be careful that the randomisation assign an equal probability for both answers.
The most secure way to get random numbers, in my opinion, is to use dices, with dice cups (like these : http://www.bgshop.com/ )

If listeners pass the test individually, each one can even choose the protocol that he prefers, as long as you get his individual p.

Hardware

Are you going to use active bi amplification, like Oohashi and the NHK ? If not, how to evaluate the role of intermodulation ? According to David Griesinger ( http://world.std.com/~griesngr/intermod.ppt ) hypersonic intermodulation mostly occurs in amplifiers, not in tweeters, while James Jhonston (link above) says that tweeters are very prone to hypersonic non-linear distortion. If you get hypersonic intermodulation, it will mean that the high definition format is inferior to the low definition one, since it adds distortion !
If you get active biamplification, how to evaluate the atmospheric hypersonic intermodulation ? If it is significant, then the test result will completely depend on the distance between the microphones and the instruments. Far from the instruments, no high definition required, since hypersonic intermodulation occurs in the performance room. Close to the instruments, and high definition is required in order to let hypersonic intermodulation occur in the listening room.
And can the difference between Griesingers' conclusion and Johnston's one come from the fact that the former tested harmonic intermodulation while the later speaks about transient non linear distortion ?

This is the scientific approach. It have become very hard because of the tests already set up. If you want to learn more, you will have to run better tests than what was already done !

However, you can also choose the debunking approach : find people who claim they can hear the night-and-day difference immediately without possible mistake. Let them use their equipment and usual listening conditions, and just add randomization. Be sure to allow the listener to give null answers, otherwise, in case of failure, he will argue that the stress confused his hearing. If he can answer nothing when he hears nothing, answering something will mean that he heard something, and not that stress prevented him to do so."

knutinh · 20.12.2006

"9. The impulse response is very important, since the brain is using the small differences in time from one ear to the other ears in order to re-calculate an image of the room. "
http://www.hydrogenaudio.org/forums/index.php?showtopic=40134

http://www.hydrogenaudio.org/forums/index.php?showtopic=40134&st=250#

"ITD's have been detected (by humans) in the 5 to 10 MICROsecond range.

In fact, they have been so detected in digital audio signals at 44.1/16, which ought to be a great big hint for those who think they can't be. "

Inter-aural time-difference har altså ingenting med avstanden mellom sampler å gjøre, og en CD kan fint ha tidsforskjell mellom høyre og venstre side som overgår hva vi mennesker har sanseapparat til å oppfatte.

-k

knutinh · 20.12.2006

Et godt poeng er at vi kan designe systemer som gir impulsrespons tilsvarende båndbredde på MHz og GHz. Hvis det ikke kan plukkes ut i en blindtest så er det irrelevant for mennesket.

"Argumentene" fra Peter er stort sett en oppramsing av påstander uten argumentasjon eller referanser, og mye av det er sprøyt. Både han og du kunne kanskje lese paperet som jeg linker til litt tidligere?

mvh
Knut

Espen R · 20.12.2006

Og her klipper og limer vi litt fra sa-cd.net:

Post by DAD-Digital Audio De Today 05:44 am (6 of 10) reply
Dear Julien

Yes I can here the difference between DSD and DXD, and I prefer DXD, however the difference is small.
I think it is the energy from the noise that disturbing me. If we compare DXD with DSD 128 fs (5.6 MHz) the difference is nearly none existing.
However DSD 64 fs (2.8 MHz for SACD) are much more close to the original analog signal than 192 kHz/24 bit when using our DSD modulator.
When developing our DXD/DSD converters we did a lot of testing with different analog sources, mostly turn tables and analog ¼ inch tapes.
We used my Audio Note AN-E Lexus speakers and my Sudgen Class A amplifier in order to optimize our AX24/Axion converter.
Sometimes we were also testing with a friend who has better Audio Note speakers and better amplifiers.

I hope DXD will be a consumer format in the future, but at the moment know body is doing anything in that direction.

Best regards,

Peter

Når det gjelder den tekstbiten jeg har markert med sort: Jeg vet ikke hvor mange ganger jeg har lest tilsvarende fra teknikere og seriøse lyttere som har testlyttet på studionivå,..men det er mange! Og jeg har fulgt DSD/SACD debatten siden 1997.
Men når sant skal sies så har analogt (1/4, eller 1/2) omtrent like mange ganger kommet et lite hestehode foran DSD i lydkvalitet ved A-B lytting.

Nå venter jeg bare at Knut skal si...
"..-hvor er blindtestene, kan noen legge frem blindtestene som dokumenterer dette"
;D ;D

Og mannen benytter en Sugden klasse A forsterker...hmm..

Da hører en forskjellene!

knutinh · 20.12.2006

Nå venter jeg bare at Knut skal si...
"..-hvor er blindtestene, kan noen legge frem blindtestene som dokumenterer dette"
;D ;D

For variasjonens skyld så gjør jeg ikke det. I stedet følger denne som du sikkert kjenner til?
http://www.bostonaudiosociety.org/bas_speaker/abx_testing2.htm

"Some readers may be unaware of the background to the "digital test" in which Ivor Tiefenbrun participated on February 23, 1984 [1-4]. To summarize briefly: Tiefenbrun has been quite outspoken about the inadequacies of digital audio recordings and the systems on which they are made, and his organization, Linn Products Ltd., was instrumental in publishing an analysis of the Sony consumer PCM-F1 digital audio adapter [5] outlining their objections. I, on the other hand, have been using this very system for a number of years now and have made close to one hundred recordings with it with superb results and not the "execrable results" reported by Tiefenbrun. I and my colleague John Vanderkooy have moreover conducted blind listening comparisons between the PCM-F1's input and its reconstructed output signals, and had yet to find anyone who can reliably distinguish between them on musical program material"

-k

nma · 22.12.2006

Og her klipper og limer vi litt fra sa-cd.net:

Post by DAD-Digital Audio De Today 05:44 am (6 of 10) reply
Dear Julien

Yes I can here the difference between DSD and DXD, and I prefer DXD, however the difference is small.
I think it is the energy from the noise that disturbing me. If we compare DXD with DSD 128 fs (5.6 MHz) the difference is nearly none existing.
However DSD 64 fs (2.8 MHz for SACD) are much more close to the original analog signal than 192 kHz/24 bit when using our DSD modulator.
When developing our DXD/DSD converters we did a lot of testing with different analog sources, mostly turn tables and analog ¼ inch tapes.
We used my Audio Note AN-E Lexus speakers and my Sudgen Class A amplifier in order to optimize our AX24/Axion converter.
Sometimes we were also testing with a friend who has better Audio Note speakers and better amplifiers.

I hope DXD will be a consumer format in the future, but at the moment know body is doing anything in that direction.

Best regards,

Peter

Når det gjelder den tekstbiten jeg har markert med sort: Jeg vet ikke hvor mange ganger jeg har lest tilsvarende fra teknikere og seriøse lyttere som har testlyttet på studionivå,..men det er mange! Og jeg har fulgt DSD/SACD debatten siden 1997.
Men når sant skal sies så har analogt (1/4, eller 1/2) omtrent like mange ganger kommet et lite hestehode foran DSD i lydkvalitet ved A-B lytting.

Nå venter jeg bare at Knut skal si...
"..-hvor er blindtestene, kan noen legge frem blindtestene som dokumenterer dette"
;D ;D

Og mannen benytter en Sugden klasse A forsterker...hmm.. Da hører en forskjellene!

Jeg forstår ikke logikken her: 24/192 er jo DXD FS/2 , så hvis DXD er bedre enn DSD FS128, så burde 24/192 være bedre enn DSD FS64.

Finner det lite sannsynlig at DS modulatoren skal ha et sweetspot ved FS 64, i forhold til PCM, (for det er jo det det påstås her) uten at dette kan dokumenteres ved objektive tall.

Slik jeg forstår det, blir antialias-filteret her utpekt som den store synderen, men et antialias-filter ved FS/2 ved 24/192 _burde_ jo ikke være forskjellen mellom "digital" og "analog" lyd. Men hva vet vel jeg..

knutinh · 22.12.2006

Jeg forstår ikke logikken her: 24/192 er jo DXD FS/2 , så hvis DXD er bedre enn DSD FS128, så burde 24/192 være bedre enn DSD FS64.

Finner det lite sannsynlig at DS modulatoren skal ha et sweetspot ved FS 64, i forhold til PCM, (for det er jo det det påstås her) uten at dette kan dokumenteres ved objektive tall.

Slik jeg forstår det, blir antialias-filteret her utpekt som den store synderen, men et antialias-filter ved FS/2 ved 24/192 _burde_ jo ikke være forskjellen mellom "digital" og "analog" lyd. Men hva vet vel jeg..

Debatten om DSD vs PCM handler ikke om tekniske fenomener. For i det øyeblikk man kommer med reelle argumenter så blir dette avspist med "jammen, DSD har jo en mer analog lyd enn PCM".

Som så mange andre ganger så brukes løsrevne tekniske argumenter for det de er verdt ("impulsresponsen er nydelig") og hvis en kritisk sjel nevner at impulsrespons og fase/frekvensrespons er samme sak så kommer subjektive argumenter tilbake.

-k

DXD, DSD, SACD og samplingfrekvens

Fersking

knutinh

Gjest

Overivrig entusiast

Æresmedlem

Fersking

Æresmedlem

Æresmedlem

Hi-Fi freak

knutinh

Gjest

kbwh

Gjest

knutinh

Gjest

knutinh

Gjest

Hi-Fi freak

knutinh

Gjest

Fersking

Hi-Fi freak

knutinh

Gjest

Bransjeaktør

Æresmedlem

Overivrig entusiast

knutinh

Gjest

knutinh

Gjest

knutinh

Gjest

Hi-Fi entusiast

knutinh

Gjest

Æresmedlem

Æresmedlem

knutinh

Gjest

Overivrig entusiast

Hi-Fi freak

Bransjeaktør

knutinh

Gjest

knutinh

Gjest

knutinh

Gjest

Æresmedlem

knutinh

Gjest

Hi-Fi freak

knutinh

Gjest