Analyse av Squeezebox Servers resampling og dens betydning for lyden

Diskusjonstråd Se tråd i gallerivisning

  • marsboer

    Hi-Fi freak
    Ble medlem
    04.04.2010
    Innlegg
    4.356
    Antall liker
    1.701
    Sted
    Phobos
    Mål:
    Se på betydningen av downsampling fra 192kHz til 96kHz og for morro skyld 44.1kHz i Squeezebox Server.
    Squeezebox Server benytter SoX til dette formålet.

    Bakgrunnsinformasjon:
    Foobar2000 SoX resampling plugin:
    http://www.hydrogenaudio.org/forums/index.php?showtopic=67373

    Viktig info:
    Best -- the same as old 'Very high' mode
    Good -- old 'Very high' mode but with single precision (instead of double precision in 'Best' mode)
    Normal -- old 'High' mode with single precision

    SoX:
    http://sox.sourceforge.net/sox.html
    spesifikt delen om rate

    Default i SoX med mindre annet er gitt er resampling med High quality med 95% bandwith og linear phase (50%).
    Siden formatet er 24-bit før og etter benyttes ikke dithering slik jeg forstår det ut fra dokumentasjonen.

    Slik jeg kan lese ut fra Squeezebox Servers convert.conf benyttes standardvalgene uten endringer.
    Eksempel:
    [sox] -q -t wav - -t flac -C 0 $RESAMPLE$ -

    Ergo blir korrekte innstillinger i foobar2000's SoX plugin følgende:
    Quality: Normal
    Passband: 95.0%
    Allow aliasing: ikke avhuket
    Phase response: 50% (linear)

    Gjennomføring:
    1. Matche Squeezebox Servers SoX-innstillinger i Foobar2000s SoX plugin for identisk kvalitet
    2. Ta utgangspunkt i en ekte 24-bit 192kHz fil med ekte høyfrekvent innhold og resample disse til henholdsvis 96kHz (standard på Transporter og Touch) og 44.1kHz (worst case scenario for å tydeliggjøre eventuelle kvalitetsproblemer)
    Filen som ble valgt var Muddy Waters - Long Distance Call fra det fantastisk vellydende albumet Folk Singer i 24-bit 192kHz utgivelseskvalitet.
    3. Benytte programmet Audacity for å invertere den resamplede kopien og deretter kjøre "Mix and Render" slik at kopien legges oppå originalen. Alle likheter vil da bli utfaset slik at kun forskjellene blir igjen i filen. Resultatet blir da en 24-bit 192kHz fil for å få med alt som evt. ble borte fra originalen.
    4. Analysere forskjellene grafisk
    5. Lytte til resultatfilene for å høre med egne ører hvor hørbare disse forskjellene eventuelt er

    Resultat:

    1. Først ser jeg på testfilen for å se om denne filen er verdig stempelet high-res. Det vil si at jeg forventer musikalskt innhold rent frekvensmessig over 22kHz som ikke bare er et teppe av støy.



    Det er tydelig frekvensinnhold over 22kHz her og jeg kan ikke se at det er brukt noen form for cutoff frekvensmessig. Filen kvalifiserer derfor som ekte high-res til tross for opptakets alder (kanskje på grunn av :D )

    192kHz resamplet til 96kHz
    Her er waveformen for begge filene



    Rent visuelt sett ser de like ut i allefall.

    Deretter inverterer jeg 96kHz varianten og mixer denne med originalen. Vi sitter da igjen med følgende differanse:



    Ingenting som gir utslag her. For å se om det har skjedd noe feil ser jeg i stedet på frekvenskomponentene. En reduksjon i samplingsfrekvens bør også ha resultert i at de høyeste frekvensene blir borte.



    Som vi ser er det frekvenser som har endret seg.

    For å se på hørbarheten på disse forskjellene, som waveformen antyder at er så godt som ikke-eksisterende, eksporterte jeg resultatet som en FLAC-fil.
    Du kan selv høre på resultatet her:

    http://www.marsboer.net/shared/Analyse%20av%20SoX%20resampling%20(Squeezebox%20Server)/Diff%20192kHz-96kHz.flac

    Merk at du må avspille filen som ekte 24bit 192kHz i hele kjeden for at lyttetesten skal være gyldig. Skru opp volumet til du hører noe som helst. Merk deg dette volumet. Tror du det er realistisk at du ville hørt differansene du hører da, om du hører noe i det hele tatt, dersom den ekte 96kHz filen også hadde spilt ved samme volum samtidig?


    192kHz resamplet til 44.1kHz (worst case for morro skyld)
    Her er waveformen for begge filene



    Rent visuelt sett ser de like ut i hvertfall.

    Deretter inverterer jeg 44.1kHz varianten og mixer denne med originalen. Vi sitter da igjen med følgende differanse:



    Med 44.1kHz ser man nå ørsmå utslag i waveformen. Vi ser nærmere på frekvenskomponentene..



    Som vi ser er det nå helt tydelig at en rekke musikkrelaterte høye frekvenser over CD'ens frekvensområde har blitt borte.

    Den eksporterte FLAC-filen med differansen kan du selv høre på her

    http://www.marsboer.net/shared/Analyse%20av%20SoX%20resampling%20(Squeezebox%20Server)/Diff%20192kHz-44.1kHz.flac

    Merk at du må avspille filen som ekte 24bit 192kHz i hele kjeden for at lyttetesten skal være gyldig. Skru opp volumet til du hører noe som helst. Merk deg dette volumet. Tror du det er realistisk at du ville hørt differansene du hører da, om du hører noe i det hele tatt, dersom den ekte 44.1kHz filen også hadde spilt ved samme volum samtidig?


    Min foreløpige konklusjon
    1. 192kHz downsamplet til både 96kHz og 44.1kHz vil rent digitalt sett (uten å ta høyde for avspillerkjeden) IKKE påvirke vår opplevde lydkvalitet på noe vis. Selv i 44.1kHz scenarioet kan jeg bare på aller høyeste max-volum i en avspillerkjede som er helt støyfri så vidt høre noe i differanse-filen. Med tanke på at den ekte 44.1kHz versjonen ville spilt helt usannsynlig høyt allerede på bare 30% av volumet er det ikke sannsynlig at dette er av noen som helst viktighet selv om det er helt tydelig at høyfrekvent musikalskt innhold har blitt borte.

    2. Likevel kan det godt være lydkvalitetsmessige forskjeller i praksis. Det er da viktig å merke seg at dette da blir 100% DAC-relatert. Siden ingen DACer er perfekte vil det være slik at noen/alle har godt av høyere samplerates for å få en bedre analog tilnærming. Dette har imidlertid ingenting med selve filenes innhold å gjøre, det er rett og slett en krykkeløsning for DAC-implementasjonen som like gjerne kan løses med oppsampling/oversampling av 44.1kHz materiale (noe som også blir gjort i dag)
    Det er derfor ikke mulig å si at høyfrekvente filer er en nødvendighet for å få god lyd. Basert på mine resultater i denne testen så vil jeg faktisk påstå at en god 44.1kHz DAC kan spille akkurat like bra som en god DAC som får tilført samme fil i en ekte 384kHz-versjon. Det kommer bare an på selve DAC-implementasjonen. Dette kan sikkert flere med moderne CD-spillere i toppklassen også stille seg bak.

    3. Det er kvalitetsforskjeller på resamplingsalgoritmene. SoX går for å være meget god på resampling. I denne testen ble High (Normal) brukt for å tilsvare Squeezebox Server. Men det er mulig å gå enda høyere på kvalitetsstigen uten at dette virker nødvendig basert på mine resultater. Andre resamplingsløsninger kan gi et dårligere resultat.

    Originalfilen og de resamplede 96kHz og 44.1kHz versjonene finnes forøvrig her (sammen med de øvrige resultatene). Da kan dere lytte selv, men merk at det er ting som tyder på at dere da lytter på DAC-implementasjonen deres og ikke reelle forskjeller i filene.

    http://www.marsboer.net/shared/Analyse%20av%20SoX%20resampling%20(Squeezebox%20Server)/
     

    Vedlegg

    .Marcus

    Hi-Fi freak
    Ble medlem
    11.07.2007
    Innlegg
    1.268
    Antall liker
    126
    Analyse av SoX resamplingens betydning for lydkvaliteten

    Takk for den, Marsboer. Svært interessant!
     

    marsboer

    Hi-Fi freak
    Ble medlem
    04.04.2010
    Innlegg
    4.356
    Antall liker
    1.701
    Sted
    Phobos
    For å dobbeltsjekke at metoden min var fornuftig kjørte jeg samme metodikk med en 16-bit 44.1kHz fil som jeg lagde en 320kbit/s CBR mp3-variant av med nyeste versjon av LAME.
    Mange sliter med å høre konsekvent forskjell på 320kbit/s mp3 og lossless-versjonen så dette bør gi oss et sammenligningsgrunnlag i forhold til resultatene jeg fikk med downsampling.

    Testfil er Kanye West - Gorgeous (feat Kid Gudi) fra albumet My Beatiful Dark Twisted Fantacy (tilfeldig valgt 16-bit 44.1kHz fil)

    Her er de to waveformene. Mp3 nederst. Ser tilsynelatende nesten like ut, men mp3 versjonen har vesentlig mer klipping (synes ikke i bildet her, men vises når jeg velger "Show clipping".



    Deretter inverterer jeg mp3-versjonen og mixer den med originalen. Da får vi denne waveformen:



    Her var det faktisk en del informasjon. Til sammenligning var linjen totalt flat med resampling fra 192kHz til 96kHz.

    Frekvensspekteret i diff-filen:



    Lytt deretter til resultatet her:
    http://www.marsboer.net/shared/Analyse%20av%20SoX%20resampling%20(Squeezebox%20Server)/mp3/Diff%20mp3.flac

    Som dere sikkert hører utarter forskjellene seg som støy som modulerer med musikkens innhold. Med tanke på hvor lite forskjell på 320kbit/s mp3 og FLAC de fleste opplever så kan du sammenligne disse lett hørbare forskjellene på normalt volum med de utrolig små forskjellene vi fikk med downsampling.

    Konklusjon:
    Metoden fungerer for å detektere forskjeller


    Originalen i FLAC, 320kbit/s mp3-versjonen og diff-filen finnes her:
    http://www.marsboer.net/shared/Analyse%20av%20SoX%20resampling%20(Squeezebox%20Server)/mp3/
     

    Vedlegg

    .Marcus

    Hi-Fi freak
    Ble medlem
    11.07.2007
    Innlegg
    1.268
    Antall liker
    126
    For meg ser det ut til at du ikke har vært heldig med å synkronisere de to filene.
     

    marsboer

    Hi-Fi freak
    Ble medlem
    04.04.2010
    Innlegg
    4.356
    Antall liker
    1.701
    Sted
    Phobos
    .Marcus skrev:
    For meg ser det ut til at du ikke har vært heldig med å synkronisere de to filene.
    Jeg konverterte bare filen, men jeg skal dobbeltsjekke at det ikke tulles med sync inni der.

    EDIT: Av en eller annen grunn er mp3-filen tidsforskjøvet ørlitegrann. Jeg skal gjøre testen på nytt.
     

    .Marcus

    Hi-Fi freak
    Ble medlem
    11.07.2007
    Innlegg
    1.268
    Antall liker
    126
    Har opplevd dette selv ved konvertering til mp3, ofte litt stress å få de to filene til å starte samtidig!
     

    marsboer

    Hi-Fi freak
    Ble medlem
    04.04.2010
    Innlegg
    4.356
    Antall liker
    1.701
    Sted
    Phobos
    Etter to forsøk hvor jeg til slutt måtte gå helt ned på sample for sample er nå mp3-versjonen oppdatert og den ser langt mer vettug ut. Konklusjonen består som før.
     

    _RoDa_

    Ikke så veldig hifi-freak lengre
    Ble medlem
    06.02.2010
    Innlegg
    12.806
    Antall liker
    13.464
    Sted
    Østfold
    Torget vurderinger
    8
    Hatten av, marsboer!! :eek:
    Takk for denne, meget interessant!
    For min egen del gjør dette at jeg vurderer 24/96 som svært nok for meg og dermed min Squeezebox Touch det samme. :)
     

    KW

    Hi-Fi freak
    Ble medlem
    30.11.2002
    Innlegg
    6.388
    Antall liker
    389
    Sted
    Bærum
    Torget vurderinger
    1
    RoDa skrev:
    Hatten av, marsboer!! :eek:
    Takk for denne, meget interessant!
    For min egen del gjør dette at jeg vurderer 24/96 som svært nok for meg og dermed min Squeezebox Touch det samme. :)
    Det tror jeg helt sikkert både du og de aller fleste andre utmerket godt kan gjøre.
    Det hele dreier seg om å få litt ro inn i hue, og ikke hele tiden føle seg usikker på hvorvidt ikke alt (for mye) medfører lydforbedring.

    Fint utført marsboer, som bare gir meg ytterligere ro, en ro som allerede er blitt bedre i noen omganger de siste årene.

    Forventninger (edit; og tro) er sterke saker.

    Mvh.KW
     

    ayaboh

    Hi-Fi freak
    Ble medlem
    07.11.2005
    Innlegg
    1.690
    Antall liker
    7
    marsboer skrev:
    Det er derfor ikke mulig å si at høyfrekvente filer er en nødvendighet for å få god lyd. Basert på mine resultater i denne testen så vil jeg faktisk påstå at en god 44.1kHz DAC kan spille akkurat like bra som en god DAC som får tilført samme fil i en ekte 384kHz-versjon. Det kommer bare an på selve DAC-implementasjonen. Dette kan sikkert flere med moderne CD-spillere i toppklassen også stille seg bak.
    Enig. De forsøkene jeg selv har gjort tyder på at dette stemmer.
     

    Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    36.282
    Antall liker
    34.816
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    Veldig interessant, grundig gjennomført og dokumentert. Transporteren min blir nok stående her lenge.
     
    M

    Mr-T

    Gjest
    Takk!

    Dette bekrefter det jeg selv mener; det er nesten umulig å høre forskjell på "ekte" hi-rez og samme materiale nedsamplet til 44.1 kHz.
     

    _RoDa_

    Ikke så veldig hifi-freak lengre
    Ble medlem
    06.02.2010
    Innlegg
    12.806
    Antall liker
    13.464
    Sted
    Østfold
    Torget vurderinger
    8
    Mr-T skrev:
    Takk!

    Dette bekrefter det jeg selv mener; det er nesten umulig å høre forskjell på "ekte" hi-rez og samme materiale nedsamplet til 44.1 kHz.
    Dette - uthevet av meg - tror jeg er mye av sannheten.
    En jævli god innspilling er en jævli god innspilling, både på CD, SACD og annen HiRez. :)
     
    M

    Mr-T

    Gjest
    ... men derimot er det temmelig stor forskjell på sluttresultatet om musikken spilles inn, mikses, redigeres og mastres i hi-rez eller ikke. Helt uavhengig om sluttproduktet leveres på kassett eller SACD....

    44.1 16-bit holder bare ikke under innspillingsprosessen, og det er vel ingen som jobber i den oppløsningen heller heldigvis.
     

    Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    36.282
    Antall liker
    34.816
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    Mr-T skrev:
    ... men derimot er det temmelig stor forskjell på sluttresultatet om musikken spilles inn, mikses, redigeres og mastres i hi-rez eller ikke. Helt uavhengig om sluttproduktet leveres på kassett eller SACD....

    44.1 16-bit holder bare ikke under innspillingsprosessen, og det er vel ingen som jobber i den oppløsningen heller heldigvis.
    Nei, fri og bevare. Det oppstår avrundingsfeil (dvs støy) hver gang signalet endres, og det er ganske mye som skjer mellom A/D-konverter og ferdig produkt. Hvis intern oppløsning i prosessoren er 32- eller 64-bit, så kan de avrundingsfeilene bli hva de vil, langt der nede i de aller minste bitsene, og så klippes de bare bort til slutt når innspillingen trunkeres ned til 24 eller 16 bit. Hvis prosesseringen ble gjort i 16 bits ville alle avrundingsfeilene blitt med i det ferdige produktet, og det hadde ikke vært noen god ting.

    Jeg anser 24-bits prosesseringen i DEQX'en min som litt i trangeste laget. Det holder fint til 16-bits innspillinger, men 24-bits data vil nok merke at noe foregår. Signal/støy-forholdet er oppgitt til 107 dB, noe som tilsvarer 17,8 bits reell oppløsning. Det vil også være nokså krevende for både forsterkere, høyttalere og lytterom å levere 24-bits oppløsning helt frem til ørebrusken. 144 dB dynamisk spenn er ganske mye...
     

    marsboer

    Hi-Fi freak
    Ble medlem
    04.04.2010
    Innlegg
    4.356
    Antall liker
    1.701
    Sted
    Phobos
    Bra du presiserte at mine konklusjoner utelukkende gjelder for avspilling av ferdig digitalisert musikk Mr. T.

    Når det er sagt så er det fremdeles viktig å huske på at DACer meg bekjent endrer spesifikasjoner noe avhengig av hva de fôres med av inndata. I hvertfall om man ser på den tekniske dokumentasjonen for DAC-chipen. Det kan derfor være verdt å ta utgangspunkt i en høyoppløst fil for så å resample denne til alle støttede samplerates på DACen og undersøke lydkvaliteten for hver av disse. Som mine tester viser så kan man anta at alle i utgangspunktet låter likt, og at eventuelle variasjoner da skyldes selve DAC-implementasjonen. Om man finner en samplerate som låter bedre enn andre, så kan det være verdt å se på muligheten for resampling av all avspilt musikk, både med høyere og lavere samplerates, til denne sampleraten. Om man kjører Squeezebox Server og da også SoX, så kan dette enkelt settes opp kun ved å endre et par parametre. Da får man også en meget god resamplingsalgoritme med på kjøpet.

    Min erfaring med de DACer jeg har hatt i eie er at dette med "egendefinert upsampling" bare er å stikke hånda inn i et ormebol hvor man aldri får fred i sjela fordi man aldri er sikker på om forskjellene man tror man hører er reelle og om de er til det bedre. Jeg vil derfor anbefale å holde kjeden enklest mulig med minst mulig tukling og la DAC-hardwaren gjøre jobben sin slik den forhåpentligvis ble optimalisert for.
     

    tkr

    Æresmedlem
    Ble medlem
    27.03.2007
    Innlegg
    20.539
    Antall liker
    27.477
    Sted
    Nede i fjæresteinene
    Torget vurderinger
    2
    M

    Mr-T

    Gjest
    Det var ikke mulig å stemme på noen 16-bit oppløsning der da... 24 vs 16 bit var poenget egentlig.
     

    tkr

    Æresmedlem
    Ble medlem
    27.03.2007
    Innlegg
    20.539
    Antall liker
    27.477
    Sted
    Nede i fjæresteinene
    Torget vurderinger
    2
    Mr-T skrev:
    Det var ikke mulig å stemme på noen 16-bit oppløsning der da... 24 vs 16 bit var poenget egentlig.
    Så det. Var likevel overrasket over hvor mange som jobbet i 44.1. 24 bits skulle vel i teorien bare gi lavere støygulv.
    mvh
     
    M

    Mr-T

    Gjest
    Det er fortsatt vanlig gjøre mix, EQ, kompresjon osv i det analoge domenet, selv om man tar opp digitalt. Skulle man prosessert digitalt med 16-bit og 44.1 kHz så går lydkvaliteten fort i skåla. Heldigvis gjøres digital lydbehandling i langt mer enn 16 bit.
     

    Kvålsvoll

    Bransjeaktør
    Ble medlem
    22.07.2010
    Innlegg
    1.601
    Antall liker
    1.696
    Sted
    Ålesund, Norge
    Det er ikke så rart at høyere samplingsfrekvens ikke gir noen betydelig gevinst.
    Så lenge 44K får med alt som er hørbart, så er det ikke noe å hente ved å sample høyere.

    Indirekte så kan høyere fs ha betydning likevel, fordi det er lettere å filtrere og fjerne den høyfrekvente støyen i en AD eller DA.

    Høy nok oppløsning er avgjørende hvis signalet skal prosesseres, for eksempel i et digitalt filter.
    Dette kan imidlertid (til en viss grad) løses i prosessoren.
    Faktisk fører høyere samplingsfrekvens til dårligere nøyaktighet i digitale filter, fordi slike filter opererer på endring av differanse mellom samples.
    Hvis filterets knekkfrekvens er veldig lav i forhold til samplingsfrekvensen vil forskjellene mellom hvert sample kunne bli så små at regnenøyaktigheten blir for dårlig.
     

    trex

    Overivrig entusiast
    Ble medlem
    05.07.2003
    Innlegg
    916
    Antall liker
    29
    Når det gjelder innspillingsdelen, har det også litt med hardware-begrensninger å gjøre.

    Hvis man har en låt med 50-100 spor, skal man ha frisk hardware på alle kanter om man skal recorde i 24/96 hele veien.
    Husk at plugins og spesielt softwareinstrumenter også er prosessor-krevende.

    Det er vel også årsaken til at jazz/klassisk ofte tar opp mer i såkalt hirez, 24/88,2-192.
    Der er antall spor mindre og plugin og softwareinstrumentbruken mye mindre. Altså mer kraft til lyd I/O.

    I daglig bruk, ligger standarden på 24/44,1 til pop/rock/kommers lyd og 24/48 til alt som har med tv og video og film å gjøre.


    Hadde dette ikke vært noen begrensing, hadde man brukt 24/96 som en standard, ganske sikkert.
    Nå er vel dynamisk headroom, overgangen fra 16 til 24 bits mye viktigere for innspilling enn høyere samplingsfrekvens etter de fleste mening.
     

    Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    36.282
    Antall liker
    34.816
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    trex skrev:
    Nå er vel dynamisk headroom, overgangen fra 16 til 24 bits mye viktigere for innspilling enn høyere samplingsfrekvens etter de fleste mening.
    Ja, og det illustrerer nok en gang det komplette idiotiet i den pågående "loudness war" hvor hele signalet absolutt skal klemmes inn i de øverste få bits'ene. 96 dB dynamisk range i 16 bits, 144 dB i 24 bits, og så spoleres hele greia med å legge nivået så høyt at det vi kan kjøpe i butikk tilsvarer et dårlig 8-bits opptak, sånn omtrent.
     
    M

    Mr-T

    Gjest
    Når jeg holdt på med dette selv så var det 24/96 som gjaldt for ting jeg gjorde i 2 til 4 spor, mens studioproduksjoner i flere spor ble alltid 24/44.1. Årsaken er som trex sier: maskinkapasitet.
     

    trex

    Overivrig entusiast
    Ble medlem
    05.07.2003
    Innlegg
    916
    Antall liker
    29
    Asbjørn skrev:
    trex skrev:
    Nå er vel dynamisk headroom, overgangen fra 16 til 24 bits mye viktigere for innspilling enn høyere samplingsfrekvens etter de fleste mening.
    Ja, og det illustrerer nok en gang det komplette idiotiet i den pågående "loudness war" hvor hele signalet absolutt skal klemmes inn i de øverste få bits'ene. 96 dB dynamisk range i 16 bits, 144 dB i 24 bits, og så spoleres hele greia med å legge nivået så høyt at det vi kan kjøpe i butikk tilsvarer et dårlig 8-bits opptak, sånn omtrent.
    Nettopp, teknikere er nøye med gain på innkommende, helst peake på -12 eller deromkring så ikke summen skal overstyre, så moser man hele greia til slutt med tildels direkte overstyrt resultat.

    Forstå det den som kan...la nå radiostasjonene gjøre sin greie med limitere og kompressorer om de vil, de har sin egen agenda med tilpasning av reklame osv, men stereolyd burde etter min mening i dag vært tilbudt som ferdig miks, i den oppløsningen den ble tatt opp i, fullstendig uten mastering (annet enn eq og tilpasninger på 2-spor).
    Det hadde det vært mening i, så kunne "HØYT SOM F**N"-miksen vært distribuert som en billigversjon til radio, pod'er av alle slags og de som generelt driter i selve lyden.
     

    nudiebear

    Hi-Fi interessert
    Ble medlem
    04.07.2008
    Innlegg
    53
    Antall liker
    1
    Flott innlegg og arbeid, Marsboer. Takk for god lektyre.
     
  • Laster inn…

Diskusjonstråd Se tråd i gallerivisning

  • Laster inn…
Topp Bunn