Hvordan avsløre om en lossless fil har vært lossy (transkodet)

marsboer

Hi-Fi freak
Ble medlem
04.04.2010
Innlegg
4.356
Antall liker
1.701
Sted
Phobos
For å finne ut om en lossless fil som f.eks FLAC, WAV eller ALAC, tidligere har vært enkodet lossy med f.eks mp3, ogg eller aac kan man analysere frekvensspekterert. Bølgeformen gir oss svært lite, siden disse enkoderne fungerer slik at de fjerner informasjon som "kamufleres" og informasjonen i lydfiler befinner seg hovedsaklig i frekvensspekteret, mens bølgeformen kun visualiserer signalamplituden. "Redusert dynamikk" i form av endringer i volumnivå på bølgeformen er derfor ikke korrekt sted å se etter spor av lossy enkoding.

Bare se på bølgeformen av henholdsvis børretzen1 og børretzen2 wav. Klarer du å se hvilken av dem som har vært lossy?

Børretzen.jpg


Ikke jeg heller.. De ser så godt som identiske ut, og vanligvis er man ikke så bortskjemt at man har både originalen og den lossy varianten for sammenligning heller.

Men hva om vi endrer visning til å se på frekvensinformasjonen i stedet.

Børretzen f zoomed.jpg


Her skjer det ting. Selv et utrent øye ser at det foregår noe svært muffins i de øvre frekvensene på den ene fila. Omtrent som om noen har malt over de øverste frekvensene på slurvete vis. Her er det informasjon som er fjernet! Man kan se at det er en VBR-codec (Variable Bit Rate) i det høyeste kvalitetsspekteret fordi det er "topper" som stikker høyere enn resten, faktisk helt opp mot 21-22 kHz. En CBR-codec (Constant Bit Rate) skjærer flatt av over hele fjøla. Her er det med andre ord tydelig at den ene har vært gjennom en lossy prosess, selv uten å ha hatt den andre filen for sammenligning. Ordentlige losslessfiler vil ha en gradvis overgang ut i de høye frekvensene. Dersom det har blitt benyttet båndbreddebegrensende tiltak i utgivelsen, f.eks at deler av innholdet i filen har vært brickwalled til en lavere samplingsfrekvens enn filens egen, så vil dette gi seg litt annerledes utslag i form av en utpreget snorrett støylinje som man typisk ser i dårligere high rez utgivelser. Det er vanligvis enkelt å se forskjell på dette og avkortninger som følge av lossy codec, på grunn av "malekost" preget på lossy-filene.

Det er enda enklere å se hvorfor man ikke må fokusere på "dynamikken" og bølgeformen om man inverterer de to variantene i forhold til hverandre og mikser dem sammen slik at man kun sitter igjen med en fil som inneholder utelukkende forskjellene.

Børretzen lossy diff lossless, waveform & f.jpg


Øverst ser du bølgeformen. Dette er rett og slett den faktiske signalmessige forskjellen mellom børretzen1 og børretzen2. Du kan faktisk også høre på filen i etterkant. Du vil da gjerne høre en støyende og susende "skyggevariant" av den opprinnelige lydfilen om du drar opp lyden litt. Men amplituden er lav og det er ikke spesielt rart at man sliter med å høre forskjell. Men hvor blir da alle dataene av ved lossy encoding? Filene blir jo drastisk mye mindre?
Det avsløres med en gang om man ser på frekvensspekteret. Selv om det nivåmessig er fjernet svært lite av signalet, er frekvensinnholdet dramatisk forskjellig. Jo rødere farge, jo høyere amplitude har frekvensområdet du ser på venstre akse.

Her sammenlignes tre WAV-filer, hvorav en har vært gjennom 320 kbit/s CBR encoding med lame, en annen V2 VBR encoding med LAME og en er originalen. 320kbit/s er på toppen, V2 VBR i midten og originalen nederst. Allerede ved V2 VBR, som regnes som svært god allround kvalitet, er et så godt som ingenting som skjer over 16 kHz.

Zoomed.jpg
 
Sist redigert:

Dazed

Æresmedlem
Ble medlem
29.01.2003
Innlegg
20.540
Antall liker
7.230
Sted
Sarpsborg
Torget vurderinger
2
Betyr det altså at hovedsaklig er det småting helt øverst i frekvensområdet som er trimmet bort? Kanskje egentlig høyere enn det vi som nærmer oss førti egentlig kan forvente å høre? Og betyr det igjen at for å høre dette vil det vær lurt å høre etter utklinging og overtoner fra cymbaler, fioliner, piccolofløyter, etc? Det er jo ingenting av vanlige instrumenter som egentlig skal gå noe særlig over 15-16KHz likevel.

Hvis omtrent ele forskjelen på testfilene iden andr tråden, kan joo det forklare hvorfor jeg ikke hørte den.

Kanskje vi skulle finne en frekvens-hørselstest på nettet og kryssjekke resultatene mot den den andre testen?
 
Sist redigert:

marsboer

Hi-Fi freak
Ble medlem
04.04.2010
Innlegg
4.356
Antall liker
1.701
Sted
Phobos
Om du ser på frekvensspekteret der man kun ser på differansen, så ser du at det fjernes ting fra hele frekvensområdet, inklusive bassområdet. Men det er lettest å se på de høyeste frekvensene siden det er så visuelt synlig her, gitt at målet er å avsløre om en fil har vært lossy uten at du har en original å sammenligne med.
 
N

nb

Gjest
@marsober - gidder du å legge ut differansefilen slik at folket kan høre kun på det som faktisk er fjernet? jeg gjorde det for en tid tilbake på et annet spor, men jeg brukte megaupload som filehost og vi vet jo hva som skjedde med den.... det er ganske lærerikt å høre hvor mye som faktisk er borte. Med lavere bitrater begynner det å bli ekstremt.
 

marsboer

Hi-Fi freak
Ble medlem
04.04.2010
Innlegg
4.356
Antall liker
1.701
Sted
Phobos
Ja. Fikser det i morgen. Jeg kan lage flere med ulike kvalitetsgrader.
 

TrompetN

Hi-Fi freak
Ble medlem
04.03.2004
Innlegg
8.700
Antall liker
7.011
Flott Marsboer!

Har du gjort samme forsøk med original master mot for eksempel Apple lossless?
Gjerne et ikke for nytt opptak.
 
N

nb

Gjest
Har du gjort samme forsøk med original master mot for eksempel Apple lossless?
Det har ingen hensikt siden innholdet i en Apple Lossless (eller FLAC) er eksakt likt opphavet. FLAC (og helt sikkert Apple lossless) støtter flere kanaler, større bitdybde og høyere samplingfrekvenser enn alt som finnes til konsumentmarkedet.

It can handle any PCM bit resolution from 4 to 32 bits per sample, any sampling rate from 1 Hz to 655,350 Hz in 1 Hz increments,[7] and any number of channels from 1 to 8.[8] Channels can be grouped in cases like stereo and 5.1 channel surround to take advantage of interchannel correlations to increase compression.

Men på generelt grunnlag er det en grei måte å sammenligne to spor på - dersom man fasevender ene og spiller de av samtidig skal resultatet bli tyssnad dersom de er like. Det fordrer dog at de er tidsmessig like på samplenivå. To filer der den ene har 1 sekund stillhet før musikken starter og en annen som har 1.1 sekund stillhet vil datamessig og innholdsmessig være ulike, men selve musikken vil være identisk - at det ene starter 0.1 sekund senere er jo ikke en veldig relevant forskjell.
 
Topp Bunn