Endelig: Blindtester kan sies å ha mistet all troverdighet

Roysen · 17.12.2007

oddgeir skrev:
Blir ikke dette litt bakvendt?
Roysen ønsker å bruke 2 kabler som det "åpenbart er forskjell på" til å verifisere blindtest som metode.

Man tar altså det fenomenet som man i utgangspunktet ønsker å etterprøve, og legger det som basis for å teste testmetoden. :

Ikke helt - de fleste her inne er enige om at det kan være lydmessige forskjeller på kabler dersom den ene ikke er konstruert for å være nøytral.

Det er i hvert fall slik jeg har oppfattet diskusjonen.

Mvh
Roysen

Vegardaase · 17.12.2007

oddgeir skrev:
Blir ikke dette litt bakvendt?
Roysen ønsker å bruke 2 kabler som det "åpenbart er forskjell på" til å verifisere blindtest som metode.

Man tar altså det fenomenet som man i utgangspunktet ønsker å etterprøve, og legger det som basis for å teste testmetoden. :

Selvfølgelig har du rett, og det viser jo med all tydelighet hvor diskusjonen står her inne.

Om man er interessert i å "teste metoden", må man benytte ting det helt klart er forskjell på, ikke ting det i bestefall er marginal forskjell på. Om man ikke gjør det, vil ikke den eventuelle testen være konklusiv.

kbwh · 17.12.2007

Roysen skrev:
Valentino skrev:

Roysen skrev:

ron-hi skrev:

Har ingen problemer med feks. å høre forskjell på mp3 og cd under blindtest, selv med en del øl innabords. Det forteller iallfall meg at blindtester har noe for seg. At hvermansen som aldri har brydd seg om lyd ikke hører forskjell, er da ikke noe argument for at blindtester ikke er troverdige. Det som bør være vesentlig er jo om hifi-interesserte hører forskjell, da det naturlig nok er vi som er mest kresne.

Klikk for å utvide...

Jeg vet ikke om du kjenner historikken bak våre diskusjoner omkring blindtester her på sentralen i sommer? Det var nå i hvert fall slik at det var en del uenighet om blindtestens fortreffelighet. Bakgrunnen for denne uenigheten kom ikke som en følge av at ikke-audiofile ikke kunne høre de samme forskjellene som audiofile.

Ballen ble imidlertid på et tidspunkt sparket tilbake til de som har så stor tro på blindtesten om de kunne foreta en blindtest hvor de på forhånd var temmelig sikre på at resultatet ville bli positivt for å verifisere at testen var egnet til foremålet. Ingen turte å stille opp på noe slikt.

Mvh
Roysen

Klikk for å utvide...

Frekk konklusjon det der, Roysen. I beste fall.

Klikk for å utvide...

Ja vel, tar jeg feil? Ønsker du å stille?

Mvh
Roysen

Klart jeg stiller om du sørger for at testbetingelsene er slik de skal være i en slik test, men det er nok lurt å bruke folk som er enige i de åpenbare forskjellene.
Deltok du i theStigs lille platespillersammenlikning ved påsketider? Jeg kan ikke huske å ha sett noe svar fra deg.

KJ · 17.12.2007

Roysen skrev:
Dette er selvfølgelig kun en bortforklaring. Det kreves ikke noe spesiellt for å verifisere blindtesten som metode ved å teste to kabler det åpenbart burde være forskjell på.

Mvh
Roysen

Før noe som helst er åpenbart, er det åpenbare spørsmålet: Hva er hørbart?

Hvor store avvik i reproduksjonen av ymse egnet lydmateriale (gjerne musikk) må til før det er hørbart? Avvik mht frekvensrespons/«utstrekning», støy, signalkorelert resonans, forvregning etc? Hvilke karakteristika for marginale avvik er mer hørbart enn andre? Det er mangt og mye i reproduksjonen av hermetisk musikk som gir seg utslag i målbare forskjeller som nødvendig vis ikke er hørbare ... den omvente sammenhengen er ikke like lett å trekke opp ... tilsvarende er det ofte en sammenheng mellom aktuelle avvik og subjektive preferanser ...

mvh
KJ

Roysen · 17.12.2007

Så nå er vi tilbake til at det ikke er lydmessige ulikheter på noen kabler i det hele tatt - om de er feilkonstruert, konstruert for å tune lyden i en spesiell retning eller konstruert for å være nøytrale?

Jeg begynner å lure litt på hvor målemafiaen egentlig står i all denne vinglingen.

For en tid tilbake var det temmelig stor enighet om at det var både målbare og hørbare ulikheter på kabler, men det var ikke enighet om at dette også gjaldt kabler som var konstruert for å være nøytrale.

Mvh
Roysen

Roysen · 17.12.2007

Valentino skrev:
Roysen skrev:

Valentino skrev:

Roysen skrev:

ron-hi skrev:

Har ingen problemer med feks. å høre forskjell på mp3 og cd under blindtest, selv med en del øl innabords. Det forteller iallfall meg at blindtester har noe for seg. At hvermansen som aldri har brydd seg om lyd ikke hører forskjell, er da ikke noe argument for at blindtester ikke er troverdige. Det som bør være vesentlig er jo om hifi-interesserte hører forskjell, da det naturlig nok er vi som er mest kresne.

Klikk for å utvide...

Jeg vet ikke om du kjenner historikken bak våre diskusjoner omkring blindtester her på sentralen i sommer? Det var nå i hvert fall slik at det var en del uenighet om blindtestens fortreffelighet. Bakgrunnen for denne uenigheten kom ikke som en følge av at ikke-audiofile ikke kunne høre de samme forskjellene som audiofile.

Ballen ble imidlertid på et tidspunkt sparket tilbake til de som har så stor tro på blindtesten om de kunne foreta en blindtest hvor de på forhånd var temmelig sikre på at resultatet ville bli positivt for å verifisere at testen var egnet til foremålet. Ingen turte å stille opp på noe slikt.

Mvh
Roysen

Klikk for å utvide...

Frekk konklusjon det der, Roysen. I beste fall.

Klikk for å utvide...

Ja vel, tar jeg feil? Ønsker du å stille?

Mvh
Roysen

Klikk for å utvide...

Klart jeg stiller om du sørger for at testbetingelsene er slik de skal være i en slik test, men det er nok lurt å bruke folk som er enige i de åpenbare forskjellene.
Deltok du i theStigs lille platespillersammenlikning ved påsketider? Jeg kan ikke huske å ha sett noe svar fra deg.

Jeg kan ikke erindre noen slik test......

Mvh
Roysen

knutinh · 17.12.2007

Roysen skrev:
Så nå er vi tilbake til at det ikke er lydmessige ulikheter på noen kabler i det hele tatt - om de er feilkonstruert, konstruert for å tune lyden i en spesiell retning eller konstruert for å være nøytrale?

Jeg begynner å lure litt på hvor målemafiaen egentlig står i all denne vinglingen.

For en tid tilbake var det temmelig stor enighet om at det var både målbare og hørbare ulikheter på kabler, men det var ikke enighet om at dette også gjaldt kabler som var konstruert for å være nøytrale.

Ingen bestrider at det kan være målbare forskjeller på kabler, og at disse sannsynligvis er hørbare dersom man går langt nok til ytterpunktene.

Legg merke til ordet sannsynligvis. Dersom jeg testet 100meter signalkabel og ikke greide å bekrefte forskjeller så ville jeg ikke ta det som at vitenskapen som vi kjenner den må forkastes, men som et tegn på at mine ører, den aktuelle kabelen og de aktuelle komponentene sannsynligvis ikke var så kritisk ovenfor kabelbytte. Hva så? Penger spart, alle fornøyd (utenom kabel-selgerene muligens)

Det er ingen som ved sine fulle fem vil hevde at fravær av bekreftet forskjell i en blindtest kan brukes for å diskvalifisere blindtester som metode, på bakgrunn av synsingen til noen audiofile som hevder at det "må" være hørbare forskjeller ut fra seende lytting.

Espen brakte fulle fjortisser inn på banen. Hvis det er slik at 14-åringer kan bli "fulle" av alkoholfri øl, hva beviser det? Betyr det at vi straks må endre på vitenskapsteorien siden "alle" vet at man må ha alkohol for å bli full? Slik tolker jeg nemlig din og Espen sin holdning - og jeg anser det for å prøve å utforme terrenget etter kartet. Som alle som har prøvd seg med spade vet så er det ganske slitsomt...

Spørsmålet mitt til deg personlig står fremdeles: Hvorfor "vet ikke" JAES og JASA om din grensesprengende vitenskap?

-k

Roysen · 17.12.2007

Poenget er vel at dersom en blindtest ikke kan benyttes til å skille på små hørbare forskjeller burde det benyttes andre metoder for å evaluere kabler.

Jeg hevder ikke å vite hvilken metode det i så fall skulle være. Jeg hevder kun min tvil omkring denne ene testen.

Mvh
Roysen

knutinh · 17.12.2007

Roysen skrev:
Poenget er vel at dersom en blindtest ikke kan benyttes til å skille på små hørbare forskjeller burde det benyttes andre metoder for å evaluere kabler.

Jeg hevder ikke å vite hvilken metode det i så fall skulle være. Jeg hevder kun min tvil omkring denne ene testen.

Dersom forskjellene bare eksisterer i ditt hode så er det ingen forskjeller å evaluere. Ingen testmetodikk vil da gi det svaret du så desperat er ute etter, utenom seende lytting, som vi vet har potensielle feilkilder.

Det synes som om du konsekvent utelater denne muligheten, på tross av at flere tester viser at det generelt er en reell sannsynlighet for det, selv for audiofile, oppegående lyttere under gode betingelser (som jeg antar at du er).

Mike mente selv at han hadde hørt 7 av 7 i en blindtest som ble beskrevet som avslappet og positiv, hvor han som subjektivist regnet med at dette skulle gå greit. Dette er ikke en unik historie. Du forkaster uten diskusjon en metodikk som er dypt forankret i vitenskapen, til fordel for en metode som det finnes flere eksempler på har store svakheter. Hva annet kan man si om det enn at du har bestemt deg for svaret og jakter på den metodikken som lar deg leve videre i troen?

-k

Roysen · 17.12.2007

knutinh skrev:
Roysen skrev:

Poenget er vel at dersom en blindtest ikke kan benyttes til å skille på små hørbare forskjeller burde det benyttes andre metoder for å evaluere kabler.

Jeg hevder ikke å vite hvilken metode det i så fall skulle være. Jeg hevder kun min tvil omkring denne ene testen.

Klikk for å utvide...

Dersom forskjellene bare eksisterer i ditt hode så er det ingen forskjeller å evaluere. Ingen testmetodikk vil da gi det svaret du så desperat er ute etter, utenom seende lytting, som vi vet har potensielle feilkilder.

Det synes som om du konsekvent utelater denne muligheten, på tross av at flere tester viser at det generelt er en reell sannsynlighet for det, selv for audiofile, oppegående lyttere under gode betingelser (som jeg antar at du er).

-k

Jeg gjentar at jeg i denne tråden kun diskuterer en test hvor det er målbare forskjeller på kablene og at de burde være hørbare.

Mvh
Roysen

knutinh · 17.12.2007

Roysen skrev:
Jeg gjentar at jeg i denne tråden kun diskuterer en test hvor det er målbare forskjeller på kablene og at de burde være hørbare.

Det finnes i min verden knapt noe som heter "burde" på den måten.

Det burde være snø ute i jula, og ofte er det det.

Avogtil er det det ikke. Hvis vi ser ut av vinduet og ikke ser snø, går ut og leker litt i sanda uten å se snø, så er det sannsynligvis ikke snø.

Hva man "burde" høre, som i etablerte hørbarhetsterskler er utelukkende funnet vet andre blindtester. At f.eks 0.5dB nivåforskjell kan gi ubevisst preferanse for et lydklipp er ikke noen atomisk sannhet, men noe noen har funnet ut ved metodisk å utsette test-personer blindt for lydstimuli og logge nivået. Kanskje vil andre blindtester finne en verdi på 0.1dB, atter andre en på 2dB. Vi har et vindu inn til virkeligheten, og vi kan lage modeller som beskriver det vi ser så godt som mulig.

Hvis du får andre resultater i en blindtest enn hva de fleste andre har fått før deg så er det grunn til å vurdere testene opp mot hverandre mhp "kvalitet" og "oppsett". Kanskje tester du egentlig en litt annen problemstilling, kanskje har du en feilkilde, kanskje er det bare statistikkens terningkast som ødelegger for deg.

-k

Roysen · 17.12.2007

knutinh skrev:
Roysen skrev:

Jeg gjentar at jeg i denne tråden kun diskuterer en test hvor det er målbare forskjeller på kablene og at de burde være hørbare.

Klikk for å utvide...

Det finnes i min verden knapt noe som heter "burde" på den måten.

Det burde være snø ute i jula, og ofte er det det.

Avogtil er det det ikke. Hvis vi ser ut av vinduet og ikke ser snø, går ut og leker litt i sanda uten å se snø, så er det sannsynligvis ikke snø.

-k

Slik du ser på det er det kun en blindtest som kan påvise at noe er hørtbart. Alt som er hørbart ved vanlig seende lytting er diskvalifisert og alt som kan måles er også diskvalifisert.

Dette er selfølgelig bare tull.

Mvh
Roysen

knutinh · 17.12.2007

Roysen skrev:
Slik du ser på det er det kun en blindtest som kan påvise at noe er hørtbart. Alt som er hørbart ved vanlig seende lytting er diskvalifisert og alt som kan måles er også diskvalifisert.

Dette er selfølgelig bare tull.

Jeg oppfordrer deg til å publisere noe vitenskaplig med andre midler. Si gjerne ifra når du har fått artikkelen igjennom peer-review. Hva er det du vet som JAES ikke vet? Hvorfor svarer du ikke på det?

Ting som høres seende eller måles er selvsagt interessant og kan brukes til så mangt. Det kan dog ikke brukes til å bevise fenomener som det er såpass stor uenighet om som det er om mange ting innen hifi.

-k

Soundproof · 17.12.2007

Roysen skrev:
Dette er selvfølgelig kun en bortforklaring. Det kreves ikke noe spesiellt for å verifisere blindtesten som metode ved å teste to kabler det åpenbart burde være forskjell på.

Mvh
Roysen

Langt derifra. nb har helt rett. Det er du (og RoDa) som mener det er forskjeller, følgelig er dere best kvalifisert til å dokumentere disse i en blindtest. Jeg mener det ikke er store forskjeller, og følgelig uegnet til å finne dem i en test.

Soundproof · 17.12.2007

Det er ikke snakk om enten eller, men både og.

Man bruker både objektive og subjektive metoder for å måle komponenters ytelse.

Maksimal teknisk objektivitet får man ved kun å bruke måleinstrumenter.
Maksimal subjektivitet får man ved kun å bruke synsing.

Blindtest er en sammensmeltning av begge maxima, ved at man forsøker å introdusere en metode, ha kontroll med variabler og avgrense mulige feilkilder. Men det er faktiskt kvalifisert lytting, i motsetning til usystematisert synsing.

Det viser seg at mange påstander om komponenters uvurderlige bidrag til lydopplevelsen forsvinner ved kvalifisert lytting -- og det er det umulig å bare kimse av.

Roysens snakk om vingling er skinnmanøvrer. Hvorfor gjentar han ikke Lavignes test og protokoll, på eget utstyr i eget lytterom, med egen kabel mot Monsters ditto? Under kontrollerte former.
Roysen må jo være den bortimot beste til å ta en slik test, siden han er så skråsikker på forskjellene og har såpass bred erfaring med å vurdere lyd pga sine omfattende tweaks.

Asbjørn · 17.12.2007

Hurra, en skikkelig krangletråd! Altfor lenge siden sist.

Altså, once more, from the top:

La oss anta at vi ønsker å finne ut om to bestemte signalkabler gir en hørbar forskjell for garvede audiofile lyttere. For å være enda mer konkret, anta at kabel A er dyrere enn kabel B, og hevdes å gi en forbedring som forsvarer denne prisen. Null-hypotesen er da at eventuell opplevd forskjell skyldes tilfeldigheter eller andre årsaker som ikke har med selve lydkvaliteten å gjøre. Vi prøver å konstruere et eksperiment som skal avkrefte denne hypotesen. En mulig testprosedyre er å samle sammen et representativt panel av audiofile personer, sette opp et anlegg som antas å være tilstrekkelig følsomt til å kunne gjengi den typen forskjeller som det er snakk om, og gjennomføre en randomisert dobbelt-blind A/B-test. Hver enkelt forsøksperson ville da høre på et musikkstykke gjennom hver av de to kablene, i tilfeldig rekkefølge, for så å skrive ned sin preferanse. A eller B, evt ingen forskjell. Legg merke til at disse forsøkspersonene ikke må være forstokkede skeptikere, som visstnok bare vil stikke fingrene i øra, synge "lalalala" og krysse av for "ingen forskjell" hver gang. Påstås det. Derfor er f eks Roysen og Espen R mye bedre egnet som forsøkspersoner enn f eks knutinh og meg. Hverken forsøksperson eller den som overvåker testen skal vite hvilket testobjekt som står i. For å redusere "stress", bør omgivelsene være behagelige og forsøket gjennomføres uten tidspress. Helst bør forsøkspersonen selv få lov til å styre switching mellom de to testobjektene, frem og tilbake så mange ganger som nødvendig for å gjøre seg opp en mening. Siden det sannsynligvis dreier seg om små forskjeller mellom testobjektene, vil det være nødvendig å gjenta forsøket et betydelig antall ganger med forskjellige forsøkspersoner og forskjellige musikkstykker. Dessuten bør hver forsøksperson gjenta forsøket et antall ganger. Oppløsningen i forsøket vil øke med økende antall forsøk - selv ørsmå forskjeller vil bli avdekket hvis vi kan gjenta eksperimentet tilstrekkelig mange ganger, f eks noen millioner enkeltforsøk. Så får man gjøre opp statistikken til slutt og bedømme sannsynligheten for at differansen i de oppgitte preferansene kan skyldes rene tilfeldigheter. Hvis den sannsynligheten er tilstrekkelig liten, f eks mindre enn 5 %, har vi sannsynliggjort at det er en forskjell og dermed forkastet nullhypotesen. So far, so good. Det er åpenbart litt krevende å sette opp en slik test, men det lar seg altså gjøre med nok tid og penger. (ref artikkelen Audio Science som jeg lenket til lengre oppe i tråden)

Validering av testprosedyren er noe annet. Anta at vi vil finne ut om den foreslåtte testprosedyren funker. Null-hypotesen vil da være at poengsettingen skyldes rene tilfeldigheter. Da vil fush' forslag om å blindteste en plate med Katie Melua mot en med Åge Aleksandersen være helt utmerket. Vi får testet avspillingsutstyret, knappen for å velge testobjekt A vs B, stemmegivningen og statistikken. Eller enda enklere, vi kunne teste en kabel mot ingen kabel. De fleste bør være i stand til å høre at det kommer musikk med bryteren i den ene stillingen, og ingen musikk med bryteren i den andre stillingen. Så samler vi sammen statistikken, og regner ut sannsynligheten for at dette resultatet (f eks 100 % gjenkjennelse av kabel vs ingen kabel) kunne oppstått ved rene tilfeldigheter. Hvis det viser seg at den sannsynligheten er større enn f eks 5 % , vet vi at det er noe fundamentalt galt noe sted, enten med det fysiske oppsettet av forsøket (virker bryteren?), med forsøkspersonens hørsel (stokk døv?), eller med antallet forsøk (2 riktige i 2 forsøk - ja, men det er 25 % sjanse for det også i myntkast). Hvis det derimot viser seg at forsøksoppsettet greier å gi et signifikant resultat, så må vi forkaste null-hypotesen - det er usannsynlig at dette resultatet skyldes rene tilfeldigheter, så testprosedyren synes å fungere.

Dessuten kan man rent analytisk beregne sannsynligheten for at et eksperiment skal være i stand til å avdekke en liten forskjell. Anta at forskjellen er så liten at jeg (eller du) vil legge merke til den 6 av 10 ganger i snitt. Altså en liten bias for den ene kabelen, kanskje avhengig av musikkstykke eller dagsform. Null-hypotesen er at det ikke er noen forskjell, altså 50/50 sjanse for at vi vil oppleve en forskjell. Gjør vi 10 forsøk og får de forventede 6 positive, så er det ikke signifikant. Det er hele 37 % sjanse for at dette kunne skjedd tilfeldig. Med 50 forsøk og 30 positive er det fortsatt 10% sjanse for at dette kunne skjedd helt tilfeldig. Først ved 80 forsøk og 48 positive er vi nede under 5 % sannsynlighet for at dette er ren tilfeldighet. Da kan vi "forkaste null-hypotesen med 95 % konfidens", som er en fancy måte å si at vi er rimelig sikre på at vi hørte forskjell. Og hvis forskjellen er mindre, dvs at antall positive blir nærmere og nærmere 50% av forsøkene, så må vi gjøre enda mye lengre forsøksserier for å kunne skille ut forskjellen fra bakgrunnsstøyen. I prinsippet kan vi skille ut hvor liten forskjell som helst, bare vi kan gjøre lang nok forsøksserie og det faktisk er en forskjell å skille ut. Likevel kan vi aldri helt utelukke at det kan være en forskjell, uansett hvor lang serie vi kjører. Vi har jo satt opp forsøket for å forsøke å utelukke at dette er likt, ikke motsatt.

Derfor kan en mer "vitenskapelig" formulering av Roysens synspunkt være at forskjellen i lydkvalitet mellom ulike kabler er så liten at det vil kreves en upraktisk lang forsøksserie for å skille den ut pålitelig i en blindtest. En annen tolkning kan være at det er kun utenomtekniske årsaker til at det oppleves en subjektiv forskjell, såsom pen innpakning, flott design, høy pris, placebo, eller hva som helst, og altså ikke signaloverføringen/lydkvaliteten. Det er i så fall et utsagn om forskjellen mellom testobjektene, ikke om testprosedyren som sådan. I begge tilfeller er det mange av oss som kan være enige...

Det vi derimot ikke kan gjøre er å blande sammen disse to forsøkene, ved f eks å "validere" prosedyren med omstridte testobjekter. Anta at jeg påstår at det er forskjell på to signalkabler, ja, en så elefantastisk stor forskjell et ethvert blikk-øre må høre det, og kanskje jeg til og med selger den beste av dem til en hungrende almue for a nominal service charge, so that you can reach Nirvana tonight. Hvis vi gjennomfører den første testen, og denne viser at testpanelet ikke kan høre forskjell, så kan vi ikke bruke dette resultatet til å forkaste testen, bare hypotesen om at det er en hørbar forskjell. Hvis vi gjennomfører det andre forsøket, og denne viser at testpanelet ikke kan høre om det står en kabel i eller ikke, så kan vi ikke bruke det resultatet til å forkaste den fantastiske signalkabelen, bare hypotesen om at testen funker. Blander vi disse to sammen, som visse debattanter insisterer på å gjøre, blir resultatet bare tøv.

Og siden det muligens vises til en tråd jeg startet for en stund siden:

For en tid tilbake var det temmelig stor enighet om at det var både målbare og hørbare ulikheter på kabler, men det var ikke enighet om at dette også gjaldt kabler som var konstruert for å være nøytrale.

Hint: 300 W. På hvert diskantelement. Delefrekvens 1400 Hz. Byttet signalkabel. Over tid ble lyden litt mørkere. Etter hvert ble den mye mørkere, selv om samme signalkabel ble stående i. Til slutt ble det også påfallende mye forvrengning oppover i diskanten. Heller tvilsomt om det skyldtes innbrenning av kabelen. Tror heller det var noen høyttalerspoler som ble utbrent. Jeg skal poste en oppdatering til den tråden når jeg får byttet diskanter, forhåpentligvis senere denne uken.

EDIT: Korrigert ihht korreks fra KJ, se nedenfor.

DIY_dude · 17.12.2007

asbjbo skrev:
Hurra, en skikkelig krangletråd! Altfor lenge siden sist.

Helt enig!

KJ · 17.12.2007

asbjbo skrev:
...
Hvis den sannsynligheten er tilstrekkelig liten, f eks mindre enn 5 %, har vi sannsynliggjort at det er en forskjell og at et representativt panel foretrekker den ene eller andre av testobjektene, og dermed forkastet nullhypotesen.
...

Kun en liten bagatell av en korreks: vær så snill å ikke blande inn preferanser å første omgang, det forkludrer bare fortolkningsromet for testresultatene. I første omgang bør en kun konsentrere seg om identifikasjon : X = A eller B. Hva som evt. er «best» av A eller B er i første instans uvesentlig.

mvh
KJ

Vegardaase · 17.12.2007

Meget bra innlegg Asbjbo!

Generelt må jeg si det er litt rart at noen av de største motstanderne av denne type testing, ikke later til å ha forstått de grunnleggende konseptene. Ved å lese Asbjbos innlegg får man essensen av hva som er introforelesningen på et hvilket som helst metodefag på universitetet.

Det var en del som ikke forsto dette i den gamle tråden til RoDa, så det kan vel repeteres:

Det vi derimot ikke kan gjøre er å blande sammen disse to forsøkene, ved f eks å "validere" prosedyren med omstridte testobjekter. Anta at jeg påstår at det er forskjell på to signalkabler, ja, en så elefantastisk stor forskjell et ethvert blikk-øre må høre det, og kanskje jeg til og med selger den beste av dem til en hungrende almue for a nominal service charge, so that you can reach Nirvana tonight. Hvis vi gjennomfører den første testen, og denne viser at testpanelet ikke kan høre forskjell, så kan vi ikke bruke dette resultatet til å forkaste testen, bare hypotesen om at det er en hørbar forskjell. Hvis vi gjennomfører det andre forsøket, og denne viser at testpanelet ikke kan høre om det står en kabel i eller ikke, så kan vi ikke bruke det resultatet til å forkaste den fantastiske signalkabelen, bare hypotesen om at testen funker. Blander vi disse to sammen, som visse debattanter inisterer på å gjøre, blir resultatet bare tøv.

Når man da bruker sine egene grunnløse motargumenter som bevis på at "det på langt nær er konsensus omkring slike tester", er det ikke så rart at det blir litt krangling...

tweakMan · 17.12.2007

knutinh skrev:
...
Dersom forskjellene bare eksisterer i ditt hode så er det ingen forskjeller å evaluere. Ingen testmetodikk vil da gi det svaret du så desperat er ute etter, utenom seende lytting, som vi vet har potensielle feilkilder.
...
Du forkaster uten diskusjon en metodikk som er dypt forankret i vitenskapen, til fordel for en metode som det finnes flere eksempler på har store svakheter

Duverden for noen antakelser!
Dette er verbale virkemidler brukt helt utenfor skalerbarhet!
Og det er du som uten å diskutere forkaster en mening og oppfattning her, nemlig den meningen og oppfattningen du avviser!
Det er greit, for det har man all mulighet til å gjøre.
Men her ordlegges det og skrives som dette emnet er forsket ferdig, og info videreformidles om at denne diskusjonen er ferdig.

Det stemmer vel ikke Knutinh?

mvh

knutinh · 17.12.2007

Imperial skrev:
Duverden for noen antakelser!

Hvilke?

Dette er verbale virkemidler brukt helt utenfor skalerbarhet!

Hæ?

Og det er du som uten å diskutere forkaster en mening og oppfattning her, nemlig den meningen og oppfattningen du avviser!

Jeg sier kort og godt at blindtester er en godt etablert vitenskaplig metode for å estimere subjektiv respons.

Rett eller galt?

Hvis du etterlyser diskusjon så har jeg en ganske lang oppsummering hvor jeg diskuterer for og imot. Men du vil kanskje ikke ha diskusjon?
http://www.hifisentralen.no/forum/index.php/topic,13143.0.html

Hverken du eller Roysen har vist nevneverdig interesse for denne som rikt henviser til relevante kilder. I stedet kommer den samme diskusjonen opp igjen og igjen, og debattantene har "glemt" argumentene.

Men her ordlegges det og skrives som dette emnet er forsket ferdig, og info videreformidles om at denne diskusjonen er ferdig.

Det stemmer vel ikke Knutinh?

Kan du henvise til forskning som har omveltet blindtesting de seneste 30 år?

-k

tweakMan · 17.12.2007

Nja, dersom forskjellene bare eksister i forskerenes hode, så tror jeg du får ta deg av det jeg!

Jeg vil ikke si at blindtester har mistet all troverdighet...
Jeg mener at blindtester er noe som prøver å etablere troverdighet.
Du anntar det motsatte og ekskluderer motpartens eksistens via resultater man påberoper seg innenfor den fraksjon du
støtter.
Men det er ikke slik at bervisbyrden har bortfalt for den fraksjonen.
At man innad i forskningsmiljøer kommer til lokale konklusjoner er jo naturlig, og går så utenfor kretsen or å søke gehør eller
validere teste egne resultater.
Riktignok skal abx leieren ha skryt for at den nå tester egne TEORIER og har noe suksess med dette (Mike L f.eks)
Det er denne faktiskt premature "feiringen" man må slutte med (synes jeg)når man da faktisk diskuterer.

At andre som har meninger ikke har sin "tekst" etablert av visse fora eller organisasjoner er jo soleklart og å lure på¨hvorfor
dette da ikke er godkjent der, er jo å innrømme at diskusjonen fortsatt pågår og ABX driver fortsatt å tester ut sin tese.

mvh

Soundproof · 17.12.2007

Her er det på sin plass med et dikt signert Donald Rumsfeld:

The Unknown

As we know,
There are known knowns.
There are things we know we know.
We also know
There are known unknowns.
That is to say
We know there are some things
We do not know.
But there are also unknown unknowns,
The ones we don't know
We don't know.

Feb. 12, 2002, Department of Defense news briefing

Vidar Øierås · 17.12.2007

asbjbo skrev:
Hurra, en skikkelig krangletråd! Altfor lenge siden sist.

Altså, once more, from the top:

La oss anta at vi ønsker å finne ut om to bestemte signalkabler gir en hørbar forskjell for garvede audiofile lyttere. For å være enda mer konkret, anta at kabel A er dyrere enn kabel B, og hevdes å gi en forbedring som forsvarer denne prisen. Null-hypotesen er da at eventuell opplevd forskjell skyldes tilfeldigheter eller andre årsaker som ikke har med selve lydkvaliteten å gjøre. Vi prøver å konstruere et eksperiment som skal avkrefte denne hypotesen. En mulig testprosedyre er å samle sammen et representativt panel av audiofile personer, sette opp et anlegg som antas å være tilstrekkelig følsomt til å kunne gjengi den typen forskjeller som det er snakk om, og gjennomføre en randomisert dobbelt-blind A/B-test. Hver enkelt forsøksperson ville da høre på et musikkstykke gjennom hver av de to kablene, i tilfeldig rekkefølge, for så å skrive ned sin preferanse. A eller B, evt ingen forskjell. Legg merke til at disse forsøkspersonene ikke må være forstokkede skeptikere, som visstnok bare vil stikke fingrene i øra, synge "lalalala" og krysse av for "ingen forskjell" hver gang. Påstås det. Derfor er f eks Roysen og Espen R mye bedre egnet som forsøkspersoner enn f eks knutinh og meg. Hverken forsøksperson eller den som overvåker testen skal vite hvilket testobjekt som står i. For å redusere "stress", bør omgivelsene være behagelige og forsøket gjennomføres uten tidspress. Helst bør forsøkspersonen selv få lov til å styre switching mellom de to testobjektene, frem og tilbake så mange ganger som nødvendig for å gjøre seg opp en mening. Siden det sannsynligvis dreier seg om små forskjeller mellom testobjektene, vil det være nødvendig å gjenta forsøket et betydelig antall ganger med forskjellige forsøkspersoner og forskjellige musikkstykker. Dessuten bør hver forsøksperson gjenta forsøket et antall ganger. Oppløsningen i forsøket vil øke med økende antall forsøk - selv ørsmå forskjeller vil bli avdekket hvis vi kan gjenta eksperimentet tilstrekkelig mange ganger, f eks noen millioner enkeltforsøk. Så får man gjøre opp statistikken til slutt og bedømme sannsynligheten for at differansen i de oppgitte preferansene kan skyldes rene tilfeldigheter. Hvis den sannsynligheten er tilstrekkelig liten, f eks mindre enn 5 %, har vi sannsynliggjort at det er en forskjell og at et representativt panel foretrekker den ene eller andre av testobjektene, og dermed forkastet nullhypotesen. So far, so good. Det er åpenbart litt krevende å sette opp en slik test, men det lar seg altså gjøre med nok tid og penger. (ref artikkelen Audio Science som jeg lenket til lengre oppe i tråden)

Validering av testprosedyren er noe annet. Anta at vi vil finne ut om den foreslåtte testprosedyren funker. Null-hypotesen vil da være at poengsettingen skyldes rene tilfeldigheter. Da vil fush' forslag om å blindteste en plate med Katie Melua mot en med Åge Aleksandersen være helt utmerket. Vi får testet avspillingsutstyret, knappen for å velge testobjekt A vs B, stemmegivningen og statistikken. Eller enda enklere, vi kunne teste en kabel mot ingen kabel. De fleste bør være i stand til å høre at det kommer musikk med bryteren i den ene stillingen, og ingen musikk med bryteren i den andre stillingen. Så samler vi sammen statistikken, og regner ut sannsynligheten for at dette resultatet (f eks 100 % gjenkjennelse av kabel vs ingen kabel) kunne oppstått ved rene tilfeldigheter. Hvis det viser seg at den sannsynligheten er større enn f eks 5 % , vet vi at det er noe fundamentalt galt noe sted, enten med det fysiske oppsettet av forsøket (virker bryteren?), med forsøkspersonens hørsel (stokk døv?), eller med antallet forsøk (2 riktige i 2 forsøk - ja, men det er 25 % sjanse for det også i myntkast). Hvis det derimot viser seg at forsøksoppsettet greier å gi et signifikant resultat, så må vi forkaste null-hypotesen - det er usannsynlig at dette resultatet skyldes rene tilfeldigheter, så testprosedyren synes å fungere.

Dessuten kan man rent analytisk beregne sannsynligheten for at et eksperiment skal være i stand til å avdekke en liten forskjell. Anta at forskjellen er så liten at jeg (eller du) vil legge merke til den 6 av 10 ganger i snitt. Altså en liten bias for den ene kabelen, kanskje avhengig av musikkstykke eller dagsform. Null-hypotesen er at det ikke er noen forskjell, altså 50/50 sjanse for at vi vil oppleve en forskjell. Gjør vi 10 forsøk og får de forventede 6 positive, så er det ikke signifikant. Det er hele 37 % sjanse for at dette kunne skjedd tilfeldig. Med 50 forsøk og 30 positive er det fortsatt 10% sjanse for at dette kunne skjedd helt tilfeldig. Først ved 80 forsøk og 48 positive er vi nede under 5 % sannsynlighet for at dette er ren tilfeldighet. Da kan vi "forkaste null-hypotesen med 95 % konfidens", som er en fancy måte å si at vi er rimelig sikre på at vi hørte forskjell. Og hvis forskjellen er mindre, dvs at antall positive blir nærmere og nærmere 50% av forsøkene, så må vi gjøre enda mye lengre forsøksserier for å kunne skille ut forskjellen fra bakgrunnsstøyen. I prinsippet kan vi skille ut hvor liten forskjell som helst, bare vi kan gjøre lang nok forsøksserie og det faktisk er en forskjell å skille ut. Likevel kan vi aldri helt utelukke at det kan være en forskjell, uansett hvor lang serie vi kjører. Vi har jo satt opp forsøket for å forsøke å utelukke at dette er likt, ikke motsatt.

Derfor kan en mer "vitenskapelig" formulering av Roysens synspunkt være at forskjellen mellom ulike kabler er så liten at det vil kreves en upraktisk lang forsøksserie for å skille den ut pålitelig i en blindtest. En annen tolkning kan være at det er kun utenomtekniske årsaker til at det oppleves en subjektiv forskjell, såsom pen innpakning, flott design, høy pris, placebo, eller hva som helst, og altså ikke signaloverføringen/lydkvaliteten. Det er i så fall et utsagn om forskjellen mellom testobjektene, ikke om testprosedyren som sådan. I begge tilfeller er det mange av oss som kan være enige...

Det vi derimot ikke kan gjøre er å blande sammen disse to forsøkene, ved f eks å "validere" prosedyren med omstridte testobjekter. Anta at jeg påstår at det er forskjell på to signalkabler, ja, en så elefantastisk stor forskjell et ethvert blikk-øre må høre det, og kanskje jeg til og med selger den beste av dem til en hungrende almue for a nominal service charge, so that you can reach Nirvana tonight. Hvis vi gjennomfører den første testen, og denne viser at testpanelet ikke kan høre forskjell, så kan vi ikke bruke dette resultatet til å forkaste testen, bare hypotesen om at det er en hørbar forskjell. Hvis vi gjennomfører det andre forsøket, og denne viser at testpanelet ikke kan høre om det står en kabel i eller ikke, så kan vi ikke bruke det resultatet til å forkaste den fantastiske signalkabelen, bare hypotesen om at testen funker. Blander vi disse to sammen, som visse debattanter inisterer på å gjøre, blir resultatet bare tøv.

Og siden det muligens vises til en tråd jeg startet for en stund siden:

For en tid tilbake var det temmelig stor enighet om at det var både målbare og hørbare ulikheter på kabler, men det var ikke enighet om at dette også gjaldt kabler som var konstruert for å være nøytrale.

Klikk for å utvide...

Hint: 300 W. På hvert diskantelement. Delefrekvens 1400 Hz. Byttet signalkabel. Over tid ble lyden litt mørkere. Etter hvert ble den mye mørkere, selv om samme signalkabel ble stående i. Til slutt ble det også påfallende mye forvrengning oppover i diskanten. Heller tvilsomt om det skyldtes innbrenning av kabelen. Tror heller det var noen høyttalerspoler som ble utbrent. Jeg skal poste en oppdatering til den tråden når jeg får byttet diskanter, forhåpentligvis senere denne uken.

Mye enklere å måle på signalet direkte. Tar maks 10 minutter (etter rigging), og resultatet er alltid korrekt - i allefall med minst 99,998474097810330357824063477531 % sansynlighet

Mvh.

Vidar

Asbjørn · 17.12.2007

Low-Q skrev:
Mye enklere å måle på signalet direkte. Tar maks 10 minutter (etter rigging), og resultatet er alltid korrekt - i allefall med minst 99,998474097810330357824063477531 % sansynlighet

Tja, +/- 1% er vel mer typisk på et multimeter (for ikke å snakke om en tommestokk). Men 99 eller 99,9984... % presisjon i signalmålingen - vi vet jo fortsatt ikke om det er hørbart og det er hva blindtesten forsøker å bringe på det rene.

EDIT: Men kanskje det er en naiv illusjon å tro at denne hobbyen dreier seg om å finne frem til best mulig lydkvalitet som et middel for å oppnå mest mulig musikkglede? I en tråd jeg har hatt gleden av å følge, hevdes det at strømkabler til 500 kr stykket er å "spare seg til fant", for gode strømkabler koster 7-8000 og deromkring. I en annen tråd var det et nytt medlem som tilsynelatende har en 13000-kroners signalkabel mellom to komponenter i 20-30000-kronersklassen, og spurte om han "trengte" enda en slik kabel for å koble til en tredje komponent i 20000-kronersklassen eller om han kunne "greie seg" med en til 7-8000. Når prisen på signalkablene begynner å nærme seg en tredjedel av hele anlegget, så er det fordundre meg ikke rart at enkelte har behov for å benekte at blindtester kan bidra til å avdekke hva som faktisk gjør en forskjell og hva som ikke gjør det.

Roysen · 17.12.2007

Soundproof skrev:
Det er ikke snakk om enten eller, men både og.

Man bruker både objektive og subjektive metoder for å måle komponenters ytelse.

Maksimal teknisk objektivitet får man ved kun å bruke måleinstrumenter.
Maksimal subjektivitet får man ved kun å bruke synsing.

Blindtest er en sammensmeltning av begge maxima, ved at man forsøker å introdusere en metode, ha kontroll med variabler og avgrense mulige feilkilder. Men det er faktiskt kvalifisert lytting, i motsetning til usystematisert synsing.

Det viser seg at mange påstander om komponenters uvurderlige bidrag til lydopplevelsen forsvinner ved kvalifisert lytting -- og det er det umulig å bare kimse av.

Roysens snakk om vingling er skinnmanøvrer. Hvorfor gjentar han ikke Lavignes test og protokoll, på eget utstyr i eget lytterom, med egen kabel mot Monsters ditto? Under kontrollerte former.
Roysen må jo være den bortimot beste til å ta en slik test, siden han er så skråsikker på forskjellene og har såpass bred erfaring med å vurdere lyd pga sine omfattende tweaks.

Du verden. Hvilke tweaks er det du snakker om egentlig?

Mvh
Roysen

Roysen · 17.12.2007

asbjbo skrev:
Hurra, en skikkelig krangletråd! Altfor lenge siden sist.

Altså, once more, from the top:

La oss anta at vi ønsker å finne ut om to bestemte signalkabler gir en hørbar forskjell for garvede audiofile lyttere. For å være enda mer konkret, anta at kabel A er dyrere enn kabel B, og hevdes å gi en forbedring som forsvarer denne prisen. Null-hypotesen er da at eventuell opplevd forskjell skyldes tilfeldigheter eller andre årsaker som ikke har med selve lydkvaliteten å gjøre. Vi prøver å konstruere et eksperiment som skal avkrefte denne hypotesen. En mulig testprosedyre er å samle sammen et representativt panel av audiofile personer, sette opp et anlegg som antas å være tilstrekkelig følsomt til å kunne gjengi den typen forskjeller som det er snakk om, og gjennomføre en randomisert dobbelt-blind A/B-test. Hver enkelt forsøksperson ville da høre på et musikkstykke gjennom hver av de to kablene, i tilfeldig rekkefølge, for så å skrive ned sin preferanse. A eller B, evt ingen forskjell. Legg merke til at disse forsøkspersonene ikke må være forstokkede skeptikere, som visstnok bare vil stikke fingrene i øra, synge "lalalala" og krysse av for "ingen forskjell" hver gang. Påstås det. Derfor er f eks Roysen og Espen R mye bedre egnet som forsøkspersoner enn f eks knutinh og meg. Hverken forsøksperson eller den som overvåker testen skal vite hvilket testobjekt som står i. For å redusere "stress", bør omgivelsene være behagelige og forsøket gjennomføres uten tidspress. Helst bør forsøkspersonen selv få lov til å styre switching mellom de to testobjektene, frem og tilbake så mange ganger som nødvendig for å gjøre seg opp en mening. Siden det sannsynligvis dreier seg om små forskjeller mellom testobjektene, vil det være nødvendig å gjenta forsøket et betydelig antall ganger med forskjellige forsøkspersoner og forskjellige musikkstykker. Dessuten bør hver forsøksperson gjenta forsøket et antall ganger. Oppløsningen i forsøket vil øke med økende antall forsøk - selv ørsmå forskjeller vil bli avdekket hvis vi kan gjenta eksperimentet tilstrekkelig mange ganger, f eks noen millioner enkeltforsøk. Så får man gjøre opp statistikken til slutt og bedømme sannsynligheten for at differansen i de oppgitte preferansene kan skyldes rene tilfeldigheter. Hvis den sannsynligheten er tilstrekkelig liten, f eks mindre enn 5 %, har vi sannsynliggjort at det er en forskjell og dermed forkastet nullhypotesen. So far, so good. Det er åpenbart litt krevende å sette opp en slik test, men det lar seg altså gjøre med nok tid og penger. (ref artikkelen Audio Science som jeg lenket til lengre oppe i tråden)

Validering av testprosedyren er noe annet. Anta at vi vil finne ut om den foreslåtte testprosedyren funker. Null-hypotesen vil da være at poengsettingen skyldes rene tilfeldigheter. Da vil fush' forslag om å blindteste en plate med Katie Melua mot en med Åge Aleksandersen være helt utmerket. Vi får testet avspillingsutstyret, knappen for å velge testobjekt A vs B, stemmegivningen og statistikken. Eller enda enklere, vi kunne teste en kabel mot ingen kabel. De fleste bør være i stand til å høre at det kommer musikk med bryteren i den ene stillingen, og ingen musikk med bryteren i den andre stillingen. Så samler vi sammen statistikken, og regner ut sannsynligheten for at dette resultatet (f eks 100 % gjenkjennelse av kabel vs ingen kabel) kunne oppstått ved rene tilfeldigheter. Hvis det viser seg at den sannsynligheten er større enn f eks 5 % , vet vi at det er noe fundamentalt galt noe sted, enten med det fysiske oppsettet av forsøket (virker bryteren?), med forsøkspersonens hørsel (stokk døv?), eller med antallet forsøk (2 riktige i 2 forsøk - ja, men det er 25 % sjanse for det også i myntkast). Hvis det derimot viser seg at forsøksoppsettet greier å gi et signifikant resultat, så må vi forkaste null-hypotesen - det er usannsynlig at dette resultatet skyldes rene tilfeldigheter, så testprosedyren synes å fungere.

Dessuten kan man rent analytisk beregne sannsynligheten for at et eksperiment skal være i stand til å avdekke en liten forskjell. Anta at forskjellen er så liten at jeg (eller du) vil legge merke til den 6 av 10 ganger i snitt. Altså en liten bias for den ene kabelen, kanskje avhengig av musikkstykke eller dagsform. Null-hypotesen er at det ikke er noen forskjell, altså 50/50 sjanse for at vi vil oppleve en forskjell. Gjør vi 10 forsøk og får de forventede 6 positive, så er det ikke signifikant. Det er hele 37 % sjanse for at dette kunne skjedd tilfeldig. Med 50 forsøk og 30 positive er det fortsatt 10% sjanse for at dette kunne skjedd helt tilfeldig. Først ved 80 forsøk og 48 positive er vi nede under 5 % sannsynlighet for at dette er ren tilfeldighet. Da kan vi "forkaste null-hypotesen med 95 % konfidens", som er en fancy måte å si at vi er rimelig sikre på at vi hørte forskjell. Og hvis forskjellen er mindre, dvs at antall positive blir nærmere og nærmere 50% av forsøkene, så må vi gjøre enda mye lengre forsøksserier for å kunne skille ut forskjellen fra bakgrunnsstøyen. I prinsippet kan vi skille ut hvor liten forskjell som helst, bare vi kan gjøre lang nok forsøksserie og det faktisk er en forskjell å skille ut. Likevel kan vi aldri helt utelukke at det kan være en forskjell, uansett hvor lang serie vi kjører. Vi har jo satt opp forsøket for å forsøke å utelukke at dette er likt, ikke motsatt.

Derfor kan en mer "vitenskapelig" formulering av Roysens synspunkt være at forskjellen i lydkvalitet mellom ulike kabler er så liten at det vil kreves en upraktisk lang forsøksserie for å skille den ut pålitelig i en blindtest. En annen tolkning kan være at det er kun utenomtekniske årsaker til at det oppleves en subjektiv forskjell, såsom pen innpakning, flott design, høy pris, placebo, eller hva som helst, og altså ikke signaloverføringen/lydkvaliteten. Det er i så fall et utsagn om forskjellen mellom testobjektene, ikke om testprosedyren som sådan. I begge tilfeller er det mange av oss som kan være enige...

Det vi derimot ikke kan gjøre er å blande sammen disse to forsøkene, ved f eks å "validere" prosedyren med omstridte testobjekter. Anta at jeg påstår at det er forskjell på to signalkabler, ja, en så elefantastisk stor forskjell et ethvert blikk-øre må høre det, og kanskje jeg til og med selger den beste av dem til en hungrende almue for a nominal service charge, so that you can reach Nirvana tonight. Hvis vi gjennomfører den første testen, og denne viser at testpanelet ikke kan høre forskjell, så kan vi ikke bruke dette resultatet til å forkaste testen, bare hypotesen om at det er en hørbar forskjell. Hvis vi gjennomfører det andre forsøket, og denne viser at testpanelet ikke kan høre om det står en kabel i eller ikke, så kan vi ikke bruke det resultatet til å forkaste den fantastiske signalkabelen, bare hypotesen om at testen funker. Blander vi disse to sammen, som visse debattanter insisterer på å gjøre, blir resultatet bare tøv.

Og siden det muligens vises til en tråd jeg startet for en stund siden:

For en tid tilbake var det temmelig stor enighet om at det var både målbare og hørbare ulikheter på kabler, men det var ikke enighet om at dette også gjaldt kabler som var konstruert for å være nøytrale.

Klikk for å utvide...

Hint: 300 W. På hvert diskantelement. Delefrekvens 1400 Hz. Byttet signalkabel. Over tid ble lyden litt mørkere. Etter hvert ble den mye mørkere, selv om samme signalkabel ble stående i. Til slutt ble det også påfallende mye forvrengning oppover i diskanten. Heller tvilsomt om det skyldtes innbrenning av kabelen. Tror heller det var noen høyttalerspoler som ble utbrent. Jeg skal poste en oppdatering til den tråden når jeg får byttet diskanter, forhåpentligvis senere denne uken.

EDIT: Korrigert ihht korreks fra KJ, se nedenfor.

Jeg synes du glemmer et par vesentlige ting. For det første har ikke jeg hevdet at forskjellene på kabler er enorme eller lette å høre eller at kabler er verdt prisen. Jeg har kun hevdet at jeg opplever forskjeller og er overbevist om at de er reelle. Min hypotse er at blindtesten ikke er god nok for slike små nyanser. Dersom du spiller Katie Melua mot Åge Aleksandersen - har du da verifisert at blindtesten er egnet til å avdekke slike nyanser?
Mvh
Roysen

Asbjørn · 17.12.2007

Roysen skrev:
Jeg synes du glemmer et par vesentlige ting. For det første har ikke jeg hevdet at forskjellene på kabler er enorme eller lette å høre eller at kabler er verdt prisen. Jeg har kun hevdet at jeg opplever forskjeller og er overbevist om at de er reelle. Min hypotse er at blindtesten ikke er god nok for slike små nyanser. Dersom du spiller Katie Melua mot Åge Aleksandersen - har du da verifisert at blindtesten er egnet til å avdekke slike nyanser?

Godt poeng. Nei, det er slett ikke verifisert, bare at mekanikken funker.

Det neste spørsmålet er hvor små nyanser det er snakk om, i form av sannsynligheten for at en audiofil person vil høre den samme forskjellen i en slik blind lyttetest, for det vil bestemme hvor mange forsøk som må gjøres før du kan forvente et gyldig resultat.

Jeg viste noen eksempler på det. Hvis vi antar 60% sjanse for å høre forskjell, så bør vi sette opp et eksperiment med minst 80 forsøk og kreve 48 positive for å gi karakteren "bestått". Hvis vi derimot antar 55 % sjanse, så må vi gjøre minst 300 forsøk og kreve 165 positive. Hvis vi antar 53 %, trenger vi 780 forsøk og krever 413 positive. Hvis vi antar 52,7%, trenger vi 1000 forsøk og krever 527 positive. Og så videre. Hvis hvert forsøk f eks kan ta 5 minutter kommer vi fort opp i en uke eller to bare for gjennomføring av testen. Og dette må man bestemme seg for på forhånd, for det holder ikke å teste til det tilfeldigvis er et "signifikant" resultat og så avbryte testen der.

Men dette sier altså ingen ting om testen som sådan, bare om at vi snakker om så små forskjeller at de ligger nær grensen for hva vi kan sanse med god repeterbarhet, og at vi derfor må kjøre en lang forsøksserie for å kunne gi et noenlunde sikkert svar. Som sagt, utsagnet "blindtesten er ikke egnet til å avdekke denne typen forskjeller" kan enten bety at "forskjellene er så små at deteksjon er svært usikkert i hvert lytteforsøk, og det vil derfor trengs et upraktisk antall lytteforsøk til å verifisere det" eller at "de subjektivt opplevde forskjellene skyldes andre forhold enn lydkvalitet". Begge deler er forsåvidt greie utsagn hvis man f eks vurderer hvor man skal legge pengene for den neste utstyrsoppgraderingen.

Testen funker den, forutsatt at man har en klar idé om hva man forsøker å teste og setter opp forsøket deretter.

Vidar Øierås · 17.12.2007

asbjbo skrev:
Low-Q skrev:

Mye enklere å måle på signalet direkte. Tar maks 10 minutter (etter rigging), og resultatet er alltid korrekt - i allefall med minst 99,998474097810330357824063477531 % sansynlighet

Klikk for å utvide...

Tja, +/- 1% er vel mer typisk på et multimeter (for ikke å snakke om en tommestokk). Men 99 eller 99,9984... % presisjon i signalmålingen - vi vet jo fortsatt ikke om det er hørbart og det er hva blindtesten forsøker å bringe på det rene.

EDIT: Men kanskje det er en naiv illusjon å tro at denne hobbyen dreier seg om å finne frem til best mulig lydkvalitet som et middel for å oppnå mest mulig musikkglede? I en tråd jeg har hatt gleden av å følge, hevdes det at strømkabler til 500 kr stykket er å "spare seg til fant", for gode strømkabler koster 7-8000 og deromkring. I en annen tråd var det et nytt medlem som tilsynelatende har en 13000-kroners signalkabel mellom to komponenter i 20-30000-kronersklassen, og spurte om han "trengte" enda en slik kabel for å koble til en tredje komponent i 20000-kronersklassen eller om han kunne "greie seg" med en til 7-8000. Når prisen på signalkablene begynner å nærme seg en tredjedel av hele anlegget, så er det fordundre meg ikke rart at enkelte har behov for å benekte at blindtester kan bidra til å avdekke hva som faktisk gjør en forskjell og hva som ikke gjør det.

En toleranse på måleutstyret på 1% kan likevel verifisere forskjeller på langt under 1% variasjon. Måleutstyret med denne toleransen viser alltid feil på 1% i samme retning - hver gang, men viser i snitt 1% feil i én eller annen retning tatt flere multimetere i betraktning. Å benytte samme multimeter for alle målingene er altså cluet.

Så for å ikke lete etter absolutte størrelser, men kun verifisere avvik, kan måleutstyret ha så store toleranser som helst uten at det går utover måledifferansen man sitter igjen med. Det finnes jo også flere måleapparater og målemetoder mellom himmel og jord enn ved bruk av multimetere

Vidar

loFi · 17.12.2007

Til Knutinh, Soundproof og andre som prøver å forsvare blindtester i forumet: Dere kjemper en forgjeves kamp, dere vil aldri nå fram. Den dagen hi-fi fansen aksepterer resultatene fra blindtester er det slutt på hifi som hobby og bransje (i sin nåværende form). Resultatene fra disse testene er jo ytterst deprimerende for de som digger dingser og duppeditter; med unntak av høyttalere låter jo nesten alt likt og fancy kabler har null effekt. Trist men sant.

tom-a · 17.12.2007

Krangling? ja, da må man jo være med...

Når sant skal sies har jeg ikke så mye praktisk erfaring med blindtesting, men kan selvfølgelig mene mye om temaet her fra sofaen lyttende til han Elias Akselsen og her kommer dine arme små også så sant som det bare kan sies ved juletider!

Min enkle filosofi er at hvis blindtestens resultat ender med at det ikke er forskjell på det meste, så forekommer resultatet meg å være galt siden det ikke stemmer overens med mine egne lyttererfaringer. Enkelt? Ja. Selvsagt temmelig uvitenskapelig sagt, ignorant som jeg er for de kalde vitenskapelige fakta som dunkes i bordet, gang på gang akkompagnert av det Sandemoseiske mantra du skal ikke tro at du hører.., et cetera, et cetera - du er en selvforfører, en målbærer av den uklare logiske tanke, den urene subjektivitet.

Dette får det jo nesten til å høres ut som om at der vitenskapen ikke er enig med meg, så får vi bøyen den til slik at den vil passe med egen sanseverden. Ja....., er det ikke det menneskene har drevet med ganske lenge for å finne de faktiske sammenhenger? For hvis vi ikke benytter menneskers sanser som referanse for det som dreier seg om menneskers sanseopplevelser, hva får vi egentlig da? Virkelighet eller pseudovirkelighet?

Jeg synes dette er en mye mer fruktbar vei å gå enn å si at det som blindtesten ikke kan bevise, ikke vitenskapelig eksisterer og derfor heller ikke kan eksistere for lytteren på en konsistent måte, reelt sett. Hvorfor? Fordi blindtesting ikke nødvendigvis er korrekt vitenskap i alle sammenhenger. Blindtesting er en vitenskapelig metode, ja, men dens utsagnskraft antar at:

- Lytteren er en konsistent og kontinuerlig likt kalibrert innretning under blindtestens
gjennomføring (i forhold til hans erfarte lytterinntrykk).

Altså: Hvis denne forutsetningen ikke holder, faller resultatets utsagnskraft.

Jeg synes at målerne glemmer å tenke på denne forutsetningen - lytterens kvalitet individet med ører og en fungerende hjerne. Hjernen er etter det jeg forstår både en analytiker, en multi-korreksjonsmekaniker, en følsom dåre for musikkens referanser, en stresset og prestasjonsorientert dåre, en selvillusjonist. Kan vi kalle lytteren en kontinuerlig likt kalibrert innretning under en blindtest? Hvilke hjerneprosesser pågår egentlig?

Det ligger her en iboende selvmotsigende i målernes argumentasjon altså: Først mener man meget tydelig at lytteren er en subjektiv innretning som lar seg bedra av ingenting, men forutsetter så at han som lytter under blindtesten oppfører seg konsekvent for å kunne argumentere resultatet. Altså: Om det er slik at lytteren under testen oppfører seg som et instrument som for hver testsekvens kalibreres forskjellig, hvilken utsagnskraft har så testen? Ikke annet enn at en lytter under slike omstendigheter er en labil innretning. At blindtesten ikke er egnet for lytterens funksjonalitet.

Men for at en slik vinkling skal ha en praktisk mening, må det finnes omstendigheter hvor lytteren faktisk oppfører seg konsekvent. Det tror jeg han gjør under langtidslytting. Et plutselig bytte av f.eks. kabel vil man da kunne høre ganske umiddelbart, gitt min erfaring (dog lyder enkelte kabler også ganske likt, så man skal aldri si alltid).

Mvh,

tom-a

Asbjørn · 18.12.2007

tom-a skrev:
Blindtesting er en vitenskapelig metode, ja, men dens utsagnskraft antar at:

- Lytteren er en konsistent og kontinuerlig likt kalibrert innretning under blindtestens
gjennomføring (i forhold til hans erfarte lytterinntrykk).

Altså: Hvis denne forutsetningen ikke holder, faller resultatets utsagnskraft.

Jeg synes at målerne glemmer å tenke på denne forutsetningen - lytterens kvalitet individet med ører og en fungerende hjerne. Hjernen er etter det jeg forstår både en analytiker, en multi-korreksjonsmekaniker, en følsom dåre for musikkens referanser, en stresset og prestasjonsorientert dåre, en selvillusjonist. Kan vi kalle lytteren en kontinuerlig likt kalibrert innretning under en blindtest? Hvilke hjerneprosesser pågår egentlig?

Det ligger her en iboende selvmotsigende i målernes argumentasjon altså: Først mener man meget tydelig at lytteren er en subjektiv innretning som lar seg bedra av ingenting, men forutsetter så at han som lytter under blindtesten oppfører seg konsekvent for å kunne argumentere resultatet. Altså: Om det er slik at lytteren under testen oppfører seg som et instrument som for hver testsekvens kalibreres forskjellig, hvilken utsagnskraft har så testen? Ikke annet enn at en lytter under slike omstendigheter er en labil innretning. At blindtesten ikke er egnet for lytterens funksjonalitet.

Nei! Det er faktisk motsatt. Blindtest som metode går ut fra at sanseopplevelsen er subjektiv og usikker, at ulike lyttere kan få ulik subjektiv opplevelse, og at den samme lytteren kan oppleve det samme fenomenet ulikt fra gang til gang. Det er selve poenget. Det kreves ingen argumentasjon eller begrunnelse, ikke at lytteren på noen måte skal gjette "riktig" eller "forsvare" det svaret vedkommende lander på, bare å svare så oppriktig som mulig på et enkelt spørsmål av typen "Hører du noen forskjell mellom disse to?" eller "Foretrekker du A eller B?" Det er derfor man gjør en hel serie forsøk for å se om det er noen statistiske mønstre i resultatet, sånn at det eventuelle "signalet" trer frem fra "støyen". Hadde det vært som du tror, at metoden forutsatte en maskinmessig lytter, så hadde det jo vært tilstrekkelig med en lytter og ett forsøk - og dett var dett.

Dette er basics, og jeg blir litt oppgitt når folk setter det sånn på hodet (men det var et riktig velskrevet innlegg, så det finnes fortsatt håp for menneskene). Les denne artikkelen + mine to-tre siste innlegg om igjen, og se om du begriper litt mer.
http://www.harman.com/wp/pdf/AudioScience.pdf
http://www.hifisentralen.no/forum/index.php/topic,18525.msg356093.html#msg356093
http://www.hifisentralen.no/forum/index.php/topic,18525.msg356302.html#msg356302

Soundproof · 18.12.2007

tom-a skrev:
Min enkle filosofi er at hvis blindtestens resultat ender med at det ikke er forskjell på det meste, så forekommer resultatet meg å være galt siden det ikke stemmer overens med mine egne lyttererfaringer.

Dette syns jeg ikke er uvitenskapelig sagt i det hele tatt.
Vi må skjelne mellom kvalitetskomponenter og sub-standard komponenter. Det er forskjell på høyttalere med SEAS drivere og dusinvare, naturligvis.

MEN - kanskje når vi hurtigere "taket" der sanseapparatet vårt har vansker med å skjelne enn vi tror? Tenk på Stereophiles reaksjon da de første gang testet Benchmarks DAC1. Det fikk Lavry til å se rødt da Atkinson (om jeg husker rett) skrev at Benchmark presterte hva en Lavry DAC til 40.000 USD evnet.
Det provoserte forøvrig Lavry til å lage LAVRY DA10 for å demonstrere Benchmarks svakheter. Uansett viste Benchmark, Atkinson og Lavry at det er mulig å spare 39.000 dollar, og likevel få high-end lyd.

Nå har denne tråden utviklet seg til at "det ikke er forskjell på noe." Jeg har henvist til AudioCritics synspunkter som en ytterlighet, ikke som dogma. Dersom det ikke var forskjell på noe kunne jeg jammen spart meg en del kroner - i rommet jeg sitter mens jeg skriver dette har jeg brukt så det holder på komponenter jeg mener er viktige og med avgjørende lydproduksjon.

Soundproof · 18.12.2007

Ellers må jeg støtte asbjbos innvending mot din påstand om at lytteren skal være rene metronomen for at blindtesten skal ha gyldighet. Tvert i mot, og det er her motstanderne mot blindtester tydeligvis ikke ser hva det er disse testene egentlig går ut på:

1. Subjektiv vurdering av stimuli.
2. Systematisert slik at man får et vurderingsgrunnlag
3. Som er statistisk signifikant i slik grad at man kan si resultatet er mer enn synsing.

Og i det ligger et paradoks, man bruker synsing for å kunne si noe om testvariabelen som ikke er synsing. Og det oppnår man ved gjentagelse, og ved å holde seg til en streng protokoll for å sikre at hver testgjennomgang er mest mulig lik de øvrige.
Det er kun når man overholder en slik protokoll, og denne er godt designet, at man løfter synsingen fra å være gjetning til å kunne være et kvalifisert vurderingsgrunnlag.

(I så måte vil jeg også kritisere asbjbo litt, som i et tidligere innlegg mente at hver testperson skulle kunne skifte så mange ganger som ønsket mellom A og B før man avga en vurdering. Den slags fleksibilitet innfører en ulikhet mellom testpersoners eksponering overfor stimuli. Det kan man ta høyde for, men er sannsynligvis unødvendig, dersom man har tilstrekkelig mange testsubjekter.)

realist · 18.12.2007

Soundproof skrev:
tom-a skrev:

Min enkle filosofi er at hvis blindtestens resultat ender med at det ikke er forskjell på det meste, så forekommer resultatet meg å være galt siden det ikke stemmer overens med mine egne lyttererfaringer.

Klikk for å utvide...

Dette syns jeg ikke er uvitenskapelig sagt i det hele tatt.
Vi må skjelne mellom kvalitetskomponenter og sub-standard komponenter. Det er forskjell på høyttalere med SEAS drivere og dusinvare, naturligvis.

MEN - kanskje når vi hurtigere "taket" der sanseapparatet vårt har vansker med å skjelne enn vi tror? Tenk på Stereophiles reaksjon da de første gang testet Benchmarks DAC1. Det fikk Lavry til å se rødt da Atkinson (om jeg husker rett) skrev at Benchmark presterte hva en Lavry DAC til 40.000 USD evnet.
Det provoserte forøvrig Lavry til å lage LAVRY DAC10 for å demonstrere Benchmarks svakheter. Uansett viste både Benchmark, Atkinson og Lavry at det er mulig å spare 39.000 dollar, og likevel få high-end lyd.

Nå har denne tråden utviklet seg til at "det ikke er forskjell på noe." Jeg har henvist til AudioCritics synspunkter som en ytterlighet, ikke som dogma. Dersom det ikke var forskjell på noe kunne jeg jammen spart meg en del kroner - i rommet jeg sitter mens jeg skriver dette har jeg brukt så det holder på komponenter jeg mener er viktige og med avgjørende lydproduksjon.

Kunne ikke la være

http://studioforums.com/eve/forums/a/tpc/f/694106689/m/6611090261

knutinh · 18.12.2007

loFi skrev:
Til Knutinh, Soundproof og andre som prøver å forsvare blindtester i forumet: Dere kjemper en forgjeves kamp, dere vil aldri nå fram.

Meget mulig.

Den dagen hi-fi fansen aksepterer resultatene fra blindtester er det slutt på hifi som hobby og bransje (i sin nåværende form).

Jeg tror ikke at det er slutt på hifi som hobby. Hvis hobbyen og bransjen endrer seg (ikke lengre blir i sin nåværende form) så ser jeg ikke på det som ensidig negativt.

Resultatene fra disse testene er jo ytterst deprimerende for de som digger dingser og duppeditter; med unntak av høyttalere låter jo nesten alt likt og fancy kabler har null effekt. Trist men sant.

Jeg har et litt annet syn: Dersom man fjerner snake-oil og svindel, dersom synsing ikke lengre oppheves til alternativ-vitenskaplig sannhet, så vil jeg personlig få bedre lyd på stua. Dette er muligens en stormannsgal plan, men jeg mener at produsentene av hifi lever i et reelt marked, hvor de må levere de varene kundene vil ha. Når kundene er opptatt av alt mulig tullball i stedetfor god lyd, så gir det oss tullballprodukter i stedetfor god lyd. Jeg er bare en av mange kunder, følgelig har jeg ikke så mye valg annet enn å kjøpe produkter i samme marked.

Jeg mener at det finnes uante muligheter til å pøse penger inn i hifi på ting som i det minste har en viss betydning, hvis det er det du ønsker. Og uansett så vil vi jo alle ha pene bokser og pene møbler, noe som alltid vil koste penger.

Det at høyttalere gir bekreftede forskjeller i blindtester mens andre ting ikke gir det, er jo fantastisk. Både får vi bekreftet at valg av komponenter kan bety noe (i det minste høyttalere - og rom), og vi får en viss indikasjon på at valg av høyttalere er mer kritisk enn valg av andre komponenter.

Jeg forstår ikke hvordan man kan prøve å kneble slik informasjon, eller irritere seg over den. Man kan dog velge å forbigå den i stillhet hvis man mener at den ikke har betydning for ens egne valg.

-k

Vegardaase · 18.12.2007

Jeg synes det har kommet mye gode og forhåpentligvis oppklarende innlegg i denne tråden.

knutinh skrev:
Jeg har et litt annet syn: Dersom man fjerner snake-oil og svindel, dersom synsing ikke lengre oppheves til alternativ-vitenskaplig sannhet, så vil jeg personlig få bedre lyd på stua. Dette er muligens en stormannsgal plan, men jeg mener at produsentene av hifi lever i et reelt marked, hvor de må levere de varene kundene vil ha. Når kundene er opptatt av alt mulig tullball i stedetfor god lyd, så gir det oss tullballprodukter i stedetfor god lyd. Jeg er bare en av mange kunder, følgelig har jeg ikke så mye valg annet enn å kjøpe produkter i samme marked.

Dette er akkurat slik jeg tenker selv. Om markedet forsvinner for ting som med stor sannsynlighet ikke gir noen lydmessig gevinst og produsentene konsentrerer seg om parametre som sannsynligvis gir større effekt, sier det seg selv at resultatet burde bli mye bedre. Til glede for alle som er glad i god lyd.

Soundproof · 18.12.2007

Greven skrev:
Jeg synes det har kommet mye gode og forhåpentligvis oppklarende innlegg i denne tråden.

knutinh skrev:

Jeg har et litt annet syn: Dersom man fjerner snake-oil og svindel, dersom synsing ikke lengre oppheves til alternativ-vitenskaplig sannhet, så vil jeg personlig få bedre lyd på stua. Dette er muligens en stormannsgal plan, men jeg mener at produsentene av hifi lever i et reelt marked, hvor de må levere de varene kundene vil ha. Når kundene er opptatt av alt mulig tullball i stedetfor god lyd, så gir det oss tullballprodukter i stedetfor god lyd. Jeg er bare en av mange kunder, følgelig har jeg ikke så mye valg annet enn å kjøpe produkter i samme marked.

Klikk for å utvide...

Dette er akkurat slik jeg tenker selv. Om markedet forsvinner for ting som med stor sannsynlighet ikke gir noen lydmessig gevinst og produsentene konsentrerer seg om parametre som sannsynligvis gir større effekt, sier det seg selv at resultatet burde bli mye bedre. Til glede for alle som er glad i god lyd.

Kan ikke annet enn samstemme. Utfordringen er at det som regel er enorme marginer å tjene på tullballprodukter -- legg merke til at disse nesten uten unntak ikke inneholder elektronikk av betydning, men er ment som supplement til komponentene, eller tjener til å forbinde disse.
Der selve komponentene krever innsats og innsikt for å være på state-of-the-art nivå, så er det langt mindre som går inn i en kabel enn det entusiastene tror; og i veldig mange tilfeller så produseres disse i bulk og rebadges av påstått "produsent" før den når hyllen du finner den i.
Dette gjelder matter og steiner og vibrasjonsfrie bord, osv.

For meg handler det om relevant ytelse i forhold til lyden jeg ønsker å oppnå, ikke om tweaks til flere hundre tusen kroner som forklares med knoting på en serviett.

Kom over en liten anekdote som jeg syns sa alt. En hi-fi entusiast hadde fått inn noen ordentlig gromme komponenter og var ferdig med tweakingen. Han fikk inn en kompis som var musiker og ville ha dennes inntrykk. Da musikkstykket var over sier musikeren:
"Han dirigerer det stykket betraktelig hurtigere enn Karajan."

Roysen · 18.12.2007

asbjbo skrev:
Roysen skrev:

Jeg synes du glemmer et par vesentlige ting. For det første har ikke jeg hevdet at forskjellene på kabler er enorme eller lette å høre eller at kabler er verdt prisen. Jeg har kun hevdet at jeg opplever forskjeller og er overbevist om at de er reelle. Min hypotse er at blindtesten ikke er god nok for slike små nyanser. Dersom du spiller Katie Melua mot Åge Aleksandersen - har du da verifisert at blindtesten er egnet til å avdekke slike nyanser?

Klikk for å utvide...

Godt poeng. Nei, det er slett ikke verifisert, bare at mekanikken funker.

Det neste spørsmålet er hvor små nyanser det er snakk om, i form av sannsynligheten for at en audiofil person vil høre den samme forskjellen i en slik blind lyttetest, for det vil bestemme hvor mange forsøk som må gjøres før du kan forvente et gyldig resultat.

Jeg viste noen eksempler på det. Hvis vi antar 60% sjanse for å høre forskjell, så bør vi sette opp et eksperiment med minst 80 forsøk og kreve 48 positive for å gi karakteren "bestått". Hvis vi derimot antar 55 % sjanse, så må vi gjøre minst 300 forsøk og kreve 165 positive. Hvis vi antar 53 %, trenger vi 780 forsøk og krever 413 positive. Hvis vi antar 52,7%, trenger vi 1000 forsøk og krever 527 positive. Og så videre. Hvis hvert forsøk f eks kan ta 5 minutter kommer vi fort opp i en uke eller to bare for gjennomføring av testen. Og dette må man bestemme seg for på forhånd, for det holder ikke å teste til det tilfeldigvis er et "signifikant" resultat og så avbryte testen der.

Men dette sier altså ingen ting om testen som sådan, bare om at vi snakker om så små forskjeller at de ligger nær grensen for hva vi kan sanse med god repeterbarhet, og at vi derfor må kjøre en lang forsøksserie for å kunne gi et noenlunde sikkert svar. Som sagt, utsagnet "blindtesten er ikke egnet til å avdekke denne typen forskjeller" kan enten bety at "forskjellene er så små at deteksjon er svært usikkert i hvert lytteforsøk, og det vil derfor trengs et upraktisk antall lytteforsøk til å verifisere det" eller at "de subjektivt opplevde forskjellene skyldes andre forhold enn lydkvalitet". Begge deler er forsåvidt greie utsagn hvis man f eks vurderer hvor man skal legge pengene for den neste utstyrsoppgraderingen.

Testen funker den, forutsatt at man har en klar idé om hva man forsøker å teste og setter opp forsøket deretter.

Hvor små nyansene er avhenger av individet og ikke bare det men det er også situasjonsavhenig. Som Tom-a her beskriver er ikke hjernen en stabil upåvirkelig entitet. Dette har jeg forsøkt å påpeke en rekke ganger med mine hentydninger til kjent rom, kjent musikk, stress etc. etc. Uansett hvor godt man forbereder seg for å utelukke slike påvirkningsfaktorer vil ikke hjernen være helt stabil og det kan påvirke resultatet på en blindtest like mye som ved seende lytting.

Svaret fra målemafiaen på dette er at mange nok iterasjoner av testen er nok for å skaffe et vitenskapelig grunnlag hvor man kan beregne påvirkningsfaktoren og dermed ta hensyn til den når man beregner resultatet. Dette er sikkert korrekt, men uansett hvor mange iterasjoner man foretar av testen vil testen kun være gyldig for de to testobjektene man benytter. Man kan ikke generalisere resultatet for alle objekter av samme type som testobjektene.

Av den grunn hjelper all verdens blindtester for å finne ut om det er forskjell på Transparent Opus og Monster svært lite når jeg står i butikken og skal vurdere om jeg skal kjøpe en Tara Labs eller Wireworld kabel som er i mitt prisleie. Jeg kan selvfølgelig ta med meg begge hjem og kjøre blindtester, men hvor mange blindtester må jeg da utføre for at grunnlaget skal være så pålitelig at man kan ved kalkulasjon utelukke påvirkningsfaktorene og er dette praktisk mulig ved hjemlån eller enda verre dersom man ikke får love å låne hjem av butikken?

Det samme gjelder dersom magasinene skal utføre blindtester på sine testobjekter. Antall iterasjoner en slik test må gjennom er så stort for at blindtesten skal ha den ønskede effekten (å utelukke yttre påvirkningsfaktoerer) at dette ikke lar seg praktisk gjennomføre. Jeg synes det er fullstendig tull å anbefale Fidelity å innføre blindtester og hevde at de ikke er troverdige dersom de ikke gjøre det. Faktisk så er det slik at ved å innføre blindtester og ikke gjøre dette grundig nok kan villede mer enn rettlede ved at det skaper en illusjon av at man har gått vitenskapelig til verks for å finne en løsning når testgrunnlaget er alt for lite til å kunne foreta noen gode konklusjoner.

Så konklusjonen kan ikke bli noen annen enn at blindtester ikke er egnet for å evaluere hi-fi utstyr.

Mvh
Roysen

knutinh · 18.12.2007

Roysen skrev:
Det samme gjelder dersom magasinene skal utføre blindtester på sine testobjekter. Antall iterasjoner en slik test må gjennom er så stort for at blindtesten skal ha den ønskede effekten (å utelukke yttre påvirkningsfaktoerer) at dette ikke lar seg praktisk gjennomføre.

20 iterasjoner er nok. Dersom man greier å plukke ut A kontra B på 16-17 av disse så har man et godt utgangspunkt for å si at hørbar forskjell er sannsynlig i akkurat denne settingen.

Dersom man greier færre treff så vet man ikke om det er en hørbar forskjell.

Dersom hypotesen er at forskjellen er så fantastisk liten at man "egentlig" hører forskjell bare 1 av 100 ganger så burde man være såpass ærlig at man skrev det i magasinet. "Denne forsterkeren er utrolig bra, men hvis det ikke var for at man så på forsterkerfronten så tror vi at man 99 av 100 ganger ikke ville høre pøkk forskjell"

Dersom man skal si noe om hvordan det vil låte i andre settinger så må man "ekstrapolere" uansett om man tester blindt eller seende - det er et selvstendig problem.

Roysen skrev:
Så konklusjonen kan ikke bli noen annen enn at blindtester ikke er egnet for å evaluere hi-fi utstyr.

For fjerde gang i denne tråden:
Hvorfor synes JAES å mene noe annet?

-k

Endelig: Blindtester kan sies å ha mistet all troverdighet

Roysen

Gjest

Hi-Fi freak

kbwh

Gjest

Æresmedlem

Roysen

Gjest

Roysen

Gjest

knutinh

Gjest

Roysen

Gjest

knutinh

Gjest

Roysen

Gjest

knutinh

Gjest

Roysen

Gjest

knutinh

Gjest

Hi-Fi freak

Hi-Fi freak

Rubinmedlem

Hi-Fi freak

Æresmedlem

Hi-Fi freak

Hi-Fi freak

knutinh

Gjest

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

Rubinmedlem

Roysen

Gjest

Roysen

Gjest

Rubinmedlem

Hi-Fi freak

loFi

Gjest

Hi-Fi entusiast

Rubinmedlem

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

knutinh

Gjest

Hi-Fi freak

Hi-Fi freak

Roysen

Gjest

knutinh

Gjest