tom-a skrev:
Nå synes jeg du reduserer mitt resonnement unødvendig bli nå ikke så besnæret av blindtestens iboende vesen at du ikke ser skogen for bare trær. Nå frister du meg til å si at det er du som ikke ser blindtestens begrensing i kontakt med mennesket, og derfor har snudd tingene på hodet.. litt.
Problemet ligger i en lytter som mener at han selv hører signifikant forskjell på A og B i en serie tester. Så viser det seg at det lytteren trodde seg systematisk å høre forskjell på, ikke stemmer. Hva kan man slutte?
At enten forskjellen er så liten at den ikke kan påvises med noen grad av sikkerhet, eller at den opplevde forskjellen skyldes noe annet enn lydkvalitet. F eks "brand name", at objektet "ser bra ut", det faktum at det kostet skjorta, osv. Poenget med en sånn test er å skille mellom det faktiske lytteinntrykket og alle andre inntrykk som også kan påvirke.
For å slutte at kabel A er hipp som happ med kabel B for lytteren, må lytteren hver gang formidle det han opplever på en systematisk måte i forhold til sine opplevelser. Han kan ikke forveksle A og B tilfeldig som en analfabet, kan han vel? Altså må lytteren forutsettes å være rasjonell i forhold til A og B når han avgir svar ved hver testsekvens (og han må si vet ikke når han faktisk ikke mener å kunne skille). Denne rasjonaliteten forutsetter blindtesten! Uten slik rasjonalitet vet vi at resultatet ikke kan bli annet enn random walk. (hvilket er noe annet enn maskinmessigheten du tillegger meg).
Ja, omtrent så mye rasjonalitet som skal til for å svare at "jeg syns den første låt best, jeg". Eller den andre. Eller, hvis det dreier seg om en ABX-test: "jeg syns den lignet mest på den første". Eller andre. Det viktigste er oppriktighet, dvs at testpersonen ikke aktivt forsøker å sabotere testen ut fra en eller annen personlig agenda. F eks ville ikke Roysen bli synderlig imponert om knutinh ikke greier å høre forskjell på to kabler i en blindtest, ut fra en (muligens uberettiget) mistanke om at testpersonen ikke ønsket å høre forskjell.
Så sammenlignes de avgitte svarene med fullstendig tilfeldige svar, og man forsøker å vise at forsøkspersonens svar nettopp
ikke kan sannsynliggjøres som rene tilfeldigheter. Det er, for å si det mildt, et vesentlig lavere krav til testpersonens artikulasjonsevne enn en del av panegyriene man kan lese, både her på forumet og i kulørt hifi-presse, om de dramatiske forskjellene mellom ulike kabler og andre gjenstander.
Hvis så denne rasjonaliteten egentlig er en funksjon av hjernes ubevisste modus ved hver testsekvens (hvor modus ved en av disse testfrekvensene f.eks. kan være: litt korreksjonstype 1 og 3, en dash nytelse, litt prestasjonsangst, litt tro på at testen går godt, mv), så svarer ikke mediet/lytteren på lyden i seg selv, men lyden gjennom hjernemoduset under lyttingen. Du som blindtester tror lytteren svarer på lyden (så tror også lytteren selv), men det han svarer på tracker (eller er dominert av) noe annet en lyden i seg selv, nemlig lyden + hjernemodus (i stadig omstilling). Så brukes dette resultatet til å tolke nettopp lyden og at kabel A ikke er signifikant forskjellig fra B.
Ja. Nettopp. Hvis testpersonene ikke er i stand til å høre (registrere) en forskjell, så er det det som skjer. Da greier vi ikke å påvise at det er en hørbar forskjell. Vi lytter som kjent vel så mye med hjernen som med ørene. Det er ikke mulig å skille mellom de to. Og så?
En annen forutsetning som gjøres (hvis blindtesten brukes til å si at kabel A er hipp som happ som kabel B) er at lytteren hjemme i sin egen stue vil oppfatte kablene på samme måte der som under testen, dvs. testlytting = langtidslytting. På nytt tas det lekende lett på lytteren og hans menneskelige aspekter. (Det er svært mange parametre involvert, hvor langtidslytting heller ikke er en stabil faktor (strømbelastning i nettet, luftfuktighet, mørketid...).
Men altså, hvis lytteren visstnok gjennomgår alle disse psykiske traumene i løpet av en lyttetest under kontrollerte forhold, så er det vel ingen spesiell grunn til å tro at vedkommende plutselig blir dønn stabil så snart vedkommende går ut av døra? Det er slett ikke sikkert at testobjektet oppleves likedan i egen stue, men hvis du på dag 1 har fått kjeft av kona for ett eller annet, på dag 2 har kontoutskriften med overtrekk for kabelkjøpet kommet, og på dag 3 har kona funnet ut at hun vil være venner med deg igjen, så kan det jo hende at grunnen til at "kabelen låter bedre" på dag 3 er nettopp slike menneskelige forhold (og ikke f eks "innbrenning" av kabelen). Kan ikke se at jeg tar lett på det i det hele tatt. Selv er jeg veldig oppmerksom på betydningen av min egen sinnstilstand når jeg skal bedømme om ett eller annet tweak funker, siden den opplevde lydkvaliteten er nokså forskjellig om man selv er stresset eller avslappet. Derfor forsøker en strukturert blindtest å korrigere for dette, f eks ved å veksle mellom hvilket av testobjektene som presenteres først, osv.
Det er en iboende logisk dissonans mellom det å forusette en rasjonell lytter (med tydelige meninger) og så benytte den samme lytters adferd som bevis for at han tar feil og ikke er rasjonell men vet ikke hvordan jeg skal få formidlet den tanken klart men det som å si at naturen tar feil i sin normalmodus. Og det tror jeg ikke på som en grunnleggende tanke. Derfor leter jeg etter en plausibel forklaring på resultater fra blindtesting vs. erfaringsbaserte opplevelser.
En slik test som jeg har beskrevet er satt opp for å påvise en eventuell forskjell mellom to testobjekter (f eks kabler eller forsterkere eller høyttalere eller...), ikke for å bevise at ingen forskjell eksisterer. Det er mye vanskeligere, for ikke å si umulig. Det er også en undertone her av at du tror en slik test er satt opp for å "lure" en testperson til å avsløre sin irrasjonalitet. Det er faktisk ikke personen som testes, men testobjektene.
Her er en liste av noen gjennomførte ABX-tester:
http://www.provide.net/~djcarlst/abx_data.htm
Som du ser er det mulig å påvise hørbar forskjell mellom (enkelte) pickuper, forsterkere, høyttalere, kondensatorer (!), delefiltere, CD-spillere, osv. Men det lot seg altså ikke gjøre å påvise signifikante forskjeller mellom de testede kablene. Skal vi liksom tro at hele denne greia om den menneskelige faktor
bare gjelder når kabler testes, mens testpersonen plutselig blir en rasjonell homo economicus når testen gjelder effektforsterkere eller CD-spillere, høyttalere, eller tilogmed kondensatorer? Du ser vel at det ikke henger på greip?
Nei, den enkleste forklaringen er at det er større forskjeller mellom enkelte typer av komponenter enn andre. I noen tilfeller er forskjellene så små at de ikke lar seg påvise under slike testforhold. Og da er det kanskje der de av oss som fortsatt har ett eller annet budsjett for denne hobbyen skal knipe inn litt på pengene. Og det er alt en sånn test forsøker å finne ut av.
Edit: Rettet en skrivefeil...