Er ABX en pålitelig testmetode?

Diskusjonstråd Se tråd i gallerivisning

  • topline

    Hi-Fi freak
    Ble medlem
    30.11.2005
    Innlegg
    2.103
    Antall liker
    0
    Dette er vel en oppramsing av dine personlige grunner for at du ikke liker ABX.

    Kritikken som har vært reist mot ABX som går på at den "ikke fanger opp detaljene jeg normalt hører" har av Fush blitt svart på en utmerket måte i mine øyne.

    At "perfekt" ABX testing kanskje medfører krav som er urealistiske og upraktiske er noe helt annet enn å si at ABX av magiske årsaker ikke er relevant for hifi.

    For de av oss som liker absolutte svar og beviser er ABX måten man kan få orden i et virvar av påstander, harmdirrende innlegg og aktører med økonomiske insentiver. Som det har vært sagt har forskjellige trender kommet og gått i hifi-verdenen. Hvis du hadde et anlegg til over 5000,- i 1995 og ikke hadde bi-wiring måtte du være "døv", i dag er det fullt tillatt å kjøre single wiring.

    Dette må bety at forskjellige "tweaks" har forskjellig grad av påvirkning, og siden alle tweaks har en eller annen forkjemper som hevder at dette er "helt nødvendig for å få lyd man kan leve med" så kan man rett og slett ikke bruke slike innspill som en guide. Etter min mening.

    -k
    Har ingen ting mot ABX tester, det er tolkingen av resultatene jeg stiller meg tvilende til.

    Du har selv hevdet at vi som mener at 30sek ikke er nok i en test kan bruke flere måneder om vi vil på test hjemme.
    Dette ser jeg på som helt hypotetisk når vi snakker om kabelttesting.
    En slik test ville bety like lite som en subjektiv vurdering da den ikke vil bestå kravene som stilles til en seriøs ABX test så vidt jeg skjønner.

    Dette med at ulike tweaks kommer og går har jeg kommentert før. Snake oil produktene forsvinner etter en stund.
    Men for å gjenta meg selv - 30 års erfaring blant xxxx tusen audiofile er godt nok for meg til å skjønne at kabler kan utgjøre en ikke uvesentlig forskjell på lydbildet fra et anlegg.
     

    Vedlegg

    K

    knutinh

    Gjest
    Har ingen ting mot ABX tester, det er tolkingen av resultatene jeg stiller meg tvilende til.
    Ahh. Da har jeg mistolket deg. Det er ingen tvil om at resultatene fra blindtester misbrukes både her og andre steder. Det er ikke et argument mot blindtester men mot slike tolkninger =)
    Du har selv hevdet at vi som mener at 30sek ikke er nok i en test kan bruke flere måneder om vi vil på test hjemme.
    Dette ser jeg på som helt hypotetisk når vi snakker om kabelttesting.
    En slik test ville bety like lite som en subjektiv vurdering da den ikke vil bestå kravene som stilles til en seriøs ABX test så vidt jeg skjønner.
    Hvorfor ikke?
    Dette med at ulike tweaks kommer og går har jeg kommentert før. Snake oil produktene forsvinner etter en stund.
    Men for å gjenta meg selv - 30 års erfaring blant xxxx tusen audiofile er godt nok for meg til å skjønne at kabler kan utgjøre en ikke uvesentlig  forskjell på lydbildet fra et anlegg.
    Hvordan kan du vite det? Du innrømmer altså at 90% av verdens audiofile kan gå på limpinnen i en kollektiv selv-bedrageri som bi-wiring, mens mer nøkterne folk etterspør beviser, argumentasjon og blindtester. Så går det 1 eller 10 år og en ny trend kommer, og regla repeterer seg selv. Hvor mange audiofile brukte superkabler i 1970?

    -k
     
    K

    knutinh

    Gjest
    topline:
    Her følger noen forslag til ABX testing. Jeg ser ikke at 3mnds hjemmetester bryter noen av disse?


    http://www.pcabx.com/
    "Ten (10) Requirements For Sensitive and Reliable Listening Tests

    (1) Program material must include critical passages that enable audible differences to be most easily heard.

    (2) Listeners must be sensitized to a audible differences, so that if an audible difference is generated by the equipment, the listener will notice it and have a useful reaction to it.

    (3) Listeners must be trained to listen systematically so that audible problems are heard.

    (4) Procedures should be "open" to detecting problems that aren't necessarily technically well-understood or even expected, at this time. A classic problem with measurements and some listening tests is that each one focuses on one or only a few problems, allowing others to escape notice.

    (5) We must have confidence that the Unit Under Test (UUT) is representative of the kind of equipment it represents. In other words the UUT must not be broken, it must not be appreciably modified in some secret way, and must not be the wrong make or model, among other things.

    (6) A suitable listening environment must be provided. It can't be too dull, too bright, too noisy, too reverberant, or too harsh. The speakers and other components have to be sufficiently free from distortion, the room must be noise-free, etc..

    (7) Listeners need to be in a good mood for listening, in good physical condition (no blocked-up ears!), and be well-trained for hearing deficiencies in the reproduced sound.

    (8) Sample volume levels need to be matched to each other or else the listeners will perceive differences that are simply due to volume differences.

    (9) Non-audible influences need to be controlled so that the listener reaches his conclusions due to "Just listening".

    (10) Listeners should control as many of the aspects of the listening test as possible. Self-controlled tests usually facilitate this. Most importantly, they should be able to switch among the alternatives at times of their choosing. The switchover should be as instantaneous and non-disruptive as possible."
     
    K

    knutinh

    Gjest
    Forøvrig så er det også interessant med "ladder" (?) tester hvor materialet du hører avhenger av svarene du har gitt til nå, slik at man med begrenset lyttetid kan konsentrere mest mulig av "oppløsningen" i testen nært interessante tester. Hvis du ikke hører forskjell på wav og 64kbps mp3 så er det sannsynligvis bortkastet å få veldig mange lytteeksempler med 320kbps mp3.

    Pre-screening og utvelgelse av gode lyttere er interessant. Personlig er man kanskje interessert i å etablere egne terskler, men for å få generelle "maksimalverdier" er det veldig nyttig å eliminere de om ikke hører forskjellene fort slik at man kan konsentrere innsatsen om de som ser ut til å høre mest.

    -k
     

    Vedlegg

    topline

    Hi-Fi freak
    Ble medlem
    30.11.2005
    Innlegg
    2.103
    Antall liker
    0
    Hvordan kan du vite det? Du innrømmer altså at 90% av verdens audiofile kan gå på limpinnen i en kollektiv selv-bedrageri som bi-wiring, mens mer nøkterne folk etterspør beviser, argumentasjon og blindtester. Så går det 1 eller 10 år og en ny trend kommer, og regla repeterer seg selv. Hvor mange audiofile brukte superkabler i 1970?-k
    Jeg vet ikke hvor tallet 90% her kommer fra. Så vidt jeg vet har det alltid vært delte meninger om dette med biwiring. Hvor er det kollektive selvbedraget??

    Om det er en trend at det kan være forskjell på kabler, så har den nå vart i rundt 20-30 år. Som sagt - jeg tror ikke at alle kan lures hele tiden.

    En langtids blindtest hjemme vil ikke kunne være sikret mot juks. Altså er testen verdiløs - for andre enn de innvolverte.
     

    Vedlegg

    Fush

    Hi-Fi freak
    Ble medlem
    20.01.2006
    Innlegg
    1.868
    Antall liker
    1
    Som sagt - jeg tror ikke at alle kan ikke lures hele tiden.
    Nei, 99% av jordens befolkning bruker billige, nøkterne kabler i sine lydanlegg...
     
    K

    knutinh

    Gjest
    En langtids blindtest hjemme vil ikke kunne være sikret mot juks. Altså er testen verdiløs - for andre enn de innvolverte.
    Og en ublind test i Lyd og Bilde eller av deg her er sikret mot juks?

    Vi kan aldri sikre oss mot uærlige sjeler (jfr Sudbø). Mekanismen mot dette er vanligvis å bekrefte interessante funn vha uavhengige tester. Dette brukes også for å eliminere udokumenterte metodefeil.

    Jo flere som søker å gjøre nøyaktig samme test og får samme resultat, jo større sannsynlighet er det for at man kan sette likhetstegn mellom de formaliserte test-betingelsen og resultatet. Altså øker den generaliserbare lærdomen av testen.

    -k
     

    topline

    Hi-Fi freak
    Ble medlem
    30.11.2005
    Innlegg
    2.103
    Antall liker
    0
    Nei, 99% av jordens befolkning bruker billige, nøkterne kabler i sine lydanlegg...
    Sikkert fornuftig, står nok i stil til anleggene. ;)
     
    K

    knutinh

    Gjest
    Men nå føler jeg at vi argumenterer i ring, topline. For hver gang innvendinger mot praktiske ulemper ved ABX testing blir besvart, kommer det innvendinger mot metodiske feil ved ABX og sånn går no dagan...

    For min egen del har jeg konkludert at ABX som metode fungerer i tilfredsstillende grad i en lang rekke anvendelser, også i testing av menneskers subjektive respons til lydstimuli. Ingen har levert meg sammenhengende argumentasjonsrekker eller empiriske bevis som overhodet tyder på noe annet. Fram til det skjer må vi gjerne stå på hver vår haug og skrike "jeg har rett", men det fører egentlig ingen vei.

    -k
     
    O

    om.s

    Gjest
    Nei, 99% av jordens befolkning bruker billige, nøkterne kabler i sine lydanlegg...
    Muligens, men ikke 99% av de med ett mer el mindre reflektert forhold til god lyd!

    mvh
     
    K

    knutinh

    Gjest
    Muligens, men ikke 99% av de med ett mer el mindre reflektert forhold til god lyd!

    mvh
    Det er en meningsytring, og en helt grei meningsytring. Men da kategoriserer du slike som meg som "ureflektert i forhold til lyd". Jeg vil påstå at jeg har en interesse for lyd som ligger langt over gjennomsnittet.

    Forskjellen er at vi er uenige om hvordan man kommer fram til god lyd, og hvordan man bestemmer om man har oppnådd god lyd.

    mvh
    Knut
     

    Vedlegg

    RJEL

    Servicemann
    Ble medlem
    30.04.2004
    Innlegg
    2.131
    Antall liker
    1.417
    Torget vurderinger
    4
    Forøvrig så er det også interessant med "ladder" (?) tester hvor materialet du hører avhenger av svarene du har gitt til nå, slik at man med begrenset lyttetid kan konsentrere mest mulig av "oppløsningen" i testen nært interessante tester. Hvis du ikke hører forskjell på wav og 64kbps mp3 så er det sannsynligvis bortkastet å få veldig mange lytteeksempler med 320kbps mp3.

    Pre-screening og utvelgelse av gode lyttere er interessant. Personlig er man kanskje interessert i å etablere egne terskler, men for å få generelle "maksimalverdier" er det veldig nyttig å eliminere de om ikke hører forskjellene fort slik at man kan konsentrere innsatsen om de som ser ut til å høre mest.

    -k
    En liten digresjon:
    Hvorfor skal alt på død og liv komprimeres.
    Hører vi ikke forskjell med en gang, ja da komprimererer vi. Hva er hensiktene med det?
    Dagens lagringsmedier er jo i GB størrelse.

    H
     

    Vedlegg

    topline

    Hi-Fi freak
    Ble medlem
    30.11.2005
    Innlegg
    2.103
    Antall liker
    0
    Forskjellen er at vi er uenige om hvordan man kommer fram til god lyd, og hvordan man bestemmer om man har oppnådd god lyd.

    mvh
    Knut
    Er vi så uenige her?
    Tror (håper) vi er enige om de store linjene for hva som er viktig, men når vi kommer over på tweaks......da krasjer det seg.. ;)

    Ellers så er det vel et merkelig spørsmål det siste.
    Svaret kan være at når du er fornøyd, og anlegget gir deg den opplevelsen du er på jakt etter, så har du god lyd i dine ører.....utfra dine egne referanser.
     
    K

    knutinh

    Gjest
    En liten digresjon:
    Hvorfor skal alt på død og liv komprimeres.
    Hører vi ikke forskjell med en gang, ja da komprimererer vi. Hva er hensiktene med det?
    Dagens lagringsmedier er jo i GB størrelse.

    H
    Det er jo en helt annen diskusjon og ikke noe jeg kan svare på. På iPod kan du såvidt jeg vet lagre musikken tapsfritt hvis du ønsker. Det at nesten ingen brukere benytter denne funksjonaliteten skulle vel være svar nok på ditt spørsmål? Vi lydinteresserte kan da ikke diktere hva andre skal prioritere.

    Det finnes helt sikkert noen som stiller spørsmålstegn ved hvorfor du bruker så mye tid på stereoanlegg når de samme pengene kunne sendt deg verden rundt på livekonserter.

    -k
     
    O

    om.s

    Gjest
    Det er en meningsytring, og en helt grei meningsytring. Men da kategoriserer du slike som meg som "ureflektert i forhold til lyd". Jeg vil påstå at jeg har en interesse for lyd som ligger langt over gjennomsnittet.

    Forskjellen er at vi er uenige om hvordan man kommer fram til god lyd, og hvordan man bestemmer om man har oppnådd god lyd.

    mvh
    Knut
    Legg merke til at det står mer eller mindre, her utelukkes ingen pga "graden" av interesse fra min side.....

    mvh
     
    K

    knutinh

    Gjest
    Er vi så uenige her?
    Tror (håper) vi er enige om de store linjene for hva som er viktig, men når vi kommer over på tweaks......da krasjer det seg.. ;)

    Ellers så er det vel et merkelig spørsmål det siste.
    Svaret kan være at når du er fornøyd, og anlegget gir deg den opplevelsen du er på jakt etter, så har du god lyd i dine ører.....utfra dine egne referanser.
    Vi er helt sikkert enige om veldig mye. Men i denne diskusjonen ser det ut til å gå et tydelig skille mellom de som mener at:
    *Stereoanlegg er elektroniske/mekaniske komponenter som adlyder fysiske lover, uansett om vi forstår disse eller ikke.
    *ublind lytting er en særdeles lite robust måte å finne robuste svar på hifirelaterte spørsmål.
    *ABX-testing er bedre egnet fordi det fjerner andre påvirkninger enn lyd.
    *Hvis man ikke kan høre forskjellen på to produkter kan heller ikke det ene være lydmessig bedre enn det andre.
    *"Magi" er noe som tilføres av den kunstneriske biten (musikere, lydteknikere og coverdesignere). Reproduksjonskjeden skal hverken ha dårlige dager eller tilføre "god timing" til urytmiske musikere.
    *Fysikk og vitenskap er nyttige verktøy og helt nødvendig for å konstruere noe som helst. Å forkaste disse er hverken ønskelig eller gjennomførbart, men man kan alltid prøve å motbevise tidligere vedtatt lærdom.

    Og de som mener det motsatte. De fleste befinner seg sikkert en plass i mellom ytterpunktene men i en slik debatt har det lett for at deltagerne blir polariserte.

    mvh
    Knut
     

    KJ

    Æresmedlem
    Ble medlem
    10.10.2004
    Innlegg
    11.161
    Antall liker
    4.327
    Torget vurderinger
    1
    ... Altså øker den generaliserbare lærdomen av testen.

    -k
    Hmmm ... jeg begynner å lure litt om dyret i åpenbaringen er generaliserbarhet. Haifai handler til tider om det spesielle og individuelle, også, eller kanskje særlig på utstyrsfronten. Dette i kombinasjon med statusen som ligger i å «innbille» verden og seg selv at man har gullører. Enkelte audioholikere er sensitive for særlig to typer fornermelser: 1) vask øra dine! og 2) du har for DÅRLIG anelgg! Dette i kombinasjon med en livsløgn om at «alt er hørbart», gjør det kanskje spesielt vanskelig å akseptere generaliserbare fakta, «alle» kabler låter likt. Generaliserbare fakta passer ikke inni den audiofile sannheten om at ingenting låter likt. Når øvelsen lyttetest ofte fortoner seg som en konkurranse om å høre/beskrive forskjeller, så er det ikke lett å ivareta sin torverdighet som haifai-nerd og sammtidig påstå at det låter likt. Ergo «vi» vil ikke ha fakta og metoder som forenkler vårt verdensbilde, fordi de ikke harmonerer med opbyggingen av den gode audiofiles selvbilde og status.

    mvh
    KJ
     
    K

    knutinh

    Gjest
    Hvis vi skal kaste absolutt all "vedtatt sannhet" på båten og være åpen for alt så innebærer det at høyttalerne kan låte bedre av at man skifter strømkabel på kaffetrakteren. Det innebærer at man fort får uendelig mange permutasjoner etterhvert som enhver tenkelig komponent må testes opp mot enhver tenkelig annen komponent som igjen må...

    Tar vi tanken enda et skritt videre så er det selvsagt dumt å basere forsterkerdesign på Ohm, Kirchoff og hva de nå heter. Det er mer fornuftig å begynne med en skuff av komponenter og begynne å lodde disse tilfeldig sammen, eller hva med å begynne med grunnstoffer og lage komponenter med tilfeldige egenskaper?


    Argumentet mitt er selvsagt at absolutt alle har et "filter" som brukes til å snevre inn verdens uendelige muligheter til et utfallsrom som er praktisk håndterbart uten å begrense alt for mye. Akkurat hvor man skal legge lista vil alltid være et debatt-spørsmål, og hvis man mener at sorte stener under CD-spilleren _kan_ gi bedre lyd uten å ha hørt det så er man mer åpen enn hva jeg er. Det betyr at man åpner helt nye akser for hva man kan/bør teste, men også at man kanskje bruker så mye tid på dette at man går glipp av andre muligheter som kanskje er mer opp i dagen som Q-tips, godt humør og høyttalerplasering =)

    -k
     
    O

    om.s

    Gjest
    Ergo «vi» vil ikke ha fakta og metoder som forenkler vårt verdensbilde, fordi de ikke harmonerer med opbyggingen av den gode audiofiles selvbilde og status.

    mvh
    KJ
    Det du gjør her er å forenkle det hele så mye at du fordummer folk!

    Les heller artikkelen i Sterophile Aug 2006 s.37-39 som har vært fremhevet tidliger.

    mvh
     

    TrompetN

    Hi-Fi freak
    Ble medlem
    04.03.2004
    Innlegg
    8.700
    Antall liker
    7.011
    Da bruker du resultatet av en type testing (seende testing) for å indikere at en annen type testing må være feil (blindtesting) og da har du vel allerede bestemt deg for hvilken du stoler på? =)

    mvh
    Knut
    Tja, til en viss grad. Det er skrevet mange ganger her på forumet at placeboeffekten gir seg over tid (ganske kort tid). Når jeg har levd med DVD spilleren i 6 måneder og synes det lyder udynamisk, for så å endre synspunkt når cdspilleren kom tilbake på plass så er det en type test som jeg stoler mer på enn blindtesten jeg gjorde her om dagen.

    For meg er dette mysteriet. Hvorfor hører jeg ikke dette på en blindtest utført i løpet av en kveld?
     

    Vedlegg

    TrompetN

    Hi-Fi freak
    Ble medlem
    04.03.2004
    Innlegg
    8.700
    Antall liker
    7.011
    topline:
    Her følger noen forslag til ABX testing. Jeg ser ikke at 3mnds hjemmetester bryter noen av disse?


    http://www.pcabx.com/
    "Ten (10) Requirements For Sensitive and Reliable Listening Tests

    (1) Program material must include critical passages that enable audible differences to be most easily heard.

    (2) Listeners must be sensitized to a audible differences, so that if an  audible difference is generated by the equipment, the listener will notice it and have a useful reaction to it.

    (3) Listeners must be trained to listen systematically so that audible problems are heard.

    (4) Procedures should be "open" to detecting problems that aren't necessarily technically well-understood or even expected, at this time. A classic problem with measurements and some listening tests is that each one focuses on one or only a few problems, allowing others to escape notice.  

    (5) We must have confidence that the Unit Under  Test (UUT) is representative of the kind of equipment it represents. In other words  the UUT must not be broken, it must not be appreciably modified in some secret way, and must not be the wrong make or model,  among other things.

    (6) A suitable listening environment must be provided. It can't be too dull, too bright, too noisy, too reverberant, or too harsh.   The speakers and other components have to be sufficiently free from distortion, the room must be noise-free, etc..

    (7) Listeners need to be in a good mood for listening, in good physical condition (no blocked-up ears!), and be well-trained for hearing deficiencies in the reproduced sound.

    (8) Sample volume levels need to be matched to each other or else the listeners will perceive differences that are simply due to volume differences.

    (9) Non-audible influences need to be controlled so that the listener reaches his conclusions due to "Just listening".  

    (10) Listeners should control as many of the aspects of the listening test as possible. Self-controlled tests usually facilitate this. Most importantly, they should be able to switch among the alternatives at times of their choosing. The switchover should be as instantaneous and non-disruptive as possible."
    Det meste her er selvsagt, men likevel en god liste å lese gjennom før blindtester skal gjennomføres.
     

    Bx

    Bransjeaktør
    Ble medlem
    04.08.2005
    Innlegg
    8.875
    Antall liker
    4.315
    For meg er dette mysteriet. Hvorfor hører jeg ikke dette på en blindtest utført i løpet av en kveld?
    Jeg synes vel egentlig du ga et slags svar på det tidligere i tråden. Det er stor forskjell på å sitte i en blindtest og å bare lytte til musikk i ro og mak.

    Subjektive svingninger vil man også oppleve. En kveld kan en ghettoblaster gi stort musikalsk utbytte, mens en annen kveld er det kjedelig å høre på referanseanlegget....

    Jeg synes dere gjorde en etter forholdene troverdig test - da tenker jeg på kabeltesten - den andre har jeg ikke fulgt med på - men jeg synes nok testresultatene har blitt lest litt feil av flere her på forumet.

    35 % sannsynlighet for at 1 av 3 får 9 av 13 rette på slump er samtidig 65% sannsynlighet for at det ikke var slump.

    De som ikke stoler på sine egne ører under normale forhold får støtte seg til matematikken og konkludere med bakgrunn i denne testen at det var omkring dobbelt så stor sannsynlighet for at den ene i testpanelet hørte en reell forskjell som at han ikke hørte det.

    Dette testresultatet gir en svak støtte for at det faktisk er reelle forskjeller. Men selv om testen og testmetodikken i seg selv er pålitelig, så er ikke datamaterialet entydig nok og omfattende nok lite til at man kan trekke konklusjoner som gir særlig mer tyngde enn kvalifiserte, subjektive vurderinger.
     
    K

    knutinh

    Gjest
    Jeg synes vel egentlig du ga et slags svar på det tidligere i tråden. Det er stor forskjell på å sitte i en blindtest og å bare lytte til musikk i ro og mak.

    Subjektive svingninger vil man også oppleve. En kveld kan en ghettoblaster gi stort musikalsk utbytte, mens en annen kveld er det kjedelig å høre på referanseanlegget....

    Jeg synes dere gjorde en etter forholdene troverdig test  - da tenker jeg på kabeltesten - den andre har jeg ikke fulgt med på - men jeg synes nok testresultatene har blitt lest litt feil av flere her på forumet.

    35 % sannsynlighet for at 1 av 3 får 9 av 13 rette på slump er samtidig 65% sannsynlighet for at det ikke var slump.

    De som ikke stoler på sine egne ører under normale forhold får støtte seg til matematikken og konkludere med bakgrunn i denne testen at det var omkring dobbelt så stor sannsynlighet for at den ene i testpanelet hørte en reell forskjell som at han ikke hørte det.

    Dette testresultatet gir en svak støtte for at det faktisk er reelle forskjeller. Men selv om testen og testmetodikken i seg selv er pålitelig, så er ikke datamaterialet entydig nok og omfattende nok lite til at man kan trekke konklusjoner som gir særlig mer tyngde enn kvalifiserte, subjektive vurderinger.
    Jeg blir i godt humør av å lese dine poster Bx. Virkelig bra at det finnes noen som er uenige med meg men er flink til å formulere seg og argumentere.

    La oss huske at dette var "ekstremvalg" innen kabler og at 2 av 3 lyttere ikke hørte noen som helst forskjell. Det er interessant sett i lys av kabler med "god rytmikk", "enormt 3d perspektiv" etc.

    Jeg avviser ikke at noen kan høre bedre enn meg, og at det kan finnes hørbare forskjeller på enkelte kabler i enkelte oppstillinger. Det jeg protesterer på at dette skal være et relevant problem for de 99% av oss som har korte kabler, høyttalere med fornuftig impedans, etc.

    Poenget er uansett at vi må sitte her og flisespikke en debatt om hvorvidt det overhodet er noensomhelst hørbar forskjell på kabler til 50,- og 20.000 når det finnes andre komponenter i kjeden som beviselig har målbare og hørbare forskjeller. Hvorfor bruker vi ikke mer tid til romkorreksjon, akustikk, høyttalere og forsterkere?

    Jeg kan ikke avvise at tilsetningsstoffer i bensinen gjør at bilen min får et par ekstra hestekrefter. Men hvis målet er å kjøre fort så virke det mye mer fornuftig å kjøpe en bil med større motor...

    -k
     

    roffe

    Hi-Fi freak
    Ble medlem
    12.01.2005
    Innlegg
    3.677
    Antall liker
    6
    Noen trakk denne diskusjonen om "kort" ABX-testing vs ublind langtidslytting inn i et annet forum. Jeg fikk lyst til å bidra med dette innlegget som jeg ga der:

    Hva er spørsmålet du ønsker besvart gjennom testaktiviteten?

    Jeg har liten erfaring med ABX-testing, og grunnen er at det er litt kjedelig å drive med, og tid- og ressurskrevende å sette opp. Men jeg har erfaring med å AB-teste med raske skift (godt under et sekund) mellom ulike komponenter i delefiltre, og har funnet ut at forskjellene ofte er mindre en det man tror... Har også erfaring med ublind langtidslytting på ulike ting (bl.a. kabler), og har ingen problemer med å skjønne at man mener det er forskjell ved langtidslytting når man likevel har problemer med å høre forskjell ved raske skift (jeg har byttet ut kabler på bakgrunn av langtidslytting også, så jeg mener absolutt den har noe for seg). Men i motsetning til mange andre utelukker jeg ikke placebo, varierende ytelse på hørselen, varierende sinnstemning, bakgrunnslyder, romtemperaturvariasjoner, sviktende auditiv hukommelse etc som problemfaktorer som begrenser nøyaktigheten ved langtidslytting. Mange kritikere av ABX-testing mener man skal "stole på at hørselen er nøyaktig". For meg er det det samme som å ignorere ovennevnte usikkerhetsmomenter. Jeg synes heller man skal være åpen for disse usikkerhetsmomentene og forsøke å lære hvordan de påvirker lytteopplevelsen. Da kan man KANSKJE lære å "lytte forbi" eller kontrollere noen av dem også.

    Jeg mener at ABX-tester (gitt at de er godt gjennomført) er gode til å svare på spørsmål om det er reelt hørbare forskjeller mellom produkter i et gitt oppsett (og at produktene dermed er bekreftet å ha ulike egenskaper). Et positivt, statistisk godt resultat her vil være objektivt gyldig for at det er reelle forskjeller mellom lydgjengivelsen for produktene, men ikke nødvendigvis i andre oppsett.

    Lang tids bruk og lytting til musikk etter samme bruksmønster som vanlig er mer egnet til å svare på spørsmål om hva testeren vil være mest fornøyd med over tid i oppsettet. Dette resultatet vil være subjektivt, men gitt at mange rapporterer den samme opplevelsen av produktet i ulike oppsett, så vil sannsynligvis produktet gi tilnærmelsesvis samme opplevelse i et lignende oppsett. Mange like, subjektive resultater vil således kunne befeste en generell oppfatning av produktet som nærmer seg noe objektivt likevel. Men det er viktig at de som tester på denne måten vet minst mulig om hvilke resultater andre har fått, ellers vil placebo raskt kunne bli en overskyggende feilkilde.

    Korte ABX-tester har etter min mening som største svakhet at selv om de er gode på å bekrefte forskjeller hvis de er der, så er de dårlige på å besvare hva som vil oppleves som best over tid ved normalt bruksmønster.

    Ublind langtidslytting har etter min mening som sin største svakhet at det er en del usikkerhetsmomenter som gjør at testingen blir mer unøyaktig, spesielt ut fra objektive kriterier.

    Etter min mening er altså begge metoder pålitelige, men de gir svar på ulike spørsmål.
     

    Vedlegg

    Bx

    Bransjeaktør
    Ble medlem
    04.08.2005
    Innlegg
    8.875
    Antall liker
    4.315
    Jeg blir i godt humør av å lese dine poster Bx. Virkelig bra at det finnes noen som er uenige med meg men er flink til å formulere seg og argumentere.

    La oss huske at dette var "ekstremvalg" innen kabler og at 2 av 3 lyttere ikke hørte noen som helst forskjell. Det er interessant sett i lys av kabler med "god rytmikk", "enormt 3d perspektiv" etc.

    -k
    Knutinh,

    Hyggelig at jeg kan være til glede :)

    Jeg pleier å anbefale venner som spør om råd å bruke minst mulig på kabler når de skal kjøpe hifi utstyr, da erfaringen min er at dette har liten innflytelse på lydbildet og enda mindre betydning på lydkvaliteten. Og rent praktis så fikk jeg vel omtrent det samme utav kabeltesten som deg: Hvis det var en forskjell, så må den ha vært liten.....

    Men det er jo direkte uvitenskapelig av deg, Knut, å hede at to av tre ikke hørte forskjell. Testresultatene gir ikke noe som helst grunnlag for å hevde noe sånt.

    I vitenskapelig forstand gir ikke testen noe som helst grunnlag for å uttale seg om nullhypotesen den ene eller andre veien.

    Men når enkelte ABX-tilhengere koser seg med det glitrende resultatet og subjektister fortviler så synes jeg det er på sin plass å understreke at det faktisk var mer sannsynlig at det var en hørbar forskjell enn at det ikke var det.

    Hvis du ikke tror meg, så kan du jo regne på det.
     

    Bx

    Bransjeaktør
    Ble medlem
    04.08.2005
    Innlegg
    8.875
    Antall liker
    4.315
    Når jeg regner på det, blir det slik:

    Antar at det ikke er forskjell på kablene. Det er 50/50 om man gjetter rett eller galt. Og så regner jeg på sannsynligheten for å få de resultatene man fikk - gitt at det ikke er forskjell på kablene.

    For hver enkelt person:

    Det er 70% sannsynlighet for å få minst 6 av 13 rette

    Det er 50 % sannsynlighete for å få minst 7 av 13 rette

    Det er 13 % sannsynlighet for 9/13

    De tre samlet (det som er interessant):

    Det er bare 36 % sannsynlig at alle tre får minst 6 rette slik de fikk her.

    Samme regnemåte gir: Bare 35% sannsynlighet for at minst en av deltakerne får minst 9 rette.

    Alt som en serie: 22/39

    Hvis jeg har regnet riktig er det bare 26% sannsynlig at man får 22 rette eller mere på 39 forsøk med ren gjetting. Må si jeg ble litt overrasket over det siste resultatet.

    Smil: Kan du kontrollregne?
     

    KJ

    Æresmedlem
    Ble medlem
    10.10.2004
    Innlegg
    11.161
    Antall liker
    4.327
    Torget vurderinger
    1
    Når jeg regner på det, blir det slik:

    Antar at det ikke er forskjell på kablene. Det er 50/50 om man gjetter rett eller galt. Og så regner jeg på sannsynligheten for å få de resultatene man fikk - gitt at det ikke er forskjell på kablene.

    For hver enkelt person:

    Det er 70% sannsynlighet for å få minst 6 av 13 rette

    Det er 50 % sannsynlighete for å få minst 7 av 13 rette

    Det er 13 % sannsynlighet for 9/13

    De tre samlet (det som er interessant):

    Det er bare 36 % sannsynlig at alle tre får minst 6 rette slik de fikk her.

    Samme regnemåte gir: Bare 35% sannsynlighet for at minst en av deltakerne får minst 9 rette.

    Alt som en serie: 22/39

    Hvis jeg har regnet riktig er det bare 26% sannsynlig at man får 22 rette eller mere på 39 forsøk med ren gjetting. Må si jeg ble litt overrasket over det siste resultatet.

    Smil: Kan du kontrollregne?
    Den kumulative forventingsverdien av ren gjettning vil fortsatt være 50/50 noe annet ville indikere systematikk, og testen av resultatet (ift. nullhypotesen om ren gjettning med en forventningsverdi på 50/50), består av 1) hvor sannsynlig er det at resultetet er noe annet enn ren gjettning (test for systematikk i svarene), 2) «besluttningsregelen» kan man med et forutbestemt signifikansninvå (normalt 90 eller 95 %) si at resultatet er forskjellig fra nullhypotesen. Så kan man etterpå regne på sansynligheten for at resulatene og konklusjonen er feil (type I og II) på tross av avgitte svar.

    mvh
    KJ
     
    K

    knutinh

    Gjest
    Men det er jo direkte uvitenskapelig av deg, Knut, å hede at to av tre ikke hørte forskjell. Testresultatene gir ikke noe som helst grunnlag for å hevde noe sånt.
    Det jeg mente var at 2 av deltagerne ikke kunne bekrefte hørbare forskjeller i denne testen med signifikant margin.



    Det ligger en skjult "virkelighet" (i rosa) som vi ønsker å finne ut av. En undermengde av denne greier vi å "bevise" (i grønt, ved blindtester el. lign.). En helt annen mengde er "tilsynelatende" (i blått) som er hvordan vi normalt oppfatter verden. Dette kan inkludere både sannheter og usannheter.

    -k
     

    Vedlegg

    bruce

    Hi-Fi entusiast
    Ble medlem
    28.10.2005
    Innlegg
    291
    Antall liker
    0
    Jeg mener at ABX-blindtester er et blind-spor. ved slike korte intense sesjoner leter vi etter innbilte forskjeller. La deg henføre til musikken og finn ut hva du liker best. Jeg tror at Placebo-effekten som mange skriver om er overdrevet. Stol på egne ører. De fleste av oss evner å lytte rimelig objektivt. Hvis jeg har kjøpt en dyr kabel til stereoen som ikke gir meg valuta for pengene, selger jeg den og prøver noe annet. jeg har ikke noe behov for å overbevise meg selv om at den virker.
     

    Fush

    Hi-Fi freak
    Ble medlem
    20.01.2006
    Innlegg
    1.868
    Antall liker
    1
    Stol på egne ører.
    Det er jo nettopp det som er poenget i en blindtest. Der må du stole kun på ørene, og kan ikke støtte deg på noen av de andre sansene.
     
    K

    knutinh

    Gjest
    Jeg mener at ABX-blindtester er et blind-spor. ved slike korte intense sesjoner leter vi etter innbilte forskjeller.
    Jeg vurderer å legge følgende til signaturen min:

    "ABX-testing kan utføres med 10 sekunder materiale eller med 2 år langt materiale eller alt i mellom"

    For nå er jeg litt lei av å stadig gjenta det :)

    -k
     

    bruce

    Hi-Fi entusiast
    Ble medlem
    28.10.2005
    Innlegg
    291
    Antall liker
    0
    Jeg tror nok at en blindtest med lange intervaller ville gi mer pålitelige resultat, men de fleste blindtester gjennomføres vel som korte, intense seanser. Mitt poeng er at jeg tror kravet til å "nulle ut" andre sanser er overdrevet. Vi hører det vi hører.
     

    topline

    Hi-Fi freak
    Ble medlem
    30.11.2005
    Innlegg
    2.103
    Antall liker
    0
    Jeg vurderer å legge følgende til signaturen min:

    "ABX-testing kan utføres med 10 sekunder materiale eller med 2 år langt materiale eller alt i mellom"

    For nå er jeg litt lei av å stadig gjenta det :)

    -k
    Men hvorfor gjør du ikke dette selv da, Knut?

    Skaff deg en virkelig god cdspiller eller forsterker, og ta en langtids ABX blindtest mellom den og din gamle.

    Tror faktisk at du kan bli overrasket over resultatet. ;)
     

    Vidar Øierås

    Hi-Fi freak
    Ble medlem
    19.01.2003
    Innlegg
    3.202
    Antall liker
    341
    Det jeg mente var at 2 av deltagerne ikke kunne bekrefte hørbare forskjeller i denne testen med signifikant margin.



    Det ligger en skjult "virkelighet" (i rosa) som vi ønsker å finne ut av. En undermengde av denne greier vi å "bevise" (i grønt, ved blindtester el. lign.). En helt annen mengde er "tilsynelatende" (i blått) som er hvordan vi normalt oppfatter verden. Dette kan inkludere både sannheter og usannheter.

    -k
    Fin illustrasjon. Hvis vi legger til at målinger tar hele den rosa ovalen, blir bildet komplett ;D
     

    rama

    biskopen av holmlia
    Ble medlem
    09.06.2003
    Innlegg
    15.782
    Antall liker
    21.295
    Sted
    oslo
    Torget vurderinger
    17
    Jeg blir i godt humør av å lese dine poster Bx. Virkelig bra at det finnes noen som er uenige med meg men er flink til å formulere seg og argumentere.

    La oss huske at dette var "ekstremvalg" innen kabler og at 2 av 3 lyttere ikke hørte noen som helst forskjell. Det er interessant sett i lys av kabler med "god rytmikk", "enormt 3d perspektiv" etc.

    Jeg avviser ikke at noen kan høre bedre enn meg, og at det kan finnes hørbare forskjeller på enkelte kabler i enkelte oppstillinger. Det jeg protesterer på at dette skal være et relevant problem for de 99% av oss som har korte kabler, høyttalere med fornuftig impedans, etc.

    Poenget er uansett at vi må sitte her og flisespikke en debatt om hvorvidt det overhodet er noensomhelst hørbar forskjell på kabler til 50,- og 20.000 når det finnes andre komponenter i kjeden som beviselig har målbare og hørbare forskjeller. Hvorfor bruker vi ikke mer tid til romkorreksjon, akustikk, høyttalere og forsterkere?

    Jeg kan ikke avvise at tilsetningsstoffer i bensinen gjør at bilen min får et par ekstra hestekrefter. Men hvis målet er å kjøre fort så virke det mye mer fornuftig å kjøpe en bil med større motor...

    -k
    ok, så du holder døra oppe for at det faktisk er lydmessige forskjeller mellom kabler, til tross for at vitenskapen avviser dette? og dermed innrømmer du at vitenskapen vår ikke er fullkommen, og at det forekommer fenomener vi ikke kan måle?

    interessant. det er jo DET som er selve kjernen i diskusjonen.

    hvorvidt disse ørsmå forskjellene er verdt 10 eller 50.000 kroner er en uinteressant diskusjon. dette spørsmålet avhenger nemlig av hvor mye penger man har, og hva man prioriterer.  
     
    K

    knutinh

    Gjest
    Men hvorfor gjør du ikke dette selv da, Knut?

    Skaff deg en virkelig god cdspiller eller forsterker, og ta en langtids ABX blindtest mellom den og din gamle.

    Tror faktisk at du kan bli overrasket over resultatet.  ;)
    Jeg hevder hverken selv å ha gullører eller at det er en enorm forskjell ute og går. Jeg ser det derfor som mer sannsynlig at personer som hevder at katta til den døve naboen hører forskjellen gjennom to vegger og 3 betonggulv er egnet til å gjennomføre en slik test.

    Selv er jeg hildet av å være skeptiker og kunnskapen om at 10 sekunder faktisk er det beste intervallet. Noen som er mer kritisk til "vitenskapens status quo" vil lettere kunne frigjøre seg fra forventningens åk =)

    -k
     
    K

    knutinh

    Gjest
    ok, så du holder døra oppe for at det faktisk er lydmessige forskjeller mellom kabler, til tross for at vitenskapen avviser dette?
    Det er vanskelig å si at "vitenskapen avviser" så lenge vitenskapen ikke er et vesen. Men de fleste som jobber med elektromagnetisk propagasjon eller menneskelig persepsjon blir fort lattermilde når det er snakk om hifikabler ja.

    Jeg holder døra åpen for at det har landet UFO-er på jorda og at bigfoot eksisterer. Men det skal bedre bevis til enn noen sannhetsvitner på TV-Norge :)

    Jeg har vel etterhvert funnet ut at det er lettere å diskutere med folk hvis man åpner hypotetisk for at de kan ha rett og så ser på de samlede beviser, enn å kategorisk avvise at de har rett (hva er da igjen å diskutere?)

    hvorvidt disse ørsmå forskjellene er verdt 10 eller 50.000 kroner er en uinteressant diskusjon. dette spørsmålet avhenger nemlig av hvor mye penger man har, og hva man prioriterer.  
    Ikke uinteressant men betydelig vanskeligere. Og premisset for en slik diskusjon må være at vi er enige om at det ER forskjeller. Dersom det ikke er noen forskjeller kan man heller ikke forsvare prisforskjeller. Enig?

    -k
     

    rama

    biskopen av holmlia
    Ble medlem
    09.06.2003
    Innlegg
    15.782
    Antall liker
    21.295
    Sted
    oslo
    Torget vurderinger
    17
    Det er vanskelig å si at "vitenskapen avviser" så lenge vitenskapen ikke er et vesen. Men de fleste som jobber med elektromagnetisk propagasjon eller menneskelig persepsjon blir fort lattermilde når det er snakk om hifikabler ja.

    Jeg holder døra åpen for at det har landet UFO-er på jorda og at bigfoot eksisterer. Men det skal bedre bevis til enn noen sannhetsvitner på TV-Norge :)

    Jeg har vel etterhvert funnet ut at det er lettere å diskutere med folk hvis man åpner hypotetisk for at de kan ha rett og så ser på de samlede beviser, enn å kategorisk avvise at de har rett (hva er da igjen å diskutere?)

    Ikke uinteressant men betydelig vanskeligere. Og premisset for en slik diskusjon må være at vi er enige om at det ER forskjeller. Dersom det ikke er noen forskjeller kan man heller ikke forsvare prisforskjeller. Enig?

    -k
    enig. den dagen jeg får bevist for meg selv at jeg ikke hører forskjell, blir det ut med kimber og inn med clas ohlson.
     

    Vedlegg

  • Laster inn…

Diskusjonstråd Se tråd i gallerivisning

  • Laster inn…
Topp Bunn