Gjennomøfring av blindtest på signalkabel!

nb · 09.06.2010

kneip skrev:
Det mest effektive her tror jeg er å slå sammen alle resultatene, da øker man konfidensen i forhold til antall abx bytter, og det igjen betyr mer bang for the buck.

La oss si 3 lyttere, 5 ABX runder gir totalt 15 forsøk. Det betyr at for 94% konfidens må deltagerene totalt prikke inn 11 eller fler rette.

Så får de tre krangle om hvem av de som har Det Gyldne Øre, eller om det kun funker om alle tre er til stede

rama · 09.06.2010

ErosLoveking skrev:
for min egen del gidder jeg ikke å velge skyttegrav. Kanskje er det forskjeller, kanskje ikke..... har liksom aldri helt klart å fordype meg eller prøve.

Kan jeg være en god lyttekanin??

jepp.
alle er gode lyttekaniner, unntatt de som på forhånd har bestemt seg for å ikke høre forskjell.

btw, fuck disse skyttergravene.
det sitter 4-5 kålhuer i hver skyttergrav, og hvem fan bryr seg om de?

Bjørn ("Orso") · 09.06.2010

Veldig bra iniativ.
Men hvorfor så få lyttere som 4 stykker? En test med større deltagelse har mye større "tyngde". Kjør på med så mange som mulig.

Så synes jeg godt man la vær å publisere hva enkelte scorte. Opplys heller totalresultatet, så ingen skal være nervøs for å bli stilt i dårlig lys. Nå har selv ingen tro på forskjeller, så sant kablene ikke har klare målbare avvik (som er innenfor det hørbare) eller utstyr som er sært og dårlig konstruert, men det skal være lov å ha en dårlig dag når man er med i blindtest.

Vet vi forresten med sikkerhet at Oblivion kablene er konstruert uten klare avvik?

KW · 09.06.2010

Groove skrev:
Interessant at man ikke kan bedømme noget lydmæssigt under 15 minutter?

Tænk på samme med et billedsignal. To fjernsynsbilleder, et med for meget rødt og et neutralt, hvor lang tid tager det at skelne?

Eller et i sort/hvid og et i farve?

Med den store forskjell at bilder kan man se samtidig ved siden av hverandre....blir en helt annen ting.
Det som kan villede er om en først ser et bilde med sterk forvrengning av farge f.eks. for rød hudtone og så svitsjer over på samme motiv med normale hudtone så vil det se ut som det har gulstikk i hudtonen (les for lite rødt)
Man blir til en viss grad fargefartsblind.
Klart mye lettere å se forskjell på små fargeforskjeller på et ubehandlet og behandlet (altså litt fargekorrigert men ellers likt bilde) side om side (frem og tilbake) enn å huske musikksnutter som blir avspilt etter hverandre.
Dersom en da skal høre samme korte snutt etter hverandre mange ganger så går hjernen i surr (i hvert fall min om forskjellene ikke er meget tydelige)
For andre som er utrente på å se fargeforskjeller så kan hende de ikke ser det om de er små nok selv om de ser bildene ved siden av hverandre samtidig (frem og tilbake)
Dersom en da hadde testet en del utrente personer på akkurat nevnte tilfelle og de (alle) hadde bommet på resultatet noe som faktisk godt kunne ha skjedd er det da et bevis på at det ikke er fargeforskjeller (som i tillegg kan måles)
Ja, for noen på HFS så virker det slik, særlig dersom de heller ikke sjøl ser forskjellen.

Jeg for min del ville nok hatt stor problemer med å detektere små forskjeller på kabler i en slik setting, nå mener jo jeg at de uansett er relativt små, men dog i enkelte tilfeller tilstede og for min del på HT kabler først og fremst.

Jeg avgjør slikt over langtidstesting, og da skulle jeg p.g.a. tilvenning valgt å kjøpe de jeg testet over henholdsvis 3 måneder +/- og 3 uker var de vel, vel ingen av de passet mine ører i mitt oppsett, selv om de hadde fått enormt mye skryt her på HFS.

Stakkars den personen som greier å detektere forskjell i ca. 9 av 10 tilfeller og så bli møtt med påstanden om at sannsynligheten for at det bare er flaks.......flakser rundt øra hans.

Er det virkelig en umulighet for at en person hører forskjell helt reelt dersom det like reelt er en målbar forskjell, selv om han kanskje grunnet et øyeblikks dårlig konsentrasjon skulle bomme en av 10 ganger sånn ca.

Når alt dette er sagt så synes jeg jo at de som hevder store og tydelige forskjeller nok burde greie gjennomsnittlig 90 % treff.
Dersom de som OMF la opp til fikk sjansen til å hevde at dette etter prøve skal jeg klare, før den virkelige testen setter inn.
Jeg ville ikke greid å konsentrere meg en gang om det var signalkabler og med ikke tydelige (som jeg heller ikke tror det er) forskjeller.

Mvh.KW Beklager ot men bare måtte

nb · 09.06.2010

KW skrev:
Stakkars den personen som greier å detektere forskjell i ca. 9 av 10 tilfeller og så bli møtt med påstanden om at sannsynligheten for at det bare er flaks.......flakser rundt øra hans.

Er det virkelig en umulighet for at en person hører forskjell helt reelt dersom det likereelt er en målbar forskjell, selv om han kanskje grunnet et øyeblikks dårlig konsentrasjon skulle bomme en av 10 ganger sånn ca.

Det er slikt man har statistikk til. Den forteller noe om sannsynligheten for at det bare var flaks. Om den er "tilstrekkelig lav" så styrker det den undersøkte hypotesen. Har du veldig mange forsøk kan man bomme veldig mange ganger og likevel få bra resultat. Si at man trenger 8 av 10 for å være fornøyd, gjør man derimot 100 forsøk holder det med 61 av 100 for at sannsynligheten for at resultatet fremkom ved flaks er omtrent den samme.

9 av 10 blir omtrent det samme som 65 av 100.

Det pleier å være vanlig å sette grensen ved 5% eller 10%, men det avhenger selvsagt av hva man skal undersøke og hvor sikre resulater man ønsker. Statistikk forteller ikke noe om det var flaks eller ikke, men sannsynligheten for at det var det. Den blir, rimelig nok aldri 0%, men man kommer etter hvert veldig, veldig nærme. Har en av en stor gruppe veldig god score, er det rimelig at den tester på nytt siden sannsynligheten for at en av mange får mange riktige gjennom flaks selvsagt øker jo flere testdeltagere. Så at f.eks en av 10 personer klarer 8 av 10 forteller egentlig ikke så veldig mye.

KW · 09.06.2010

orso skrev:
Veldig bra iniativ.
Men hvorfor så få lyttere som 4 stykker? En test med større deltagelse har mye større "tyngde". Kjør på med så mange som mulig.

Så synes jeg godt man la vær å publisere hva enkelte scorte. Opplys heller totalresultatet, så ingen skal være nervøs for å bli stilt i dårlig lys. Nå har selv ingen tro på forskjeller, så sant kablene ikke har klare målbare avvik (som er innenfor det hørbare) eller utstyr som er sært og dårlig konstruert, men det skal være lov å ha en dårlig dag når man er med i blindtest.

Vet vi forresten med sikkerhet at Oblivion kablene er konstruert uten klare avvik?

Hva i huleste er klare avvik da, bortsett da fra ekstremt store avvik kvadratmessig og det vil vel da uansett kun dreie seg om HT.kabel.

Mvh.KW

KW · 09.06.2010

nb skrev:
KW skrev:

Stakkars den personen som greier å detektere forskjell i ca. 9 av 10 tilfeller og så bli møtt med påstanden om at sannsynligheten for at det bare er flaks.......flakser rundt øra hans.

Er det virkelig en umulighet for at en person hører forskjell helt reelt dersom det likereelt er en målbar forskjell, selv om han kanskje grunnet et øyeblikks dårlig konsentrasjon skulle bomme en av 10 ganger sånn ca.

Klikk for å utvide...

Det er slikt man har statistikk til. Den forteller noe om sannsynligheten for at det bare var flaks. Om den er "tilstrekkelig lav" så styrker det den undersøkte hypotesen. Har du veldig mange forsøk kan man bomme veldig mange ganger og likevel få bra resultat. Si at man trenger 8 av 10 for å være fornøyd, gjør man derimot 100 forsøk holder det med 61 av 100 for at sannsynligheten for at resultatet fremkom ved flaks er omtrent den samme.

9 av 10 blir omtrent det samme som 65 av 100.

Jeg tenkte jo mer i banen 90 % da altså 90 av 100 ganger, men lenge før det er man nok rimelig surrete i huet uansett.
F.eks 9 av 10 10 ganger over 10 forskjellige ganger/dager om du skjønner hva jeg mener.
Mvh.KW

nb · 09.06.2010

KW skrev:
Jeg tenkte jo mer i banen 90 % da altså 90 av 100 ganger, men lenge før det er man nok rimelig surrete i huet uansett.
F.eks 9 av 10 10 ganger over 10 forskjellige ganger/dager om du skjønner hva jeg mener.
Mvh.KW

Som vist over så tregs det på langt nær så mange riktige ved så mange forsøk for å få en ekstrem forklaringsgrad.
Det går, statistisk sett, ut på ett om du kjører 10 forsøk daglig i 10 dager eller 100 på en dag siden de enkelte forsøkene er uavhengige (i alle fall i teorien).

Har du 70% riktig, dvs 70 av 100 er sannsynligheten for at du har truffet så ofte gjennom tipping ca 0,002%. For 80 av 100 blir det 0,000000001% (muligens har jeg blingset på en null der, men du skjønner tegninga

) Til sammenligning er sannsynligheten for 7 rette i Lotto ca 0,000018% om du leverer en enkeltrekke.

Det som imidlertid er statistisk litt interessant er om man antar at sannsynligheten for å høre forskjell er større enn 50%, da trengs det langt flere riktige. La oss bare for disusjonens skyld si at det er 80% sjanse for å tippe riktig, dvs at lytteren er veldig sikker på å treffe, men bommer innimellom av en eller annen grunn (i dette tilfelle 1 av 5 ganger). Da ville det kreve 86 av 100 for at det skulle være flaks med mindre enn 5% sannsynlighet.

(Excel-funksjonen BINOMDIST gir deg tallene om du vil leke deg litt med de selv)

nb · 09.06.2010

Det som er skummelt er f.eks. følgende rekkefølge på "X", dvs den som skal identifiseres som A eller B:
B,B,A,A,B,A,B,B,B,B (var første jeg fikk når jeg genererte den tilfeldig i Excel). Da vil kanskje noen tenke at "nei, det kan ikke være B fire ganger på rad og så mange ganger totalt, så jeg sier A selv om jeg tror det er B" mot slutten av de 10 forsøkene.

Parelius · 09.06.2010

orso skrev:
Så synes jeg godt man la vær å publisere hva enkelte scorte. Opplys heller totalresultatet [zip]

Tiltredes. Det som er interessant er jo resultatene, ikke personene. Tror også at det kan være greit å få dette klart på forhånd.

KW · 09.06.2010

nb skrev:
KW skrev:

Jeg tenkte jo mer i banen 90 % da altså 90 av 100 ganger, men lenge før det er man nok rimelig surrete i huet uansett.
F.eks 9 av 10 10 ganger over 10 forskjellige ganger/dager om du skjønner hva jeg mener.
Mvh.KW

Klikk for å utvide...

Som vist over så tregs det på langt nær så mange riktige ved så mange forsøk for å få en ekstrem forklaringsgrad.
Det går, statistisk sett, ut på ett om du kjører 10 forsøk daglig i 10 dager eller 100 på en dag siden de enkelte forsøkene er uavhenige (i alle fall i teorien).

Har du 70% riktig, dvs 70 av 100 er sannsynligheten for at du har truffet så ofte gjennom tipping ca 0,002%. For 80 av 100 blir det 0,000000001% (muligens har jeg blingset på en null der, men du skjønner tegninga

Det som imidlertid er statistisk litt interessant er om man antar at sannsynligheten for å høre forskjell er større enn 50%, da trengs det langt flere riktige. La oss bare for disusjonens skyld si at det er 80% sjanse for å tippe riktig, dvs at lytteren er veldig sikker på å treffe, men bommer innimellom av en eller annen grunn (i dette tilfelle 1 av 5 ganger). Da ville det kreve 86 av 100 for at det skulle være flaks med mindre enn 5% sannsynlighet.

(Excel-funksjonen BINOMDIST gir deg tallene om du vil leke deg litt med de selv)

Ok!
Jeg tror jeg skjønner tegninga og eksemplet/forslaget med 10 ganger fordelt over 10 forskjellige dager gjelder meg da ;D

Får håpe at folk flest er enig med meg i at det burde være lettere for en som hevder at forskjellene er stooore å greie høy score enn en som bare hevder at de er marginale, enten de nå er store eller marginale bare sånn for troverdighetens skyld mener jeg :

;D

Jeg hadde ikke giddi, men så hevder jeg heller ikke store forskjeller på kabler, men fornekter heller ikke de små.
Med egen evne til å se små forskjeller og fargenyanser grunnet trening/erfaring og erfaring med mange andres dårlige ditto så må jeg jo bare innse at det godt kan forholde seg også slik vedrørende små lydforskjeller....... at noen er flinkere enn andre..........men en ting er å påstå en helt annen er å bevise.

Mvh.KW

KW · 09.06.2010

Parelius skrev:
orso skrev:

Så synes jeg godt man la vær å publisere hva enkelte scorte. Opplys heller totalresultatet [zip]

Klikk for å utvide...

Tiltredes. Det som er interessant er jo resultatene, ikke personene. Tror også at det kan være greit å få dette klart på forhånd.

Jeg er enig at personen kan og bør anonymiseres, men jeg synes da i retferdighetens navn at om en er flink får høy score og det kanskje gode evner til å lytte grunnet erfaring med nettopp det, så skal ikke resultatet bare vises som et gjennomsnitt av hele gruppa? Eller misforstår jeg?

Mvh.KW

Bjørn ("Orso") · 09.06.2010

KW skrev:
Hva i huleste er klare avvik da, bortsett da fra ekstremt store avvik kvadratmessig og det vil vel da uansett kun dreie seg om HT.kabel.

Mvh.KW

Det har ikke full oversik over, men det finnes kabler med såpass klare avvik at de låter annerledes. Men vi snakker da om høyttalerkabler så vidt jeg vet, og da er det uvesentlig for denne testen. Glemte at det var snakk om signalkabler......

Stealth Fine Ribbon er forresten et eksempel med avvik som det kom fram i denne testen med målinger:
http://www.audioholics.com/reviews/cables/speaker-cable-face-off-1/speaker-cable-face-off-1-page-2

nb · 09.06.2010

KW skrev:
Jeg er enig at personen kan og bør anonymiseres, men jeg synes da i retferdighetens navn at om en er flink får høy score og det kanskje gode evner til å lytte grunnet erfaring med nettopp det, så skal ikke resultatet bare vises som et gjennomsnitt av hele gruppa? Eller misforstår jeg?

Ja, du gjør nok det - i alle fall delvis. At en av en stor gruppe scorer bra er ikke så oppsiktsvekkende. Og det blir mindre oppsiktsvekkende jo større gruppen er. For å avgjøre om denne personen er et ekte gulløre eller bare heldig må da denne personen testes en gang alene.

Igjen kan man regne ut sannsyligheten for at f.eks en av 10 fikk 9 av 10 riktige. Den vil være betydelig høyere enn om vedkommende ble testet alene. I følge store talls lov vil normalt en høy score bli kansellert av en annens lave score slik at resultatet for gruppen som helhet blir middelmådig (dersom det ikke er mulig å høre forskjell, vel og merke).

rama · 09.06.2010

det gjør meg nada om resultatet for hver enkelt flashes her på hfs.
og jeg bryr meg ikke om folk beskylder meg for å ha flaks eller uflaks.
jeg gjør dette for egen vinnings (og fornøyelses) skyld, uansett resultat, og ikke for å tilfredstille noen andre.

jeg går ut ifra at vi skal lytte en og en, og ikke en hel bøling som krangler om sweet spot i samme sofaen?
og at man velger musikk og lengde på kuttet selv.

forøvrig skal lyttekaninene sette premissene for testen, og ikke diverse gnålere.
det viktigste er at vi abx-lytter blindt til to ulike kabler, et x antall ganger.

og ikke fan om jeg kjører 100 runder!
jeg har et liv, ffs.

nb · 09.06.2010

Gago skrev:
og ikke fan om jeg kjører 100 runder!
jeg har et liv, ffs.

100 runder er neppe aktuelt, var kun et eksempel for å illustrere sannsynlighetsberegningene - man kan bomme svært mange ganger bare det er nok forsøk. Skal en test gjennomføres så er det kurant å ha klart for seg hva den forteller og hva den ikke forteller. I diskusjoner rundt enkelte tester har det blitt sagt ting som "jamen han hadde jo de første tre korrekt, han ble sikkert sliten etter det" "men han ene hadde jo 8 av 10" osv - forklaringene på at så er tilfelle kan være mange, men det lar seg gjøre å regne ut hva sannsynligheten for at noe bare var flaks er i slike tilfeller.

Testen Lavinge(?) gjorde ble avbrutt fordi han hadde bommet såpass mange ganger at de ikke ville fått et resultat som var så signifikant som de på forhånd hadde bestemt seg for. Det er helt kruant å gjøre, det er ikke kurant å avbryte etter 3 av 10 og si at man har klart alle og slå seg til ro med det. Eller legge spesielt stor vekt på de to første eller lignende. Det kan finnes rimelige forklaringer på at så er tilfelle, men statistisk er det irrelevant. Det er statistisk kurant å avbryte etter 3 av 10 for så å kjøre de resterende 7 på et senere tidspunkt, poenget er at man ikke kan cherrypicke resultatene man synest passer best etterpå.

rama · 09.06.2010

altså, jeg driter i hva folk her inne måtte finne "statistisk relevant".

jeg stiller opp og lytter, og drar mine egne konklusjoner - til egen nytte.

la si at vi kjører 10 runder.
klarer jeg 8 eller mer, så slår jeg meg til ro med at jeg hører forskjell men var ukonsentrert og bommet et par ganger.
6-8 = hmmm, betenkelig, dette må gjentas en annen gang.
under 6 = ikke en dritt forskjell. clas ohlson next!

andre lyttekaniner får bomme eller treffe så mange ganger de vil for min del, det har ingenting med meg å gjøre.

Parelius · 09.06.2010

Gago skrev:
altså, jeg driter i hva som folk her inne måtte finne "statistisk relevant".

Det er jo greit nok, men gjøres dette for din skyld?

Når en nå først går til dette skrittet, så er det jo litt dumt å bare ta et halvt steg.

nb · 09.06.2010

Gago skrev:
klarer jeg 8 eller mer, så slår jeg meg til ro med at jeg hører forskjell men var ukonsentrert og bommet et par ganger.
6-8 = hmmm, betenkelig, dette må gjentas en annen gang.
under 6 = ikke en dritt forskjell. clas ohlson next!

Greit nok (8 av 10 er det kun 5,45% sannsynlighet for at er ved flaks for en enkelt lytter, altså ganske lav som du selv antar) - det ville uansett være et temmelig fornuftig sted å sette grensen også i et formellt eksperiment. 9 av 11 ville kanskje være bedre egnet som grense, da kommer man seg under 5%-grensen som ligger akkurat mellom 8 og 9 av 10.

rama · 09.06.2010

Parelius skrev:
Gago skrev:

altså, jeg driter i hva som folk her inne måtte finne "statistisk relevant".

Klikk for å utvide...

Det er jo greit nok, men gjøres dette for din skyld?

Når en nå først går til dette skrittet, så er det jo litt dumt å bare ta et halvt steg.

hva mener du med et halvt steg, parelius?

ja, jeg gjør dette for min skyld.
jeg har kjørt enkle blindtester før (kun tre runder av gangen), men har aldri orka å gjøre det skikkelig.

hvis noen kan arrangere en litt større test, så stiller jeg mer enn gjerne.
jeg er ikke bekymret for å få et nullresultat, for å si det slik.

jeg har ingen dyre kabler å forsvare, ingen mennesker jeg skal tilfredstille (forutenom kona mi), ingen kjepphester å ri.
derimot vil jeg gjerne lære litt mer om min egen hørsel og hi-fi, så dette blir da bare artig.

Parelius · 09.06.2010

Gago skrev:
Parelius skrev:

Gago skrev:

altså, jeg driter i hva som folk her inne måtte finne "statistisk relevant".

Klikk for å utvide...

Det er jo greit nok, men gjøres dette for din skyld?

Når en nå først går til dette skrittet, så er det jo litt dumt å bare ta et halvt steg.

Klikk for å utvide...

hva mener du med et halvt steg, parelius?

ja, jeg gjør dette for min skyld.

Ikke noe annet enn at virker litt rart å drite i hva som er statistisk relevant.

At du på privaten får vite scoren din og trekker dine konklusjoner på det er jo ikke noe jeg har imot.

Tror vi snakker ut fra to forskjellige perspektiv her.

rama · 09.06.2010

åja, sånn å forstå.

altså, folk må gjerne bruke "tallene" mine som de vil, lage statistikk og herje og kose seg.

Parelius · 09.06.2010

Gago skrev:
altså, folk må gjerne bruke "tallene" mine som de vil, lage statistikk og herje og kose seg.

He-he!

KW · 10.06.2010

Gago skrev:
åja, sånn å forstå.

altså, folk må gjerne bruke "tallene" mine som de vil, lage statistikk og herje og kose seg.

;D ;D ;D
KW

OMF · 10.06.2010

Bare for å kaste lys over en liten sak til....

Vi må på forhånd bestemme oss for om det skal kjøres en "gruppetest" eller om det skal kjøres "individuelle tester".

Hvorfor det....

La oss ta to eksempler - antall riktige av 10 forsøk under
Test 1 og test 2
Lytter 1 8 10
Lytter 2 7 3
Lytter 3 8 5
Lytter 4 6 6

Hvis vi nå evaluer test 1 som 4 enkelt tester - så vil ingen ha en signifikant treffprosent. Dette er alt innenfor naturlig variasjon.
Hvis vi derimot ser på det som en gruppetest - så har gruppen 29 av 40 riktige - mot en forventing på 20. Dette er statisk signifikant og påviser at man har greid å identifisere riktige.

I test 2 er tallene litt anerledes. Som enkelt tester vil lytter 1 ha bevist sine egenskaper med 10/10, mens gruppen har et snitt på 24 som ikke beviser noen ting.

Det er viktig at testens evalueringskritereier avklares på forhåmnd - slik at man ikke bedriver data mining i etterkant - slik det er påpekt med blant annet Lavinge testen. Det blir litt sånn som man viser på den 6.sans på TV. Man lar en gruppe mennesker gjette på et eller annet - en relativt stor gruppe gjetter på et spørsmål med ikke så alt for mange variabler - noen gjetter omtrentlig eller helt riktig - så fjerner man de andre deltakerne og står igjen med en person som har andre evner. Det blir det samme som å velge ut lottovinneren ut av 2 millionere spillere - for så å beskrive hvor usedvanlig dyktige denne fyren er!

Mvh
OMF

kneip · 10.06.2010

OMF skrev:
Vi må på forhånd bestemme oss for om det skal kjøres en "gruppetest" eller om det skal kjøres "individuelle tester".

Om formålet er å finne ut om lyttepanelet hører forskjell er gruppetest suverent best, fordi det gir desidert høyest konfidens.

Jeg ser ikke helt at dere må bli enige om det på forhånd. Gjennomføringen av testen vil jo være den samme, uansett.

Parelius · 10.06.2010

En annen ting som kanskje også kunne gjøres:

Tar det for gitt at spesifikasjonene på kablene er kjent. Hvis en i tillegg kunne skaffet spesifikasjoner på utstyret, så ville en ha mulighet til å se om en kan si noe om forventet lydlighet på rent teoretisk basis forut for testen.

To ting vil en da kunne antyde noe om, og en tredje bonus:

1) Teoriens evne (gitt visse opplysninger) til å forutsi noe om lyden.

2) Hvis teorien kan komme med noe slikt, så vil en også kunne gjøre deltagerne oppmerksomme på hva de eventuelt skulle være spesielt oppmerksomme på. I seg selv noe som er et gode i en slik test. Og dermed

3) om slike teoretiske forutsigelser er innenfor det hørbare for oss dødelige.

Alle tre dele en fordel, vil jeg anta.

utgatt60135 · 10.06.2010

nb skrev:
KW skrev:

Stakkars den personen som greier å detektere forskjell i ca. 9 av 10 tilfeller og så bli møtt med påstanden om at sannsynligheten for at det bare er flaks.......flakser rundt øra hans.

Er det virkelig en umulighet for at en person hører forskjell helt reelt dersom det likereelt er en målbar forskjell, selv om han kanskje grunnet et øyeblikks dårlig konsentrasjon skulle bomme en av 10 ganger sånn ca.

Klikk for å utvide...

Det er slikt man har statistikk til. Den forteller noe om sannsynligheten for at det bare var flaks. Om den er "tilstrekkelig lav" så styrker det den undersøkte hypotesen. Har du veldig mange forsøk kan man bomme veldig mange ganger og likevel få bra resultat. Si at man trenger 8 av 10 for å være fornøyd, gjør man derimot 100 forsøk holder det med 61 av 100 for at sannsynligheten for at resultatet fremkom ved flaks er omtrent den samme.

9 av 10 blir omtrent det samme som 65 av 100.

Det pleier å være vanlig å sette grensen ved 5% eller 10%, men det avhenger selvsagt av hva man skal undersøke og hvor sikre resulater man ønsker. Statistikk forteller ikke noe om det var flaks eller ikke, men sannsynligheten for at det var det. Den blir, rimelig nok aldri 0%, men man kommer etter hvert veldig, veldig nærme. Har en av en stor gruppe veldig god score, er det rimelig at den tester på nytt siden sannsynligheten for at en av mange får mange riktige gjennom flaks selvsagt øker jo flere testdeltagere. Så at f.eks en av 10 personer klarer 8 av 10 forteller egentlig ikke så veldig mye.

Du tenker vitenskapelig bevis, men selv er jeg mer opptatt av om blindtester stadfester at lydsignaturen man opplever å høre faktisk stemmer og derav ikke er innbildt.

Alså at det ikke dreier seg om "tipping", men reelle hørbare forskjeller. Det var grunnen til at jeg ikke brydde meg om å gjennomføre veldig mange repitisjoner i tillegg til at man kan bli fort "mett" etter mange runder. Jeg mente at jeg klarte å detektere en signatur og klarte å gjenkjenne denne blindt og ikke tro at det kanskje var kabel a. Konklusjonen min var at jeg kunne stole på mine lytteevner, ikke for å obverbevise skeptikere. En annen konklusjon var at kabelforkjeller er veldig små og at f.eks hifi skribenter overdriver voldsomt. Og en tredje var at forskjellene virker klart mindre blindt enn ikke blindt.

Om mange nok gjennomfører slike uformelle blindtester budre det være troverdig nok. Jeg ville neppe stilt opp på en seanse med mange ukjente, et ukjent anlegg og skeptikere som vil ha bevis.

Kaare G. Opsahl · 10.06.2010

ErosLoveking skrev:
for min egen del gidder jeg ikke å velge skyttegrav. Kanskje er det forskjeller, kanskje ikke..... har liksom aldri helt klart å fordype meg eller prøve.

Kan jeg være en god lyttekanin??

yes!

ErosLoveking · 10.06.2010

65finger skrev:
ErosLoveking skrev:

for min egen del gidder jeg ikke å velge skyttegrav. Kanskje er det forskjeller, kanskje ikke..... har liksom aldri helt klart å fordype meg eller prøve.

Kan jeg være en god lyttekanin??

Klikk for å utvide...

yes!

takk!

føler meg selv som en ganske liberal lytteautomat. Siden jeg har et rævkjørt anlegg, påkostet et par kroner i overkant, litt mål og mening, men uten helt styring, ja jeg er gjerne med. En session uten smørning, to med rom.

hehe.

ikke avskriv meg helt som et tullehue, er ganske sikker på at jeg har langt mer oppegående lyttetuter plassert i toppetasjen uten så store forutinntatte forventninger enn de fleste som melder seg på her har.

*host*

OMF · 10.06.2010

kneip skrev:
OMF skrev:

Vi må på forhånd bestemme oss for om det skal kjøres en "gruppetest" eller om det skal kjøres "individuelle tester".

Klikk for å utvide...

Om formålet er å finne ut om lyttepanelet hører forskjell er gruppetest suverent best, fordi det gir desidert høyest konfidens.

Jeg ser ikke helt at dere må bli enige om det på forhånd. Gjennomføringen av testen vil jo være den samme, uansett.

Ved en gruppetest så vil en lytterns dårlige resultat kunne ødelegge for en annen lytters gode resultat.

Vel eksempempelet ovenfor forklarer hvorfor vi må velge metode først. Ved slike forsøk med usikkerhet og en gitt sannsynlighets fordeling - så må man bestemme seg for hva man ønsker å oppnå på forhånd - man kan ikke gjøre som enkelte har gjort med feks Lavigne testen og se på dataene i etterkant og tilpasset metoden -feks ved å bare godkjennte de første resultatene etter pausen fordi de var riktige. Dette er helt grunnleggende for sannsynlighetsregning.

Det blir tydeligere hvis vi øker antall lyttere. La oss si at vi har 50 lyttere.

Sannsynligheten for at 1 lytter skal ha alle riktige på 10 forsøk er 0,5^10 = 0,1% - altså rimelig sikkert.
Dette kan bare skje i et av 1000 tilfeller.

Derimot hvis vi ser på gruppen med 50 lyttere som helhet - så er sannsynligheten for at 1 av dem faktisk har alle 10 riktige så høy som 5%, og øker vi antalleet til 100 - stiger sannsynligheten for et helt riktig resultatet til 10% - selv om testdeltakerne ikke har evnen til å skille kablene. Og da er litt av kluet at man kan ikke ta denne ene deltakeren ut av konteksten og si at han har greid å skille kablene fra hverandre. Det gjør man ofte - og så glemmer man at sannsynligheten for at dette skulle skje var 10% også hevder man at det har skjedd noe som har en sannsynlighet på 0,1%. Dette er "datamining" Derfor må man på forhånd bestemme seg for hva man ønsker å sjekke.

Mvh
OMF

kneip · 10.06.2010

OMF skrev:
Det blir tydeligere hvis vi øker antall lyttere. La oss si at vi har 50 lyttere.

Sannsynligheten for at 1 lytter skal ha alle riktige på 10 forsøk er 0,5^10 = 0,1% - altså rimelig sikkert.
Dette kan bare skje i et av 1000 tilfeller.

Derimot hvis vi ser på gruppen med 50 lyttere som helhet - så er sannsynligheten for at 1 av dem faktisk har alle 10 riktige så høy som 5%, og øker vi antalleet til 100 - stiger sannsynligheten for et helt riktig resultatet til 10% - selv om testdeltakerne ikke har evnen til å skille kablene. Og da er litt av kluet at man kan ikke ta denne ene deltakeren ut av konteksten og si at han har greid å skille kablene fra hverandre. Det gjør man ofte - og så glemmer man at sannsynligheten for at dette skulle skje var 10% også hevder man at det har skjedd noe som har en sannsynlighet på 0,1%. Dette er "datamining" Derfor må man på forhånd bestemme seg for hva man ønsker å sjekke.

Mvh
OMF

Om man vil sjekke om hvem i panelet som treffer, så er jo selvfølgelig individuelle tester tingen. Hvis man har mange deltakere så må man vel da enten kjøre mange repetisjoner eller plukke ut de som scorer bra til en finalerunde eller lignende for å få opp konfidensen.

Et annet moment er at jeg tviler på at man ser hardbarkede skeptikere løpe til kabelsjappa med kun 95% konfidens. det er jo tross alt 1/20 sjanse for at resulatet er ren tilfeldighet. Da må det enda en runde til. Men da kanskje det er enda flere som vil stille sin tid til disp.

rama · 10.06.2010

individuelt må det være.

kan ikke ha en bøling som sitter i sofaen og drekker øl, promper og krangler om sweet spot, og noen kanskje havner halvveis ute på gangen siden det tross alt er begrenset med plass i stallen til 65finger.

i så fall ville resultatet vært totalt verdiløst for min del, selv om det er hyggelig med et vorspiel.

Kaare G. Opsahl · 10.06.2010

ErosLoveking skrev:
65finger skrev:

ErosLoveking skrev:

for min egen del gidder jeg ikke å velge skyttegrav. Kanskje er det forskjeller, kanskje ikke..... har liksom aldri helt klart å fordype meg eller prøve.

Kan jeg være en god lyttekanin??

Klikk for å utvide...

yes!

Klikk for å utvide...

takk!

føler meg selv som en ganske liberal lytteautomat. Siden jeg har et rævkjørt anlegg, påkostet et par kroner i overkant, litt mål og mening, men uten helt styring, ja jeg er gjerne med. En session uten smørning, to med rom.

hehe. ikke avskriv meg helt som et tullehue, er ganske sikker på at jeg har langt mer oppegående lyttetuter plassert i toppetasjen uten så store forutinntatte forventninger enn de fleste som melder seg på her har.

*host*

du er intet tullehue eros, det er sikkert!

Skink_123 · 10.06.2010

Ja håper det blir minst mulig sirkus og mest mulig lax stemning.

OMF · 14.06.2010

Hei!
Denne er ikke glemt altså...bare litt travelt også har vi relativt romslig tidsplan så vidt jeg har forstått....

Mvh
OMF

Karma · 17.06.2010

Gago skrev:
kan ikke ha en bøling som sitter i sofaen og drekker øl, promper og krangler om sweet spot,...

Slike råd må jo bare være helt uvurderlige for OMF! ;D ;D ;D

ABX · 30.06.2010

nb skrev:
Bruker du BINOMDIST, antar 50% sannsynlighet for korrekt, gjør 10 forsøk og en lytter har la oss si 7 riktige så gir
=BINOMDIST(7;10;0,5;TRUE) svaret 0,9453 eller 94,53%, dvs at det er 94,53% sannsynlighet for å syv eller færre riktige, så sannsynligheten for at det bare er flaks at vedkommende har flere enn 7 av 10 blir da 100%-94,53% = 5,47%. Sannsnligheten ser slik ut (for at det bare er flaks)
7 eller fleire av 10 17,18%
8 eller fleire av 10 5,47%
9 eller fleire av 10 1,07% 0,11%
10 av 10 er 0,5^10 = 0,00098 = 0,098% 0%

Det at du har flere lyttere kan ses på som uavhengige forsøk, så det blir egentlig det samme. Er det 10 lyttere som hver gjør 10 forsøk er sannsynligheten for at minst 1 vil ha 7 eller flere av 10 riktige den samme - 17,18 større enn 99,999% !!
Med et lite forbehold om at satistikken min er smårusten....

(Korreksjonar i innlegget over)
Det statistiske opplegget dykkar (dvs. "OMF + resten") er ikkje godt nok.
Når det gjeld kabeldebatten så er svaret gitt for dei som trur på vitenskapen, og eg gidder ikkje bidra meir i samanheng med ABX av kablar.
http://www.theaudiocritic.com/downloads/article_1.pdf
Men eg deltek og bidrar gjerne på ABX-testing av forsterkeri (både for- og effektforsterkar):
http://www.hifisentralen.no/forum/index.php/topic,48745.0.html

HCS · 30.06.2010

Temmlig påtagelig hvordan enkelte teori-huer gjemmer seg bak alskens "svada" enn å stille opp å se en blindtest gjennomført i praksis. Honnør til OMF for tiltaket. Uansett utfall så er det iallefall noe konkret, ikke tåkeprat via en graf som enkelte her inne ser som sitt store bidrag...

Kaare G. Opsahl · 30.06.2010

Det blir spennende! jeg skifter elementer i Ht i løpet av juni og de trenger tid til å spille seg inn. De forrige tok 8mnd ;D har bassknørv så det blir nok en test i løpet av september

Gjennomøfring av blindtest på signalkabel!

nb

Gjest

biskopen av holmlia

Bransjeaktør

Hi-Fi freak

nb

Gjest

Hi-Fi freak

Hi-Fi freak

nb

Gjest

nb

Gjest

Parelius

Gjest

Hi-Fi freak

Hi-Fi freak

Bransjeaktør

nb

Gjest

biskopen av holmlia

nb

Gjest

biskopen av holmlia

Parelius

Gjest

nb

Gjest

biskopen av holmlia

Parelius

Gjest

biskopen av holmlia

Parelius

Gjest

Hi-Fi freak

Æresmedlem

Hi-Fi entusiast

Parelius

Gjest

utgatt60135

Gjest

Kaare G. Opsahl

Gjest

Æresmedlem

Æresmedlem

Hi-Fi entusiast

biskopen av holmlia

Kaare G. Opsahl

Gjest

Bransjeaktør

Æresmedlem

Hi-Fi freak

ABX

Gjest

En vanlig fyr fra bygda..

Kaare G. Opsahl

Gjest