Dette er et regneark med binominal-fordelingen som kan bruke til å regne ut sannsynligheten for å få et gitt resultat med bare "flaks".5.1 Hvordan omvende en skeptiker
Enkelte audiofile mener at blindtester svikter som metode. Disse kan ikke henviset til noe vitenskaplig som underbygger det, men overbevisningen er sterk. Mange andre mener at blindtester er en grei metode, men at de testene som er kjørt så langt svikter. En siste gruppe har stor tiltro til blindtester, og mener at fraværet av blindtester er en indikasjon (men ikke bevis) på at et fenomen er uvesentlig. Dersom man irriterer seg over skeptikere som ikke deler din entusiasme over tweak/dippedutt X så er det en metode som fungerer...
En grunnleggende egenskap ved gode forsøk er at de tåler at kritiske sjeler leter med argus-øyne for å finne svakheter. Hvis man ikke tolerer at andre er kritisk til det man sier og skriver, så kan det å publisere en test gi mye frustrasjon.
Hvis man derimot tar saklig kritikk som noe positivt, muligheten til å gjøre ting så godt som mulig, så kan man også være sin egen største kritiker under planlegging og gjennomføring. Ved å stadig tenke igjennom hvilke saklige innvendinger som kan komme mot valgene du tar, så er det rimelig at du får et bedre slutt-resultat.
5.1.1 Første grunnregel er å dokumentere alt. Det kan aldri bli for nitidig dokumentasjon, men du bør selvsagt "sile" hva du presenterer i et gitt dokument/sammendrag. Ta bilder av oppsettet, mål fenomenene du skal teste, oppgi navn/modell etc. Ikke minst så må du oppgi hva personene under test har svart (gjerne anonymisert). Tenk på hva en ukjent person må vite for å kunne gjenta eksperimentet ditt bare ut fra dokumentasjonen, og fremdeles ha størst mulig sjanse for samme resutat.
5.1.2 Ha kontroll på statistikken. En av de vanligste feilene som vi vanlige dødelige gjør, er at vi bruker intuisjon som erstatning for statistikk. Ting som kan virke som "for usannsynlig til at det kan være flaks/uflaks" kan være mer sannsynlig enn man tror. Og motsatt.
5.1.3 Ha kontroll på grunnleggende premisser for blindtesting av lyd. Dersom nivået mellom to lydkilder avviker med mer enn 0.1dB så er det mulig at personene hører forskjell på lydnivå istedetfor lydkvalitet. At en CD-spiller spiller litt høyere enn en annen er normalt ikke så veldig interessant. Sørg for en positiv atmosfære der test-deltakerne føler seg avslappet og motivert til å høre forskjeller.
5.1.4 Rederlighet. Dersom formålet med en blindtest er å få "innblikk i virkeligheten" (og ikke å vinne en eller annen diskusjon), så bør du offentliggjøre resultatet uansett. Det aller beste er at du offentliggjør det at du skal gjøre en blindtest på forhånd, og så offentliggjør resultatet etterpå. Dersom du mener at resultatet er ugyldig så skriv en forklaring.
Ja. Ta imot råd fra de som har gjennomført blindtester og fra faglitteraturen i stedetfor å bruke masse tid på å finne opp kruttet på nytt bare for å komme til et resultat som ingen setter lit til, eller som maskerer reelle forskjeller.Greven skrev:1) For det første synes jeg målsetningen med testen må være å finne ut om det er forskjell - ikke gradere opp denne evt forskjellen. Det vil gjøre både gjennomføringen, databehandlingen og "publiseringen" av resultatet mye enklere. Om man så kommer frem til at det er forskjell, så har man jo noe å gå videre med en annen gang.
Dette kommer litt an på lokalene og muligheter for kabling.4) "Switch-ansvarllig" deltar selvfølgelig ikke i testen. Optimalt burde han heller ikke være i samme rom, men dette blir vel umulig å gjennomføre.
Det er ofte enklest å gjennomføre testen individuelt.5) Skjema der deltakere krysser av for hvilket drivverk som er innkoblet holdes selvfølgelig skjult for de andre deltakerne. Jeg tror det er helt umulig å vurdere andre parametre enn "hvilket drivverk spiller", så hold dere til dette.
Det er fritt opp til de som designer testen å velge klipplengde. Dersom man ønsker positivt resultat så anbefaler jeg også korte klipp.6) Bli enige om hvilke musikkstykker som skal brukes under gjennomføringen. Bruk musikk som det er enighet om at er best egnet for å skille små forskjeller og brenn dette på to disker (slik unngår man også evt påstander om at kvaliteten heves av å brennes...). Få evt noen data/matlab kyndige til å matematisk bevise at diskene er 100% identiske.
7) Bli enige om varighet på klippene. Jeg tror at korte klipp vil gi størst mulig sannsynlighet for å høre forskjell og vil anbefale 30 sek klipp.
Det er ingenting i veien for å gjennomføre to runder: en åpen runde hvor de som vil får delta, og så analysere resultatet og gjennomføre en andre runde med bare de lytterne som hadde signifikant positive besvarelser.8 ) Få noen som er stødige i statistikk til å regne ut hvor mange gjennomføringer som trengs for å kunne gi et fornuftig tallmatriale med 6 (?) deltakere. I denne sammenheng er det ikke en fordel at nb deltar i panelet da han er en uttalt skeptiker. Man bør derfor regne ut antall repitisjoner som kreves om panelet består av 5 deltakere (som da er antallet som på forhånd mener å høre forskjell). Merk at dette er for å øke sannsynligheten for å detektere evt forskjell.
knutinh skrev:Enkelte audiofile mener at blindtester svikter som metode. Disse kan ikke henviset til noe vitenskaplig som underbygger det, men overbevisningen er sterk.
Henvisning? Hva er det du har fått med deg som artikkelen (fra siste nummer av JAES) under har misforstått?Voff skrev:Dette er dokumenter til det kjedsommelige i forskningen.knutinh skrev:Enkelte audiofile mener at blindtester svikter som metode. Disse kan ikke henviset til noe vitenskaplig som underbygger det, men overbevisningen er sterk.
"On Some Biases Encountered in Modern Audio Quality Listening TestsA Review*
S?AWOMIR ZIELIN´ SKI, AES Member, AND FRANCIS RUMSEY, AES Fellow
(S.Zielinski@surrey.ac.uk) (f.rumsey@surrey.ac.uk)
Institute of Sound Recording, University of Surrey, Guildford, GU2 7XH, UK
AND
SØREN BECH, AES Fellow
(SBE@bang-olufsen.dk)
Bang & Olufsen, Struer, Denmark
...
In general listeners affective judgments can be biased
by the appearance of the equipment, price, and branding.
For example, Toole and Olive demonstrated that in preference
tests (affective judgments) both experienced and
inexperienced listeners were biased by the appearance and
the brand names of the loudspeakers evaluated [38].
...
This study is often quoted as a classical example
of how important it is to undertake blind listening
tests in order to reduce nonacoustic bias.
...
a group of listeners
were asked to assess the audio quality of two identical
types of hearing aids, labeled as either digital or conventional.
They found that out of 40 participants 33 listeners
preferred the hearing aids labeled digital, 3 preferred
the conventional ones, and only 4 participants did not hear
the difference between the two. Like Toole and Olive,
Benter et al. also emphasized the importance of undertaking
blind listening tests in order to minimize this type
of bias.
...
Hvorfor ville du benytte deg av en metode som i følge deg dokumentert metodisk svikter?...Jeg synes at blindtester på blinde kunne ha vært interessant!
Dersom du med dette tenker på boka over ("Evolving the mind"), så ville det kanskje være ærlig å opplyse leseren om at forfatteren selv innrømmer at det er temmelig spekulativt, og fritt for empiri? Er det det du mener med "dokumenter til det kjedsommelige i forskningen"?Voff skrev:Det interessante er at jo lengre du begraver deg ned i persepsjonsforskninga (la oss ikke gjøre det her ), jo mer ligner verdensbildet på kvantefysikkens!
Mange forskere gjør nettop en slik tilnærming. Nå har det blitt hevdet at ingen EGENTLIG forstår kvantefysikk.... ;D
Jeg synes faktisk du har et godt poeng her. Nå var det ikke "the usual suspects" som tok initiativet til å gjøre en sånn lyttetest, og det var andre som stilte direkte spørsmål om korrekt metode tidligere i tråden, så jeg syntes det var like greit å svare med en beskrivelse av noe som vil være korrekt metode. Motivasjonen for hele greia var vel å overbevise visse skeptikere, hinsides rimelig tvil, om at det faktisk finnes hørbare forskjeller mellom transporter. Og noen er adskillig mer skeptiske enn andre, så dette ble dimensjonert deretter.Roysen skrev:Dette blir sikkert oppfattet som en provokasjon men jeg synes man burde stikke fingeren i jorda. Vi befinner oss i hifisentralen og ikke i et forskningsinstitutt. Hva er motivasjonen for testen.
Nei, det er jeg ikke enig i. 5 riktige av 5 forsøk eller 7 av 8 holder i massevis (se tabellen i tidligere innlegg, eller regnearket knutinh viste til). Da skal jeg med glede strø magisk vitenskapelig pulver over og erklære dette for Signifikant og Vitenskapelig Bevist. Personlig tror jeg forskjellene her vil være ganske klare, så jeg blir ikke overrasket om det ender opp med sånne tall. For en del andre ting, hvor forskjellene i beste fall er veldig, veldig små kan det trengs mye lengre forsøksserier, noe som blir upraktisk å gjennomføre. De fleste vil gå lei etter noen hundre ABX-forsøk.Testgrunnlaget vil uansett bli for lite for noen konklusjon.
Helt enig, og det var vel omtrent slik jeg avsluttet mitt lange innlegg på forrige side også. Dessuten kan mange små forskjeller som hver for seg ikke er identifiserbare (f eks forvrengning under hørbarhetsterskelen) summere seg opp til noe som definitivt er hørbart gjennom hele kjeden. Å pirke ett eller to strå ut av den høystakken kan ha noe for seg.For det andre er det vel slik at konsekvent identifisering av mindre ulikheter er vanskelig. At en blindtest ikke identifiserer disse ulikhetene betyr ikke at de ikke finnes.
Jeg går ut ifra at det er dette du refererer til:impulse skrev:Med all respekt, KoB..Her er du relativt arrogant. Ingen av de som humrer i skjegget av påstått opplevde forskjeller på drivverk har vist særlig interesse for å delta på testen. Men jeg gjentar, dere er hertelig velkomne!
Jeg skrev dette som svar på Roysens punkt 3: For det andre er det vel slik at konsekvent identifisering av mindre ulikheter er vanskelig. At en blindtest ikke identifiserer disse ulikhetene betyr ikke at de ikke finnes.Det blir litt latterlig å skulle argumentere for eksistens av forskjeller man ikke er i stand til å identifisere, og at slike forskjeller er avgjørende for lyden. He-he. Sorry, klarer ikke å la være, sitter og humrer mens jeg skriver dette.
Det medfører allikevel ingen konklusjon på lik linje med testen til Mike. Hva ønsker man å oppnå med testen annet enn muligens en personlig overbevising for de som deltar. Dette kan sikkert Knutinh si noe mer om enn meg men det kreves så vidt jeg vet en viss mengde på datagrunnlaget for å kunne kalkulere bort fakturer som juks, flaks etc. med nok sikkerhet. Testgrunnlaget her er for lite til å kunne bevise at det er forskjeller som om slike skulle påvises i testen. Dersom det ikke blir påvist noen forskjeller beviser det i hvert fall ingen ting annet enn at de deltakerne som deltar på det tidspunktet som testen ble foretatt under de forutsetningen som forelå på det tidspunktet ikke kunne skille på de spesifikke drivverkene som er med i testen. Hva skal man med en slik test?KindOfBlue skrev:Dette blir sikkert oppfattet som en provokasjon men jeg synes man burde stikke fingeren i jorda. Vi befinner oss i hifisentralen og ikke i et forskningsinstitutt. Hva er motivasjonen for testen. Testgrunnlaget vil uansett bli for lite for noen konklusjon.
Overhodet ikke. Akkurat som vi kan konstatere at Lavigne ikke hører forskjell på Transparent Opus MM og Monster Standard, vil man kunne konstatere om ulike deltagere hører/ikke hører forskjell på drivverk.
Har du lest tråden som avfødte denne testen, Roysen?Roysen skrev:Det medfører allikevel ingen konklusjon på lik linje med testen til Mike. Hva ønsker man å oppnå med testen annet enn mulignes en personlig overbevising for de som deltar. Dette kan sikkert Knutinh si noe mer om enn meg men det kreves så vidt jeg vet en viss mengde på datagrunnlaget for å kunne kalkulere bort fakturer som juks, flaks etc. med nok sikkerhet. Testgrunnlaget her er for lite til å kunne bevise at det er forskjeller som om slike skulle påvises i testen. Dersom det ikke blir påvist noen forskjeller beviser det i hvert fall ingen ting annet enn at de deltakerne som deltar på det tidspunktet som testen ble foretatt under de forutsetningen som forelå på det tidspunktet ikke kunne skille på de spesifikke drivverkene som er med i testen. Hva skal man med en slik test?KindOfBlue skrev:Dette blir sikkert oppfattet som en provokasjon men jeg synes man burde stikke fingeren i jorda. Vi befinner oss i hifisentralen og ikke i et forskningsinstitutt. Hva er motivasjonen for testen. Testgrunnlaget vil uansett bli for lite for noen konklusjon.
Overhodet ikke. Akkurat som vi kan konstatere at Lavigne ikke hører forskjell på Transparent Opus MM og Monster Standard, vil man kunne konstatere om ulike deltagere hører/ikke hører forskjell på drivverk.
Mvh
Roysen
Målinger er jeg helt for. Det burde være protokollen i så måte. Spørsmålet da blir hvilke faktorer er det mulig at påvirker hørselen og kan vi måle disse.KindOfBlue skrev:Samtidig synes jeg dette med blindtester blir noe latterlig. Det blir omtrent som dersom det oppserveres nye ulver i Norge, blindtestes det da for at det med stor sikkerhet kan skilles mellom ulv og hund eller stoler man på sansene?
Her er det protokollen kommer inn, og forsøker å eliminere feil. Akkurat som en ulveobservasjon følges av at viltnemda rykker ut og sjekker terrenget, ser etter spor, leter etter urinmarkeringer (lukter som faen, du har aldri hatt en hund som har hatt slik lukt av urinen.)
Det har jeg fått med meg. Like fullt står spørsmålet mitt - hva skal man med en slik test?KindOfBlue skrev:Har du lest tråden som avfødte denne testen, Roysen?Roysen skrev:Det medfører allikevel ingen konklusjon på lik linje med testen til Mike. Hva ønsker man å oppnå med testen annet enn mulignes en personlig overbevising for de som deltar. Dette kan sikkert Knutinh si noe mer om enn meg men det kreves så vidt jeg vet en viss mengde på datagrunnlaget for å kunne kalkulere bort fakturer som juks, flaks etc. med nok sikkerhet. Testgrunnlaget her er for lite til å kunne bevise at det er forskjeller som om slike skulle påvises i testen. Dersom det ikke blir påvist noen forskjeller beviser det i hvert fall ingen ting annet enn at de deltakerne som deltar på det tidspunktet som testen ble foretatt under de forutsetningen som forelå på det tidspunktet ikke kunne skille på de spesifikke drivverkene som er med i testen. Hva skal man med en slik test?KindOfBlue skrev:Dette blir sikkert oppfattet som en provokasjon men jeg synes man burde stikke fingeren i jorda. Vi befinner oss i hifisentralen og ikke i et forskningsinstitutt. Hva er motivasjonen for testen. Testgrunnlaget vil uansett bli for lite for noen konklusjon.
Overhodet ikke. Akkurat som vi kan konstatere at Lavigne ikke hører forskjell på Transparent Opus MM og Monster Standard, vil man kunne konstatere om ulike deltagere hører/ikke hører forskjell på drivverk.
Mvh
Roysen
Såvidt jeg husker er dette et tiltak som er iverksatt av dem som er overbevist om at det er forskjeller på drivverk (og andre komponenter), og som er villige til å teste denne overbevisningen etter kriterier som en gang for alle skal stoppe kjeften på skeptikere som meg.
Så det er vel hensikten med denne testen?
Vi kjenner heller ikke alle de faktorene som innvirker på et sykdomsbilde, likefullt så prøver vi ut ulike medisiner, mens vi søker å se hva som skjer med dette bildet.Roysen skrev:Målinger er jeg helt for. Det burde være protokollen i så måte. Spørsmålet da blir hvilke faktorer er det mulig at påvirker hørselen og kan vi måle disse.KindOfBlue skrev:Samtidig synes jeg dette med blindtester blir noe latterlig. Det blir omtrent som dersom det oppserveres nye ulver i Norge, blindtestes det da for at det med stor sikkerhet kan skilles mellom ulv og hund eller stoler man på sansene?
Her er det protokollen kommer inn, og forsøker å eliminere feil. Akkurat som en ulveobservasjon følges av at viltnemda rykker ut og sjekker terrenget, ser etter spor, leter etter urinmarkeringer (lukter som faen, du har aldri hatt en hund som har hatt slik lukt av urinen.)
Svaret på dette tror jeg med stor sannsynlighet er at vi ikke vet helt nøyaktig alle faktorene som påvirker hørselen og vi er derfor heller ikke i stand til å måle de.
Mvh
Roysen
Det kan brukes til å påvise at det ikke er forskjeller mellom produkter og at det derfor, er grunnløst å kjøpe noe som er dyrere og ser mer påkostet ut. Har jeg en mistanke om...Roysen skrev:Det har jeg fått med meg. Like fullt står spørsmålet mitt - hva skal man med en slik test?KindOfBlue skrev:Har du lest tråden som avfødte denne testen, Roysen?Roysen skrev:Det medfører allikevel ingen konklusjon på lik linje med testen til Mike. Hva ønsker man å oppnå med testen annet enn mulignes en personlig overbevising for de som deltar. Dette kan sikkert Knutinh si noe mer om enn meg men det kreves så vidt jeg vet en viss mengde på datagrunnlaget for å kunne kalkulere bort fakturer som juks, flaks etc. med nok sikkerhet. Testgrunnlaget her er for lite til å kunne bevise at det er forskjeller som om slike skulle påvises i testen. Dersom det ikke blir påvist noen forskjeller beviser det i hvert fall ingen ting annet enn at de deltakerne som deltar på det tidspunktet som testen ble foretatt under de forutsetningen som forelå på det tidspunktet ikke kunne skille på de spesifikke drivverkene som er med i testen. Hva skal man med en slik test?KindOfBlue skrev:Dette blir sikkert oppfattet som en provokasjon men jeg synes man burde stikke fingeren i jorda. Vi befinner oss i hifisentralen og ikke i et forskningsinstitutt. Hva er motivasjonen for testen. Testgrunnlaget vil uansett bli for lite for noen konklusjon.
Overhodet ikke. Akkurat som vi kan konstatere at Lavigne ikke hører forskjell på Transparent Opus MM og Monster Standard, vil man kunne konstatere om ulike deltagere hører/ikke hører forskjell på drivverk.
Mvh
Roysen
Såvidt jeg husker er dette et tiltak som er iverksatt av dem som er overbevist om at det er forskjeller på drivverk (og andre komponenter), og som er villige til å teste denne overbevisningen etter kriterier som en gang for alle skal stoppe kjeften på skeptikere som meg.
Så det er vel hensikten med denne testen?
Mvh
Roysen
Det er en helt annen diskusjon som vel blir et personlig valg. Dersom du velger å humre i skjegget av det så deg om det. Jeg velger da å se på deg som litt nedlatende.KindOfBlue skrev:For det andre er det vel slik at konsekvent identifisering av mindre ulikheter er vanskelig. At en blindtest ikke identifiserer disse ulikhetene betyr ikke at de ikke finnes.
Vel - om det er vanskelig i en gitt testsituasjon, med egen musikk, der alt er lagt til rette for at man skal fokusere på å finne slike forskjeller, så kan vi vel se bort fra at dette er noe man behøver å bruke penger på?
Og da har man klart å gi et bidrag til trådstarters resonnement, når han i tråden som fødte denne spurte om det virkelig er nødvendig å bruke like mye man bruker på en BMW i 3-serien på et drivverk? (Jeg omskriver).
Det blir litt latterlig å skulle argumentere for eksistens av forskjeller man ikke er i stand til å identifisere, og at slike forskjeller er avgjørende for lyden. He-he. Sorry, klarer ikke å la være, sitter og humrer mens jeg skriver dette.
Dette har jeg argumentert for flere ganger. Selve blindtest settingen slik den er satt opp i denne testen kan være forstyrrende for selve resultatet. Den er ikke identisk med settingen hvor det blir rapportert ulikheter.KindOfBlue skrev:Og det har ingen ting med forskning å gjøre. Folk snakker om forskjeller de hører hele tiden, her skal de sette seg ned og lytte etter forskjeller, og si hvilken de hører.
Det har eller vil aldri komme på tale. Blindtester og hi-fi har ingenting med hverarndre å gjøre.KindOfBlue skrev:Ellers mistenker jeg at du har gjennomført en tilsvarende test hjemme hos deg selv?
Hvor leser du det? Jeg har forøvrig aldri skrevet at de ulikhetene jeg har rapportert er oppdaget ved korte skift mellom testobjektene som en blindtest legger opp til. Jeg vet at du ikke er enig at lengre lytteseaner før bytter er avgjørende, men der er jeg uenig.KindOfBlue skrev:Når man leser og hører om folks erfaringer med drivverk, inkl. dine egne, virker det som om det er lett å høre forskjell, hver gang.
Men akkurat det kan ikke en slik test påvise. Den kan bare påvise at de testdeltakerne som var med i denne spesifikke testen, med dette spesifikke utstyret under de forutsetningen som forelå på dette tidspunktet ikke klarte å skille mellom de spesifikke drivverkene som var med.bjornh skrev:Det kan brukes til å påvise at det ikke er forskjeller mellom proidukter og at det derfor, er grunnløst å kjøpe noe som er dyrere og ser mer påkostet ut. Har jeg en mistanke om...Roysen skrev:Det har jeg fått med meg. Like fullt står spørsmålet mitt - hva skal man med en slik test?KindOfBlue skrev:Har du lest tråden som avfødte denne testen, Roysen?Roysen skrev:Det medfører allikevel ingen konklusjon på lik linje med testen til Mike. Hva ønsker man å oppnå med testen annet enn mulignes en personlig overbevising for de som deltar. Dette kan sikkert Knutinh si noe mer om enn meg men det kreves så vidt jeg vet en viss mengde på datagrunnlaget for å kunne kalkulere bort fakturer som juks, flaks etc. med nok sikkerhet. Testgrunnlaget her er for lite til å kunne bevise at det er forskjeller som om slike skulle påvises i testen. Dersom det ikke blir påvist noen forskjeller beviser det i hvert fall ingen ting annet enn at de deltakerne som deltar på det tidspunktet som testen ble foretatt under de forutsetningen som forelå på det tidspunktet ikke kunne skille på de spesifikke drivverkene som er med i testen. Hva skal man med en slik test?KindOfBlue skrev:Dette blir sikkert oppfattet som en provokasjon men jeg synes man burde stikke fingeren i jorda. Vi befinner oss i hifisentralen og ikke i et forskningsinstitutt. Hva er motivasjonen for testen. Testgrunnlaget vil uansett bli for lite for noen konklusjon.
Overhodet ikke. Akkurat som vi kan konstatere at Lavigne ikke hører forskjell på Transparent Opus MM og Monster Standard, vil man kunne konstatere om ulike deltagere hører/ikke hører forskjell på drivverk.
Mvh
Roysen
Såvidt jeg husker er dette et tiltak som er iverksatt av dem som er overbevist om at det er forskjeller på drivverk (og andre komponenter), og som er villige til å teste denne overbevisningen etter kriterier som en gang for alle skal stoppe kjeften på skeptikere som meg.
Så det er vel hensikten med denne testen?
Mvh
Roysen
Mvh. Bjørn
Jeg vil påstå at med et så lite testgrunnlag er det ikke mulig å utelukke en rekke faktorer som kan påvirke resultatet og som ikke har noe med hvilke drivverk man benytter å gjøre.KindOfBlue skrev:Det kan også brukes til å bevise at det er forskjeller på komponenter - disse behøver ikke være prisavhengige.
Finner man forskjeller, kan det være interessant å studere hva disse går ut på, og hvilke som er ønskelige og hvilke som er uønskede.
For eksempel.
Men dine påstander om forskjell på drivverk, mellom samme og ulike DACer, i seende lytting står derimot som konklusjoner hugget i granitt?Roysen skrev:Jeg vil påstå at med et så lite testgrunnlag er det ikke mulig å utelukke en rekke faktorer som kan påvirke resultatet og som ikke har noe med hvilke drivverk man benytter å gjøre.KindOfBlue skrev:Det kan også brukes til å bevise at det er forskjeller på komponenter - disse behøver ikke være prisavhengige.
Finner man forskjeller, kan det være interessant å studere hva disse går ut på, og hvilke som er ønskelige og hvilke som er uønskede.
For eksempel.
Mvh
Roysen
Dersom du har oppfattet det dithen har du missforstått meg. Jeg rapporterer bare hva jeg opplever og at jeg har større tro på det som en fasit enn en blindtest. Jeg har ikke forsøkt meg på noen vitenskapelig tilnærming for å forsøke å bevise noe som helst.KindOfBlue skrev:Men dine påstander om forskjell på drivverk, mellom samme og ulike DACer, i seende lytting står derimot som konklusjoner hugget i granitt?Roysen skrev:Jeg vil påstå at med et så lite testgrunnlag er det ikke mulig å utelukke en rekke faktorer som kan påvirke resultatet og som ikke har noe med hvilke drivverk man benytter å gjøre.KindOfBlue skrev:Det kan også brukes til å bevise at det er forskjeller på komponenter - disse behøver ikke være prisavhengige.
Finner man forskjeller, kan det være interessant å studere hva disse går ut på, og hvilke som er ønskelige og hvilke som er uønskede.
For eksempel.
Mvh
Roysen
Halloen!Roysen skrev:Det medfører allikevel ingen konklusjon på lik linje med testen til Mike. Hva ønsker man å oppnå med testen annet enn muligens en personlig overbevising for de som deltar. Dette kan sikkert Knutinh si noe mer om enn meg men det kreves så vidt jeg vet en viss mengde på datagrunnlaget for å kunne kalkulere bort fakturer som juks, flaks etc. med nok sikkerhet. Testgrunnlaget her er for lite til å kunne bevise at det er forskjeller som om slike skulle påvises i testen.
Vennligst forklar, og vis meg hvor jeg eventuelt har regnet feil i binomialfordelingen, eller hvor svikten oppstår i den forsøksprosedyren jeg foreslo. Jeg mener fortsatt at dette bør funke helt utmerket, forutsatt at man gjør selve lyttetesten samvittighetsfullt.Jeg vil påstå at med et så lite testgrunnlag er det ikke mulig å utelukke en rekke faktorer som kan påvirke resultatet og som ikke har noe med hvilke drivverk man benytter å gjøre.
Av en eller annen årsak hadde din foreslåtte metode gått meg hus forbi. Dette virker forsåvidt greit. Mitt eneste ankepunkt er at man ikke utelukker tre faktorer. 1) At det er mulig at det er invdividuellt betinget om man kan høre forskjeller fordi det er for få personer med i testen. Det er en kjennssak at enkelte hører bedre enn andre og det er også en påstått kjennsgjerning blant audiofile at det er en treningssak å høre forskjeller på komponenter. 2) At et er mulig at andre drivverk hadde gitt et helt annet resultat. 3) At det er samspillet eller synergien mellom komponentene og kablene i systemet som produserer lyden. Man klarer ikke å eliminere dette som en årsak til et nullresultat.asbjbo skrev:Halloen!Roysen skrev:Det medfører allikevel ingen konklusjon på lik linje med testen til Mike. Hva ønsker man å oppnå med testen annet enn muligens en personlig overbevising for de som deltar. Dette kan sikkert Knutinh si noe mer om enn meg men det kreves så vidt jeg vet en viss mengde på datagrunnlaget for å kunne kalkulere bort fakturer som juks, flaks etc. med nok sikkerhet. Testgrunnlaget her er for lite til å kunne bevise at det er forskjeller som om slike skulle påvises i testen.
Jeg har nettopp lagt frem en tabell over nøyaktig hvor stort datagrunnlaget behøver å være for å kalkulere bort alle sånne faktorer, forutsatt at selve lyttetesten gjøres på fornuftig vis. 7 riktige av 8 forsøk holder i massevis for meg, ettersom det da er mindre enn 5 % sjanse for at dette skjedde ved rene tilfeldigheter.
Hvis forskjellene er mindre enn jeg tror, slik at de ikke kan skilles ut oftere enn, la oss si, 6 av 10 ganger, så må man gjøre mye lengre serier for å få tilsvarende sikkerhet. Jeg vil være nøyaktig like overbevist om at det finnes en forskjell ved 59 riktige av 100 forsøk, selv om ting da tyder på at forskjellen er ganske liten.
Vennligst forklar, og vis meg hvor jeg eventuelt har regnet feil i binomialfordelingen, eller hvor svikten oppstår i den forsøksprosedyren jeg foreslo. Jeg mener fortsatt at dette bør funke helt utmerket, forutsatt at man gjør selve lyttetesten samvittighetsfullt.Jeg vil påstå at med et så lite testgrunnlag er det ikke mulig å utelukke en rekke faktorer som kan påvirke resultatet og som ikke har noe med hvilke drivverk man benytter å gjøre.
Det er forøvrig skrevet doktorgradsavhandlinger i statistikk om hva man kan og ikke kan si, og med hvilken grad av sikkerhet, fra et statistisk utvalg med størrelse én. I dette tilfellet påstår jeg at det minste testgrunnlaget jeg vil akseptere er fem, og da må alle fem svarene være korrekte for at konklusjonen skal være mer enn 95 % sikker.
Nå opplever jeg deg som litt arrogant igjen. Hvilket av mine argumenter kan avskrives som en følge av det du skriver her?KindOfBlue skrev:Forståelse for statistisk metode og den vitenskapelig tilnærmingen som ligger bak blindtest som verktøy er det derimot mindre av.
Det er flere kanonører som har erklært at de hører forskjell med på testen, og de har bred erfaring og er trente - skal man gå etter utsagn fra samme.Roysen skrev:Av en eller annen årsak hadde din foreslåtte metode gått meg hus forbi. Dette virker forsåvidt greit. Mitt eneste ankepunkt er at man ikke utelukker tre faktorer. 1) At det er mulig at det er invdividuellt betinget om man kan høre forskjeller fordi det er for få personer med i testen. Det er en kjennssak at enkelte hører bedre enn andre og det er også en påstått kjennsgjerning blant audiofile at det er en treningssak å høre forskjeller på komponenter. 2) At et er mulig at andre drivverk hadde gitt et helt annet resultat. 3) At det er samspillet eller synergien mellom komponentene og kablene i systemet som produserer lyden. Man klarer ikke å eliminere dette som en årsak til et nullresultat.
I tillegg kommer selvsagt de argumentene jeg hele tiden har hatt mot selve blindtesten som metode men det hører vel til en annen diskusjon.
Mvh
Roysen
Det er en grunn til at Asbjbo skriver "Halllooooooeeeeen!" i sitt tilsvar til deg. Han har konkret vist hvilke utfall som skal til for å kunne hevde statistisk signifikans for resultatet. Helt i henhold til statistisk analyse.Roysen skrev:Nå opplever jeg deg som litt arrogant igjen. Hvilket av mine argumenter kan avskrives som en følge av det du skriver her?KindOfBlue skrev:Forståelse for statistisk metode og den vitenskapelig tilnærmingen som ligger bak blindtest som verktøy er det derimot mindre av.
Mvh
Royen
Det fikk jeg selvfølgelig med meg og jeg har nå også skrevet at det er bra. Jeg sikter til de øvrige argumentene jeg har mot blindtester.KindOfBlue skrev:Det er en grunn til at Asbjbo skriver "Halllooooooeeeeen!" i sitt tilsvar til deg. Han har konkret vist hvilke utfall som skal til for å kunne hevde statistisk signifikans for resultatet. Helt i henhold til statistisk analyse.Roysen skrev:Nå opplever jeg deg som litt arrogant igjen. Hvilket av mine argumenter kan avskrives som en følge av det du skriver her?KindOfBlue skrev:Forståelse for statistisk metode og den vitenskapelig tilnærmingen som ligger bak blindtest som verktøy er det derimot mindre av.
Mvh
Royen
Dersom man skal gå vitenskapelig til verks (og det bør man vel dersom man skal benytte en vitenskapelig metode i et forsøk på å påvse noe) så er vel ikke det at man påstår at man har kanonører, bred erfaring og trente ører nok til at man kan utelukke at så ikke er tilfelle. Dersom man skal stole på det kan man vel like så godt stole på deres lytteopplevelser?KindOfBlue skrev:Det er flere kanonører som har erklært at de hører forskjell med på testen, og de har bred erfaring og er trente - skal man gå etter utsagn fra samme.Roysen skrev:Av en eller annen årsak hadde din foreslåtte metode gått meg hus forbi. Dette virker forsåvidt greit. Mitt eneste ankepunkt er at man ikke utelukker tre faktorer. 1) At det er mulig at det er invdividuellt betinget om man kan høre forskjeller fordi det er for få personer med i testen. Det er en kjennssak at enkelte hører bedre enn andre og det er også en påstått kjennsgjerning blant audiofile at det er en treningssak å høre forskjeller på komponenter. 2) At et er mulig at andre drivverk hadde gitt et helt annet resultat. 3) At det er samspillet eller synergien mellom komponentene og kablene i systemet som produserer lyden. Man klarer ikke å eliminere dette som en årsak til et nullresultat.
I tillegg kommer selvsagt de argumentene jeg hele tiden har hatt mot selve blindtesten som metode men det hører vel til en annen diskusjon.
Mvh
Roysen
Igjen - dersom man skal gå vitenskapelig til verks (og det bør man vel dersom man skal benytte en vitenskapelig metode i et forsøk på å påvse noe) så er vel ikke pris nødvendigvis det som er avgjørende for kvaliteten på drivverket og dets output? Dersom testen hadde vært er det forskjell på dyre og billige drivverk - hadde det vært noe annet, men her forsøker man på påvise om det er eksisterer ulikheter i det hele. Valg av drivverk for å finne slike forskjeller bør derfor være basert på noe mindre tilfeldig enn pris.KindOfBlue skrev:Som nevnt i tråden kan man la en første session, uavhengig av resultat, bli grunnlag for videre undersøkelser.
Derfor har man også foreslått at man skal bruke et antatt elendig drivverk i match mot et topp ditto, nettopp for å kunne fastslå hørbar forskjell -- FØR man ev. går videre og tester på andre grunnlag.
(F.eks. velansette komponenter som er i helt ulike prisklasser - mitt forslag er Cambridge Azur 840C mot dCS Puccini; eller Pioneer DVD mot Goldmunds versjon av samme).
Er det nødvendig å gjenta meg selv til det kjedsommelige. Jeg har hele tiden hevdet at mine argumenter mot blindtest går på at resultatet ene og alene er forklarende for den spesifikke situasjonen og tidspunktet. Det gjelder også Mikes test. Selv om jeg kanskje ikke har forklart det med store bokstaver gjelder det også denne testen. Mike er min venn og jeg ønsker egenltlig ikke å argumentere for noe som kan virke fordummende på ham.KindOfBlue skrev:Når det gjelder dine argumenter mot blindtest som metode så velger jeg å egentlig bortse fra disse, din bias er så overtydelig.
F.eks. har du ikke rapportert tilbake med mer utfyldig informasjon i forbindelse med Lavigne testen. Da denne kom var man i gang med en heftig blindtestdiskusjon her inne -- men du valgte å fullstendig se bort fra Lavignes krystallklare rapport og konklusjon, til tross for at hans testoppsett etterkom de aller fleste av dine innvendinger mot blindtester.
Du feide i stedet til side dette mildt sagt utrolige utfallet, fordi det ikke passet deg. (Noe annet er umulig å konkludere, Roysen).
Du verden. Hvor har du det fra? Det jeg har skrevet er at forskning er bra, men ikke "kvasi"-forskning som kan være til like mye forvirring som forklaring.KindOfBlue skrev:Nå virker det som om du er innbitt på at det er et feilgrep å gjennomføre "forskning" på drivverk ...