Den store drivverktesten, metodikk og oppsett

Bjørn.H · 19.07.2008

Dette er viktig, KindofBlue, det du her trekker fram.

Mvh. Bjørn

Rune.U · 19.07.2008

Hm Så ikke denne tråden med en gang så jeg skriver innlegget her også.
Når det gjelder den forestående testen,så vil jeg for egen regning anbefale å bruke en litt under pari DAC.Den bør vel kanskje ikke være direkte dårlig,men jeg vil tro at sjansen for å høre om det virkelig er forskjell på drivverk vil øke noe med en middelmådig DAC.Det er lettere å høre forskjell på-fra dårlig opp til middels lyd,enn forskjell på flere typer topp lyd.
Og -GOD FERIE til alle!!

Mvh Rune

Valentino · 19.07.2008

Tror det (som før nevnt) er riktig smart å bruke påtenkt DAC jeg, ettersom man mener å høre forskjell på drivverk gjennom den.

Slik sett er det ganske enkelt: Ta et hvilket som helst annet drivverk enn impulses vanlige som drivverk B og la det stå til en lytter om gangen. De andre kan drikke impulses utmerkede kaffe på kjøkkenet eller balkongen. Jeg foreslår at skeptiker nb som koblefant. Han er en hederlig fyr, AV-receiver og alt.

AB og så X så praktisk somulig mulig. La alle høre sin musikksnutt med forheng så mye de orker før alvoret begynner. 15 repetisjoner (X) per lytter, la alle sitte gjennom alle 15 slik at resignasjon ikke preger testen om en eller flere skulle score pingpong underveis.

Rune.U · 20.07.2008

Som,hadde som nær sagt vanlig

,vært enig med Valentino.-Men jeg tror fortsatt at en litt "rimelig DAC" raskere vil avsløre det som ev.vil dukke opp i en slik test.-Tenk bare på hvilke argumenter som vil dukke opp etterpå om ikke alle forbehold blir tatt...........!!!!
Nå er jeg rimelig klar over at ikke undertegnete i de fleste høve ikke blir ansett for å være særlig meningsberettiget.

-Og i alle fall ikke i en slik grad at det er noen særlig grunn til å bli tatt spesiellt alvorlig.-Men,, kanskje det likevel er litt grunn til å ta alle forbehold i forhold til en slik test,om det skal være sånn at vi for en gangs skyld skal være i stand til å ta den seriøst!
Selfølgelig vil det vel være mange som hevder at hvor "svakheten" ligger ikke vil bety noe,men jeg vil bestemt hevde at dette ikke er uvesentlig.-Bevares-Ikke ta mitt ord for det,det beste er å prøve selv først.Dette bør være temmelig enkelt å finne ut for tvilere med litt ekstrautstyr hjemme.

Mvh Rune

rama · 20.07.2008

har ikke orket å lese gjennom alle innleggene, men drister meg til et forslag likevel.

- kun 2 drivverk. impulse sitt og en billig cd-spiller.
- resten av systemet (inkludert dac) er opp til impulse å bestemme. men systemet skal selvfølgelig være konstant gjennom hele seansen.
- kun 1 testlåt, valgt ut av testkaninene.
- de to drivverkene står på et godkjent (av alle testkaninene) underlag ute på kjøkkenet. dermed trenger vi en digitalkabel på 2-3m, men dette kan sikkert skaffes.
- vi trenger en fast dj på kjøkkenet, som har ansvar for avspilling samt svitsjing av drivverk. dj'en skal også notere resultatene.
- maks 4 testkaniner, blir for langdryg og slitsomt ellers.

1) låta skal spilles 3 ganger på hvert at drivverkene som oppvarming, og testkaninene skal under oppvarmingen få vite hvilket drivverk som spiller - slik at vi blir kjent med både musikken, drivverkene og resten av systemet.
2) deretter er det en og en testkanin i sweetspot - de andre kan gjerne sitte der og holde kjeft eller stikke ut en tur - men INGEN skal ha innsyn til kjøkkenet.
3) testlåta blir spilt 3 ganger på hvert drivverk i random orden, tilfeldig valgt av dj'en. maks 3 min hver gang. testkaninen skal etter hver avspilling rope til dj'en hvilket drivverk han (tror han) har hørt. dj'en noterer riktig eller feil. altså tilsammen 6 runder for hver mann, før vi skifter testkanin.
4) mellom hver avspilling, skal dj ta nøyaktig et minutts pause og plugge digitalkabelen ut av det drivverket som har vært brukt og inn i et av drivverkene. det samme med cd'en, dersom vi ikke har to kopier av samme skive.
5) testkaninene skal KUN oppgi hvilket drivverk som er blitt brukt, ikke noe pjatt om bassfylde, gjennomsiktighet og livsbejaende blomstermetaforer. testen dreier seg om å skille mellom drivverk, ikke hva som låter best.

ellers:
alle testkaninene må være av den oppfatning at det går an å høre forskjell mellom drivverk. selv tror jeg at det er mulig, selv om jeg innrømmer at det er langt mindre hørbar forskjell på drivverk enn dac. blir en vanskelig test, men på ingen måter avskrekkende. husk at vi som stiller opp, er å regne som matyrer. ;D
bommer vi grovt, så har vi jo lært noe nytt og kan heretter spare penger på drivverk.
og kanskje andre audiofile også får seg en tankevekker.
og treffer vi på på 80-100%, så kan vi jo bare slå fast at vi hadde rett, og holde frem som vi stevner.
en vinn vinn-situasjon, med andre ord.

(ideelt sett bør alle 4 kaninene treffe 100% for å kunne regne resultatet som positivt, men jeg synes opptil 20% bom er ok, med tanke på stress i forbindelse med testsituasjon, konsentrasjosnsvik grunnet røykesug, kjedsomhet, tissetrengthet, etc.)

Asbjørn · 30.07.2008

Dessverre hadde jeg ikke sett denne tråden, siden jeg var på ferie da det var mest aktivitet i den.

Jeg er ikke helt fornøyd med testprosedyren, og synes dere gjør det litt vanskelig for dere selv. Den foreslåtte prosedyren er ikke en ABX, men heller en lang serie av blindtester. Det er forsåvidt OK, bortsett fra tiden som går mellom de kjente referansene og selve testene. Det er ikke hørselsminnet dere prøver å teste, men hvorvidt det er forskjell mellom testobjektene. Disse kan f eks være impulse's vanlige transport og en eller annen transport som han (eller andre) mener at låter forskjellig fra den vanlige, gjerne valgt slik at det er lett å høre forskjell ved vanlig seende lytting. Nivåmatching er ikke en faktor her, siden utgangsnivået fra DACen vil være det samme så lenge den får samme bitstrøm inn, og dere vil bruke samme DAC hele veien.

Prosedyren ville vært bedre (og ABX!) hvis hvert enkelt forsøk gikk ut på at at DJ på kjøkkenet først spilte på A og annonserte dette, deretter på B og annonserte det, og så på en tilfeldig valgt transport X (som enten er A eller B) og spurte hvilken det var. Testpersonen skulle da avgi ett svar, hvorvidt "X" høres ut som "A" eller "B". Dette svaret noteres ute på kjøkkenet, sammen med hva det egentlig var, uten at testpersonen(e) får vite om svaret var riktig eller galt. Så går man videre til neste testperson, eventuelt at den samme får gjenta prosedyren fra start - "A", "B", og så "X". Dermed er det alltid like lang tid mellom de kjente referansene og selve forsøket, sånn at varigheten av hørselsminnet elimineres som usikkerhetsfaktor. Når hele forsøksserien er gjennomført, oppsummerer man resultatene og sjekker om dette er signifikant. Deretter kan champagnen komme frem. (De fleste vitenskapelige laboratorier har en flaske i kjøleskapet, sånn i tilfelle.)

Det er også lurt om DJ'en kaster kron og mynt hver gang for å bestemme om det er "A" eller "B" som skal være "X" denne gangen, eventuelt gjør dette på forhånd og setter opp en hemmelig kjøreplan som bare DJ kjenner til. Poenget er at det ikke skal være mulig for forsøkspersonen å gjette hvilken som kommer neste gang ut fra bevisste eller ubevisste mønstre i rekkefølgen. Det vil ikke være spesielt smart av DJ å sette opp "A" og "B" som "X" annenhver gang...

En annen viktig detalj er at DJ må plugge ut og inn hver gang, enten det er nødvendig eller ikke, slik at testpersonen ikke kan skille mellom testobjektene ved å høre at det plugges ut og inn (A!) eller ikke (B!). Tilsvarende for mekaniske lyder fra transporten som kan lekke gjennom til lytterommet, f eks CD-skuff som lukkes, magnetpuck som smeller på plass, osv. Det kan være lurt å ha to identiske eksemplarer av samme CD for å redusere muligheten for dette. Et lignende signal er om det er stor forskjell i cue tid mellom de to spillerne, slik at det vil ta ulik tid fra DJ gjør annonseringen til musikken kommer. Det må også sjekkes og eventuelt korrigeres for av DJ.

Ideelt sett skulle ikke engang DJ vite hva som var hva, slik at det ikke sniker seg inn ekstra informasjon f eks i tonefallet når vedkommende annonserer "A", "B" og "X". En enkel måte å komme rundt det på er at en person i lytterommet gjør annonseringen, mens DJ (som er den eneste som vet hva som egentlig er koblet til) er både taus og usynlig. Da blir dette en dobbeltblind test, hvor forsøksleder i lytterommet ikke vet hva som kobles til som "X" og derfor heller ikke kan komme i skade for å signalere dette ubevisst.

Jeg ville også satt lapper på de to testobjektene med "A" og "B" på, sånn at ikke DJ blir forvirret i kampens hete. Usannsynlig, men det ville spolere hele forsøket om de ble forvekslet.

Min personlige hypotese vil være at dere hører nokså klare forskjeller gjennom Audio Note DAC (men ikke gjennom f eks en Benchmark), så jeg tror ikke dere trenger hundrevis av forsøk for å luske ut en ørliten statistisk overvekt i den ene eller andre retningen.

Da blir null-hypotesen i forsøket at dette låter helt likt og at alle riktige svar skyldes rene tilfeldigheter. For riktig å glede nerdene blant oss (

) forlanger vi 95 % konfidensnivå. Da kan vi trygt forkaste null-hypotesen hvis vi oppnår så mange suksesser at sjansen for at dette har skjedd ved rene tilfeldigheter er mindre enn 5 %. Uhm, på regnestaven skulle det tilsi:

Antall A/B/X forsøkMinimum antall riktige svar
55
66
77
87
98
109
119
1210
1512
1813
2115
2417
2719
3020

Det vil si at med f eks 12 A/B/X-forsøk og riktig svar 10 av gangene, så viser det at det er en forskjell. Hvis testpersonene derimot svarer riktig 9 av 12 ganger, så kan vi fortsatt ikke utelukke at dette er tilfeldigheter (ved 95 % konfidensnivå).

Færre enn 5 forsøk funker ikke, siden sjansen for å få 4 av 4 i tilfeldig myntkast er 6,3 %, altså større enn de 5 % vi forlanger her. Og hvis dere gidder, har jeg denne tabellen opp til 100 forsøk (da trengs minst 59 suksesser), og kan enkelt regne ut den for hvilken kombinasjon av seriestørrelse og konfidenskrav som helst.

Det er fint om dere bestemmer dere på forhånd for hvor mange forsøk dere har tenkt å gjøre og så gjennomfører det før dere teller opp resultatene. La oss si at dere har planlagt å gjennomføre 20 forsøk, får suksess på de sju første, feil på det åttende, og så velger å avbryte "mens leken er god". Da vil noen av oss sikkert pirke litt i det. Den uangripelige måten å gjøre det på er å først bestemme seg for antall forsøk, gjennomføre det, og hvis det nesten var mange nok suksesser og man fortsatt tror det virkelig er en forskjell, bestemme et større antall forsøk og starte helt på ny (uten å ta med den gamle forsøksserien i data for den nye serien).

Uansett, denne prosedyren er satt opp for å kunne bevise at det finnes hørbare forskjeller mellom disse to transportene gjennom denne DAC'en. Om dere får et negativt resultat (for få riktige svar for å oppnå statistisk signifikans), så beviser ikke det at det ikke er forskjell, bare at sannsynligheten for å høre forskjell er mindre enn hva den valgte forsøksserien gjør det mulig å avdekke. Og om dere får et positivt resultat, så beviser ikke det at det vil være hørbar forskjell mellom de samme transportene gjennom en annen DAC eller at det vil være hørbar forskjell mellom to andre transporter gjennom den samme DAC'en, bare at det er hørbare forskjeller i dette oppsettet.

Jeg ser frem til fortsettelsen!

Fush · 30.07.2008

Veldig bra asbjbo! Et testoppsett som dette ville i allefall være nok til å overbevise en skeptiker som undertegnede.

knutinh · 30.07.2008

Det å få noen tusen medlemmer enig i noe som helst er vanskelig, så også i konklusjonen av en slik blindtest. Hensikten bør dog være å få sikrere kunnskap på tvers av skyttergraver, og da mener jeg at det som skisseres her er veldig positivt. Jeg hadde satt stor pris på relativt sikker kunnskap som viser at en kinesisk DVD-spiller fra rema låter forskjellig fra et kostbart CD-drivverk når begge er tilkoblet en gitt DAC.

Jeg er enig i mye av det Greven har sagt:
Begynn enkelt. Prøv å teste det man tar som en selvfølge. Husk at det er grenser for hvor lenge man greier å holde oppmerksomheten på topp.

Hele veien bør dere tilstrebe at eneste forskjell mellom "A" og "B" (eventuelt) er lyden som kommer ut av høyttalerne. Dvs at ventetid, knepp i releer, kabler som plugges inn, etc bør være identisk både når man svitsjer fra A til B, fra B til A, fra A til A og fra B til B. Det tryggeste er kanskje om dere starter CD-avspilling fra et gitt punkt ved hvert skifte (slik at dere slipper å synkronisere CD-spillerne). Dersom mekanisk støy fra driverket kan høres så bør begge startes samtidig. Dersom en spiller bruker lengre tid på å starte enn den andre så bør test-personen ikke høre "klikket" fra start-knappen.

Dersom dere velger ABX-testen (jeg ser ingen grunn til å gjøre noe annet), husk premissene for testen: Hypotesen er at det ikke er hørbar forskjell mellom "A" og "B". Dersom en test-person greier å identifisere "X" rett i mange av rundene så sammenligner vi det med sjansen for å få like mange rette ved å kaste mynt. Dersom sjansen for et gitt resultat med flaks er veldig "liten", så er sjansen for at vedkommende virkelig hørte forskjell tilsvarende "stor", og hypotesen forkastes.

Alle former for "cherry picking" gjør at forutsetningene for å bruke den enkle statistikken bryter sammen. Dette inkluderer å velge ut resultatet til 1 av 20 testpersoner, å avbryte testen på et "positivt" tidspunkt, eller å kjøre testen på nytt og på nytt helt til man slumper til å få et positivt resultat.

Jeg forstår ikke hvorfor folk snakker om nivå-matching ved test av CD-drivverk? Jeg tar for gitt at det er snakk om å bruke en DAC, og at det er denne som avgjør nivået. Dersom man frykter at drivverkene under test ikke gir en 1:1 sample-strøm fra plata så kan dette enkelt sjekkes på forhånd ved å spille av noen sekunder inn i et PC-lydkort med spdif inngang.
http://avforum.no/forum/generelt-au...r-subjekt-objektivister-kabler-holografi.html

5.1 Hvordan omvende en skeptiker
Enkelte audiofile mener at blindtester svikter som metode. Disse kan ikke henviset til noe vitenskaplig som underbygger det, men overbevisningen er sterk. Mange andre mener at blindtester er en grei metode, men at de testene som er kjørt så langt svikter. En siste gruppe har stor tiltro til blindtester, og mener at fraværet av blindtester er en indikasjon (men ikke bevis) på at et fenomen er uvesentlig. Dersom man irriterer seg over skeptikere som ikke deler din entusiasme over tweak/dippedutt X så er det en metode som fungerer...

En grunnleggende egenskap ved gode forsøk er at de tåler at kritiske sjeler leter med argus-øyne for å finne svakheter. Hvis man ikke tolerer at andre er kritisk til det man sier og skriver, så kan det å publisere en test gi mye frustrasjon.

Hvis man derimot tar saklig kritikk som noe positivt, muligheten til å gjøre ting så godt som mulig, så kan man også være sin egen største kritiker under planlegging og gjennomføring. Ved å stadig tenke igjennom hvilke saklige innvendinger som kan komme mot valgene du tar, så er det rimelig at du får et bedre slutt-resultat.

5.1.1 Første grunnregel er å dokumentere alt. Det kan aldri bli for nitidig dokumentasjon, men du bør selvsagt "sile" hva du presenterer i et gitt dokument/sammendrag. Ta bilder av oppsettet, mål fenomenene du skal teste, oppgi navn/modell etc. Ikke minst så må du oppgi hva personene under test har svart (gjerne anonymisert). Tenk på hva en ukjent person må vite for å kunne gjenta eksperimentet ditt bare ut fra dokumentasjonen, og fremdeles ha størst mulig sjanse for samme resutat.

5.1.2 Ha kontroll på statistikken. En av de vanligste feilene som vi vanlige dødelige gjør, er at vi bruker intuisjon som erstatning for statistikk. Ting som kan virke som "for usannsynlig til at det kan være flaks/uflaks" kan være mer sannsynlig enn man tror. Og motsatt.

5.1.3 Ha kontroll på grunnleggende premisser for blindtesting av lyd. Dersom nivået mellom to lydkilder avviker med mer enn 0.1dB så er det mulig at personene hører forskjell på lydnivå istedetfor lydkvalitet. At en CD-spiller spiller litt høyere enn en annen er normalt ikke så veldig interessant. Sørg for en positiv atmosfære der test-deltakerne føler seg avslappet og motivert til å høre forskjeller.

5.1.4 Rederlighet. Dersom formålet med en blindtest er å få "innblikk i virkeligheten" (og ikke å vinne en eller annen diskusjon), så bør du offentliggjøre resultatet uansett. Det aller beste er at du offentliggjør det at du skal gjøre en blindtest på forhånd, og så offentliggjør resultatet etterpå. Dersom du mener at resultatet er ugyldig så skriv en forklaring.

Dette er et regneark med binominal-fordelingen som kan bruke til å regne ut sannsynligheten for å få et gitt resultat med bare "flaks".

Gi personene så mye tid de ønsker (innen riemlighetens grenser) til å gjøre seg kjent med lyd-alternativene, og å trene. Når de gir signal om at de ønsker å gjennomføre testen, skal testen gjennomføres uansett (evt loggføres som en ufullført test).

-k

knutinh · 31.07.2008

Greven skrev:
1) For det første synes jeg målsetningen med testen må være å finne ut om det er forskjell - ikke gradere opp denne evt forskjellen. Det vil gjøre både gjennomføringen, databehandlingen og "publiseringen" av resultatet mye enklere. Om man så kommer frem til at det er forskjell, så har man jo noe å gå videre med en annen gang.

Ja. Ta imot råd fra de som har gjennomført blindtester og fra faglitteraturen i stedetfor å bruke masse tid på å finne opp kruttet på nytt bare for å komme til et resultat som ingen setter lit til, eller som maskerer reelle forskjeller.

Gjør ting enkelt, følg "kokebøker" slavisk, og noter evt ideer for grensesprengende nye testmetoder for framtidig bruk.

4) "Switch-ansvarllig" deltar selvfølgelig ikke i testen. Optimalt burde han heller ikke være i samme rom, men dette blir vel umulig å gjennomføre.

Dette kommer litt an på lokalene og muligheter for kabling.

5) Skjema der deltakere krysser av for hvilket drivverk som er innkoblet holdes selvfølgelig skjult for de andre deltakerne. Jeg tror det er helt umulig å vurdere andre parametre enn "hvilket drivverk spiller", så hold dere til dette.

Det er ofte enklest å gjennomføre testen individuelt.

6) Bli enige om hvilke musikkstykker som skal brukes under gjennomføringen. Bruk musikk som det er enighet om at er best egnet for å skille små forskjeller og brenn dette på to disker (slik unngår man også evt påstander om at kvaliteten heves av å brennes...). Få evt noen data/matlab kyndige til å matematisk bevise at diskene er 100% identiske.

7) Bli enige om varighet på klippene. Jeg tror at korte klipp vil gi størst mulig sannsynlighet for å høre forskjell og vil anbefale 30 sek klipp.

Det er fritt opp til de som designer testen å velge klipplengde. Dersom man ønsker positivt resultat så anbefaler jeg også korte klipp.

8 ) Få noen som er stødige i statistikk til å regne ut hvor mange gjennomføringer som trengs for å kunne gi et fornuftig tallmatriale med 6 (?) deltakere. I denne sammenheng er det ikke en fordel at nb deltar i panelet da han er en uttalt skeptiker. Man bør derfor regne ut antall repitisjoner som kreves om panelet består av 5 deltakere (som da er antallet som på forhånd mener å høre forskjell). Merk at dette er for å øke sannsynligheten for å detektere evt forskjell.

Det er ingenting i veien for å gjennomføre to runder: en åpen runde hvor de som vil får delta, og så analysere resultatet og gjennomføre en andre runde med bare de lytterne som hadde signifikant positive besvarelser.

-k

Voff · 31.07.2008

knutinh skrev:
Enkelte audiofile mener at blindtester svikter som metode. Disse kan ikke henviset til noe vitenskaplig som underbygger det, men overbevisningen er sterk.

Dette er dokumenter til det kjedsommelige i forskningen. Både når det gjelder smaksopplevelser, hørselopplevelser, og sist men ikke minst, synsopplevelser. Sistnevnte ved studier av såkalte "blindsynte". Nemlig at persepsjon er svært avhengig av sinnstilstand (men det vet vi vel alle?). Ingen sanser likt under en testsituasjon som de gjør under andre, mindre selvbevisste situasjoner. Dessuten, er det synsinntrykk vår viktigste sans. Den brukes til å assosiere og memorere andre sanseinntrykk. Folk med fotografisk (bra uttrykk i denne sammenheng!) hukommelse, bruker visuelle inntrykk for a hjelpe hukommelsen. Jeg synes at blindtester på blinde kunne ha vært interessant!

Bjørn.H · 31.07.2008

Et godt poeng, Voff.

Mvh. Bjørn

knutinh · 31.07.2008

Voff skrev:
knutinh skrev:

Enkelte audiofile mener at blindtester svikter som metode. Disse kan ikke henviset til noe vitenskaplig som underbygger det, men overbevisningen er sterk.

Klikk for å utvide...

Dette er dokumenter til det kjedsommelige i forskningen.

Henvisning? Hva er det du har fått med deg som artikkelen (fra siste nummer av JAES) under har misforstått?

http://www.aes.org/

"On Some Biases Encountered in Modern Audio Quality Listening TestsA Review*
S?AWOMIR ZIELIN´ SKI, AES Member, AND FRANCIS RUMSEY, AES Fellow
(S.Zielinski@surrey.ac.uk) (f.rumsey@surrey.ac.uk)
Institute of Sound Recording, University of Surrey, Guildford, GU2 7XH, UK
AND
SØREN BECH, AES Fellow
(SBE@bang-olufsen.dk)
Bang & Olufsen, Struer, Denmark
...
In general listeners affective judgments can be biased
by the appearance of the equipment, price, and branding.
For example, Toole and Olive demonstrated that in preference
tests (affective judgments) both experienced and
inexperienced listeners were biased by the appearance and
the brand names of the loudspeakers evaluated [38].
...
This study is often quoted as a classical example
of how important it is to undertake blind listening
tests in order to reduce nonacoustic bias.
...
a group of listeners
were asked to assess the audio quality of two identical
types of hearing aids, labeled as either digital or conventional.
They found that out of 40 participants 33 listeners
preferred the hearing aids labeled digital, 3 preferred
the conventional ones, and only 4 participants did not hear
the difference between the two. Like Toole and Olive,
Benter et al. also emphasized the importance of undertaking
blind listening tests in order to minimize this type
of bias.
...

...Jeg synes at blindtester på blinde kunne ha vært interessant!

Hvorfor ville du benytte deg av en metode som i følge deg dokumentert metodisk svikter?

Tidligere har du henvist til to bøker som jeg har kjøpt og lest som skulle støtte for dine til tider kontroversielle påstander. Jeg fant ingen støtte. Hentet du det bare ut av tomme lufta?
http://www.hifisentralen.no/forum/index.php/topic,14584.msg335735.html#msg335735

Voff skrev:
Det interessante er at jo lengre du begraver deg ned i persepsjonsforskninga (la oss ikke gjøre det her ), jo mer ligner verdensbildet på kvantefysikkens!
Mange forskere gjør nettop en slik tilnærming. Nå har det blitt hevdet at ingen EGENTLIG forstår kvantefysikk.... ;D

Dersom du med dette tenker på boka over ("Evolving the mind"), så ville det kanskje være ærlig å opplyse leseren om at forfatteren selv innrømmer at det er temmelig spekulativt, og fritt for empiri? Er det det du mener med "dokumenter til det kjedsommelige i forskningen"?

-k

Asbjørn · 31.07.2008

Siden blindtester som metode har vært diskutert til det kjedsommelige tidligere: La oss ikke gjøre et godt og interessant initiativ til nok en krangletråd. Voff og knutinh snakker om litt forskjellige ting her, så begge har rett (IMHO); Voff har rett i at persepsjon påvirkes av alle sanser, bl.a. skjerpes hørselen av sterkere lys i rommet, og knutinh har rett i at alt dette kan holdes konstant for å finne ut det vi faktisk er interessert i her, nemlig hvorvidt det er hørbare forskjeller på transporter, alt annet likt.

Den praktiske konsekvensen er at dere bør ha konstant lysnivå i rommet, og at dere kanskje vil høre mer forskjell i godt lys enn i dunkel stearinsbelysning. Det er ikke verre enn det.

Roysen · 31.07.2008

Dette blir sikkert oppfattet som en provokasjon men jeg synes man burde stikke fingeren i jorda. Vi befinner oss i hifisentralen og ikke i et forskningsinstitutt. Hva er motivasjonen for testen. Testgrunnlaget vil uansett bli for lite for noen konklusjon.

Samtidig synes jeg dette med blindtester blir noe latterlig. Det blir omtrent som dersom det oppserveres nye ulver i Norge, blindtestes det da for at det med stor sikkerhet kan skilles mellom ulv og hund eller stoler man på sansene?

For det andre er det vel slik at konsekvent identifisering av mindre ulikheter er vanskelig. At en blindtest ikke identifiserer disse ulikhetene betyr ikke at de ikke finnes.

Mvh
Roysen

KindOfBlue · 31.07.2008

Dette blir sikkert oppfattet som en provokasjon men jeg synes man burde stikke fingeren i jorda. Vi befinner oss i hifisentralen og ikke i et forskningsinstitutt. Hva er motivasjonen for testen. Testgrunnlaget vil uansett bli for lite for noen konklusjon.

Overhodet ikke. Akkurat som vi kan konstatere at Lavigne ikke hører forskjell på Transparent Opus MM og Monster Standard, vil man kunne konstatere om ulike deltagere hører/ikke hører forskjell på drivverk.

Samtidig synes jeg dette med blindtester blir noe latterlig. Det blir omtrent som dersom det oppserveres nye ulver i Norge, blindtestes det da for at det med stor sikkerhet kan skilles mellom ulv og hund eller stoler man på sansene?

Her er det protokollen kommer inn, og forsøker å eliminere feil. Akkurat som en ulveobservasjon følges av at viltnemda rykker ut og sjekker terrenget, ser etter spor, leter etter urinmarkeringer (lukter som faen, du har aldri hatt en hund som har hatt slik lukt av urinen.)

For det andre er det vel slik at konsekvent identifisering av mindre ulikheter er vanskelig. At en blindtest ikke identifiserer disse ulikhetene betyr ikke at de ikke finnes.

Vel - om det er vanskelig i en gitt testsituasjon, med egen musikk, der alt er lagt til rette for at man skal fokusere på å finne slike forskjeller, så kan vi vel se bort fra at dette er noe man behøver å bruke penger på?
Og da har man klart å gi et bidrag til trådstarters resonnement, når han i tråden som fødte denne spurte om det virkelig er nødvendig å bruke like mye man bruker på en BMW i 3-serien på et drivverk? (Jeg omskriver).

Det blir litt latterlig å skulle argumentere for eksistens av forskjeller man ikke er i stand til å identifisere, og at slike forskjeller er avgjørende for lyden. He-he. Sorry, klarer ikke å la være, sitter og humrer mens jeg skriver dette.

Og det har ingen ting med forskning å gjøre. Folk snakker om forskjeller de hører hele tiden, her skal de sette seg ned og lytte etter forskjeller, og si hvilken de hører.

Ellers mistenker jeg at du har gjennomført en tilsvarende test hjemme hos deg selv?

Når man leser og hører om folks erfaringer med drivverk, inkl. dine egne, virker det som om det er lett å høre forskjell, hver gang.

impulse · 31.07.2008

Med all respekt, KoB..Her er du relativt arrogant. Ingen av de som humrer i skjegget av påstått opplevde forskjeller på drivverk har vist særlig interesse for å delta på testen. Men jeg gjentar, dere er hertelig velkommen!
Riktignok står nb på lista, men han har jo trukket seg helt ut fra sentralen,så om han dukker opp er vel heller usikkert....

Asbjørn · 31.07.2008

Roysen skrev:
Dette blir sikkert oppfattet som en provokasjon men jeg synes man burde stikke fingeren i jorda. Vi befinner oss i hifisentralen og ikke i et forskningsinstitutt. Hva er motivasjonen for testen.

Jeg synes faktisk du har et godt poeng her. Nå var det ikke "the usual suspects" som tok initiativet til å gjøre en sånn lyttetest, og det var andre som stilte direkte spørsmål om korrekt metode tidligere i tråden, så jeg syntes det var like greit å svare med en beskrivelse av noe som vil være korrekt metode. Motivasjonen for hele greia var vel å overbevise visse skeptikere, hinsides rimelig tvil, om at det faktisk finnes hørbare forskjeller mellom transporter. Og noen er adskillig mer skeptiske enn andre, så dette ble dimensjonert deretter.

Men selv har jeg aldri tatt meg bryet med å sette opp en slik dobbeltblind test med signifikanstesting for å verifisere at de forskjellene jeg mener å høre hjemme hos meg selv er reproduserbare. Jeg hører det jeg hører og stoler stort sett på mine egne ører, og det er godt nok for meg. Om andre tror meg når jeg beskriver hva jeg har hørt får være opp til dem. Selv tror jeg stort sett på andres beskrivelser av hva de har hørt, men ikke alltid på teoriene om hvorfor de har hørt dette.

Testgrunnlaget vil uansett bli for lite for noen konklusjon.

Nei, det er jeg ikke enig i. 5 riktige av 5 forsøk eller 7 av 8 holder i massevis (se tabellen i tidligere innlegg, eller regnearket knutinh viste til). Da skal jeg med glede strø magisk vitenskapelig pulver over og erklære dette for Signifikant og Vitenskapelig Bevist. Personlig tror jeg forskjellene her vil være ganske klare, så jeg blir ikke overrasket om det ender opp med sånne tall. For en del andre ting, hvor forskjellene i beste fall er veldig, veldig små kan det trengs mye lengre forsøksserier, noe som blir upraktisk å gjennomføre. De fleste vil gå lei etter noen hundre ABX-forsøk.

For det andre er det vel slik at konsekvent identifisering av mindre ulikheter er vanskelig. At en blindtest ikke identifiserer disse ulikhetene betyr ikke at de ikke finnes.

Helt enig, og det var vel omtrent slik jeg avsluttet mitt lange innlegg på forrige side også. Dessuten kan mange små forskjeller som hver for seg ikke er identifiserbare (f eks forvrengning under hørbarhetsterskelen) summere seg opp til noe som definitivt er hørbart gjennom hele kjeden. Å pirke ett eller to strå ut av den høystakken kan ha noe for seg.

KindOfBlue · 31.07.2008

impulse skrev:
Med all respekt, KoB..Her er du relativt arrogant. Ingen av de som humrer i skjegget av påstått opplevde forskjeller på drivverk har vist særlig interesse for å delta på testen. Men jeg gjentar, dere er hertelig velkomne!

Jeg går ut ifra at det er dette du refererer til:

Det blir litt latterlig å skulle argumentere for eksistens av forskjeller man ikke er i stand til å identifisere, og at slike forskjeller er avgjørende for lyden. He-he. Sorry, klarer ikke å la være, sitter og humrer mens jeg skriver dette.

Jeg skrev dette som svar på Roysens punkt 3: For det andre er det vel slik at konsekvent identifisering av mindre ulikheter er vanskelig. At en blindtest ikke identifiserer disse ulikhetene betyr ikke at de ikke finnes.

- der han argumenterer på denne sirkelmåten, og ikke som en generell kommentar til folk som hører forskjeller. Og det var dette som fikk meg til å humre.

Legg merke til at ulikhetene nå er små, vanskelige å identifisere konsekvent, men at de likevel må kunne eksistere, til tross for at de ikke lar seg avsløre av eksperiment.

Det var dette jeg humret over.

Jeg syns tiltaket er perfekt. Siden jeg i blindtester jeg har vært med på ikke hører disse forskjellene som andre rapporterer å høre, har det liten hensikt at jeg er med og tar opp tid eller sprer dårlige vibber blant dem som kan høre slike forskjeller -- det har med eksperimentell bias å gjøre.

Forøvrig kan jeg avsløre at jeg er i gang med å skrive en betraktning omkring hvorfor det likevel kan være forskjeller, selv om man ikke hører dem, dog med utgangspunkt i vitenskapelige vurderinger, og ikke subjektiv empiri.

Jeg beklager om dette virket arrogant, det var ikke meningen - men må også innrømme at jeg finner Roysens ekstreme uvilje mot blindtesting interessant nok til at jeg blir engasjert.

impulse · 31.07.2008

Helt OK, KoB. Point taken. Jeg ser du er ute i godt ærend her. Ser ikke bort fra at jeg fyrte av litt fordi jeg rett og slett er ganske lei denne kranglingen om drivverkets viktighet og eventuelle signatur og premissene for testen.

KindOfBlue · 31.07.2008

Jeg opplever ikke dette som krangling, men som diskusjon, mellom parter som har ulike synspunkt.

Vi kommer ikke av flekken, hverken med hobbyen eller livet, om vi omgir oss med folk som har samme oppfatning som oss. Det er når vi bryner oss mot andres standpunkter og erfaringer at vi kan bli eksponert for impulser og stimuli som kan ta oss videre.

Jeg har lært mye av denne tråden, og av "modertråden." Og ser frem til videre utvikling. Ellers er asbjbos gjennomgang av hvordan det bør settes opp fin.
Det viktigste ved slike tester er å sikre integritet i forhold til hvordan X avgjøres i hver ABX-rekke, og hvordan dette kommuniseres.

I Mike Lavigne testen syns jeg det er en svakhet at man setter øreklokker på ham mellom hvert kabelskift, for å unngå at han skal kunne ta kabelen på lyden. Jeg tror at disse øreklokkene kan ha forstyrret hans lytteperspektiv - jeg skrev ikke at dette skjedde, men at det kan ha skjedd.
Det er verdt å kikke på alle leddene i kjeden, mens man setter opp eksperimentet. Det skal være en hyggelig aften, men det var også fint om dere fikk noe å slå i bordet med.

Roysen · 31.07.2008

KindOfBlue skrev:
Dette blir sikkert oppfattet som en provokasjon men jeg synes man burde stikke fingeren i jorda. Vi befinner oss i hifisentralen og ikke i et forskningsinstitutt. Hva er motivasjonen for testen. Testgrunnlaget vil uansett bli for lite for noen konklusjon.

Overhodet ikke. Akkurat som vi kan konstatere at Lavigne ikke hører forskjell på Transparent Opus MM og Monster Standard, vil man kunne konstatere om ulike deltagere hører/ikke hører forskjell på drivverk.

Det medfører allikevel ingen konklusjon på lik linje med testen til Mike. Hva ønsker man å oppnå med testen annet enn muligens en personlig overbevising for de som deltar. Dette kan sikkert Knutinh si noe mer om enn meg men det kreves så vidt jeg vet en viss mengde på datagrunnlaget for å kunne kalkulere bort fakturer som juks, flaks etc. med nok sikkerhet. Testgrunnlaget her er for lite til å kunne bevise at det er forskjeller som om slike skulle påvises i testen. Dersom det ikke blir påvist noen forskjeller beviser det i hvert fall ingen ting annet enn at de deltakerne som deltar på det tidspunktet som testen ble foretatt under de forutsetningen som forelå på det tidspunktet ikke kunne skille på de spesifikke drivverkene som er med i testen. Hva skal man med en slik test?

Mvh
Roysen

KindOfBlue · 31.07.2008

Roysen skrev:
KindOfBlue skrev:

Dette blir sikkert oppfattet som en provokasjon men jeg synes man burde stikke fingeren i jorda. Vi befinner oss i hifisentralen og ikke i et forskningsinstitutt. Hva er motivasjonen for testen. Testgrunnlaget vil uansett bli for lite for noen konklusjon.

Overhodet ikke. Akkurat som vi kan konstatere at Lavigne ikke hører forskjell på Transparent Opus MM og Monster Standard, vil man kunne konstatere om ulike deltagere hører/ikke hører forskjell på drivverk.

Klikk for å utvide...

Det medfører allikevel ingen konklusjon på lik linje med testen til Mike. Hva ønsker man å oppnå med testen annet enn mulignes en personlig overbevising for de som deltar. Dette kan sikkert Knutinh si noe mer om enn meg men det kreves så vidt jeg vet en viss mengde på datagrunnlaget for å kunne kalkulere bort fakturer som juks, flaks etc. med nok sikkerhet. Testgrunnlaget her er for lite til å kunne bevise at det er forskjeller som om slike skulle påvises i testen. Dersom det ikke blir påvist noen forskjeller beviser det i hvert fall ingen ting annet enn at de deltakerne som deltar på det tidspunktet som testen ble foretatt under de forutsetningen som forelå på det tidspunktet ikke kunne skille på de spesifikke drivverkene som er med i testen. Hva skal man med en slik test?

Mvh
Roysen

Har du lest tråden som avfødte denne testen, Roysen?
Såvidt jeg husker er dette et tiltak som er iverksatt av dem som er overbevist om at det er forskjeller på drivverk (og andre komponenter), og som er villige til å teste denne overbevisningen etter kriterier som en gang for alle skal stoppe kjeften på skeptikere som meg.

Så det er vel hensikten med denne testen?

Roysen · 31.07.2008

KindOfBlue skrev:
Samtidig synes jeg dette med blindtester blir noe latterlig. Det blir omtrent som dersom det oppserveres nye ulver i Norge, blindtestes det da for at det med stor sikkerhet kan skilles mellom ulv og hund eller stoler man på sansene?

Her er det protokollen kommer inn, og forsøker å eliminere feil. Akkurat som en ulveobservasjon følges av at viltnemda rykker ut og sjekker terrenget, ser etter spor, leter etter urinmarkeringer (lukter som faen, du har aldri hatt en hund som har hatt slik lukt av urinen.)

Målinger er jeg helt for. Det burde være protokollen i så måte. Spørsmålet da blir hvilke faktorer er det mulig at påvirker hørselen og kan vi måle disse.

Svaret på dette tror jeg med stor sannsynlighet er at vi ikke vet helt nøyaktig alle faktorene som påvirker hørselen og vi er derfor heller ikke i stand til å måle de.

Mvh
Roysen

Roysen · 31.07.2008

KindOfBlue skrev:
Roysen skrev:

KindOfBlue skrev:

Dette blir sikkert oppfattet som en provokasjon men jeg synes man burde stikke fingeren i jorda. Vi befinner oss i hifisentralen og ikke i et forskningsinstitutt. Hva er motivasjonen for testen. Testgrunnlaget vil uansett bli for lite for noen konklusjon.

Overhodet ikke. Akkurat som vi kan konstatere at Lavigne ikke hører forskjell på Transparent Opus MM og Monster Standard, vil man kunne konstatere om ulike deltagere hører/ikke hører forskjell på drivverk.

Klikk for å utvide...

Det medfører allikevel ingen konklusjon på lik linje med testen til Mike. Hva ønsker man å oppnå med testen annet enn mulignes en personlig overbevising for de som deltar. Dette kan sikkert Knutinh si noe mer om enn meg men det kreves så vidt jeg vet en viss mengde på datagrunnlaget for å kunne kalkulere bort fakturer som juks, flaks etc. med nok sikkerhet. Testgrunnlaget her er for lite til å kunne bevise at det er forskjeller som om slike skulle påvises i testen. Dersom det ikke blir påvist noen forskjeller beviser det i hvert fall ingen ting annet enn at de deltakerne som deltar på det tidspunktet som testen ble foretatt under de forutsetningen som forelå på det tidspunktet ikke kunne skille på de spesifikke drivverkene som er med i testen. Hva skal man med en slik test?

Mvh
Roysen

Klikk for å utvide...

Har du lest tråden som avfødte denne testen, Roysen?
Såvidt jeg husker er dette et tiltak som er iverksatt av dem som er overbevist om at det er forskjeller på drivverk (og andre komponenter), og som er villige til å teste denne overbevisningen etter kriterier som en gang for alle skal stoppe kjeften på skeptikere som meg.

Så det er vel hensikten med denne testen?

Det har jeg fått med meg. Like fullt står spørsmålet mitt - hva skal man med en slik test?

Mvh
Roysen

KindOfBlue · 31.07.2008

Roysen skrev:
KindOfBlue skrev:

Samtidig synes jeg dette med blindtester blir noe latterlig. Det blir omtrent som dersom det oppserveres nye ulver i Norge, blindtestes det da for at det med stor sikkerhet kan skilles mellom ulv og hund eller stoler man på sansene?

Her er det protokollen kommer inn, og forsøker å eliminere feil. Akkurat som en ulveobservasjon følges av at viltnemda rykker ut og sjekker terrenget, ser etter spor, leter etter urinmarkeringer (lukter som faen, du har aldri hatt en hund som har hatt slik lukt av urinen.)

Klikk for å utvide...

Målinger er jeg helt for. Det burde være protokollen i så måte. Spørsmålet da blir hvilke faktorer er det mulig at påvirker hørselen og kan vi måle disse.

Svaret på dette tror jeg med stor sannsynlighet er at vi ikke vet helt nøyaktig alle faktorene som påvirker hørselen og vi er derfor heller ikke i stand til å måle de.

Mvh
Roysen

Vi kjenner heller ikke alle de faktorene som innvirker på et sykdomsbilde, likefullt så prøver vi ut ulike medisiner, mens vi søker å se hva som skjer med dette bildet.
Vi eliminerer det som ikke virker, mot det som virker.

Interessant nok:
Leger kledd i legefrakk og med stetoskop, og som oppfører seg med legeautorietet, har en større legende effekt på pasienter enn leger kledd i hverdagstøy som oppfører seg jovialt.

Store, røde piller (placebo) har større effekt enn små blå.

Pasienter med god støtte i nær familiekrets blir hurtigere friske.

Pasienter med sterke konflikter, som "legges til side" pga sykdommen, har vanskeligere for å bli friske om dem de har konflikter med besøker dem under sykdommen.

===

Som du sier - det er mange faktorer som virker inn. Med ved god test-design kan vi faktisk kikke på ulike faktorer, og danne oss et generelt inntrykk av hva som foregår, og et spesifikt inntrykk av fenomener i den forbindelse.

Din skepsis bringer ikke saken videre.

Bjørn.H · 31.07.2008

Roysen skrev:
KindOfBlue skrev:

Roysen skrev:

KindOfBlue skrev:

Dette blir sikkert oppfattet som en provokasjon men jeg synes man burde stikke fingeren i jorda. Vi befinner oss i hifisentralen og ikke i et forskningsinstitutt. Hva er motivasjonen for testen. Testgrunnlaget vil uansett bli for lite for noen konklusjon.

Overhodet ikke. Akkurat som vi kan konstatere at Lavigne ikke hører forskjell på Transparent Opus MM og Monster Standard, vil man kunne konstatere om ulike deltagere hører/ikke hører forskjell på drivverk.

Klikk for å utvide...

Det medfører allikevel ingen konklusjon på lik linje med testen til Mike. Hva ønsker man å oppnå med testen annet enn mulignes en personlig overbevising for de som deltar. Dette kan sikkert Knutinh si noe mer om enn meg men det kreves så vidt jeg vet en viss mengde på datagrunnlaget for å kunne kalkulere bort fakturer som juks, flaks etc. med nok sikkerhet. Testgrunnlaget her er for lite til å kunne bevise at det er forskjeller som om slike skulle påvises i testen. Dersom det ikke blir påvist noen forskjeller beviser det i hvert fall ingen ting annet enn at de deltakerne som deltar på det tidspunktet som testen ble foretatt under de forutsetningen som forelå på det tidspunktet ikke kunne skille på de spesifikke drivverkene som er med i testen. Hva skal man med en slik test?

Mvh
Roysen

Klikk for å utvide...

Har du lest tråden som avfødte denne testen, Roysen?
Såvidt jeg husker er dette et tiltak som er iverksatt av dem som er overbevist om at det er forskjeller på drivverk (og andre komponenter), og som er villige til å teste denne overbevisningen etter kriterier som en gang for alle skal stoppe kjeften på skeptikere som meg.

Så det er vel hensikten med denne testen?

Klikk for å utvide...

Det har jeg fått med meg. Like fullt står spørsmålet mitt - hva skal man med en slik test?

Mvh
Roysen

Det kan brukes til å påvise at det ikke er forskjeller mellom produkter og at det derfor, er grunnløst å kjøpe noe som er dyrere og ser mer påkostet ut. Har jeg en mistanke om...

Mvh. Bjørn

KindOfBlue · 31.07.2008

Det kan også brukes til å bevise at det er forskjeller på komponenter - disse behøver ikke være prisavhengige.
Finner man forskjeller, kan det være interessant å studere hva disse går ut på, og hvilke som er ønskelige og hvilke som er uønskede.

For eksempel.

Roysen · 31.07.2008

KindOfBlue skrev:
For det andre er det vel slik at konsekvent identifisering av mindre ulikheter er vanskelig. At en blindtest ikke identifiserer disse ulikhetene betyr ikke at de ikke finnes.

Vel - om det er vanskelig i en gitt testsituasjon, med egen musikk, der alt er lagt til rette for at man skal fokusere på å finne slike forskjeller, så kan vi vel se bort fra at dette er noe man behøver å bruke penger på?
Og da har man klart å gi et bidrag til trådstarters resonnement, når han i tråden som fødte denne spurte om det virkelig er nødvendig å bruke like mye man bruker på en BMW i 3-serien på et drivverk? (Jeg omskriver).

Det blir litt latterlig å skulle argumentere for eksistens av forskjeller man ikke er i stand til å identifisere, og at slike forskjeller er avgjørende for lyden. He-he. Sorry, klarer ikke å la være, sitter og humrer mens jeg skriver dette.

Det er en helt annen diskusjon som vel blir et personlig valg. Dersom du velger å humre i skjegget av det så deg om det. Jeg velger da å se på deg som litt nedlatende.

KindOfBlue skrev:
Og det har ingen ting med forskning å gjøre. Folk snakker om forskjeller de hører hele tiden, her skal de sette seg ned og lytte etter forskjeller, og si hvilken de hører.

Dette har jeg argumentert for flere ganger. Selve blindtest settingen slik den er satt opp i denne testen kan være forstyrrende for selve resultatet. Den er ikke identisk med settingen hvor det blir rapportert ulikheter.

KindOfBlue skrev:
Ellers mistenker jeg at du har gjennomført en tilsvarende test hjemme hos deg selv?

Det har eller vil aldri komme på tale. Blindtester og hi-fi har ingenting med hverarndre å gjøre.

KindOfBlue skrev:
Når man leser og hører om folks erfaringer med drivverk, inkl. dine egne, virker det som om det er lett å høre forskjell, hver gang.

Hvor leser du det? Jeg har forøvrig aldri skrevet at de ulikhetene jeg har rapportert er oppdaget ved korte skift mellom testobjektene som en blindtest legger opp til. Jeg vet at du ikke er enig at lengre lytteseaner før bytter er avgjørende, men der er jeg uenig.

Mvh
Roysen

Roysen · 31.07.2008

bjornh skrev:
Roysen skrev:

KindOfBlue skrev:

Roysen skrev:

KindOfBlue skrev:

Dette blir sikkert oppfattet som en provokasjon men jeg synes man burde stikke fingeren i jorda. Vi befinner oss i hifisentralen og ikke i et forskningsinstitutt. Hva er motivasjonen for testen. Testgrunnlaget vil uansett bli for lite for noen konklusjon.

Overhodet ikke. Akkurat som vi kan konstatere at Lavigne ikke hører forskjell på Transparent Opus MM og Monster Standard, vil man kunne konstatere om ulike deltagere hører/ikke hører forskjell på drivverk.

Klikk for å utvide...

Det medfører allikevel ingen konklusjon på lik linje med testen til Mike. Hva ønsker man å oppnå med testen annet enn mulignes en personlig overbevising for de som deltar. Dette kan sikkert Knutinh si noe mer om enn meg men det kreves så vidt jeg vet en viss mengde på datagrunnlaget for å kunne kalkulere bort fakturer som juks, flaks etc. med nok sikkerhet. Testgrunnlaget her er for lite til å kunne bevise at det er forskjeller som om slike skulle påvises i testen. Dersom det ikke blir påvist noen forskjeller beviser det i hvert fall ingen ting annet enn at de deltakerne som deltar på det tidspunktet som testen ble foretatt under de forutsetningen som forelå på det tidspunktet ikke kunne skille på de spesifikke drivverkene som er med i testen. Hva skal man med en slik test?

Mvh
Roysen

Klikk for å utvide...

Har du lest tråden som avfødte denne testen, Roysen?
Såvidt jeg husker er dette et tiltak som er iverksatt av dem som er overbevist om at det er forskjeller på drivverk (og andre komponenter), og som er villige til å teste denne overbevisningen etter kriterier som en gang for alle skal stoppe kjeften på skeptikere som meg.

Så det er vel hensikten med denne testen?

Klikk for å utvide...

Det har jeg fått med meg. Like fullt står spørsmålet mitt - hva skal man med en slik test?

Mvh
Roysen

Klikk for å utvide...

Det kan brukes til å påvise at det ikke er forskjeller mellom proidukter og at det derfor, er grunnløst å kjøpe noe som er dyrere og ser mer påkostet ut. Har jeg en mistanke om...

Mvh. Bjørn

Men akkurat det kan ikke en slik test påvise. Den kan bare påvise at de testdeltakerne som var med i denne spesifikke testen, med dette spesifikke utstyret under de forutsetningen som forelå på dette tidspunktet ikke klarte å skille mellom de spesifikke drivverkene som var med.

Ingen vet om testen hadde gitt det samme resultatet dagen etter eller dagen før, om natten, dersom man hadde hatt andre personer med i testen, dersom andre anlegg hadde vært benyttet eller annet testlokale for ikke snakke om andre drivverk.

Mvh
Roysen

Roysen · 31.07.2008

KindOfBlue skrev:
Det kan også brukes til å bevise at det er forskjeller på komponenter - disse behøver ikke være prisavhengige.
Finner man forskjeller, kan det være interessant å studere hva disse går ut på, og hvilke som er ønskelige og hvilke som er uønskede.

For eksempel.

Jeg vil påstå at med et så lite testgrunnlag er det ikke mulig å utelukke en rekke faktorer som kan påvirke resultatet og som ikke har noe med hvilke drivverk man benytter å gjøre.

Mvh
Roysen

KindOfBlue · 31.07.2008

Roysen skrev:
KindOfBlue skrev:

Det kan også brukes til å bevise at det er forskjeller på komponenter - disse behøver ikke være prisavhengige.
Finner man forskjeller, kan det være interessant å studere hva disse går ut på, og hvilke som er ønskelige og hvilke som er uønskede.

For eksempel.

Klikk for å utvide...

Jeg vil påstå at med et så lite testgrunnlag er det ikke mulig å utelukke en rekke faktorer som kan påvirke resultatet og som ikke har noe med hvilke drivverk man benytter å gjøre.

Mvh
Roysen

Men dine påstander om forskjell på drivverk, mellom samme og ulike DACer, i seende lytting står derimot som konklusjoner hugget i granitt?

Nei - testen gir ikke en facit, men du får en indikasjon. Og jo grundigere det gjennomføres, dess sterkere blir indikasjonen. Skjønner ikke hvorfor dette skulle være galt - er til og med sensualistenes initiativ!

Om to hører forskjell og to ikke hører forskjell, kan man f.eks. postulere at hvorvidt man detekterer forskjell er avhengig av lytteren.
Hvilket igjen fører meg til det paradoksale at når ens sanseorganer er best egnet, har man ikke råd til hverken hifi eller topp viner; men når de har tapt seg ordentlig i forhold til hva man disponerte av sansefølsomhet som 20-åring så kan man kjøpe på seg toppkomponenter og -viner, uten lenger å ha redskapen som skal til for å kunne nyte det man har kjøpt!

På tide med hifi-viagra!

;D

Roysen · 31.07.2008

KindOfBlue skrev:
Roysen skrev:

KindOfBlue skrev:

Det kan også brukes til å bevise at det er forskjeller på komponenter - disse behøver ikke være prisavhengige.
Finner man forskjeller, kan det være interessant å studere hva disse går ut på, og hvilke som er ønskelige og hvilke som er uønskede.

For eksempel.

Klikk for å utvide...

Jeg vil påstå at med et så lite testgrunnlag er det ikke mulig å utelukke en rekke faktorer som kan påvirke resultatet og som ikke har noe med hvilke drivverk man benytter å gjøre.

Mvh
Roysen

Klikk for å utvide...

Men dine påstander om forskjell på drivverk, mellom samme og ulike DACer, i seende lytting står derimot som konklusjoner hugget i granitt?

Dersom du har oppfattet det dithen har du missforstått meg. Jeg rapporterer bare hva jeg opplever og at jeg har større tro på det som en fasit enn en blindtest. Jeg har ikke forsøkt meg på noen vitenskapelig tilnærming for å forsøke å bevise noe som helst.

En blindtest er en vitenskapelig metode for å forsøke å påvise noe. Dersom blindtesten da generer et så lite grunnlag at det ikke er mulig å kalkulere bort faktorer man må kalkulere bort for å kunne benytte dette som en pålitelig metode. Hva har man igjen da?

Mvh
Roysen

Asbjørn · 31.07.2008

Roysen skrev:
Det medfører allikevel ingen konklusjon på lik linje med testen til Mike. Hva ønsker man å oppnå med testen annet enn muligens en personlig overbevising for de som deltar. Dette kan sikkert Knutinh si noe mer om enn meg men det kreves så vidt jeg vet en viss mengde på datagrunnlaget for å kunne kalkulere bort fakturer som juks, flaks etc. med nok sikkerhet. Testgrunnlaget her er for lite til å kunne bevise at det er forskjeller som om slike skulle påvises i testen.

Halloen!

Jeg har nettopp lagt frem en tabell over nøyaktig hvor stort datagrunnlaget behøver å være for å kalkulere bort alle sånne faktorer, forutsatt at selve lyttetesten gjøres på fornuftig vis. 7 riktige av 8 forsøk holder i massevis for meg, ettersom det da er mindre enn 5 % sjanse for at dette skjedde ved rene tilfeldigheter.

Hvis forskjellene er mindre enn jeg tror, slik at de ikke kan skilles ut oftere enn, la oss si, 6 av 10 ganger, så må man gjøre mye lengre serier for å få tilsvarende sikkerhet. Jeg vil være nøyaktig like overbevist om at det finnes en forskjell ved 59 riktige av 100 forsøk, selv om ting da tyder på at forskjellen er ganske liten.

Jeg vil påstå at med et så lite testgrunnlag er det ikke mulig å utelukke en rekke faktorer som kan påvirke resultatet og som ikke har noe med hvilke drivverk man benytter å gjøre.

Vennligst forklar, og vis meg hvor jeg eventuelt har regnet feil i binomialfordelingen, eller hvor svikten oppstår i den forsøksprosedyren jeg foreslo. Jeg mener fortsatt at dette bør funke helt utmerket, forutsatt at man gjør selve lyttetesten samvittighetsfullt.

Det er forøvrig skrevet doktorgradsavhandlinger i statistikk om hva man kan og ikke kan si, og med hvilken grad av sikkerhet, fra et statistisk utvalg med størrelse én. I dette tilfellet påstår jeg at det minste testgrunnlaget jeg vil akseptere er fem, og da må alle fem svarene være korrekte for at konklusjonen skal være mer enn 95 % sikker.

Roysen · 31.07.2008

asbjbo skrev:
Roysen skrev:

Det medfører allikevel ingen konklusjon på lik linje med testen til Mike. Hva ønsker man å oppnå med testen annet enn muligens en personlig overbevising for de som deltar. Dette kan sikkert Knutinh si noe mer om enn meg men det kreves så vidt jeg vet en viss mengde på datagrunnlaget for å kunne kalkulere bort fakturer som juks, flaks etc. med nok sikkerhet. Testgrunnlaget her er for lite til å kunne bevise at det er forskjeller som om slike skulle påvises i testen.

Klikk for å utvide...

Halloen!

Jeg har nettopp lagt frem en tabell over nøyaktig hvor stort datagrunnlaget behøver å være for å kalkulere bort alle sånne faktorer, forutsatt at selve lyttetesten gjøres på fornuftig vis. 7 riktige av 8 forsøk holder i massevis for meg, ettersom det da er mindre enn 5 % sjanse for at dette skjedde ved rene tilfeldigheter.

Hvis forskjellene er mindre enn jeg tror, slik at de ikke kan skilles ut oftere enn, la oss si, 6 av 10 ganger, så må man gjøre mye lengre serier for å få tilsvarende sikkerhet. Jeg vil være nøyaktig like overbevist om at det finnes en forskjell ved 59 riktige av 100 forsøk, selv om ting da tyder på at forskjellen er ganske liten.

Jeg vil påstå at med et så lite testgrunnlag er det ikke mulig å utelukke en rekke faktorer som kan påvirke resultatet og som ikke har noe med hvilke drivverk man benytter å gjøre.

Klikk for å utvide...

Vennligst forklar, og vis meg hvor jeg eventuelt har regnet feil i binomialfordelingen, eller hvor svikten oppstår i den forsøksprosedyren jeg foreslo. Jeg mener fortsatt at dette bør funke helt utmerket, forutsatt at man gjør selve lyttetesten samvittighetsfullt.

Det er forøvrig skrevet doktorgradsavhandlinger i statistikk om hva man kan og ikke kan si, og med hvilken grad av sikkerhet, fra et statistisk utvalg med størrelse én. I dette tilfellet påstår jeg at det minste testgrunnlaget jeg vil akseptere er fem, og da må alle fem svarene være korrekte for at konklusjonen skal være mer enn 95 % sikker.

Av en eller annen årsak hadde din foreslåtte metode gått meg hus forbi. Dette virker forsåvidt greit. Mitt eneste ankepunkt er at man ikke utelukker tre faktorer. 1) At det er mulig at det er invdividuellt betinget om man kan høre forskjeller fordi det er for få personer med i testen. Det er en kjennssak at enkelte hører bedre enn andre og det er også en påstått kjennsgjerning blant audiofile at det er en treningssak å høre forskjeller på komponenter. 2) At et er mulig at andre drivverk hadde gitt et helt annet resultat. 3) At det er samspillet eller synergien mellom komponentene og kablene i systemet som produserer lyden. Man klarer ikke å eliminere dette som en årsak til et nullresultat.

I tillegg kommer selvsagt de argumentene jeg hele tiden har hatt mot selve blindtesten som metode men det hører vel til en annen diskusjon.

Mvh
Roysen

KindOfBlue · 31.07.2008

asbjbo - Roysen forkaster blindtest som metode pga en rekke faktorer han mener innvirker, og som desavuerer ethvert resultat. Deriblant stress, testsituasjonen, at man ikke er kjent med formatet, komponentene, musikken, rommet, prestasjonsangst, osv.

I tillegg er det fremkommet en del påstander om hva blindtester IKKE er i stand til å måle, men som er avgjørende for hifi-opplevelsen.

Forståelse for statistisk metode og den vitenskapelig tilnærmingen som ligger bak blindtest som verktøy er det derimot mindre av.

===

Jeg syns både Den store drivverkstesten og andre tiltak som gjøres for å skape en litt mer konkret holdning til hifi er å applaudere.
Det må være lov å både lytte OG tenke.

F.eks. er det mange som påstår at en liten justering på +/- 1 cm når det gjelder høyttalerplassering vil ha stor innvirkning på opplevelsen av lyden fra disse.

Når man da tillater seg å påpeke at en tilsvarende flytting av hodet med +/-1 cm må ha tilsvarende stor innvirkning blir man fortalt at det er sprøyt å komme med en slik påstand.

Greit nok. Da er enten den første påstanden feil - til tross for at det er belegg for at man kan påvirke fenomen som stående bølge etc. vha HTs relative plassering i forhold til rommet. Om sensitiviteten er på +/- 1cm stadiet er en annen sak.

En annen mulighet er at rapportert OPPLEVD forskjell mellom komponenter skyldes at man ikke har hatt hodet (og ørene) i eksakt samme posisjon hver gang man lyttet.

FOR - er det slik at det å flytte en høyttaler et par cm kan ha stor innvirkning på frekvensgjengivelsen, så vil det å flytte på hodet kunne ha en like stor innvirkning på opplevelsen av samme frekvensspenn.

(Det er forøvrig mange forklaringsmodeller på eksemplet jeg bruker, det brukes for å skape ettertanke.)

Vha blindtester og en protokoll som tar hensyn til feilvariabler og forsøker å kontrollere eller eliminere disse, kan man nærme seg en bedre forståelse av hva som egentlig foregår når vi lytter til hifi-komponenter.

Men enkelte synes å være fullstendig uvillige til å vurdere en slik fremgangsmåte!

Roysen · 31.07.2008

KindOfBlue skrev:
Forståelse for statistisk metode og den vitenskapelig tilnærmingen som ligger bak blindtest som verktøy er det derimot mindre av.

Nå opplever jeg deg som litt arrogant igjen. Hvilket av mine argumenter kan avskrives som en følge av det du skriver her?

Mvh
Royen

KindOfBlue · 31.07.2008

Roysen skrev:
Av en eller annen årsak hadde din foreslåtte metode gått meg hus forbi. Dette virker forsåvidt greit. Mitt eneste ankepunkt er at man ikke utelukker tre faktorer. 1) At det er mulig at det er invdividuellt betinget om man kan høre forskjeller fordi det er for få personer med i testen. Det er en kjennssak at enkelte hører bedre enn andre og det er også en påstått kjennsgjerning blant audiofile at det er en treningssak å høre forskjeller på komponenter. 2) At et er mulig at andre drivverk hadde gitt et helt annet resultat. 3) At det er samspillet eller synergien mellom komponentene og kablene i systemet som produserer lyden. Man klarer ikke å eliminere dette som en årsak til et nullresultat.

I tillegg kommer selvsagt de argumentene jeg hele tiden har hatt mot selve blindtesten som metode men det hører vel til en annen diskusjon.

Mvh
Roysen

Det er flere kanonører som har erklært at de hører forskjell med på testen, og de har bred erfaring og er trente - skal man gå etter utsagn fra samme.

Som nevnt i tråden kan man la en første session, uavhengig av resultat, bli grunnlag for videre undersøkelser.
Derfor har man også foreslått at man skal bruke et antatt elendig drivverk i match mot et topp ditto, nettopp for å kunne fastslå hørbar forskjell -- FØR man ev. går videre og tester på andre grunnlag.
(F.eks. velansette komponenter som er i helt ulike prisklasser - mitt forslag er Cambridge Azur 840C mot dCS Puccini; eller Pioneer DVD mot Goldmunds versjon av samme).

Når det gjelder dine argumenter mot blindtest som metode så velger jeg å egentlig bortse fra disse, din bias er så overtydelig.
F.eks. har du ikke rapportert tilbake med mer utfyldig informasjon i forbindelse med Lavigne testen. Da denne kom var man i gang med en heftig blindtestdiskusjon her inne -- men du valgte å fullstendig se bort fra Lavignes krystallklare rapport og konklusjon, til tross for at hans testoppsett etterkom de aller fleste av dine innvendinger mot blindtester.
Du feide i stedet til side dette mildt sagt utrolige utfallet, fordi det ikke passet deg. (Noe annet er umulig å konkludere, Roysen).

Nå virker det som om du er innbitt på at det er et feilgrep å gjennomføre "forskning" på drivverk ...

KindOfBlue · 31.07.2008

Roysen skrev:
KindOfBlue skrev:

Forståelse for statistisk metode og den vitenskapelig tilnærmingen som ligger bak blindtest som verktøy er det derimot mindre av.

Klikk for å utvide...

Nå opplever jeg deg som litt arrogant igjen. Hvilket av mine argumenter kan avskrives som en følge av det du skriver her?

Mvh
Royen

Det er en grunn til at Asbjbo skriver "Halllooooooeeeeen!" i sitt tilsvar til deg. Han har konkret vist hvilke utfall som skal til for å kunne hevde statistisk signifikans for resultatet. Helt i henhold til statistisk analyse.

Roysen · 31.07.2008

KindOfBlue skrev:
Roysen skrev:

KindOfBlue skrev:

Forståelse for statistisk metode og den vitenskapelig tilnærmingen som ligger bak blindtest som verktøy er det derimot mindre av.

Klikk for å utvide...

Nå opplever jeg deg som litt arrogant igjen. Hvilket av mine argumenter kan avskrives som en følge av det du skriver her?

Mvh
Royen

Klikk for å utvide...

Det er en grunn til at Asbjbo skriver "Halllooooooeeeeen!" i sitt tilsvar til deg. Han har konkret vist hvilke utfall som skal til for å kunne hevde statistisk signifikans for resultatet. Helt i henhold til statistisk analyse.

Det fikk jeg selvfølgelig med meg og jeg har nå også skrevet at det er bra. Jeg sikter til de øvrige argumentene jeg har mot blindtester.

Jeg tror imidlertid ikke at man hadde satt legemilder på markedet etter en så begrenset blindtest som gjennført her.

Mvh
Roysen

Roysen · 31.07.2008

KindOfBlue skrev:
Roysen skrev:

Av en eller annen årsak hadde din foreslåtte metode gått meg hus forbi. Dette virker forsåvidt greit. Mitt eneste ankepunkt er at man ikke utelukker tre faktorer. 1) At det er mulig at det er invdividuellt betinget om man kan høre forskjeller fordi det er for få personer med i testen. Det er en kjennssak at enkelte hører bedre enn andre og det er også en påstått kjennsgjerning blant audiofile at det er en treningssak å høre forskjeller på komponenter. 2) At et er mulig at andre drivverk hadde gitt et helt annet resultat. 3) At det er samspillet eller synergien mellom komponentene og kablene i systemet som produserer lyden. Man klarer ikke å eliminere dette som en årsak til et nullresultat.

I tillegg kommer selvsagt de argumentene jeg hele tiden har hatt mot selve blindtesten som metode men det hører vel til en annen diskusjon.

Mvh
Roysen

Klikk for å utvide...

Det er flere kanonører som har erklært at de hører forskjell med på testen, og de har bred erfaring og er trente - skal man gå etter utsagn fra samme.

Dersom man skal gå vitenskapelig til verks (og det bør man vel dersom man skal benytte en vitenskapelig metode i et forsøk på å påvse noe) så er vel ikke det at man påstår at man har kanonører, bred erfaring og trente ører nok til at man kan utelukke at så ikke er tilfelle. Dersom man skal stole på det kan man vel like så godt stole på deres lytteopplevelser?

KindOfBlue skrev:
Som nevnt i tråden kan man la en første session, uavhengig av resultat, bli grunnlag for videre undersøkelser.
Derfor har man også foreslått at man skal bruke et antatt elendig drivverk i match mot et topp ditto, nettopp for å kunne fastslå hørbar forskjell -- FØR man ev. går videre og tester på andre grunnlag.
(F.eks. velansette komponenter som er i helt ulike prisklasser - mitt forslag er Cambridge Azur 840C mot dCS Puccini; eller Pioneer DVD mot Goldmunds versjon av samme).

Igjen - dersom man skal gå vitenskapelig til verks (og det bør man vel dersom man skal benytte en vitenskapelig metode i et forsøk på å påvse noe) så er vel ikke pris nødvendigvis det som er avgjørende for kvaliteten på drivverket og dets output? Dersom testen hadde vært er det forskjell på dyre og billige drivverk - hadde det vært noe annet, men her forsøker man på påvise om det er eksisterer ulikheter i det hele. Valg av drivverk for å finne slike forskjeller bør derfor være basert på noe mindre tilfeldig enn pris.

KindOfBlue skrev:
Når det gjelder dine argumenter mot blindtest som metode så velger jeg å egentlig bortse fra disse, din bias er så overtydelig.
F.eks. har du ikke rapportert tilbake med mer utfyldig informasjon i forbindelse med Lavigne testen. Da denne kom var man i gang med en heftig blindtestdiskusjon her inne -- men du valgte å fullstendig se bort fra Lavignes krystallklare rapport og konklusjon, til tross for at hans testoppsett etterkom de aller fleste av dine innvendinger mot blindtester.
Du feide i stedet til side dette mildt sagt utrolige utfallet, fordi det ikke passet deg. (Noe annet er umulig å konkludere, Roysen).

Er det nødvendig å gjenta meg selv til det kjedsommelige. Jeg har hele tiden hevdet at mine argumenter mot blindtest går på at resultatet ene og alene er forklarende for den spesifikke situasjonen og tidspunktet. Det gjelder også Mikes test. Selv om jeg kanskje ikke har forklart det med store bokstaver gjelder det også denne testen. Mike er min venn og jeg ønsker egenltlig ikke å argumentere for noe som kan virke fordummende på ham.

KindOfBlue skrev:
Nå virker det som om du er innbitt på at det er et feilgrep å gjennomføre "forskning" på drivverk ...

Du verden. Hvor har du det fra? Det jeg har skrevet er at forskning er bra, men ikke "kvasi"-forskning som kan være til like mye forvirring som forklaring.

Mvh
Roysen

Den store drivverktesten, metodikk og oppsett

Æresmedlem

Overivrig entusiast

Lustig im Tempo und keck im Ausdruck

Overivrig entusiast

biskopen av holmlia

Rubinmedlem

Hi-Fi freak

knutinh

Gjest

knutinh

Gjest

Æresmedlem

Æresmedlem

knutinh

Gjest

Rubinmedlem

Roysen

Gjest

KindOfBlue

Gjest

Æresmedlem

Rubinmedlem

KindOfBlue

Gjest

Æresmedlem

KindOfBlue

Gjest

Roysen

Gjest

KindOfBlue

Gjest

Roysen

Gjest

Roysen

Gjest

KindOfBlue

Gjest

Æresmedlem

KindOfBlue

Gjest

Roysen

Gjest

Roysen

Gjest

Roysen

Gjest

KindOfBlue

Gjest

Roysen

Gjest

Rubinmedlem

Roysen

Gjest

KindOfBlue

Gjest

Roysen

Gjest

KindOfBlue

Gjest

KindOfBlue

Gjest

Roysen

Gjest

Roysen

Gjest