Om du lukker enden på en orgelpipe får du en tone som ligger en oktav lavere. Det finnes spesielle måter å delvis terminere en slik pipe, jeg tror det er et godt eksempel på en subharmonisk effekt.
Var først og fremst ikke harmoniske og inharmoniske over- og undertoner jeg tenkte på, selv om de gjerne også kan spre seg langt utenfor kjerneregisteret til et instrument. Over-/undertone var feil ordvalg. Spektra er bedre ord!
Transienter, lyder som endrer seg fort, har ikke et sett med spesifike frekvenser. Det er en spredning av energi som dekker et område i det vi kaller frekvens. Egentlig er alt i verden slike noe udefinerbare spredninger av energi. Når energien er konsentrert i smale nok bånd gir begrepet frekvens mening. I andre situasjoner er det en vagere definert energispredning over et spektra som er cluet.
Transienter er spektra. Spredningen har dominant respons i visse områder og mindre respons i andre. Hvor spredt energien er kan sees på hvor hurtig endringen i lyden foregår. Alle lyder som har en form endring over tid vil ha en spredt energi, i tillegg til de rene tonene som evnt blir produsert. Det mest spredte fenomenet av alle, det stikk motsatte av en sinustone, er en impuls. Impulser har det fulle spektra fra maksfrekvens i systemet og hele veien ned til flat strøm (DC).
Musikalske signaler er alltid et sted mellom yttergrensene definert av sinustone og impuls. Frekvens som begrep dekker bare sinus-aspektet av lyd. Spredningen av energi som transienter gir heter spektra i fysikken, men det er et lite brukt begrep i musikk. Burde kanskje kalles noe helt annet for å unngå forvirring med frekvens? Kartet som vist til i tråden her dekker altså for det meste sinus/frekvens delen av lyd, med en svak vekt på transientsiden synlig i bl.a. stemmeområdet som vist.
Her er diverse grafer som viser tid bortover, frekvens oppover og nivå som farge.
En mann som sier "soun" uten D lyden. S'en er en distribusjon av energi (luft fra lungene), filtrert ned til relativt lite og høyfrekventspektra av at tungen ligger nærmt den øvre tannrekken. OU delen er svingninger av stemmebåndet og her kan hver enkelt svingning sees om en distinkt utblåsing av energi over et bredt spektra. N lyden er av samme repetetive svingningsnatur som vokallydene O og U, men mer dempet, da tungen legger seg opp i gangen og blokkerer høyfrekvent lyd.
En mann som sier "ekkofisk". E'en er en grunntone med harmonier, K'en er en kort utblåsning av energi, O'en har et mer dempet registrer enn E'en, F'en på er en ny utblåsning av energi over et ganske stort register, I'en er mer konsentrert enn E'en og O'en, S lyden er filtrert til en høyfrekvent distribusjon av energi og det hele avsluttes på 44 sek med en ny skarp transient, K lyden.
En del praktiske forhold kan også sees direkte i grafen. Filen har vært en 320k MP3. Dette kan sees ved at det meste over 16000Hz er fjernet fra materialet, med kun noen få områder som byr på energi over 16kHz der MP3-koderen bestemmer seg for at dette er viktig nok til å inkludere i den svært begrensede bitstrømmen. Det kan også sees at dette er et gammelt opptak, fra de dager da voiceover-artister jobbet med gammeldagse (CRT) fjernsyn i det samme rommet som mikrofonen befant seg. Den høyfrekvente pipetonen som er konstant for hele opptaket ligger på 625(linjer i sekundet) ganget med 25 (frames i sekundet) = 15625 Hz. I disse moderne dager med flatskjermer er ikke dette lenger et problem med opptak av stemme, selv om det fortsatt dukker opp en gang i blant.
Første lyden er en hihat, andre lyden er et bassdunk og tredje lyden er en skarptromme som grovt sett kan sees som en kombinasjon av de to første. I tilegg er det en durelyd som ligger konstant gjennom hele opptaket (linjen litt nedenfor midten). Lydene kommer fra en vinylplate, så det er også noen klikkelyder fra vinylen der (f.eks. rett før 0,20 sek)
En dyp ståbass, den transiente delen av lyden under selve anslaget kan sees før den repetetive frekvensen til strengen blir dominant.
Et lenger område med tid, et pianostykke med mye sustainpedal. Hver enkelt note som blir spilt popper opp som de lyseste strekene. De andre tonene fra de andre notene blir hengende så lenge pedalen er nede. Anslaget når pianisten slår på tangentene kan sees å være et spredt spektra med energi, med noen litt kraftigere anslag her og der som resultat av at spilleren slår litt hardere med hammerne. Dette var en meget svakt og høflig spilt intro til en ballade, likevel er den transiente naturen til angrepsdelen av pianolyden tydelig i grafen.
Slike kombinerte tid/frekvensgrafer har store begrensninger. For å få frem såpass mye detaljer er det brukt store mengder med overlapping både i frekvens og tid. Alt i alt er det en hel del artifakter i grafene som egentlig ikke ligger i lydene. Håper ingen tror at det er nøyaktig slik lyd ser ut! Poenget er å vise at det er distribusjoner av energi i noen områder(transienter, filtrert støy) og repetetive svingninger i andre områder (stemmebånd/streng/trommeresonans).
Edit: ser at noen av bildene forsvinner utenfor kanten. På PC virker det fint å høyreklikke og trykke "open image", mac har sikkert noe tilsvarende.
Nyquist/Shannon sier ikke noe om spesifike frekvenser. Samplingsteoremet sier at alt av energi under en viss frekvensgrense kan lagres med 100% presisjon så lenge det lagres med takfaste samplepunkter som kommer oftere enn to ganger denne frekvensen. Om energien er spredd eller klumpet sammen bryr ikke sampleren seg om.
Nyquist/Shannon sier ikke noe om spesifike frekvenser. Samplingsteoremet sier at alt av energi under en viss frekvensgrense kan lagres med 100% presisjon så lenge det lagres med takfaste samplepunkter som kommer oftere enn to ganger denne frekvensen. Om energien er spredd eller klumpet sammen bryr ikke sampleren seg om.
Det jeg hinter til er at for å få med all informasjonen i ett endelig musikkstykke (lyd) så må du i tillegg til dobblingen av samplingen legge til den inverse av varigheten. Altså 1/T.
Det jeg mente linket til dette var at du påpekte utstrekningen til impulsene i perkusjonene. Vi vet jo at en Dirac inneholder alle frekvenser og derav må man ha uendelig høy samplingsfrekvens for å få med alt. Men det gjelder faktisk også for lengre lydintervaller. Så dersom en lyd varer 1 sekund må man altså ha samplingsfrekvens som er 2xhøyeste frekvens + 1
Dette er bare en kuriositet fra ett praktisk ståsted, men er litt artig synes jeg.
Nå er jeg på litt tynn is, men oppstår ikke undertoner/subharmoniske som resultat av intermodulasjon mellom andre toner? Mulig jeg blander begrepene, men det jeg sikter til er at 100Hz og 70Hz kan resultere i en 30Hz komponent.
For å få differansefrekvenser når du blander to toner må du ha en ulinearitet. I lineær teori eksisterer ikke slike. Men øret er for eksempel ulineært i sin respons, og luringene lager 16 Hz orgellyder med å spille 32 og 48 Hz samtidig, OG HØYT! Ulineariteter blir, som navnet til en viss grad antyder, verre ved høye nivåer. Mediet kan også være ulineært, f.eks både luft og vann, for ikke å snakke om høyttalerelementer. Så det er både riktig og galt samtidig, og det er ikke noe feil med det!
Modulasjon av «subharmoniske» komponenter skyldes mange av de samme «forvregnings» mekanismene som lager (over-)harmoniske komponenter så helt feil blir det vel ikke med «subharmonisk» for differansetoner.
Differansetoner kan være svært uharmoniske, eksemplet 16-32-48 var nokså harmonisk, men hvis det er tilfeldige tall og differanser involvert blir det ikke enkle brøker og halve frekvenser uten at det er noe spesielt. Overharmoniske er nettopp det: harmoniske. Selv om de f.eks er laget av klipping eller annen ulinearitet.
Så: undertoner er ikke et bra ord, og slett ikke underharmoniske.
Den fundamentale differansen av intermodulasjon blir normalt ikke referert til som forvrengning. Det er sidebåndene som normalt referers til som forvrengning. Her er et par eksempler.
Den fundamentale differansen av intermodulasjon blir normalt ikke referert til som forvrengning. Det er sidebåndene som normalt referers til som forvrengning. Her er et par eksempler.
...
Hvis det er slik bransjen får lave forvrengningstall vil jeg skygge langt unna produktet. En differansetone er resultatet av slem ulinearitet, og av verste slag. Hvorfor skulle ikke den telle?
Det jeg hinter til er at for å få med all informasjonen i ett endelig musikkstykke (lyd) så må du i tillegg til dobblingen av samplingen legge til den inverse av varigheten. Altså 1/T.
Inversjonen du tenker på er definisjonen av frekvens. Frekvens = 1/tid.
Frekvens er et abstrakt begrep som mennesker har funnet på, det er ikke noe som faktisk eksisterer i den fysiske virkeligheten. Følgelig er det heller ikke noe som en sampler bryr seg med!
En impuls som inneholder all informasjon fra flat strøm (DC) til maksimumfrekvens i systemet (rett under halvparten av samplerate) kan lagres med 3 samples: 0 1 0. Ingen grunn til å blande inn 1/tid.
Med samplene 0 1 0 kan du ikke rekonstruere impulsen uten tidsdata (samplerate). Avhengig av om sampleraten er høy nok i forhold til informasjonen i originalsignalet. Så langt tror jeg vi er på bølgelengde. De 3 samplene 0 1 0 sier deg ingenting isolert sett. De kan jo være tatt ut fra nesten hva som helst. De kan så klart beskriver en overføringsfunksjon, men det blir noe helt annet.
Det tillegget jeg kom med, tar hensyn til at frekvensinnholdet går mot uendelig når tidsrommet går mot null. Ref. Dirac.
Med samplene 0 1 0 kan du ikke rekonstruere impulsen uten tidsdata (samplerate). Avhengig av om sampleraten er høy nok i forhold til informasjonen i originalsignalet. Så langt tror jeg vi er på bølgelengde. De 3 samplene 0 1 0 sier deg ingenting isolert sett. De kan jo være tatt ut fra nesten hva som helst. De kan så klart beskriver en overføringsfunksjon, men det blir noe helt annet.
Det tillegget jeg kom med, tar hensyn til at frekvensinnholdet går mot uendelig når tidsrommet går mot null. Ref. Dirac.
Frågan, enten den er reell eller imaginær, er uansett hva som behøvs av øvre grensefrekvens for å kunne gjenngi musikk på en rimelig transparent måte +/- ringing, +/- evt presisjon i fase og gjengivelse/timingen av impulser mellom høyre og venstre +/- evt effekter av å begrense den øvre grensefrekvensen i flere stadier i løpet av en produksjon av hermetisk musikk ... det er mulig det siste bare er et «analogt» problem. Mht fase og timingen av impulser - kan 44,1Hz sampling gjengi en forskjell i impulstiming mellom høyre og venstre på omkring 10 µS? 10 µS etter det jeg har lest (Ref. wiki) omkring nedre grense for å kunne oppfatte endring i tidsforskjell mellom ørene - dvs grensen for oppløsning av den horisontale panoreringen av lyd.
Litt usikker på hva du spør om egentlig. Spør du om 44.1Khz kan tilfredsstille et krav om 10uS presisjon?
I så fall. Dette bestemmes av klokkepresisjonen i sampleren, mer enn sampleraten isolert. Dette "tillegget" jeg kom drassende med har ingen praktisk verdi hverdagen, det er bare en matematisk kuriositet.
Øvre hørselsgrense er jo satt til ca 20Khz, men man sampler likevel som om det skulle være 22.05Khz, så det godt med slingringsmon der.
Med samplene 0 1 0 kan du ikke rekonstruere impulsen uten tidsdata (samplerate). Avhengig av om sampleraten er høy nok i forhold til informasjonen i originalsignalet. Så langt tror jeg vi er på bølgelengde. De 3 samplene 0 1 0 sier deg ingenting isolert sett. De kan jo være tatt ut fra nesten hva som helst. De kan så klart beskriver en overføringsfunksjon, men det blir noe helt annet.
Enig! Poenget var at 0 1 0 vil gi maksfrekvens i systemet uansett hvilken samplerate det velges. Rundet det av med en null for mye på slutten for å gjøre det mer visuelt som en impuls, men egentlig holder det med Dirac delta impulsen: 0 og 1. Dette er en energispredning som ikke lar seg beskrive med begrepet frekvens (1/tid).
Kanskje kuriosaen du sikter til er at 1/tid i dette tilfellet gir maksfrekvens direkte uten å regne på flankesteilhet. 0 1 er i etthvert samplet system det samme som maks teoretisk frekvens. Med to samples i et 44100/sek samplesystem er maksfrekvens 1/tid, i Hertz: 1/(2*(1/44100)) = 22050. Men... Denne kuriosaen forutsetter at filteret slipper gjennom all data på 22050 Hz, noe det helst ikke skal gjøre.
timc skrev:
Det tillegget jeg kom med, tar hensyn til at frekvensinnholdet går mot uendelig når tidsrommet går mot null. Ref. Dirac.
Det nærmer seg ideel impuls, ja. Et samplet system lagrer dataen som en serie med slike umulius perfektus impulser som blir filtrert ned til virkelighetens båndbreddebegrensning i rekonstruksjonen til en flytende analog bølge. Var det kanskje noe sånt som var i tankene dine?
Eller var det noe annet du tenkte på? Lærer gjerne noe nytt om digital lyd, er lenge siden nå.
KJ skrev:
Mht fase og timingen av impulser - kan 44,1Hz sampling gjengi en forskjell i impulstiming mellom høyre og venstre på omkring 10 µS?
Ja! Det er ingen grense for hvilken presisjon lyd kan lagres med så lenge det befinner seg i riktig område; under halvparten av samplerate.
Her er et bilde som viser hvordan et sett med samples er i stand til å lagre informasjon mellom samplepunktene:
Summen av mange impulser kan anta hvilken som helst bølgeform med så og si uendelig presisjon i fase. Begrensningen ligger, som TimC påpeker, i stabiliteten til sampleren.
Slik jeg ser det kan man tenke på to måter. Den første er den tradisjonelle at man vet frekvensinnholdet og så bruker dobbel samplingsfrekvens for å få med alt.
Imidlertid forutsetter samplingsteoremet at signalet er uendelig. For nesten all praktisk bruk kan man se bort fra denne detaljen.
Så til den "andre" måten. La oss si at du skal sample ett signal med fmax=10Hz. Da trenger du altså en Fs på 20Hz for å få med alt normalt sett. Men, tenk deg så hva som skjer dersom tidsrommet du skal sample blir kortere enn tidsrommet mellom 2 sampler. Da får man jo bare èn sample og det holder ikke.
Da kan man altså velge å si at frekvensinnholdet har endret seg, og justere deretter, eller man kan legge til 1/T til det vanlige samplingsteoremet.
Tror vi er ganske enige, men formulerer oss forskjellig. Uansett som sagt, så er dette i de aller fleste tilfeller kun en kuriositet, men den gir deg en helt eksakt verdi for nødvendig samplingsfrekvens. Det har matematisk betydning, men lite praktisk.