Frekvenser - instrumental og vokal

T

timc

Gjest
Snickers-is skrev:
Om du lukker enden på en orgelpipe får du en tone som ligger en oktav lavere. Det finnes spesielle måter å delvis terminere en slik pipe, jeg tror det er et godt eksempel på en subharmonisk effekt.
Blir dette det samme? Med lukket/åpen så endrer man jo fra kvartbølge/halvbølgeresonator (husker aldri hvilken vei det går).


-Tim
 

Snickers-is

Bransjeaktør
Ble medlem
05.02.2004
Innlegg
18.813
Antall liker
17.834
Sted
Østfold
timc skrev:
Med lukket/åpen så endrer man jo fra kvartbølge/halvbølgeresonator (husker aldri hvilken vei det går).
Dette er litt på siden av mitt kunnskapsfelt, jeg tør ikke si sikkert hvordan det forholder seg.
 

Nordenstam

Hi-Fi entusiast
Ble medlem
17.05.2010
Innlegg
196
Antall liker
3
Bra spørsmål!

Var først og fremst ikke harmoniske og inharmoniske over- og undertoner jeg tenkte på, selv om de gjerne også kan spre seg langt utenfor kjerneregisteret til et instrument. Over-/undertone var feil ordvalg. Spektra er bedre ord!

Transienter, lyder som endrer seg fort, har ikke et sett med spesifike frekvenser. Det er en spredning av energi som dekker et område i det vi kaller frekvens. Egentlig er alt i verden slike noe udefinerbare spredninger av energi. Når energien er konsentrert i smale nok bånd gir begrepet frekvens mening. I andre situasjoner er det en vagere definert energispredning over et spektra som er cluet.

Transienter er spektra. Spredningen har dominant respons i visse områder og mindre respons i andre. Hvor spredt energien er kan sees på hvor hurtig endringen i lyden foregår. Alle lyder som har en form endring over tid vil ha en spredt energi, i tillegg til de rene tonene som evnt blir produsert. Det mest spredte fenomenet av alle, det stikk motsatte av en sinustone, er en impuls. Impulser har det fulle spektra fra maksfrekvens i systemet og hele veien ned til flat strøm (DC).

Musikalske signaler er alltid et sted mellom yttergrensene definert av sinustone og impuls. Frekvens som begrep dekker bare sinus-aspektet av lyd. Spredningen av energi som transienter gir heter spektra i fysikken, men det er et lite brukt begrep i musikk. Burde kanskje kalles noe helt annet for å unngå forvirring med frekvens? Kartet som vist til i tråden her dekker altså for det meste sinus/frekvens delen av lyd, med en svak vekt på transientsiden synlig i bl.a. stemmeområdet som vist.


Her er diverse grafer som viser tid bortover, frekvens oppover og nivå som farge.


En mann som sier "soun" uten D lyden. S'en er en distribusjon av energi (luft fra lungene), filtrert ned til relativt lite og høyfrekventspektra av at tungen ligger nærmt den øvre tannrekken. OU delen er svingninger av stemmebåndet og her kan hver enkelt svingning sees om en distinkt utblåsing av energi over et bredt spektra. N lyden er av samme repetetive svingningsnatur som vokallydene O og U, men mer dempet, da tungen legger seg opp i gangen og blokkerer høyfrekvent lyd.



En mann som sier "ekkofisk". E'en er en grunntone med harmonier, K'en er en kort utblåsning av energi, O'en har et mer dempet registrer enn E'en, F'en på er en ny utblåsning av energi over et ganske stort register, I'en er mer konsentrert enn E'en og O'en, S lyden er filtrert til en høyfrekvent distribusjon av energi og det hele avsluttes på 44 sek med en ny skarp transient, K lyden.
En del praktiske forhold kan også sees direkte i grafen. Filen har vært en 320k MP3. Dette kan sees ved at det meste over 16000Hz er fjernet fra materialet, med kun noen få områder som byr på energi over 16kHz der MP3-koderen bestemmer seg for at dette er viktig nok til å inkludere i den svært begrensede bitstrømmen. Det kan også sees at dette er et gammelt opptak, fra de dager da voiceover-artister jobbet med gammeldagse (CRT) fjernsyn i det samme rommet som mikrofonen befant seg. Den høyfrekvente pipetonen som er konstant for hele opptaket ligger på 625(linjer i sekundet) ganget med 25 (frames i sekundet) = 15625 Hz. I disse moderne dager med flatskjermer er ikke dette lenger et problem med opptak av stemme, selv om det fortsatt dukker opp en gang i blant.



Første lyden er en hihat, andre lyden er et bassdunk og tredje lyden er en skarptromme som grovt sett kan sees som en kombinasjon av de to første. I tilegg er det en durelyd som ligger konstant gjennom hele opptaket (linjen litt nedenfor midten). Lydene kommer fra en vinylplate, så det er også noen klikkelyder fra vinylen der (f.eks. rett før 0,20 sek)



En dyp ståbass, den transiente delen av lyden under selve anslaget kan sees før den repetetive frekvensen til strengen blir dominant.



Et lenger område med tid, et pianostykke med mye sustainpedal. Hver enkelt note som blir spilt popper opp som de lyseste strekene. De andre tonene fra de andre notene blir hengende så lenge pedalen er nede. Anslaget når pianisten slår på tangentene kan sees å være et spredt spektra med energi, med noen litt kraftigere anslag her og der som resultat av at spilleren slår litt hardere med hammerne. Dette var en meget svakt og høflig spilt intro til en ballade, likevel er den transiente naturen til angrepsdelen av pianolyden tydelig i grafen.


Slike kombinerte tid/frekvensgrafer har store begrensninger. For å få frem såpass mye detaljer er det brukt store mengder med overlapping både i frekvens og tid. Alt i alt er det en hel del artifakter i grafene som egentlig ikke ligger i lydene. Håper ingen tror at det er nøyaktig slik lyd ser ut! Poenget er å vise at det er distribusjoner av energi i noen områder(transienter, filtrert støy) og repetetive svingninger i andre områder (stemmebånd/streng/trommeresonans).

Edit: ser at noen av bildene forsvinner utenfor kanten. På PC virker det fint å høyreklikke og trykke "open image", mac har sikkert noe tilsvarende.


Mvh,

Andreas Nordenstam
 
T

timc

Gjest
Dette henger jo fint sammen med at nyqvistteoremet er feil ;)
 

Nordenstam

Hi-Fi entusiast
Ble medlem
17.05.2010
Innlegg
196
Antall liker
3
??

Nyquist/Shannon sier ikke noe om spesifike frekvenser. Samplingsteoremet sier at alt av energi under en viss frekvensgrense kan lagres med 100% presisjon så lenge det lagres med takfaste samplepunkter som kommer oftere enn to ganger denne frekvensen. Om energien er spredd eller klumpet sammen bryr ikke sampleren seg om.

Eller misforstår jeg deg fullstendig? :)
 
T

timc

Gjest
Nordenstam skrev:
??

Nyquist/Shannon sier ikke noe om spesifike frekvenser. Samplingsteoremet sier at alt av energi under en viss frekvensgrense kan lagres med 100% presisjon så lenge det lagres med takfaste samplepunkter som kommer oftere enn to ganger denne frekvensen. Om energien er spredd eller klumpet sammen bryr ikke sampleren seg om.

Eller misforstår jeg deg fullstendig? :)
Om du misforstår eller ikke vet jeg ikke.

Det jeg hinter til er at for å få med all informasjonen i ett endelig musikkstykke (lyd) så må du i tillegg til dobblingen av samplingen legge til den inverse av varigheten. Altså 1/T.

Det jeg mente linket til dette var at du påpekte utstrekningen til impulsene i perkusjonene. Vi vet jo at en Dirac inneholder alle frekvenser og derav må man ha uendelig høy samplingsfrekvens for å få med alt. Men det gjelder faktisk også for lengre lydintervaller. Så dersom en lyd varer 1 sekund må man altså ha samplingsfrekvens som er 2xhøyeste frekvens + 1

Dette er bare en kuriositet fra ett praktisk ståsted, men er litt artig synes jeg.


-Tim
 

Barbaresco

Hi-Fi freak
Ble medlem
23.03.2006
Innlegg
3.025
Antall liker
726
Torget vurderinger
1
timc skrev:
Nå er jeg på litt tynn is, men oppstår ikke undertoner/subharmoniske som resultat av intermodulasjon mellom andre toner? Mulig jeg blander begrepene, men det jeg sikter til er at 100Hz og 70Hz kan resultere i en 30Hz komponent.


-Tim
For å få differansefrekvenser når du blander to toner må du ha en ulinearitet. I lineær teori eksisterer ikke slike. Men øret er for eksempel ulineært i sin respons, og luringene lager 16 Hz orgellyder med å spille 32 og 48 Hz samtidig, OG HØYT! Ulineariteter blir, som navnet til en viss grad antyder, verre ved høye nivåer. Mediet kan også være ulineært, f.eks både luft og vann, for ikke å snakke om høyttalerelementer. Så det er både riktig og galt samtidig, og det er ikke noe feil med det!
 

KJ

Æresmedlem
Ble medlem
10.10.2004
Innlegg
11.609
Antall liker
5.340
Torget vurderinger
1
timc skrev:
Snickers-is skrev:
Det er riktig Timc, men jeg er ikke sikker på om det er riktig å referere til den som harmonisk.
Nei...det ble feil. Men hva er da subharmoniske? Jeg har hørt snakk om subharmoniske i orgelpiper og strenginstrumenter med kasse.

Altså jeg skjønner hva subharmonisk innebærer, men hva kommer det av?
Modulasjon av «subharmoniske» komponenter skyldes mange av de samme «forvregnings» mekanismene som lager (over-)harmoniske komponenter så helt feil blir det vel ikke med «subharmonisk» for differansetoner.

mvh
KJ
 

Barbaresco

Hi-Fi freak
Ble medlem
23.03.2006
Innlegg
3.025
Antall liker
726
Torget vurderinger
1
Differansetoner kan være svært uharmoniske, eksemplet 16-32-48 var nokså harmonisk, men hvis det er tilfeldige tall og differanser involvert blir det ikke enkle brøker og halve frekvenser uten at det er noe spesielt. Overharmoniske er nettopp det: harmoniske. Selv om de f.eks er laget av klipping eller annen ulinearitet.

Så: undertoner er ikke et bra ord, og slett ikke underharmoniske.
 
T

timc

Gjest
Må ikke en undertone inntreffe på harmoniske trinn for å kalles subharmonisk? I motsetning til differansetoner som kan være hva som helst.


-Tim
 

Snickers-is

Bransjeaktør
Ble medlem
05.02.2004
Innlegg
18.813
Antall liker
17.834
Sted
Østfold
Den fundamentale differansen av intermodulasjon blir normalt ikke referert til som forvrengning. Det er sidebåndene som normalt referers til som forvrengning. Her er et par eksempler.



 

KJ

Æresmedlem
Ble medlem
10.10.2004
Innlegg
11.609
Antall liker
5.340
Torget vurderinger
1
Snickers-is skrev:
Den fundamentale differansen av intermodulasjon blir normalt ikke referert til som forvrengning. Det er sidebåndene som normalt referers til som forvrengning. Her er et par eksempler.
...
? det er litt underlig siden det i eksemplet «ditt» og tilsvarende situasjoner ofte er dfifferansetonene som er mest hørbare og «slitsomme».

mvh
KJ
 

Barbaresco

Hi-Fi freak
Ble medlem
23.03.2006
Innlegg
3.025
Antall liker
726
Torget vurderinger
1
Hvis det er slik bransjen får lave forvrengningstall vil jeg skygge langt unna produktet. En differansetone er resultatet av slem ulinearitet, og av verste slag. Hvorfor skulle ikke den telle?
 

Nordenstam

Hi-Fi entusiast
Ble medlem
17.05.2010
Innlegg
196
Antall liker
3
timc skrev:
Det jeg hinter til er at for å få med all informasjonen i ett endelig musikkstykke (lyd) så må du i tillegg til dobblingen av samplingen legge til den inverse av varigheten. Altså 1/T.
Inversjonen du tenker på er definisjonen av frekvens. Frekvens = 1/tid.

Frekvens er et abstrakt begrep som mennesker har funnet på, det er ikke noe som faktisk eksisterer i den fysiske virkeligheten. Følgelig er det heller ikke noe som en sampler bryr seg med!

En impuls som inneholder all informasjon fra flat strøm (DC) til maksimumfrekvens i systemet (rett under halvparten av samplerate) kan lagres med 3 samples: 0 1 0. Ingen grunn til å blande inn 1/tid.

Skrev nylig en lang utgreien om frekvens her.


Andreas
 
T

timc

Gjest
Nå lurer jeg på om vi snakker om det samme.

Med samplene 0 1 0 kan du ikke rekonstruere impulsen uten tidsdata (samplerate). Avhengig av om sampleraten er høy nok i forhold til informasjonen i originalsignalet. Så langt tror jeg vi er på bølgelengde. De 3 samplene 0 1 0 sier deg ingenting isolert sett. De kan jo være tatt ut fra nesten hva som helst. De kan så klart beskriver en overføringsfunksjon, men det blir noe helt annet.

Det tillegget jeg kom med, tar hensyn til at frekvensinnholdet går mot uendelig når tidsrommet går mot null. Ref. Dirac.
 

KJ

Æresmedlem
Ble medlem
10.10.2004
Innlegg
11.609
Antall liker
5.340
Torget vurderinger
1
timc skrev:
Nå lurer jeg på om vi snakker om det samme.

Med samplene 0 1 0 kan du ikke rekonstruere impulsen uten tidsdata (samplerate). Avhengig av om sampleraten er høy nok i forhold til informasjonen i originalsignalet. Så langt tror jeg vi er på bølgelengde. De 3 samplene 0 1 0 sier deg ingenting isolert sett. De kan jo være tatt ut fra nesten hva som helst. De kan så klart beskriver en overføringsfunksjon, men det blir noe helt annet.

Det tillegget jeg kom med, tar hensyn til at frekvensinnholdet går mot uendelig når tidsrommet går mot null. Ref. Dirac.
Frågan, enten den er reell eller imaginær, er uansett hva som behøvs av øvre grensefrekvens for å kunne gjenngi musikk på en rimelig transparent måte +/- ringing, +/- evt presisjon i fase og gjengivelse/timingen av impulser mellom høyre og venstre +/- evt effekter av å begrense den øvre grensefrekvensen i flere stadier i løpet av en produksjon av hermetisk musikk ... det er mulig det siste bare er et «analogt» problem. Mht fase og timingen av impulser - kan 44,1Hz sampling gjengi en forskjell i impulstiming mellom høyre og venstre på omkring 10 µS? 10 µS etter det jeg har lest (Ref. wiki) omkring nedre grense for å kunne oppfatte endring i tidsforskjell mellom ørene - dvs grensen for oppløsning av den horisontale panoreringen av lyd.

mhv
KJ
 
T

timc

Gjest
Litt usikker på hva du spør om egentlig. Spør du om 44.1Khz kan tilfredsstille et krav om 10uS presisjon?

I så fall. Dette bestemmes av klokkepresisjonen i sampleren, mer enn sampleraten isolert. Dette "tillegget" jeg kom drassende med har ingen praktisk verdi hverdagen, det er bare en matematisk kuriositet.

Øvre hørselsgrense er jo satt til ca 20Khz, men man sampler likevel som om det skulle være 22.05Khz, så det godt med slingringsmon der.
 

Nordenstam

Hi-Fi entusiast
Ble medlem
17.05.2010
Innlegg
196
Antall liker
3
timc skrev:
Nå lurer jeg på om vi snakker om det samme.

Med samplene 0 1 0 kan du ikke rekonstruere impulsen uten tidsdata (samplerate). Avhengig av om sampleraten er høy nok i forhold til informasjonen i originalsignalet. Så langt tror jeg vi er på bølgelengde. De 3 samplene 0 1 0 sier deg ingenting isolert sett. De kan jo være tatt ut fra nesten hva som helst. De kan så klart beskriver en overføringsfunksjon, men det blir noe helt annet.
Enig! Poenget var at 0 1 0 vil gi maksfrekvens i systemet uansett hvilken samplerate det velges. Rundet det av med en null for mye på slutten for å gjøre det mer visuelt som en impuls, men egentlig holder det med Dirac delta impulsen: 0 og 1. Dette er en energispredning som ikke lar seg beskrive med begrepet frekvens (1/tid).

Kanskje kuriosaen du sikter til er at 1/tid i dette tilfellet gir maksfrekvens direkte uten å regne på flankesteilhet. 0 1 er i etthvert samplet system det samme som maks teoretisk frekvens. Med to samples i et 44100/sek samplesystem er maksfrekvens 1/tid, i Hertz: 1/(2*(1/44100)) = 22050. Men... Denne kuriosaen forutsetter at filteret slipper gjennom all data på 22050 Hz, noe det helst ikke skal gjøre.

timc skrev:
Det tillegget jeg kom med, tar hensyn til at frekvensinnholdet går mot uendelig når tidsrommet går mot null. Ref. Dirac.
Det nærmer seg ideel impuls, ja. Et samplet system lagrer dataen som en serie med slike umulius perfektus impulser som blir filtrert ned til virkelighetens båndbreddebegrensning i rekonstruksjonen til en flytende analog bølge. Var det kanskje noe sånt som var i tankene dine?

Eller var det noe annet du tenkte på? Lærer gjerne noe nytt om digital lyd, er lenge siden nå. :)


KJ skrev:
Mht fase og timingen av impulser - kan 44,1Hz sampling gjengi en forskjell i impulstiming mellom høyre og venstre på omkring 10 µS?
Ja! Det er ingen grense for hvilken presisjon lyd kan lagres med så lenge det befinner seg i riktig område; under halvparten av samplerate.

Her er et bilde som viser hvordan et sett med samples er i stand til å lagre informasjon mellom samplepunktene:


Summen av mange impulser kan anta hvilken som helst bølgeform med så og si uendelig presisjon i fase. Begrensningen ligger, som TimC påpeker, i stabiliteten til sampleren.
 
T

timc

Gjest
Tror vi er på bølgelengde Andreas.

Slik jeg ser det kan man tenke på to måter. Den første er den tradisjonelle at man vet frekvensinnholdet og så bruker dobbel samplingsfrekvens for å få med alt.

Imidlertid forutsetter samplingsteoremet at signalet er uendelig. For nesten all praktisk bruk kan man se bort fra denne detaljen.

Så til den "andre" måten. La oss si at du skal sample ett signal med fmax=10Hz. Da trenger du altså en Fs på 20Hz for å få med alt normalt sett. Men, tenk deg så hva som skjer dersom tidsrommet du skal sample blir kortere enn tidsrommet mellom 2 sampler. Da får man jo bare èn sample og det holder ikke.

Da kan man altså velge å si at frekvensinnholdet har endret seg, og justere deretter, eller man kan legge til 1/T til det vanlige samplingsteoremet.

Tror vi er ganske enige, men formulerer oss forskjellig. Uansett som sagt, så er dette i de aller fleste tilfeller kun en kuriositet, men den gir deg en helt eksakt verdi for nødvendig samplingsfrekvens. Det har matematisk betydning, men lite praktisk.


-Tim
 
Topp Bunn