Studio JHW Janssen sa

Vosim

Last updated: 27 Januari 2004

1. Foreword and introduction into VOSIM sound synthesis by Werner Kaegi

Interface, Vol. 15 (1986), pp. 71-82. 0303-3902/86/1502-007 1 $3.00 © Swets & Zeitlinger


Controlling the VOSIM Sound Synthesis System by Werner Kaegi


ABSTRACT
This paper gives first a brief glance at an alternative system for digital sound synthesis which is known under the name VOSIM. The cycle of a VOSIM time function consists of a series of sin2 -pulses.The amplitude of the successive pulses decreases uniformally. After the last pulse there is a delay. The main parameters for describing a VOSIM signal are: pulse width, number of pulses, rate by which the pulses decay, length of delay and overall-amplitude. The model suggests additional parameters which have to do with how the sound changes as it progresses. VOSIM is particularly suitable for producing sounds with formants such as speech and musical sounds. VOSIM oscillators are intelligent ones and as a consequence they are complex to control. For this reason the MIDIM control language has been developed and will be discussed briefly in the last part of this paper. For a more comprehensive presentation of the MIDIM language cf. pp. 83-161 of this issue.


1. INTRODUCTION
Whereas the synthesis-networks in the early days of computer application in music were the work of pioneers, the market is now dominated by industry products. The advantage of the comrnercial development is certainly the standardization in technical aspects (e.g. compatibility with the Midi-bus). The disadvantages are the low-level program languages, the uniformity and weakness of abstraction which narrow the field of musical interpretation and, as a consequence, may have an ill effect on the artistic quality of the music and its further development. And the idea frequently comes into play that the ideal tool is the real-time syntheziser and that the more involved and more artistically interesting systems cannot participate before they will achieve the speed of "real-time". Thus everything tends towards real-time performance, which means towards a playable instrument while the aspects of musical composition are in danger of being devalued. We should, however, not forget that musical composition has always had to do with premeditation and can never be confused with improvisation. By this I by no means doubt the value of intelligent interactive systems. Already in the 70's I was aware that VOSIM is particularly suitable for real-time synthesis by means of a syntheziser (cf. Buxton 1977, p. 68). However, for artistic as well as scientific reasons I felt more attracted to setting up a compositional language.


2. THE VOSIM SOUND SYNTHESIS
As early as 1966, when working at Geneva Radio, I had thought of the application of tone burst signals for musical means. I suspected that it might become an elegant and powerful alternative to the conventional methods for sound synthesis used at that time. This was the case even even though I only knew the graph of the amplitude-envelope in frequency-domain for the sin2 tone burst signal with N=1 (cf. Kaegi 1967, p. 62/63) and experimentation was not possible due to the lack of a tone burst generator. In 1970 I submitted a project to the Fonds National Suisse and a few months later was given the necessary funds in order to embark on my project at Sonology, where I had the possibility of working with two analog tone burst generators. Very soon I was familiar enough with the sin2 tone burst as to produce speech- and instrumental sounds as well as singing which I presented for the first time at the Saarländische Rundfunk Saarbrücken on December 12, 1971 and later on the 19th of October 1972 at the Goethe Institute in Amsterdam. In 1973, in collaboration with Stan Tempelaars, I opened a second research project the purpose of which was to gain an insight into the parameters of the signal function (by means of tests applying Kruskal multidimensional scaling) as well as into the representation in the frequency domain. The model which later was given the name VOSIM (VOice SIMulation) was published for the first time in the same year (Kaegi 1973) and an extended version (Kaegi 1974) was presented in 1976 by Kaegi and Tempelaars at the AES conference in Zürich. In 1978 followed the publication in the AES journal (Kaegi/Tempelaars 1978). According to the terminology applied by Digital Music Systems inc. (Wallraff 1983) and by Robert Moog (Moog 1984) the VOSIM belongs to the alternative systems.

2. Het VOSIM klank synthese systeem door Heinerich Kaegi en Jos Janssen

Het Vosim klanksynthese systeem is gebaseerd op het in 1973 door W. Kaegi en S. Tempelaars gepubliceerde VOSIM-model. Technische uitvoeringen vonden plaats in de vorm van verschillende types generatoren. Het MIDIM-systeem werkte met twee digitale generatoren. Voor een uitvoerige bespreking van het systeem verwijzen we naar de literatuur (Interface, Vol. 15 (1986), 0303-3902/86/1502-007 1 © Swets & Zeitlinger)

De VOSIM signaalfunctie

Het VOSIM-signaal bestaat uit een reeks van N sin kwadraat-pulsen van dezelfde breedte (pulstijd T), gevolgd door een zogenaamde delay-tijd, waarin de amplitude nul is. De Amplitude A van deze pulstrein is per definitie de hoogte van de eerste puls, elke volgende puls heeft een grootte C % van zijn voorganger. C noemen we de Decay factor. Bij C = 100% zijn alle pulsen even groot. C = 0% is niet toegestaan. De hele periodeduur bedraagt T' = N * T + M. Wanneer het gehele signaal slechts één zulke periode T'lang is, spreken we van een one-shot. hieronder een voorbeeld.

Meestal echter wordt de periode Np maal herhaald, waarbij van periode tot periode veranderingen mogelijk zijn. Liniaire interpolaties op de parameters zijn in het VISIM7 model gedefinieerd voor T, M en A en worden aangegeven met een delta D

De eerste van de Np periodes heeft dan de waarden T, M en A, en de laatste de waarden T + D T, M + D M en A + D A. Bovendien kan de delay-tijd M gemoduleerd worden, D is de modulatie frequentie, S de modulatie-soort (ruis- of periodiek-achtig), FM de modulatiefrequentie.

De VOSIM7-vector bevat 12 parameters, te weten:

T, DT, M, DM, D, A, DA, C, N, S, FM, Np

Wat is een spektrum?

Volgens het Fourier-theorema is het mogelijk om elke trilling uit harmonische componenten samen te stellen, die we harmonischen of boventonen noemen. Verschillende trillingen onderscheiden zich in de sterkte (of amplitude) van de harmonischen waaruit ze samengesteld kunnen worden. Praten we over harmonischen, dan bedoelen we met de eerste harmonische F1 de grondtoon of grondfrequentie. De frequenties van alle volgende harmonischen zijn dan simpelweg te berekenen F2 = 2 * F1, F3 = 3 * F1 etc. spreken we van boventonen, dan wordt met de eerste boventoon de tweede harmonische bedoeld, met de tweede boventoon de derde harmonische.

Wiskundig is de reeks van de harmonischen dus zeer eenvoudig en in een frequentie-diagram liggen ze alle op gelijke afstanden. Uitgedrukt in harmonischen intervallen krijgen we een wat onoverzichtelijke reeks: oktaaf, kwint, oktaaf, terts, kwint, septiem, oktaaf, etc. Om verwarring op te helderen, het volgende diagram:

Zetten we nu de amplitudes van de harmonischen uit tegen hun frequenties dan verkrijgen we een spectrum. Aangenomen wordt dat het gehoor een soort Fourier-analysator is, d.w.z. signalen in hun frequentie-componenten ontbindt. Daarom kan het spectrum vaak meer inzicht verschaffen in de karakteristieken van een klank.

De meeste klanken veranderen in de tijd, zodat ook het spectrum veranderdt. we spreken in dat geval van een running spectrum.

Omhullende en formanten

Deze beschrijving van het spectrum geldt strikt genomen alleen voor ongemoduleerde en tegelijkertijd lange signalen. Om te verduidelijken hoe het spectrum in andere gevallen wordt, voeren we eerst het begrip omhullende in (zie af.beelding). Datis de lijn die de toppen van de harmonischen met elkaar verbindt. Nu gelden de volgende vuistregels:

Dit is ook goed te horen: een lang signaal klinkt mooi harmonisch, we horen de losse componenten. Naar mate het signaal korter wordt, klinkt het tik-achtiger, omdat het gehele spectrum tussen de harmonischen opgevuld wordt tot aan de omhullende (vergelijk dit met ruis-achtige signalen waarin alle frequentie-componenten voorkomen), De harmonischen zijn niet meer apart te herkennen.

Het is handig om bij een signaal de harmonischen en omhullende te bepalen.

Gemoduleerde signalen bevatten in het spectrum naast de harmonischen ook bij de modulatiefrequentie pieken.

Tenslotte voeren we het begrip formant in. Dat is een maximum in de omhullende met een frequentie FW. Bij voorbeeld vokalen kunnen gekarakteriseerd worden door twee formanten, die een vaste plaats in het spectrum hebben.

3. VOS2WAV door Luuk Trip

VOS2WAV is een DOS programma, speciaal geschreven voor Jos Janssen, dat een vosimvector file in een mono of stereo 16 bits wavefile omzet. Onder WINDOWS kan het ook gebruikt worden, hierbij kan het echter voorkomen dat er te weinig geheugen is om grote vosim-files om te zetten. VOS2WAV kan alleen gebruikt worden op PC's uitgerust met een 386 processor of hoger. Er moet een co-processor aanwezig zijn. (Dus ook 486DX, Pentium.)
Deze versie van VOS2WAV genereert geluid met twee vosim-generators, van een vosim-file wordt aangenomen dat er paren van vosim-vectors in staan.
Een eerste order filter zorgt ervoor dat de gelijkstroom (dc) component weggefilterd wordt. Het filter heeft een afval van 6 decibel per octaaf vanaf het kantelpunt, richting nul Hertz.