1. Foreword and introduction into VOSIM sound synthesis by Werner Kaegi
Interface, Vol. 15 (1986), pp. 71-82. 0303-3902/86/1502-007 1 $3.00 © Swets & Zeitlinger
Controlling the VOSIM Sound Synthesis System by Werner
Kaegi
ABSTRACT
This paper gives first a brief glance at an alternative system
for digital sound synthesis which is known under the name VOSIM. The cycle of
a VOSIM time function consists of a series of sin2 -pulses.The amplitude of
the successive pulses decreases uniformally. After the last pulse there is a
delay. The main parameters for describing a VOSIM signal are: pulse width, number
of pulses, rate by which the pulses decay, length of delay and overall-amplitude.
The model suggests additional parameters which have to do with how the sound
changes as it progresses. VOSIM is particularly suitable for producing sounds
with formants such as speech and musical sounds. VOSIM oscillators are intelligent
ones and as a consequence they are complex to control. For this reason the MIDIM
control language has been developed and will be discussed briefly in the last
part of this paper. For a more comprehensive presentation of the MIDIM language
cf. pp. 83-161 of this issue.
1. INTRODUCTION
Whereas the synthesis-networks in the early days of computer
application in music were the work of pioneers, the market is now dominated
by industry products. The advantage of the comrnercial development is certainly
the standardization in technical aspects (e.g. compatibility with the Midi-bus).
The disadvantages are the low-level program languages, the uniformity and weakness
of abstraction which narrow the field of musical interpretation and, as a consequence,
may have an ill effect on the artistic quality of the music and its further
development. And the idea frequently comes into play that the ideal tool is
the real-time syntheziser and that the more involved and more artistically interesting
systems cannot participate before they will achieve the speed of "real-time".
Thus everything tends towards real-time performance, which means towards a playable
instrument while the aspects of musical composition are in danger of being devalued.
We should, however, not forget that musical composition has always had to do
with premeditation and can never be confused with improvisation. By this I by
no means doubt the value of intelligent interactive systems. Already in the
70's I was aware that VOSIM is particularly suitable for real-time synthesis
by means of a syntheziser (cf. Buxton 1977, p. 68). However, for artistic as
well as scientific reasons I felt more attracted to setting up a compositional
language.
2. THE VOSIM SOUND SYNTHESIS
As early as 1966, when working at Geneva Radio, I had thought of the application
of tone burst signals for musical means. I suspected that it might become an
elegant and powerful alternative to the conventional methods for sound synthesis
used at that time. This was the case even even though I only knew the graph
of the amplitude-envelope in frequency-domain for the sin2 tone burst signal
with N=1 (cf. Kaegi 1967, p. 62/63) and experimentation was not possible due
to the lack of a tone burst generator. In 1970 I submitted a project to the
Fonds National Suisse and a few months later was given the necessary funds in
order to embark on my project at Sonology, where I had the possibility of working
with two analog tone burst generators. Very soon I was familiar enough with
the sin2 tone burst as to produce speech- and instrumental sounds as well as
singing which I presented for the first time at the Saarländische Rundfunk
Saarbrücken on December 12, 1971 and later on the 19th of October 1972
at the Goethe Institute in Amsterdam. In 1973, in collaboration with Stan Tempelaars,
I opened a second research project the purpose of which was to gain an insight
into the parameters of the signal function (by means of tests applying Kruskal
multidimensional scaling) as well as into the representation in the frequency
domain. The model which later was given the name VOSIM (VOice SIMulation) was
published for the first time in the same year (Kaegi 1973) and an extended version
(Kaegi 1974) was presented in 1976 by Kaegi and Tempelaars at the AES conference
in Zürich. In 1978 followed the publication in the AES journal (Kaegi/Tempelaars
1978). According to the terminology applied by Digital Music Systems inc. (Wallraff
1983) and by Robert Moog (Moog 1984) the VOSIM belongs to the alternative systems.
2. Het VOSIM klank synthese systeem door Heinerich Kaegi en Jos Janssen
Het Vosim klanksynthese systeem is gebaseerd op het in 1973 door W. Kaegi en S. Tempelaars gepubliceerde VOSIM-model. Technische uitvoeringen vonden plaats in de vorm van verschillende types generatoren. Het MIDIM-systeem werkte met twee digitale generatoren. Voor een uitvoerige bespreking van het systeem verwijzen we naar de literatuur (Interface, Vol. 15 (1986), 0303-3902/86/1502-007 1 © Swets & Zeitlinger)
Het VOSIM-signaal bestaat uit een reeks van N sin kwadraat-pulsen van dezelfde breedte (pulstijd T), gevolgd door een zogenaamde delay-tijd, waarin de amplitude nul is. De Amplitude A van deze pulstrein is per definitie de hoogte van de eerste puls, elke volgende puls heeft een grootte C % van zijn voorganger. C noemen we de Decay factor. Bij C = 100% zijn alle pulsen even groot. C = 0% is niet toegestaan. De hele periodeduur bedraagt T' = N * T + M. Wanneer het gehele signaal slechts één zulke periode T'lang is, spreken we van een one-shot. hieronder een voorbeeld.

Meestal echter wordt de periode Np maal herhaald, waarbij van periode tot periode veranderingen mogelijk zijn. Liniaire interpolaties op de parameters zijn in het VISIM7 model gedefinieerd voor T, M en A en worden aangegeven met een delta D
De eerste van de Np periodes heeft dan de waarden T, M en A, en de laatste de waarden T + D T, M + D M en A + D A. Bovendien kan de delay-tijd M gemoduleerd worden, D is de modulatie frequentie, S de modulatie-soort (ruis- of periodiek-achtig), FM de modulatiefrequentie.
De VOSIM7-vector bevat 12 parameters, te weten:
T, DT, M, DM, D, A, DA, C, N, S, FM, Np
Volgens het Fourier-theorema is het mogelijk om elke trilling uit harmonische componenten samen te stellen, die we harmonischen of boventonen noemen. Verschillende trillingen onderscheiden zich in de sterkte (of amplitude) van de harmonischen waaruit ze samengesteld kunnen worden. Praten we over harmonischen, dan bedoelen we met de eerste harmonische F1 de grondtoon of grondfrequentie. De frequenties van alle volgende harmonischen zijn dan simpelweg te berekenen F2 = 2 * F1, F3 = 3 * F1 etc. spreken we van boventonen, dan wordt met de eerste boventoon de tweede harmonische bedoeld, met de tweede boventoon de derde harmonische.
Wiskundig is de reeks van de harmonischen dus zeer eenvoudig en in een frequentie-diagram liggen ze alle op gelijke afstanden. Uitgedrukt in harmonischen intervallen krijgen we een wat onoverzichtelijke reeks: oktaaf, kwint, oktaaf, terts, kwint, septiem, oktaaf, etc. Om verwarring op te helderen, het volgende diagram:

Zetten we nu de amplitudes van de harmonischen uit tegen hun frequenties dan verkrijgen we een spectrum. Aangenomen wordt dat het gehoor een soort Fourier-analysator is, d.w.z. signalen in hun frequentie-componenten ontbindt. Daarom kan het spectrum vaak meer inzicht verschaffen in de karakteristieken van een klank.
De meeste klanken veranderen in de tijd, zodat ook het spectrum veranderdt. we spreken in dat geval van een running spectrum.
Deze beschrijving van het spectrum geldt strikt genomen alleen voor ongemoduleerde en tegelijkertijd lange signalen. Om te verduidelijken hoe het spectrum in andere gevallen wordt, voeren we eerst het begrip omhullende in (zie af.beelding). Datis de lijn die de toppen van de harmonischen met elkaar verbindt. Nu gelden de volgende vuistregels:
Dit is ook goed te horen: een lang signaal klinkt mooi harmonisch, we horen de losse componenten. Naar mate het signaal korter wordt, klinkt het tik-achtiger, omdat het gehele spectrum tussen de harmonischen opgevuld wordt tot aan de omhullende (vergelijk dit met ruis-achtige signalen waarin alle frequentie-componenten voorkomen), De harmonischen zijn niet meer apart te herkennen.
Het is handig om bij een signaal de harmonischen en omhullende te bepalen.
Gemoduleerde signalen bevatten in het spectrum naast de harmonischen ook bij de modulatiefrequentie pieken.

3. VOS2WAV door Luuk Trip
VOS2WAV is een DOS programma, speciaal geschreven voor Jos Janssen, dat een vosimvector file in een mono of stereo 16 bits wavefile omzet. Onder WINDOWS kan het ook gebruikt worden, hierbij kan het echter voorkomen dat er te weinig geheugen is om grote vosim-files om te zetten. VOS2WAV kan alleen gebruikt worden op PC's uitgerust met een 386 processor of hoger. Er moet een co-processor aanwezig zijn. (Dus ook 486DX, Pentium.)