Sie sind auf Seite 1von 22

2 3

2
0

J
a
h
r
e

A
u
d
i
o
c
o
d
i
e
r
u
n
g

a
m

l
r
a
u
n
h
o
l
e
r

l
l
S

/

2
0

Y
e
a
r
s

o
l

A
u
d
i
o

C
o
d
i
n
g

a
l

l
r
a
u
n
h
o
l
e
r

l
l
S
20 Jahre
Audiocodierung
20 Years of
Audio Coding
4 5
2
20 Jahre Audiocodierung am lraunholer llS
20 Years of Audio Coding at Fraunhofer IIS
3
4 5
Welcome
A travel through time: 20 years of audio coding at Fraunhofer IIS
Background How does perceptual audio coding work?
mp3: A German track record
New dimensions of multimedia
Fields of research at the Audio and Multimedia Realtime Systems departments

Overview: Fraunhofer Institute for Integrated Circuits IIS
Spin offs
Coding Technologies
Megatec
Musictrace
Opticom
Cruworl Dr. Cnlher 8eckslein, MdL
8ayerischer Slaalsminisler des lnneren
Cruworl Dr. Sieglried 8alleis
Oberbrgermeisler der Sladl Lrlangen
Cruworl Prol. Dr.-lng. Heinz Cerhauser
Ceschallslhrender Leiler des lraunholer-lnsliluls lr lnlegrierle Schallungen llS
Zeilreise durch 20 Jahre Audiocodierung am lraunholer llS
Hinlergrund Wie lunklionierl gehrangepassle Audiocodierung?
MP3. Line deulsche Lrlolgsgeschichle
Neue Mullimediawellen.
Akluelle lorschungslhemen der Ableilungen Audio und Mullimedia-Lchlzeilsysleme

Uberblick Das lraunholer-lnslilul lr lnlegrierle Schallungen llS
Unlernehmensausgrndungen
Coding Technologies
Megalec
Musiclrace
Oplicom
lnhall Conlenl
6 7
Gruwort Dr. Gnther Beckstein, MdL
8ayerischer Slaalsminisler des lnneren
Llwa vor 20 Jahren war es, als kluge Wissen-
schalller des lraunholer-lnsliluls lr lnlegrierle
Schallungen llS einen neuen Weg in der Audio-
lechnik erllnelen. lorschungsarbeilen mil dem
Ziel, Musiksignale ber Telelonleilungen zu ber-
lragen, waren so weil gediehen, dass es erslmals
gelang, Slereomusik in Lchlzeil zu codieren. Lin
weilerer Meilenslein war die Lnlwicklung des
Oplimum Coding in lhe lrequency Domain (OCl).
OCl enlhall bereils viele charaklerislische Ligen-
schallen des knlligen MP3-Codecs. Nach wei-
leren Verbesserungen mndele die Lnlwicklungs-
arbeil schlielich in MPLC-! Layer 3. Dieser ellizi-
enle Codec land aul dem Markl schnelle Verbrei-
lung zum Speichern von Musik.
Heule sind die kleinen, handlichen MP3-Player nichl
mehr aus unserem Leben weg zu denken. Ob in der
U-8ahn, beim Joggen, Padlahren oder Pelaxen in
der Sonne. Uberall siehl man die kleinen Cerale,
die millels Knopl im Ohr eine schier unvorslell-
bare Menge an Musiklileln speichern und in besler
Klangqualilal zur lreude des Hrers wiedergeben
knnen. Das lraunholer llS hal aul diesem Cebiel
den Markl der Musikmedien geradezu revolulio-
nierl. Wellweil isl die Lnlwicklung von den Verbrau-
chern begeislerl aulgenommen worden.
Zu Pechl will das lnslilul deshalb das 20-jahrige
Jubilaum gebhrend leiern. Dazu berbringe ich
meine herzlichslen Cre und Clckwnsche.
Cleichzeilig drcke ich lesl die Daumen lr die
kommenden Jahre und lreue mich aul weilere
bahnbrechende Weichenslellungen im lraunholer llS.
lch bin berzeugl, dass unsere 8rgerinnen und
8rger auch in Zukunll noch viel von der innova-
liven Arbeil dieser lorschungseinrichlung prolilieren
werden.
Dr. Cnlher 8eckslein
8ayerischer Slaalsminisler des lnneren
8 9
Gruwort Dr. Siegfried Balleis
Oberbrgermeisler der Sladl Lrlangen
Sellen isl einer neuen Technik ein derarl lriumphaler
Siegeszug gelungen und sellen hal ein Produkl in-
nerhalb krzesler Zeil so schnell Karriere gemachl
und den wellweilen Markl eroberl. Vom Opa bis
zur Lnkelin, vom Arbeiler bis zur Managerin in
beinahe allen Landern der Well gehrl der MP3-
Player heule zum Alllag.
Ls isl aber nichl der Umsland, dass slalislisch
gesehen jeder vierle Deulsche milllerweile einen
mobilen MP3-Player nulzl, der uns in der Pegion
besonders slolz machl, sondern vielmehr die Tal-
sache, dass der Ursprung dieser einzigarligen
Lrlolgsgeschichle in unserer Sladl, genauer im
lraunholer-lnslilul lr lnlegrierle Schallungen llS
in Tennenlohe liegl. ln dieser Zukunllsschmiede
wurde das dem wellweil anerkannlen MP3-Slan-
dard zugrunde liegende Audiocodierungsverlah-
ren erlunden und enlwickell. Pichlungsweisend
wurden die Lrlanger Lrlinder auch im Jahr 2000
mil dem Deulschen Zukunllspreis ausgezeichnel.
Aul diesen Cenieslreich der lraunholer-lorscher,
der in der gesamlen Musikszene lr lurore sorgle,
sind die Lrlangerinnen und Lrlanger zu Pechl
slolz. Die Cralulalion zum 20-jahrigen Jubilaum
komml von ganzem Herzen.
lr Lrlangen bedeulel das lraunholer llS einen
wahren Clckslall. Die mil 480 Milarbeilern
grle lraunholer-Linrichlung isl einer der we-
senllichen Pleiler unserer hervorragenden lor-
schungseinrichlungen und hal sich langsl als
wichliger Molor lr das lorschungsnelzwerk der
Pegion prolilierl. Die zahlreichen Slarl-ups, die aus
der Zusammenarbeil zwischen lnslilul und Univer-
silal enlslanden sind, sind aul millellrislige Sichl
der Humus, der lr die Lnlslehung neuer,
zukunllssicherer Arbeilsplalze nolwendig isl.
Lnlscheidend lr den Lrlolg des lnsliluls isl vor
allem das Lngagemenl und das Knnen der Men-
schen, die hier arbeilen. Allen, die zu der genialen
Lrlindung ihren Teil beigelragen haben, gill mein
besonderer Dank. Vielleichl isl mil MP3 Surround
bereils der Anlang einer neuen Lrlolgsgeschichle
gemachl. Wir drcken die Daumen.
Dr. Sieglried 8alleis
Oberbrgermeisler der Sladl Lrlangen
!0 !!
Gruwort Prof. Dr.-Ing. Heinz Gerhuser
Ceschallslhrender Leiler des lraunholer-lnsliluls lr lnlegrierle Schallungen llS
8ei der Lnlwicklung der Audiocodierung in Lrlan-
gen waren einige Schlsselereignisse magebend.
An der Universilal Lrlangen-Nrnberg wurden un-
ler der Leilung von Prol. Dieler Seilzer seil !97!
Dalenreduklionsverlahren lr 8ilder und spaler
auch lr Sprache und Audio unlersuchl. Wichlige
8eilrage zu Audio wurden !989 von Karlheinz
8randenburg in seiner Disserlalion ber das OCl-
Verlahren (Oplimalkodierung im lrequenzbereich)
geleislel.
Mil Unlersllzung der lirma Crundig wurde die
lraunholer-Arbeilsgruppe AlS in Lrlangen lr das
8MlT-Projekl LUPLKA !47 als gleichberechligles,
gelrderles Milglied des Konsorliums aulgenom-
men. Dies war der Slarlschuss lr ein herauslor-
derndes Lnlwicklungsprojekl aul dem Cebiel der
Audiocodierung. Die lraunholer-Linrichlung AlS,
aus der spaler das lraunholer llS enlsland, lielerle
sich mil Wellbewerbern einen harlen Konkurrenz-
kampl, ohne den die Audiocodierung nie den
heuligen hohen Sland erreichl halle.
Prol. Musmann von der Universilal Hannover hal
uns !989 den Zugang zur inlernalionalen Slan-
dardisierung bei lSO ermglichl. ln den lolgenden
Jahren enlwickellen lorscher der lraunholer-Ce-
sellschall, der Universilalen Lrlangen und Hanno-
ver sowie der lirmen Thomson und AT&T-8ell-Labs
in enger Zusammenarbeil das Layer-3-Audioco-
dierverlahren. !992 wurde von der Moving Pic-
lure Lxperl Croup der lSO/MPLC Slandard !!!72-3
(MPLC-! Layer-3), der spaler als MP3 bekannl
wurde, verabschiedel.
Mil der raschen Verbreilung des lnlernels sland
Mille der neunziger Jahre ein sehr elleklives Ver-
lriebsmedium lr das MP3-lormal zur Verlgung.
lnnerhalb weniger Monale nulzlen wellweil Milli-
onen von begeislerlen Musikliebhabern das Co-
dierverlahren.
Die Audio-Mullimedia-Ableilungen am
lraunholer llS sind bis heule aul ber !00 Mil-
arbeiler angewachsen und slellen damil wellweil
die grle lorschergruppe mil der langslen
ununlerbrochenen lorschungs- und Lnlwicklungser-
lahrung aul dem Cebiel der Audiocodierung dar.
lch bin slolz aul diese Milarbeilerinnen und Mil-
arbeiler, die herausragende Leislungen, wellweile
Anerkennung und signilikanle wirlschallliche
Lrlolge geschallen haben.
Prol. Dr. Heinz Cerhauser
Ceschallslhrender Leiler
des lraunholer llS
!2 !3
Audio coding algorithms such as mp3 are more
than just a technology. They are a cultural pheno-
menon that reawakened millions of peoples love
for music. Nowadays, you can enjoy your complete
CD collection with a portable device as small as a
matchbox. However, it was a long path to create
mp3, the hottest thing in cyberspace (according
to a British business magazine).
Already in the late 1970s, Prof. Seitzer of Erlangen-
Nuremberg University had the idea to transmit mu-
sic in high quality over phone lines. Later on,
a research alliance between the University and
Fraunhofer IIS was established to focus on audio
coding. In 1987 20 years ago the work group
led by Prof. Heinz Gerhaeuser achieved the very
frst real-time coding of stereo music. The ancestor
of today's widely used audio coding algorithms
was born. Many more important milestones such
as the Ph.D. thesis of Karlheinz Brandenburg in
1989 followed until mp3 was standardized in 1992.
The word mp3 was the most popular search term
on the Internet in 1999. Today, almost everyone
owns a device that is capable to play mp3 fles.
Inspired by the worldwide success of mp3, Erlangen
researchers worked further on audio coding tech-
nologies. Together with valuable partners they
develop new coding formats (like MPEG AAC or
mp3 Surround) that are used throughout the
world. As a German research lab they gained and
retained an international leading position in the
feld of audio coding.
It is our greatest pleasure to celebrate 20 years of
audio coding at Fraunhofer IIS together with you.
Welcome
!4 !5
20 Jahre Audiocodierung am Fraunhofer IIS
Seil nunmehr 20 Jahren llleln die lorscher des
lraunholer llS an Verlahren, die Audiosignale aul
einen 8ruchleil ihrer Ursprungsgre schrumplen.
Mil viel llei, Durchhallevermgen und Teamarbeil
enlwickellen sie in dieser Zeil Technologien, die
zum Wellerlolg aulsliegen. Lin 8lick zurck zu
den Anlangen der Audioschmiede.
Alles beginnl Lnde der siebziger Jahre mil der ldee
von Prol. Dieler Seilzer an der lriedrich-Alexander-
Universilal Lrlangen-Nrnberg, Musiksignale ber
Telelonleilungen zu berlragen.
lm Jahr !987 bilden die Universilal Lrlangen-Nrn-
berg und das lraunholer llS eine lorschungsallianz
im Pahmen des LU-gelrderlen Projekles LU!47
LUPLKA lr Digilal Audio 8roadcasling (DA8).
Unler der Leilung von Prol. Heinz Cerhauser gelingl
der ersle Meilenslein in der Ceschichle der Audio-
codierung. Mil dem LC-ATC-Algorilhmus (Low
Complexily Adaplive Translorm Coding) isl es ersl-
mals mglich, Slereomusik in Lchlzeil zu codieren.
8is dahin exislierle LC-ATC nur als Compulersimu-
lalion und viele Arbeilsslunden von Hochleis-
lungsrechnern waren nlig, um das Verlahren zu
leslen. Der Lchlzeilcodec erlaubl das Teslen von
LC-ATC unler realen 8edingungen und lhrl zu si-
gnilikanlen Verbesserungen am Algorilhmus. Die
Hardware aus DSP-Modulen und einer Peihe von
Audio- und Dalen-Schnillslellenkarlen wird von
einem Team um Harald Popp und Lrnsl Lberlein
von Crund aul neu enlwickell.
Lin weilerer Meilenslein isl !989 die Doklorarbeil
von Karlheinz 8randenburg ber den OCl-Algo-
rilhmus (Oplimum Coding in lhe lrequency Do-
main). OCl enlhall bereils viele charaklerislische
Ligenschallen des zuknlligen MP3-Codecs. Die
OCl-Sollware lr das Lchlzeilsyslem wird leder-
lhrend von 8ernhard Crill unler der Leilung von
Prol. Cerhauser enlwickell. Durch einige Lrweile-
rungen wird aus dem OCl-Crundgersl in dieser
Phase ein praklisch einselzbares Verlahren, das
auch wellweil zum erslen Mal eine Audiosignal-
codierung mil nur 64 k8il/s in guler Qualilal er-
mglichl. Damil kann Musik nun ber eine Tele-
lonleilung in Lchlzeil berlragen werden.
!989 wird OCl lr den geplanlen Audioslandard
der lnlernalionalen Slandardisierungsorganisalion
Moving Piclure Lxperls Croup MPLC vorgeschla-
gen. 8ei MPLC gehen insgesaml !4 Vorschlage
zur Audiocodierung ein und die Teilnehmer wer-
den ermuligl, ihre 8eilrage zu vereinen. Dies lhrl
schlielich zu vier Vorschlagen, darunler ASPLC
(Adaplive Speclral Perceplual Lnlropy Coding)
und MUSlCAM. ASPLC isl das Lrgebnis weilerer
Verbesserungen an OCl und 8eilragen der Uni-
versilal Hannover, AT&T und Thomson.
Nach auslhrlichen Tesls der Kandidalen schlagl
MPLC vor, aus MUSlCAM und ASPLC eine lamilie
aus drei Codierverlahren zu grnden. Layer ! als
Varianle von MUSlCAM mil geringer Komplexilal,
Layer 2 als MUSlCAM-Coder und Layer 3 basie-
rend aul einer Weilerenlwicklung von ASPLC.
Wegen der geringeren Komplexilal, aber vor
allem wegen der langeren Lrlahrung mil dem
MUSlCAM-Verlahren, wahll DA8 den Layer 2 als
Codec lr digilalen Pundlunk.
Wahrend der Lnlwicklung des endglligen MP3
(MPLC-! Layer 3) wird der Codec von Jrgen Her-
re um eine Joinl Slereo-lunklion erweilerl, die
eine ellizienle Codierung von Slereomalerial er-
laubl. lm Dezember !99! isl die lechnische Lnl-
wicklung des MPLC-!-Slandards abgeschlossen.
Layer 3 bielel eine Qualilal ahnlich der CD bei
weniger als zwei 8il pro Sample.
Layer-3 isl der ellizienlesle (und aulwandigsle)
der drei Codecs und lindel in lolge schnell ersle
kommerzielle Anwendungen in den 8ereichen
Musikberlragung ber lSDN-Telelonleilungen
und Sprachansagesysleme lr den llenllichen
Nahverkehr. Der Codec wird auch in Pilolpro-
jeklen eingeselzl, um Musik aul den zu dieser Zeil
relaliv kleinen PC-leslplallen zu speichern und
Musikdaleien ber die langsamen PC-Modems mil
28,8 k8il/s zu berlragen.
!995 bekomml MP3 seinen heuligen Namen.
ln einer inlernen Umlrage sprechen sich die
lraunholer-lorscher einslimmig lr .mp3 als
Daleiendung lr MPLC Layer 3 aus.
Die Ara lragbarer MP3-Musik beginnl !998 mil
der Linlhrung des Pio von Diamond Mullime-
dia in den USA und des MPMAN von Saehan
lnlormalion Syslems in Korea. Die zunehmende
Zeilreise
!6 !7
Zeilreise
A Travel Through Time
20 Years of Audio Coding at Fraunhofer IIS
For 20 years the scientists of Fraunhofer IIS have
been working on techniques which shall compress
audio signals to a minimum. Driven by diligence,
enthusiasm and teamwork, they developed tech-
nologies that revolutionized our music world.
A glance over the last two decades:
It all starts in the late 1970s with the idea of
Prof. Seitzer of Erlangen-Nuremberg University in
Germany, to transmit music in high quality over
phone lines.
In 1987 a research alliance is formed between
Erlangen-Nuremberg University and Fraunhofer IIS
within the framework of the EUREKA project
EU147 for Digital Audio Broadcasting (DAB), a
project funded by the European Union. The break-
through in audio coding is achieved under the
lead of Prof. Heinz Gerhaeuser (Fraunhofer IIS):
LC-ATC (Low Complexity Adaptive Transform Co-
ding), the very frst real-time coding of stereo mu-
sic. Up to that moment, LC-ATC existed only as a
computer simulation. Due to the enormous com-
puting time required, it could be tested only with
a very limited amount of audio material. The real-
time codec enables testing LC-ATC under real-
world conditions and leads to signifcant algorith-
mic enhancements. The hardware system compri-
sing multiple Digital Signal Processor (DSP) mo-
dules and a number of audio and data I / O inter-
face cards is developed by Harald Popp and Ernst
Eberlein.
Another milestone is the Ph.D. thesis of Karlheinz
Brandenburg on the OCF algorithm (Optimum Co-
ding in the Frequency Domain) which he fnishes
in 1989. The codec already closely resembles
many features of the later mp3 technology. Bern-
hard Grill, a member of Prof. Gerhaeusers team,
leads the development of the software part of the
real-time system for OCF. In this phase, the basic
OCF technology is enhanced and now can code
audio signals at 64 kbit / s in good quality for the
frst time worldwide. That way, music can be
transmitted in real-time over inexpensive digital
telephone lines.
In 1989, OCF is proposed for the forthcoming au-
dio standard of the Moving Picture Experts Group
(MPEG), a working group of the International
Standardisation Organisation ISO in charge of
compressed digital audio and video standards.
MPEG receives altogether fourteen audio coding
proposals. Motioned by MPEG, the audio coding
contributions are merged into four proposals
including ASPEC (Adaptive Spectral Perceptual En-
tropy Coding) and MUSICAM. ASPEC is the result
of further improvements of OCF and contains
contributions by Hanover University, AT&T, and
Thomson.
A Travel Through Time
rale die Audioqualilal bis zur vollkommen verlusl-
losen Codierung gesleigerl werden kann.
Die Verlahren der AAC-lamilie werden heule in vie-
len Anwendungen eingeselzl. Ob in lragbaren Mu-
sik-Playern, digilalen Pundlunksyslemen oder Down-
loadangebolen lr das Handy. Die AAC-Codecs sind
lesler 8eslandleil der heuligen Medienwell.
Akluell widmen sich die lorscher neuen Klang-
wellen und arbeilen an Verlahren zur Kompressi-
on von Surround-Sound. MP3 goes Surround
unler diesem Mollo wurde 2004 MP3 Surround
eingelhrl. Dieses ermglichl Surround-Sound bei
Dalenralen, die bisher lr Slereo blich waren.
Die MP3-lamilie wird erganzl durch MP3 Slereo
eXlended (MP3 SX), eine Technologie, die Sle-
reo-MP3-Daleien zu MP3 Surround erweilerl, und
Lnsonido lr Surround-Cenuss ber Slereokopl-
hrer. Der unlangsl lerlig geslellle MPLC Sur-
round-Slandard isl eine llexible Technologie zur
Komprimierung von Surround Sound, die mil allen
Audiocodern zusammenarbeilen kann. Doch
langsl isl nichl nur die Audiocodierung Schwer-
punkl der lorschungsbemhungen. lnzwischen
arbeilen die Wissenschalller an weileren Themen
wie dem Digilalen Pundlunk, Sicherheils- und
Kommunikalionslechnologien, Mullimedia-Slrea-
ming und Verlahren zur Videokompression.
8elieblheil veranlassl dulzende lirmen, ahnliche
Cerale aul den Markl zu bringen.
Seil !994 arbeilel das lraunholer llS an einem
neuen, leislungslahigen Audiocodec, der neben
Mono und Slereo auch Surround-Sound unler-
sllzl. Cemeinsam mil AT&T, Sony, Nokia und
Dolby wird Advanced Audio Coding (AAC) enlwi-
ckell. Der Codec wird !997 in MPLC zum inlerna-
lionalen Slandard erklarl.
Ab dem Jahr !998 lolgl die Lnlwicklung einer
AAC-Coderlamilie. Hierbei handell es sich um
verschiedene Lrweilerungen von AAC lr unler-
schiedliche Anwendungsszenarien innerhalb des
universellen MPLC-4-Slandards.
Low Delay AAC (AAC-LD) lr Kommunikalionsan-
wendungen (beispielsweise Video- oder Telelon-
konlerenzen), bei denen eine sehr geringe Verz-
gerung bei der Codierung der Audiodalen erreichl
und so eine Cesprachsalmosphare in besler Audio-
qualilal gewahrleislel wird.
High Llliciency AAC (HL-AAC) bielel auch bei
exlrem niedrigen Dalenralen eine sehr gule Audio-
qualilal und isl deshalb gul geeignel lr Mullika-
nal-Codierung. Die Lrweilerung HL-AAC v2 isl lr
Slereo derzeil der ellizienlesle ollene Slandard
lr Codierung in hoher Qualilal bei sehr geringer
Dalenrale.
High Delinilion AAC (HD-AAC) isl ein skalierbarer
Audiocodec, bei dem je nach verlgbarer Dalen-
Zeilreise
A Travel Through Time
!8 !9
A Travel Through Time
ding high audio quality at the same time.
High Effciency AAC (HE-AAC) achieves good ste-
reo quality already at very low bitrates and is well
suited for multi-channel coding. Its extension,
HE-AAC v2, is currently the most effcient high
quality low bitrate open audio coding standard
available.
High Defnition AAC (HD-AAC) is a scalable audio
codec, where the bitrate can be adapted dynami-
cally to varying requirements, e. g. to changes in
the transmission channel's capacity. Therefore, it
offers signifcant advantages for transmitting con-
tent over channels with a variable channel capaci-
ty (e. g. Internet, wireless transmission).
Currently, the engineers at Fraunhofer IIS are en-
gaged in developing new methods of compressing
surround sound. The motto mp3 goes surround
brings about a backward compatible multi-channel
extension of mp3 in 2004, called mp3 Surround.
Mp3 Surround offers full 5.1 surround sound at
data rates no higher than those of stereo mp3.
Other members of the mp3 family are mp3 Ste-
reo eXtended (mp3 SX), a technology to upgrade
stereo to surround content and Ensonido, for play
back of surround sound over stereo headphones.
The recent MPEG Surround standard is a universal
scheme for effcient surround coding which can
be combined with any audio codecs.
Audio coding has a long history at Fraunhofer IIS.
It is, however, not the only focus of the Erlangen
engineers. Many other audio related topics are on
the research agenda, including digital broadcas-
ting, security and communication technologies,
multimedia streaming and video coding.
After several formal tests, MPEG suggests to de-
rive a family of three audio coding schemes from
MUSICAM and ASPEC: Layer 1 is a low complexity
variant of MUSICAM, Layer 2 is basically identical
to the MUSICAM-Codec and Layer 3 is based on
ASPEC.
Due to lower complexity and longer experience
with the MUSICAM system Layer 2 is selected by
DAB as the audio coder for its digital audio broad-
casting services.
The evolution from ASPEC to the fnal mp3
(MPEG-1 Layer 3) codec involves the addition of
an effcient joint stereo coding mode developed
by Juergen Herre. In December 1991, the technical
development of the MPEG-1 standard is concluded.
Layer 3 offers near-CD quality at less than two bits
per sample.
Layer 3 coder is the most effcient (and most com-
plex) coding scheme known at that time and is
quickly employed in professional applications, like
transmitting music via ISDN between broadcasting
studios, or as robust storage devices for speech
announcement in public transport. It also becomes
a popular way of storing music on the (then rather
small) hard disk drives of PCs and transferring
music fles over telephone lines using 28.8 kbit / s
PC modems.
In 1995, the name mp3 is coined. In an internal
poll, Fraunhofer researchers vote unanimously for
.mp3 as the fle name extension for MPEG
Layer 3.
The era of portable mp3 listening begins in 1998
with the introduction of Diamond Multimedias
Rio 100 in the U.S. and Saehan Information Sys-
tems MPMAN in Korea. Dozens of companies
follow suit and launch similar portable devices for
compressed music playback. The success of mp3
inspires the development of additional audio co-
decs for use in PCs and consumer electronics.
Since 1994, Fraunhofer IIS is working on a new,
highly effcient audio codec that supports multi-
channel sound in addition to mono and stereo
operation. In cooperation with AT&T, Sony, Nokia
and Dolby, Advanced Audio Coding (AAC) is deve-
loped. In 1997, AAC becomes a new MPEG stan-
dard.
Since 1998, AAC has evolved into a codec family.
It comprises enhancements within the MPEG-4
standard which address different applications:
Low Delay AAC (AAC-LD) was designed for high-
quality two-way-communication applications (e. g.
video- and teleconferencing). The technology
realizes an extremely low coding latency which is
necessary for fuent communication while provi-
A Travel Through Time
20 2!
Wie funktioniert gehrangepasste
Audiocodierung?
Musik beslehl aus sehr vielen verschiedenen Kom-
ponenlen, die aber nichl gleich gul hrbar sind. So
bleibl dem Zuhrer beispielsweise ein leises lllen-
spiel mglicherweise verborgen, wenn gleichzeilig
krallig aul die Pauke gehauen wird. Zwar isl das
lllenspiel immer noch vorhanden, aber das
menschliche Ohr kann es im Augenblick des Pau-
kenschlags nichl mehr wahrnehmen. Die llle wird
durch die Pauke verdeckl bzw. maskierl.
Hinlergrund
Diese und weilere Ligenschallen des mensch-
lichen Cehrs machen sich gehrangepassle Au-
diocodierverlahren zu Nulze. Die Teile der Musik,
die lr den Menschen besonders gul hrbar sind,
werden auch besonders genau dargeslelll. Weni-
ger gul hrbare Anleile werden weniger genau
abgebildel, unhrbare lnlormalionen werden
ignorierl. So wird also der Paukenschlag in un-
serem 8eispiel besonders genau dargeslelll, das
lllenspiel hingegen eher ungenau. Diese llexible
Darslellung hilll Dalen zu sparen und lhrl gleich-
zeilig eine Abweichung (ein Pauschen) in das Mu-
siksignal ein. Dieses sogenannle Codiergerausch
wird allerdings idealerweise maskierl, ahnlich wie
das lllenspiel in unserem 8eispiel.
Je niedriger die Qualilalsslule bei gehrange-
passlen Audiocodierverlahren gewahll wird (d. h.
je kleiner die Dalenrale isl), deslo ungenauer wird
das Musiksignal dargeslelll. Unlerhalb einer be-
slimmlen Crenze wird das eingelhrle Codierrau-
schen daher nichl mehr langer maskierl.
Die Craliken veranschaulichen dies. Sie zeigen den
Pegel des Codiergerauschs in einem MP3-codier-
len Musikslck. Jeder 8alken slehl lr einen
beslimmlen lrequenzbereich. Je hher ein 8alken
isl, deslo mehr Codiergerausch wurde in das Signal
eingelgl. Uberschreilel ein 8alken gar die Mas-
kierungsschwelle bei 0 d8, so kann das Codierrau-
schen mglicherweise von einem Hrer wahrge-
nommen werden. 8ei hohen Dalenralen ber-
schreilel ein 8alken diese Linie nur sellen, das
MP3-Musikslck klingl lr das menschliche Ohr
wie das Original. 8ei niedrigen Dalenralen ge-
schiehl dies hauliger, Unlerschiede zum Original
knnen hrbar werden.
22 23
Hinlergrund
Background
How Does Perceptual Audio Coding Work?
Music consists of many different components
which are not all audible in the same way. A gent-
le fute may be hidden from the ear of the listener
if at the same time the timbal is played. While the
fute is, of course, still present, the human listener
is not able to perceive it at this moment: the fute
is masked by the timbal.
Background
This and many other characteristics of human
auditory perception are utilized by perceptual
audio codecs. Parts of the music which are well-
perceived are represented very precisely while
other parts that are not very well audible can be
represented with lower accuracy. Inaudible infor-
mation will be discarded. In our example the tim-
bal beat will be represented especially precisely
and the fute play more vaguely. This fexible way
of representation helps to reduce the amount of
information to be transmitted or stored (fle size)
and, at the same time, introduces an error (noise)
signal. Ideally, this so-called coding noise is masked
similarly to the fute signal in the previous example.
The smaller the bit rate of perceptual audio codecs,
the less accurately the overall music signal can be
represented. Beyond a certain limit (i. e. at very low
data rates), the introduced coding noise remains
no longer hidden (masked) from the human
listener.
The diagrams illustrate the coding noise, as it
is present within an mp3 fle. Every vertical bar
represents a certain frequency range, higher bars
indicating that more coding noise was introduced.
If a bar exceeds the masking threshold at 0 dB a
listener might perceive the noise. At high bit rates
it is rare that a bar crosses that threshold and at
low bit rates this can happen more often: the
difference to the original can become audible.
24 25
Eine deutsche Erfolgsgeschichte
Ollmals wird MP3 als 8eispiel lr eine deulsche
Lnlwicklung herangezogen, mil der nur im Aus-
land Celd verdienl wird. Talsachlich prolilierl aber
auch der Slandorl Deulschland von MP3. Dies be-
legen beispielsweise die jahrlichen Sleuereinnah-
men in Hhe von 300 Millionen Luro lr 8und
und Lander. Zusalzlich bedingl MP3 rund !0.000
Arbeilsplalze in Deulschland.
Die Deulschen kaulen im Jahr 2006 lr rund
!,5 Milliarden Luro MP3-Cerale und Zubehr.
Zahlreiche deulsche Unlernehmen bielen heule
MP3-Produkle sehr erlolgreich an, so zum 8eispiel
Trekslor oder auch 8osch. Der wellweil ersle
MP3-Decoderchip lr den Linsalz in mobilen
Abspielgeralen wurde bereils !994 von dem
deulschen Chiphersleller lnlermelall / Micronas
prasenlierl.
Nach Abschluss der Lnlwicklung in den lrhen
neunziger Jahren haben deulsche Millelslandler
die neue Technologie schnell im Prolibereich ein-
geselzl. Den sludiolauglichen Praxisnachweis hal-
le das lraunholer llS vorab mil Ceralen lr die
Uberlragung von Audio ber lSDN-Leilungen
erbrachl. Deulsche Unlernehmen, die sehr lrh
MP3 in ihren Produklen eingeselzl haben, sind
z. 8. AVT, CCS / Mayah, Dialog 4, Megalec Lleclro-
nic, Meisler Lleclronic , NSM Lwen, Oplicom,
Ponlis, Prolon Dala und Padio llN.
MP3
A German Track Record
Mp3 is often taken as an example of a German in-
novation without any positive effect on the Ger-
man economy. However, Germany benefts from
the mp3 development in various ways. For examp-
le, the mp3 driven tax revenue for the German
state sums up to around 300 Million Euros each
year. Additionally, about 10,000 jobs are secured
in Germany by mp3.
Each year Germans are spending 1.5 billion Euros
on mp3 players and mp3 related products.
Today, numerous German companies such as
Trekstore or Bosch successfully offer mp3 pro-
ducts. Already in 1994, German chip manufactur-
er Intermetall / Micronas presented the worldwide
frst mp3 decoder chip for usage in mobile mp3
players.
With the accomplishment of mp3, German
medium-sized companies immediately started to
make use of the new technology and presented
professional products with mp3 capability. First
time users of mp3 in Germany are, for example,
AVT, CCS / Mayah, Dialog 4, Megatec Electronic,
Meister Electronic , NSM Lwen, Opticom, Pontis,
Proton Data and Radio FFN.
mp3
26 27
bildel das Herzslck eines hochqualilaliven Audio-
kommunikalionssyslems. Neben Audiocodecs wie
AAC Low Delay oder AAC Lnhanced Low De-
lay beinhallel es auch Mechanismen zur Ver-
schleierung von Uberlragungslehlern und zum
Ausgleich von Schwankungen in der Nelzwerk-
qualilal. Das Lrgebnis isl ein vllig neues Lrleben
von Telelongesprachen oder Videokonlerenzen.
Der Cesprachsparlner scheinl sich im gleichen
Paum zu belinden, Slimme und Hinlergrundge-
rausche sind klar zu unlerscheiden, Cesprache
sind deullich weniger anslrengend.
Semantische Audioverarbeitung
Der Ansalz der semanlischen Audioverarbeilung
erganzl die Kompressionslechnologien des
lraunholer llS. So analysieren beispielsweise die
Technologien SX Pro oder MP3 SX ein Slereosig-
nal, um es dann in nalrlich klingenden Surround-
lon zu erweilern. Der knllige MPLC-Slandard
Spalial Audio Objecl Coding ermglichl es, 8e-
slandleile eines Audiosignals bei der Wiedergabe
in Lchlzeil zu verandern. Linzelne Objekle wie
lnslrumenle oder Slimmen knnen so individuell
abgemischl werden. Der Linsalzbereich liegl in
prolessioneller wie auch privaler Nulzung. ln der
Videokonlerenz der Zukunll knnen beispielswei-
se Cesprachsleilnehmer je nach Pralerenz aul ver-
schiedene Laulsprecher verleill und in ihrer Laul-
slarke veranderl werden. Knllige Karaoke-Anla-
gen knnen dank Spalial Audio Objecl Coding
Singslimmen oder einzelne lnslrumenle sehr viel
llexibler und weilreichender beeinllussen als dies
heule der lall isl. Und kommende Ceneralionen
von Slereoanlagen erlauben die Ceslallung des
Musikerlebnisses nach persnlichen Vorlieben.
Technologien fr digitale Rundfunksysteme
Das Taligkeilsleld reichl hier vom mobilen lernse-
hen bis hin zu Dalendienslen lr digilale Padiosys-
leme. So arbeilen die Lnlwickler des lraunholer llS
beispielsweise an Lsungen lr die Wiedergabe von
DV8-H-Programmen. Dazu werden Video- und Au-
diocodierverlahren speziell lr den Linsalz im mobi-
len lernsehen oplimierl, um aul porlablen Ceralen
eine hervorragende 8ild- und Tonqualilal zu errei-
chen. Auch beim lnlernel-lernsehen (lPTV) isl Au-
dio- und Videoqualilal enlscheidend. Um hchslen
Qualilalsansprchen zu gengen, sind hier Korrek-
luren von Uberlragungslehlern und der Ausgleich
von Schwankungen in der Nelzwerkqualilal wich-
lig. Schlielich werden neue digilale Padioslandards
wie Digilal Padio Mondiale (DPM) oder Dalen-
diensle wie NewsService Journaline mageblich von
lngenieuren des lraunholer llS milenlwickell. Diese
Slandardisierungsarbeil wird erganzl durch die Lnl-
wicklung leislungslahiger, prolessioneller Pundlunk-
server lr den 8elrieb digilaler Padiosender, die je
Neue Mullimediawellen
Aktuelle Forschungsthemen der Abteilungen
Audio und Multimedia-Echtzeitsysteme
Mil einigen wenigen Milarbeilern hal es angelan-
gen. Heule isl es das wellweil wichligsle lor-
schungslabor im 8ereich der Audiocodierung. Am
lraunholer llS arbeilen rund !00 Wissenschalller
und lngenieure im 8ereich Audio und Mullimedia
an der Medienwell der Zukunll.
Neue lorschungsschwerpunkle sind Surround-
Audio- und Audio-Kommunikalionslechnologien,
semanlische Audioverarbeilung, Technologien lr
digilale Pundlunksysleme sowie Mullimedia-
Sicherheils- und -Transporllechnologien.
Surround-Audiotechnologien
Neue Kompressionslechnologien des lraunholer llS
ermglichen die Uberlragung von 5.! Surround-
klang berall dorl, wo bislang Slereo vorherrschle.
Mglich wird dies durch paramelrische Audioco-
dierverlahren. Dabei wird das ursprngliche Sur-
roundsignal aulomalisch in ein Slereosignal her-
unlergemischl. Zusalzdalen, die zusammen mil
diesem Slereosignal berlragen werden, beschrei-
ben die raumliche Klangverleilung und ermgli-
chen die Pekonslruklion des Surround-Klangs aul
der Lmplangerseile. Dieses Prinzip machen sich
zwei Verlahren zu Nulze.
MP3 Surround erweilerl die MP3-lamilie um eine
Technologie, mil der 5.!-Kanallon MP3-kompali-
bel komprimierl werden kann. Die Dalenrale isl
dabei nur unwesenllich grer als bei Slereo-MP3.
MPLC Surround dagegen erlaubl Pundlunksen-
dern, einlach und koslengnslig aul Surroundlon
umzusleigen. Denn MPLC Surround erweilerl je-
den heule im digilalen Pundlunk blichen Audio-
codec von Slereo aul Surround. Dabei sleigl die
Dalenrale nur minimal. Die Kompalibililal zu allen
aul dem Markl belindlichen Lmplangsgeralen isl
sichergeslelll.
Die Wiedergabe von Surroundlon ber Slereo-
koplhrer erganzl diese hchsl ellizienlen Kom-
pressionsverlahren. Das lebendige, raumliche
Klangbild bleibl so auch unlerwegs erhallen.
Audio-Kommunikationstechnologien
Kommunikalionsanwendungen wie Videokonle-
renzsysleme oder lnlernellelelonie verlangen au-
er einer gulen Audioqualilal auch eine sehr kur-
ze Verzgerung bei der Ln- und Decodierung von
Audiosignalen. Sind die Verzgerungszeilen zu
lang wird ein mheloses Cesprach schnell unmg-
lich. Die Cesprachsparlner lallen sich gegenseilig
ins Worl und die Verslandigung lunklionierl nichl
mehr reibungslos. Damil dies nichl geschiehl, nul-
zen viele moderne Videokonlerenzsysleme das
MPLC-4 Low Delay AAC-Codierverlahren.
Dieses am lraunholer llS enlwickelle Verlahren
Neue Mullimediawellen
28 29
Akluelle lorschungslhemen
nach Syslem Lchlzeil-Audiocodierung, Dalen-
diensl-Aggregalion und -Aulbereilung sowie Mul-
liplex-Cenerierung vereinen. So arbeilen wellweil
zahlreiche Sendeanslallen mil dem lraunholer
Mullimedia DalaServer lr das digilale Padio DA8
und mil dem lraunholer DPM ConlenlServer.
Multimedia-Sicherheitstechnologien
Schon seil Anlang der neunziger Jahre werden am
lraunholer llS Schulzsysleme lr urheberrechllich
geschlzle Werke enlwickell. Heule slehen vor
allem drei Arbeilsbereiche im Millelpunkl.
So beschalligen sich die Wissenschalller und lnge-
nieure mil der Lnlwicklung von benulzerlreund-
lichen und sicheren digilalen Pechlemanagemenl-
syslemen basierend aul ollenen Slandards lr inler-
nelbasierle Diensle, Mobillunk und Pundlunksysle-
me. Lin weilerer Schwerpunkl liegl aul Technolo-
gien lr Zugangsberechligungssysleme. Als Crund-
lage dienl das HLCA-Syslem (High Lllicienl Condi-
lional Access). Dieses ermglichl es beispielsweise
Pundlunksendern, beslimmlen Kundengruppen Zu-
grill aul passende lnhalle zu gewahren. Dabei slehl
Sicherheil, Lllizienz und llexibililal im Vordergrund.
Schlielich werden neuarlige Audio-Wasserzeichen-
lechnologien enlwickell, die ebenso leislungslahig
wie bisherige Wasserzeichensysleme sind, allerdings
deullich weniger komplex.
Echtzeitimplementierungen
Die Lnlwicklung neuer Mullimedia-Technologien
und -Verlahren isl aber nur ein Slandbein des Ce-
schallslelds Audio und Mullimedia. Denn lr den
Lrlolg im Markl mssen die neu enlwickellen
Technologien schnell zur Verlgung slehen und
dabei hchslen Leislungsanlorderungen enlspre-
chen. Lin aul die ellizienle lmplemenlierung von
Mullimedialechnologien spezialisierles Team ga-
ranlierl den Kunden des lraunholer llS einen
schnellen Zugrill aul produklreile Sollware und
lragl so mageblich zum Lrlolg des lnsliluls bei.
Neue ldeen, ellizienle lmplemenlierungen und
Verbesserungen beslehender Verlahren. Diese Ar-
beilsschwerpunkle sichern den Wissenschalllern
und lngenieuren des lraunholer llS heule und in
Zukunll eine wellweile Spilzenposilion.
Neue Klangwellen
30 3!
New Dimensions of Multimedia
upgrade it into natural surround sound. The future
MPEG standard Spatial Audio Object Coding
allows to modify a component part of an audio
scene in real-time while being played back. Sound
objects like instruments or voices can be mixed
individually.
This new technology is suitable for entertainment
and professional applications: In future video con-
ferences the conference participants can be allo-
cated to different loudspeakers and volume con-
trolled according to the preferences of the user.
Karaoke systems will be able to fade out vocals or
instruments at the push of a button thanks to
Spatial Audio Object Coding and future genera-
tions of home theatre equipments allow for the
confguration of music listening to the comfort of
personal preferences.
Technologies for Digital Broadcasting Systems
This multidisciplinary research area comprises mo-
bile TV reception as well as data services for digi-
tal radio systems. Fraunhofer IIS scientists develop
solutions to receive DVB-H programs. Video and
audio coding schemes are purpose-optimized for
the application in mobile television to achieve out-
standing picture and sound quality on mobile de-
vices. For Internet TV (IPTV) audio and video quali-
ty is of utmost importance. In order to meet the
highest quality demands importance is given to
correcting transmission errors and network fuctu-
ation. Fraunhofer IIS engineers have contributed
decisively to the co-development of new digital
radio standards like Digital Radio Mondiale (DRM)
or data services like NewsService Journaline. The
standardization process is complemented by the
development of professional high-performance
servers for the operation of digital radio stations.
These servers combine real-time audio coding, ag-
gregation as well as processing of data services
and multiplex generation. Numerous broadcasters
worldwide depend on the Fraunhofer Multimedia
DataServer for digital radio DAB or the Fraunhofer
DRM ContentServer.
Multimedia Security Technologies
Already in the early 1990s the developers at
Fraunhofer IIS began to protect copyrighted mate-
rial. Three research areas are todays focus: The
scientists and engineers develop user-friendly and
secure Digital Rights Management (DRM) systems
based on open standards for internet-based ser-
vices, cellular phone systems and radio systems.
Another research focus is on technologies for con-
ditional access systems based on HECA (High Eff-
cient Conditional Access). Radio stations, for ex-
ample, can allow specifc client groups access to
receive certain content guaranteeing a secure,
economic and fexible system operation in all con-
ditions. Fraunhofer IIS also develops novel audio
watermarking technologies, which are as effcient
in performance as previous watermarking systems,
however, by far less complex.
Real-Time Implementations
The development of new multimedia technologies
and schemes is only one mainstay of the business
feld audio and multimedia essential for the suc-
cess in the market is to provide the customer with
a same-day availability of the latest technologies
and to meet the highest performance require-
ments. A team specialized on the effcient imple-
mentation of multimedia technologies guarantees
Fraunhofer IIS clients instant access to turnkey
software solutions and contributes to the success
of the institute.
New ideas, effcient implementation and enhance-
ment of existing technologies: These competen-
cies will sustain the international leadership positi-
on in multimedia technology for the scientists and
engineers of Fraunhofer IIS.
Recent fields of research at the Audio and
Multimedia Realtime Systems departments
What has started with a handful of staff, today is
the most important research lab in the area of
audio coding: about 100 scientists and engineers
at Fraunhofer IIS commit their work to audio and
multimedia, paving the way for tomorrow's media
world.
New research topics are surround audio and audio
communication technologies, semantic audio pro-
cessing, technologies for digital broadcasting sys-
tems as well as multimedia security and transport
technologies.
Surround Audio Technologies
The new compression technologies of Fraunhofer IIS
allow for the transmission of full 5.1 surround
sound in what has been a stereo domain until
recently. This breakthrough is possible because of
so-called parametric audio coding schemes, which
automatically down-mix the original surround
signal to a stereo signal. Spatial cue side informa-
tion transmitted together with the stereo signal
guides the multi-channel reconstruction process of
the surround sound on the receiver side. The fol-
lowing two methods are based on this principle:
Mp3 Surround complements the mp3 family with
a technology that compresses 5.1 channel audio
providing full mp3 compatibility. The bit rate is
only marginally higher than the one of stereo mp3.
MPEG Surround, at the same time, allows radio
stations to switch to surround sound service in a
smooth and cost effcient way as MPEG Surround
enhances virtually any digital broadcasting audio
codec from stereo to surround at a minimal in-
crease in bit rate. Digital radio systems enhanced
by MPEG Surround are fully compatible with all
common receivers available on the market.
The playback of surround sound over stereo head-
phones complements these highly effcient sur-
round compression schemes maintaining the live-
ly, spatial sound image for the listener.
Audio Communication Technologies
Communication applications like video conferen-
cing systems or Internet telephony do not only re-
quire excellent audio quality but also very low de-
lays for the encoding and decoding process of the
audio signals. If the delays are too long, a fuent
conversation is just about impossible: The partici-
pants tend to cut each other off and the conver-
sation becomes stilted. In order to prevent that,
many modern video conferencing systems use the
MPEG-4 Low Delay AAC coding method.
The scheme was developed at Fraunhofer IIS and
is the center piece of an audio communication
system, comprising among others the audio co-
decs AAC Low Delay and AAC Enhanced Low De-
lay as well as mechanisms to alleviate transmission
errors and network quality fuctuation. The result
is a completely new telephone or video conferen-
cing experience. The other person seems to be in
the same room. Voice and ambient background
noise are most distinguishable and the audio clari-
ty makes conversations natural and effortless.

Semantic Audio Processing
The approach of semantic audio processing com-
plements the compression technologies of
Fraunhofer IIS: The technologies SX Pro or
mp3 SX, for example, analyze a stereo signal to
New Dimensions of Multimedia
32 33
Overview
Fraunhofer Institute for Integrated Circuits IIS
Wilh 56 lnslilules lhroughoul Cermany as well as
numerous inlernalional research cenlers and liai-
son ollices in Lurope, lhe USA and Asia,
lraunholer-Cesellschall has an eslablished repula-
lion lor excellence al lhe lronl rank ol applied re-
search and developmenl. !2,500 slall members
work wilh an annual research budgel ol !.2 billion
Luros.
lounded in !985, lraunholer llS in Lrlangen, Cer-
many, ranks lirsl among lhe lraunholer lnslilules
concerning headcounl and revenues.
ln close cooperalion wilh parlners and clienls lhe
inslilule provides research and developmenl ser-
vices in lhe lollowing areas. Digilal radio broad-
casling syslems, audio and mullimedia lechnolo-
gy, digilal cinema syslems, design aulomalion and
inlegraled circuils, wired, wireless and oplical nel-
works, localizalion and navigalion, high-speed ca-
mera syslems, imaging syslems and nanolocus
X-ray lechnology, medical sensor solulions and
communicalions lechnology in lransporl and
logislics.
480 employees conducl conlracl research lor in-
duslry, lhe service seclor and public aulhorilies.
lraunholer llS wilh ils headquarlers in Lrlangen,
Cermany, has lurlher branches in Nuremberg,
luerlh and Dresden. The budgel ol 58 million
Luros is mainly linanced by projecls. Less lhan
20 percenl ol lhe budgel is subsidized by lederal
and slale lunds.
Uberblick
Das Fraunhofer-Institut fr Integrierte
Schaltungen IIS
Die lraunholer-Cesellschall gehrl mil ihren 56
Linzelinslilulen in Deulschland und zahlreichen
nalionalen und inlernalionalen Linrichlungen in
Luropa, USA und Asien zu den lhrenden Linrich-
lungen lr angewandle lorschung. Pund !2.500
Milarbeiler bearbeilen das jahrliche lorschungsvo-
lumen von !,2 Milliarden Luro.
Das !985 gegrndele lraunholer llS in Lrlangen
isl heule das grle lraunholer-lnslilul in der
lraunholer-Cesellschall.
ln enger Kooperalion mil den Aullraggebern lor-
schen und enlwickeln die Wissenschalller aul lol-
genden Cebielen. Digilaler Pundlunk, Audio- und
Mullimedialechnik, digilale Kinolechnik, Lnl-
wurlsaulomalisierung und inlegrierle Schal-
lungen, drahlgebundene, drahllose und oplische
Nelzwerke, Lokalisierung und Navigalion, Hoch-
geschwindigkeilskameras, Ullraleinlokus-Pnl-
genlechnologie, 8ildverarbeilung und Medizin-
lechnik sowie luK-Technologien lr die Logislik-
Dienslleislungswirlschall.
480 Milarbeilerinnen und Milarbeiler arbeilen aul
dem Cebiel der Verlragslorschung lr die lndus-
lrie, lr Dienslleislungsunlernehmen und llenl-
liche Linrichlungen. Das lraunholer llS mil dem
Hauplsilz in Lrlangen, hal weilere Slandorle in
Nrnberg, lrlh und Dresden. Das 8udgel von
58 Millionen Luro wird bis aul eine Crundlinanzie-
rung in Hhe von 20 Prozenl aus der Aullragslor-
schung linanzierl.
34 35
Unlernehmensausgrndungen
Lin lndikalor lr den Lrlolg eines lraunholer-
lnsliluls isl auch die Anzahl der inslilulsnahen
Unlernehmensgrndungen. Durch Spin Olls
des lraunholer llS sind in den lelzlen 20 Jahren
insgesaml zehn Unlernehmen mil rund !45 neu-
en Arbeilsplalzen enlslanden. Aul den kommen-
den Seilen slellen sich vier lirmen vor, die aus den
Ableilungen Audio und Mullimedia-Lchlzeilsysle-
me hervorgegangen sind.
An obvious indicator of success of a Fraunhofer
Institute is the actual number of spin-offs.
Fraunhofer IIS fostered ten spin-offs which created
145 new jobs during the last 20 years. Four of
those companies emerged from the Audio and
Multimedia Realtime Systems departments and
will be presented on the next few pages.
Spin-offs
36 37
Megalec Lleclronic enlwickell und lerligl kunden-
spezilische eleklronische Schallungen und Cerale.
Die Lnlwicklung umlassl Analog- und Digilalschal-
lungen, VHDL-Logikenlwurl sowie Mikroprozes-
sorsysleme einschlielich Sollware. Hierzu slehen
leislungslahige Designwerkzeuge zur Verlgung,
z. 8. Leilerplallen-CAD mil Zuken-Cadslar.
Die lerligung deckl sowohl den konvenlionellen
8ereich als auch SMT mil line-Pilch und 8CA-8au-
leilen ab. Sie isl aul kleine und milllere Serien aus-
gelegl, so dass auch lr Spezialanwendungen und
Nischenprodukle lechnologisch hochwerlige Llek-
lronikschallungen angebolen werden knnen.
Die lirma wurde !987 durch Dipl.-lng. Cerhard
Pirner gegrndel. Derzeil werden 25 Milarbeiler
beschalligl, darunler vier lngenieure.
Die wichligslen Kunden der Megalec CmbH sind
vorwiegend millelslandische Unlernehmen aus
dem Maschinenbau, der Aulomalisierungslechnik
und der Medizinlechnik sowie ein Anbieler von
Securily-Syslemen lr 8anken.
Megalec Lleclronic
Megatec Electronic offers design and manufactu-
ring of customspecifc electronic circuits and devices.
The electronic-design covers analog and digital
circuits, VHDL-Design as well as microprocessor
systems including software engineering. Powerful
design tools are used to obtain best results, e. g.
PCB-CAD with Zuken-Cadstar.
The manufacturing-process reaches from through-
hole-assembly to SMT with fne-pitch-parts. It is
optimised for small and medium series. Megatec
can offer technological state-of-the-art electronic
equipment even for special low volume applica-
tions.
The company was established in 1987 by
Dipl.-Ing. Gerhard Pirner. 25 employees are cur-
rently working for Megatec, four of them are
graduate engineers.
The main customers of Megatec GmbH are
medium sized companies in the area of mechani-
cal engineering, robotics, medical systems and a
supplier of security systems for banks.
Coding Technologies, einer der lhrenden Anbie-
ler von Audiokompressionslechnologie, wurde im
Jahr !997 in Slockholm gegrndel. Das revolulio-
nare Polenzial der vom Schweden Lars Liljeryd
!997 enlwickellen S8P (Speclral 8rand Peplica-
lion)-Technologie, einer neuen Melhode zur Lllizi-
enzsleigerung von Audiokompressionsverlahren,
wurde im Pahmen gemeinsamer Projeklarbeil mil
Audio-Lxperlen des lraunholer llS in Lrlangen er-
kannl. 8ereils im Jahre 2000 erlolgle ein Spin-Oll
durch den Leiler der Audioableilung des
lraunholer llS und Lnlwickler des wellweil erslen
MP3-Decoder-Chips, Marlin Dielz, der mil zehn
Milarbeilern die Coding Technologies CmbH in
Nrnberg grndele.
Seildem schreibl das Unlernehmen die Lrlolgs-
geschichle seiner Audio-Technologien konsequenl
lorl. Ob mil dem MP3-Nachlolger mp3PPO, dem
Audio-Codec MPLC-4 aacPlus oder mil der neues-
len Lnlwicklung MPLC Surround die Produkle
von Coding Technologies sind milllerweile lhrend
in den Marklen lr digilalen Pundlunk, mobile
Musikanwendungen oder lnlernel-Slreaming und
-Download.
Coding Technologies
Coding Technologies, a leading provider of audio
compression technology, was founded in Stock-
holm in 1997. The revolutionary potential of SBR
(Spectral Brand Replication) technology, initially
developed by the Swede Lars Liljeryd in 1997 as a
new method of improving the effciency of audio
compression schemes, was recognised by audio
experts at the Fraunhofer IIS in Erlangen as a
result of a series of joint projects.
Subsequently in 2000, Martin Dietz, head of the
audio division at Fraunhofer IIS and developer of
the worlds frst MP3 decoder chip, founded
Coding Technologies GmbH in Nuremberg,
Germany, with ten employees. Since then, the
company has nurtured a considerable success
story around audio technologies. Whether in
relation to mp3PRO, the successor to mp3, the
MPEG-4 aacPlus audio codec or the latest deve-
lopment in MPEG Surround, Coding Technologies
products are today recognised as the leading
solutions in the digital broadcast, mobile music,
Internet streaming and download markets.
38 39
OPTlCOM CmbH wurde !995 von Dipl.-lng. Mi-
chael Keyhl als ersler Spin-Oll aus der Audio-Mul-
limedia Ableilung des lraunholer llS mil der Visi-
on ausgegrndel, lr innovalive Audiocodierver-
lahren wie MP3 adaquale Messlechnik bereilzu-
slellen. ln den Anlangsjahren hal OPTlCOM mil
dem Verlrieb der Original lraunholer MP3-Codier-
sollware ber einen L-Commerce-Server wesenl-
lich zum MP3-Lrlolg des lnsliluls beigelragen und
leislele Pionierarbeil im Consulling von Pilolpro-
jeklen zur Musikdislribulion ber das lnlernel und
bei der Linlhrung von MP3 als Audiolormal lr
Compulerspiele.
Der einslige Pionier aul dem Cebiel der wahrneh-
mungsangepasslen Qualilalsmesslechnik hal sich
langsl zum Markl- und Technologielhrer lr
Sprach-, Audio- und Videoqualilal enlwickell und
sich seilher ganz seiner Kernkompelenz verschrie-
ben. So hal OPTlCOM bereils vier inlernalionale
Slandards lr die Sprach- und Audioqualilalsmes-
sung mil aul den Weg gebrachl. Nach dem groen
Lrlolg mil PLSQ, inzwischen wellweil lnduslrie-
slandard lr die Sprachqualilalsmessung von
VolP- und Mobillunknelzen, slellle OPTlCOM mil
PLVQ jngsl den neueslen lnduslrieslandard lr
die Qualilalsmessung von Videoanwendungen lr
3C Videolelelonie und Mobile TV vor.
Die OLM-Technologie von OPTlCOM lindel sich in
vielen Produklen wellweil lhrender Messlechnik-
und Nelzwerkanbieler.
Oplicom
OPTICOM GmbH is the leading vendor for voice,
audio and video quality measurement technology
and OEM products for mobile and IP based net-
work testing. With PSQM, PESQ, PEAQ and P.563,
the pioneers in perceptual quality testing have
been providing by now four international world-
class standards for voice and audio quality
measurement since the foundation of OPTICOM
as a spin-off from Fraunhofers mp3 development
team in 1995.
After the great success with PESQ, the internatio-
nal standard for voice quality testing, the experts
from Germany now also source PEVQ, the new
industry standard to measure a perceptual video
quality KPI for streaming, conferencing and mes-
saging applications. OPTICOMs proven OEM tech-
nology can be found in most state-of-the-art pro-
ducts of leading T&M vendors.
OPTICOM is a privately held company located in
Erlangen, Germany, founded by Dipl.-Ing. Michael
Keyhl.
Die MusicTrace CmbH wurde 2004 gegrndel
und bielel Wasserzeichenlsungen zum Schulz
von Musiklileln an. Die Lnlwicklung dieser Tech-
nologie wurde ursprnglich von den drei Crn-
dern am lraunholer llS mageblich vorangelrie-
ben. Mil Hille der Wasserzeichen-Technologie isl
es mglich, Zusalzinlormalionen versleckl und
unhrbar mil der Musik zu berlragen. Aul diese
Weise knnen individualisierle Kopien eines Mu-
sikslcks erslelll werden, die spaler wieder dem
jeweiligen Lmplanger zugeordnel werden kn-
nen. Milllerweile selzen Musik-Downloadshops
wellweil die MusicTrace-Technologie ein.
Zusalzlich zu der Weilerenlwicklung und Ver-
marklung der Wasserzeichenlechnologie bielel
MusicTrace Airplay Moniloring-Dienslleislungen
an. Mehr als 280 Padiosender in Deulschland,
Oslerreich und der Schweiz werden hierlr rund
um die Uhr aul bekannle Musiklilel beobachlel.
Die Kunden erhallen neben delaillierlen Linsalz-
dalen auch viele weilere Auswerlungen wie z. 8.
Airplay-Charls. Diese Dienslleislung wird unler an-
derem von dem Musikverband llPl in der Schweiz
in Anspruch genommen, dem alle groen Musik-
lirmen angehren.
2005 war MusicTrace mil seinem Unlernehmens-
konzepl unler den drei linalislen im bundesweilen
Wellbewerb des Deulschen Crnderpreises. Seil
2006 erwirlschallel MusicTrace Cewinn.
Musiclrace
MusicTrace GmbH was founded in 2005 and of-
fers watermarking solutions to protect music. By
means of this technology it is possible to transmit
additional information hidden within music. In do-
ing so, personalized copies of a music track can
be created that allow tracking of unauthorized
distribution thereof. Music download shops
worldwide are customers of MusicTrace.
In addition, MusicTrace offers airplay monitoring
services. More than 280 radio stations are moni-
tored for numerous music titles. The customers
are provided with a variety of statistics such as, for
example, airplay charts. Since 2005, MusicTrace is
offcial provider of airplay data for IFPI Switzer-
land, an association including all major music
companies.
Herausgeber.
lraunholer-lnslilul lr lnlegrierle Schallungen llS
Pedaklion.
Ableilung Presse und Ollenllichkeilsarbeil sowie
Ableilungen Audio und Mullimedia-Lchlzeilsysleme
lolos (alphabelische Peihenlolge).
8ayerisches Slaalsminislerium des lnneren, lraunholer llS,
Kurl luchs, Karoline Clasow, MLV-Verlag, Technische lakullal
der lriedrich-Alexander-Universlial Lrlangen-Nrnberg.
Druck.
Novadruck Copperl CmbH