Beruflich Dokumente
Kultur Dokumente
Thomas Gängler
Belegarbeit - Verteidigung
# Motivation
# Anwendungsfälle auf private Musiksammlungen
# Musikmerkmale und -metadaten
# Merkmals- und Metadatenextraktion
# Fazit und Ausblick
[01]
# Ordnen
# Orientieren
# Suchen
# Empfehlen
# Wiedergabelisten- und Mixgenerierung
# Verändern
# Gemeinsam Benutzen
# Verbalisierte Anfrage:
> Textanfrage (IST) oder gesprochene Anfrage (SOLL)
> Stichwortsuche (IST) oder Suche durch natürliche
Sprache (SOLL)
# Anfrage mit Audioinhalt:
> Anfrage durch Melodie (Singen, Summen, ...), Klopfen,
Musikbeispiel (SOLL)
# Hybride Anfrage:
> Verbalisierte Anfrage + Anfrage mit Audioinhalt (SOLL)
# Sehr viel Kontext- und Inhaltsinformationen benötigt
# Anfragen oft unscharf formuliert
# Ähnlichkeitsmetriken aus:
> Gemeinschaftliches Filtern
> Audiosignalanalyse (Inhaltsbasiertes Filtern)
> Metadatenanalyse (Kontextbasiertes Filtern)
> Benutzerprofilauswertung (Musikgeschmacksprofil)
# Einbeziehung aller Musikmetadatentypen möglich
# Probleme: Popularitätsverzerrung, Kalt-Start-Problem
# Lösung: sinnvolle Kombination bzw. Auswahl- und
Wichtungsmöglichkeit der Ähnlichkeitsmetriken
> z.B. Einbindung existierender Musikgeschmacksprofile,
vordefinierter Stereotypen (demografisches Filtern)
[10]
# Administrative Metadaten:
> Benutzerprofile für angepasste Sichten und Statistiken
> Zugangskontrolle (“Party-Modus”)
> Freigaben (gemeinsames Archiv)
> Digitales Ausleihen
[11]
einfache Audiosignaleigenschaften
physikalische Beschreibungen
Frequenz, Spektrum, Intensität, Grobheit, Einschwingzeit,
Dauer Lautheit, ...
angereicherte Audiosignaleigenschaften
Expertentaxonomien Folksonomien
Industrietaxonomien,
Internettaxonomien
# Metadatentypen:
> Objektiv: Künstler, Musikstücktitel, Albumtitel, ...
> Subjektiv: Musikgerne, Stimmung, Bekanntheitsgrad, ...
# Musikmetadatentypen:
> Redaktionelle Metadaten: professionell/ gemeinschaftlich
erstellt; z.B. administrative Daten, Künstlerbiografien
> Kulturelle Metadaten: durch Kultur/ Milieu erzeugt, d.h.
Musik in einem Kontext; z.B. Musikstil, ähnliche Künstler
> Akustische Metadaten: Grundtonart, Tempo, Rhythmus,
Melodie, Klangfarbe, ...
[12]
# Rahmenwerke:
Musikdokument
> MARSYAS, CLAM, Vamp
Audiosignal # Programmiersprache: ChucK
# Web Services:
Signalabtastung
> MUSCLE, Echo Nest
Analyse-/Texturfenster Direkte Statistiken
STFT,
Musikalischer
DWT, Zeit-Frequenz-Transformation Spektralstatistiken
VRT, ... Fingerabdruck
Mel-Skala,
Bark-Skala Perzeptionsmodelle Perzeptionsstatistiken
Musikdokument Audiosignalanalyse
Jaudiotagger,
TagLib, Aperture, Metadaten Merkmalsvektoren
Echo Nest, ...
Web Services, Suchmaschinen,
Metadatenanreicherung Musikinformationsseiten, SPARQL-
Endpunkte, lokal bzw. privaten
Multivariate Netzwerk, ...
Analysemethoden,
Maschinelles Lernen,
Klassifikation, Einordnung, Ähnlichkeiten
Ontologien
# Fazit:
> Modellierung des Musikwahrnehmungs- und Verarbeits-
prozesses ist komplex
> Kombination der Merkmalsextraktionstechniken und
Anpassung an das Benutzerprofil notwendig
> Unschärfe und Abstraktion für intuitiven Umgang
> Ontologiebasiertes Metadatenformat (Music Ontology)
für formatgebundene und -unabhängige Spezifikationen
> Umfangreiche persönliche Musikwissensbasis als
Grundlage für bessere Benutzung der Musiksammlung
# Ausblick:
> Implementierung einer persönlichen Musikwissensbasis
> Ausnutzung des Web of Data für Wissensanreicherung
> Ontologiebasiertes Musikmetadatenformat in
Musikdokumenten
> Erweiterung der Music Ontology (Wiedergabelisten-
modellierung, erweitertes Veröffentlichungskonzept)
> Optimierung der Extraktionsabläufe (VRT, ...) und
Einordnungs-, Klassifikations- und Regressionstechniken
> Digitales Ausleihen
> Anfragen per natürlicher Sprache (textuell/mündlich)
[01] Xavier Serra. Sound and Music Description. Presentation at Music Technology Group, Universitat Pompeu Fabra,
Barcelona, 2008
[02] Ausschnitt aufgenommen von der Sicht Cover Flow in iTunes
[03] Ausschnitt aufgenommen von http://www.lastmusicmap.com/#
[04] Yves Raimond. A Distributed Music Information System. PhD thesis, Queen Mary, University of London, November
2008.
[05] Ausschnitt aufgenommen von http://audiomap.tuneglue.net
[06] Ausschnitt aufgenommen von http://finetunes.musiclens.de/
[07] Ausschnitt aufgenommen von http://musicovery.com/
[08] Ausschnitt aufgenommen von http://www.sfu.ca/˜jdyim/musicianMap/musicianMap.html
[09] Ausschnitt aufgenommen von der Sicht mufin vision in MAGIX MP3 Maker 15
[10] Anita Shen Lillie. MusicBox: Navigating the space of your music. Master’s thesis, School of Architecture and
Planning, Massachusetts Institute of Technology, September 2008.
[11] Beispiel ist von der Rent-Aktion abgeleitet; siehe
http://rhizomik.net/˜roberto/thesis/html/Conceptualisation.html#ActionRent
[12] Tristan Jehan. Creating Music by Listening. PhD thesis, School of Architecture and Planning, Massachusetts
Institute of Technology, September 2005.
[13] http://ims.dei.unipd.it/websites/cms/research/musicinformation-retrieval.html
[14] Luis Gustavo Pereira Marques Martins. A Computational Framework for Sound Segregation in Music
Signals. PhD thesis, Faculdade de Engenharia da Universidade do Porto, Sep. 2008.
[15] Michael Fingerhut. Music Information Retrieval, or how to search for (and maybe find) music and do away with
incipits. In International Association of Sound and Audiovisual Archives (IASA) Conference 2004, Oslo, Norwegen,
2004.
[16] Thomas Lidy. Evaluation of New Audio Features and Their Utilization in Novel Music Retrieval Applications. Master’s
thesis, Institut für Softwaretechnik und Interaktive Systeme, Technischen Universität Wien, Wien, Österreich,
Dezember 2006.
[17] Aliaksandr V. Paradzinets. Variable Resolution Transform-based Music Feature Extraction and their Applications for
Music Information Retrieval. PhD thesis, Ecole Centrale de Lyon, 2007.
CDDB http://www.gracenote.com/
freeDB http://www.freedb.org/
MusicBrainz http://musicbrainz.org/
Discogs http://www.discogs.com/
Allmusic http://www.allmusic.com/
Last.fm http://www.lastfm.de/
Pandora http://www.pandora.com/
Rockanango http://www.aristomusic.com/
Amazon http://www.amazon.com/
MARSYAS George Tzanetakis. Manipulation, Analysis and Retrieval Systems for Audio
Signals. PhD thesis, Computer Science Department, Princeton University, 2002.
CLAM Xavier Amatriain, Pau Arumi, and David Garcia. CLAM: A Framework for
Efficient and Rapid Development of Cross-platform Audio Applications. In
Proceedings of ACM Multimedia 2006, pages 951 – 954, Santa Barbara, California,
USA, Oktober 2006.
Vamp http://www.vampplugins.org/
ChucK Ge Wang, Rebecca Fiebrink, and Perry R. Cook. Combining Analysis and Synthsis
in the ChuK Programming Language. In Proceedings of the 2007 International
Computer Music Conference (ICMC), Kopenhagen, Dänemark, 2007.
MUSCLE http://www.muscle-noe.org/
EchoNest http://the.echonest.com/
Jaudiotagger http://www.jthink.net/jaudiotagger/index.jsp
Aperture http://aperture.sourceforge.net/index.html
TagLib http://developer.kde.org/˜wheeler/taglib.html
audioDB http://omras2.doc.gold.ac.uk/software/audiodb/
[13]
[14]
# Klassisch:
> Facetttennavigation
> Coverbild-Anzeige
[02]
[03]
[04]
32 / 24
[05]
[06]
[07]
[08]
[09]
[15]
[16]
[17]
DBTune http://dbtune.org/
BBC Backstage http://bbc.openlinksw.com/sparql