| Learning vector quantization (LVQ) is een familie van populaire algoritmen die gebruikt worden in verschillende problemen, zoals classificatieproblemen in beeldverwerking of analyse van medische gegevens. Op basis van voorbeeldgegevens wordt er een set van prototypen bepaald die typische kenmerken representeren en een classificatieschema parametriseren die op afstand is gebaseerd. Een atraktief kenmerk van LVQ is dat de prototypen gedefineerd zijn in de ruimte van de gegevens en daar door een intuitieve interpretatie toelaten. Een sleutelprobleem hierbij is de keuze van een gepaste afstandmaat. Vaak wordt de Euclidische metriek gebruikt zonder deze keuze met argumenten te onderbouwen of worden er verschillende maten met elkaar vergeleken in een trial-and-error benadering. Een mogelijke oplossing van dit probleem is de inzet van een adaptieve metriek. Voor dit doel heeft men "relevance learning" schemas ontwikkeld die aan elke dimensie in de kenmerkruimte een relevantiefactor toekennen. Deze factoren en de prototypen worden in het leerproces tegelijkertijd geactualiseerd. Een doel van dit onderzoeksvoorstel is een verbeterde theoretische inzicht in relevance learning. Hierbij willen we onze eerde ontwikkelde wiskundige omschrijving van de lerndynamika van LVQ uitbreiden met de aanpassing van afstandsmaten. Ons hooftdoel is belangrijke uitbreiding van relevance learning te formuleren, onderzoeken en toepassen. Hiervoor stellen we een schema die een matrix van relevantie's aanpast in het leerproces. Naast de toekenning van gewichten aan verschillende dimensies houdt deze matrix rekening met correlaties tussen de dimensies. Daarenbovenwillen wij onzemethode in practische problemen, zoals de analyse van medische beelden, de classificatie van gegevens in bioinformatica, etc., implementeren en testen. Learning vector quantization (LVQ) is a family of appealing algorithms which are used in a variety of problems including classification problems in image processing, medical data analysis, or bioinformatics. An iterative training process determines from given example data a set of prototypes which represent typical features and parameterize a distance based classification scheme. One attractive feature of LVQ is that prototypes are defined in the space of the data and allow for intuitive interpretation. A key difficulty is the choice of an appropriate distance measure. Frequently, Euclidean metrics is employed without further justification, or different measures are compared in a trial-and-error approach. An appealing solution to this problem is the use of adaptive metrics. Relevance learning schemes have been proposed which assign a relevance factor to each dimension in feature space. These factors and the prototypes are updated at the same time during training. One aim of the project is a better theoretical understanding of relevance learning. We will extend our previous mathematical description of the learning dynamics and performance of LVQ to the application of distance measures. Most importantly, we will formulate, investigate, and apply an important extension: We suggest schemes which adapt a matrix of relevances during training. This matrix does not only weight single features differently but takes into account correlations between them as well. As a testbed for the novel class of algorithms we will implement and benchmark our method in practical problems of medical image analysis, classification of bioinformatics data, and other applications. |