KNAW

Onderzoek

Adaptive dissimilarity measures, dimension reduction and visualization

Pagina-navigatie:


Wijzig Onderzoekgegevens


Titel Adaptive dissimilarity measures, dimension reduction and visualization
Looptijd 09 / 2007 - 12 / 2011
Status Afgesloten
Dissertatie Ja
Onderzoeknummer OND1336430
Leverancier gegevens NWO

Samenvatting

In haar proefschrift presenteert Kerstin Bunte enkele uitbreidingen van het Learning Vector Quantization (LVQ) algoritme. Het algoritme kan gebruikt worden in een grote verscheidenheid aan applicaties, bijvoorbeeld in software voor medisch beeldherkenning. Met deze methode won de onderzoeksgroep kort geleden de DREAM6/FlowCAP Challenge voor Molecular Classification of Acute Myeloid Leukaemia . In het eerste deel worden applicaties besproken van Content Based Image Retrieval (CBIR) op dermatologische afbeeldingen, supervised dimension reduction en advanced texture learning bij beeldanalyse. Het gedetailleerde onderzoek naar dimensionality reduction komt uitgebreid aan bod in de tweede helft van het proefschrift. We stellen een algemeen framework voor, dat de aanpassing van verschillende methoden voor dimension reduction voor explicit mappings vergemakkelijkt. Hiermee wordt naast rechtstreekse out-of-sample extensies ook het theoretische onderzoek naar de generalisatie-eigenschappen van dimension reduction mogelijk. Dit concept wordt geïllustreerd op verschillende unsupervised en supervised examples. Verder wordt een nieuwe techniek voor efficiënt unsupervised non-linear dimension reduction voorgesteld die de concepten van fast online learning en optimalisatie van divergenties combineert. In contrast met de meeste niet-lineaire technieken, waarvan de computationele inspanningen kwadratisch toenemen met het aantal punten, heeft de voorgestelde methode lineaire complexiteit. Tot slot worden drie op divergentie gebaseerde algoritmes gegeneraliseerd en onderzocht op het gebruik van willekeurige divergenties.

Samenvatting (EN)

Learning vector quantization (LVQ) is een familie van populaire algoritmen die gebruikt worden in verschillende problemen, zoals classificatieproblemen in beeldverwerking of analyse van medische gegevens. Op basis van voorbeeldgegevens wordt er een set van prototypen bepaald die typische kenmerken representeren en een classificatieschema parametriseren die op afstand is gebaseerd. Een atraktief kenmerk van LVQ is dat de prototypen gedefineerd zijn in de ruimte van de gegevens en daar door een intuitieve interpretatie toelaten. Een sleutelprobleem hierbij is de keuze van een gepaste afstandmaat. Vaak wordt de Euclidische metriek gebruikt zonder deze keuze met argumenten te onderbouwen of worden er verschillende maten met elkaar vergeleken in een trial-and-error benadering. Een mogelijke oplossing van dit probleem is de inzet van een adaptieve metriek. Voor dit doel heeft men "relevance learning" schemas ontwikkeld die aan elke dimensie in de kenmerkruimte een relevantiefactor toekennen. Deze factoren en de prototypen worden in het leerproces tegelijkertijd geactualiseerd. Een doel van dit onderzoeksvoorstel is een verbeterde theoretische inzicht in relevance learning. Hierbij willen we onze eerde ontwikkelde wiskundige omschrijving van de lerndynamika van LVQ uitbreiden met de aanpassing van afstandsmaten. Ons hooftdoel is belangrijke uitbreiding van relevance learning te formuleren, onderzoeken en toepassen. Hiervoor stellen we een schema die een matrix van relevantie's aanpast in het leerproces. Naast de toekenning van gewichten aan verschillende dimensies houdt deze matrix rekening met correlaties tussen de dimensies. Daarenbovenwillen wij onzemethode in practische problemen, zoals de analyse van medische beelden, de classificatie van gegevens in bioinformatica, etc., implementeren en testen. Learning vector quantization (LVQ) is a family of appealing algorithms which are used in a variety of problems including classification problems in image processing, medical data analysis, or bioinformatics. An iterative training process determines from given example data a set of prototypes which represent typical features and parameterize a distance based classification scheme. One attractive feature of LVQ is that prototypes are defined in the space of the data and allow for intuitive interpretation. A key difficulty is the choice of an appropriate distance measure. Frequently, Euclidean metrics is employed without further justification, or different measures are compared in a trial-and-error approach. An appealing solution to this problem is the use of adaptive metrics. Relevance learning schemes have been proposed which assign a relevance factor to each dimension in feature space. These factors and the prototypes are updated at the same time during training. One aim of the project is a better theoretical understanding of relevance learning. We will extend our previous mathematical description of the learning dynamics and performance of LVQ to the application of distance measures. Most importantly, we will formulate, investigate, and apply an important extension: We suggest schemes which adapt a matrix of relevances during training. This matrix does not only weight single features differently but takes into account correlations between them as well. As a testbed for the novel class of algorithms we will implement and benchmark our method in practical problems of medical image analysis, classification of bioinformatics data, and other applications.

Betrokken organisaties

Betrokken personen

Promotor Prof.dr. M. Biehl
Promotor Prof.dr. N. Petkov
Promovendus Dr. K. Bunte

Omhoog
Ga terug naar de inhoud
Ga terug naar de site navigatie