Development and validation of SNP identification and candidate gene prediction tools


Update content

Title Development and validation of SNP identification and candidate gene prediction tools
Period 01 / 2008 - 12 / 2009
Status Completed
Research number OND1337156


SNPs are becoming more and more the markers of choice for genetic analysis. However, at the moment the number of SNP markers available is limited. A large number of putative SNPs is contained in publicly available databases. This project aims at exploitation this information by using recently developed software and algorithms for detection of reliable SNPs in public databases to identify and validate new markers.
Once a SNP is identified and an assay developed, assigning genotypic scores (homozygote or heterozygote) based on SNP analysis is relatively straightforward in diploids. However in the case of polyploids a quantitative SNP assay has to be converted into a discrete scoring (e.g. nulliplex tetraplex in the case of tetraploids). This project also aims at the development of algorithms and software to automate this polyploid scoring, using data sets of tetraploid potato cultivars.

Research objectives:

1. To validate bioinformatics tools for detection of reliable SNPs based on public databases
2. To develop and validate software for the automated genotypic scoring of SNPs in polyploids

Activities 2009
In previous years a SNP identification pipeline was developed (Tang et al 2007). In validation experiments in 2007 and 2008 in potato, a wealth of data has been generated that need to be analyzed. Part of this analysis will be carried out within this project. Based on that analysis a scientific publication will be written.

Results and products:
Results obtained in 2008

- Jifeng Tang succesfully defended het PhD thesis and published two articles
- Using the Illumina Golden Gate platform, 384 SNPs were analyzed in a collection of 288 diploid and tetraploid potato genotypes. Also older pyrosequencing results of 15 SNPs in 450 tetraploid potato cultivars were re-analyzed.
Using a variety of statistical methods (clustering, mixture models) genotype calls (nulliplex, simplex etc) were obtained from the quantitative SNP scores
- Using the Fluidigm assay, a set of 96 tetraploid potato varieties is being analyzed for 16 SNPs

Output 2009
- Data analysis and publication related to validation of SNPs in potato

Abstract (NL)

SNP s worden in genetische onderzoeken steeds vaker gebruikt als merker. Op dit moment is het aantal beschikbare SNP-merkers echter beperkt. Een groot aantal veronderstelde SNP's zijn opgenomen in openbare databases. Dit project streeft naar de exploitatie van deze gegevens door de ontwikkeling en validatie van nieuwe software en algoritmen voor het opsporen van betrouwbare SNP's in openbare databases voor het identificeren en valideren van nieuwe merkers.
Als een SNP is geïdentificeerd en een onderzoek is ontwikkeld, is het toewijzen van genotypische scores (homozygoot of heterozygoot) op basis van de SNP-analyse relatief eenvoudig in diploïdes. In het geval van polyploïdes moet een kwantitatief SNP-onderzoek worden omgezet in een afzonderlijke score (d.w.z. nulliplex tetraplex in het geval van tetraploïdes). Dit project streeft bovendien naar de ontwikkeling van algoritmen en software om deze score voor polyploïdes te automatiseren, door middel van datasets van tetraploïde aardappelcultivars.

1. De validatie van instrumenten voor bio-informatica voor het opsporen van betrouwbare SNP s gebaseerd op openbare databases
2. De ontwikkeling en validatie van software voor de geautomatiseerde genotypische scoring van SNP's in polyploïdes.

Resultaten 2008

- Jifeng Tang verdedigde met succes zijn dissertatie en publiceerde twee artikelen
- Door gebruik te maken van het Illumina Golden Gate platform werden 384 SNP's geanalyseerd uit een verzameling van 288 diploïde en tetraploïde aardappelgenotypen. Boven werden oudere resultaten van de pyrosequencing van 15 SNP's in 450 tetraploïde aardappelcultivars opnieuw geanalyseerd. Door middel van verschillende statistische methoden (clusteranalyse, mengmodellen) werden genotypen (nulliplex, simplex, etc.) verkregen uit de kwantitatieve SNP-scores
- Door middel van het Fluidigm-onderzoek wordt momenteel een set van 96 tetraploïde aardappelvariëteiten geanalyseerd op 16 SNP's

Resultaten 2009

- Gegevensanalyse en publicatie met betrekking tot validatie van SNP s bij de aardappel

Publicaties bij dit project zijn beschikbaar via deze Link

Related organisations

Related people

Project leader Dr. R.E. Voorrips

Related research (upper level)


D18210 Agriculture and horticulture
D21400 Genetics

Go to page top
Go back to contents
Go back to site navigation