View Item 
        •   Utrecht University Student Theses Repository Home
        • UU Theses Repository
        • Theses
        • View Item
        •   Utrecht University Student Theses Repository Home
        • UU Theses Repository
        • Theses
        • View Item
        JavaScript is disabled for your browser. Some features of this site may not work without it.

        Browse

        All of UU Student Theses RepositoryBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

        Een Bayesian random censoring model voor ontbrekende waarden in proteomica data

        Thumbnail
        View/Open
        Thesis.pdf (304.1Kb)
        Publication date
        2015
        Author
        Rooijen, K. van
        Metadata
        Show full item record
        Summary
        In proteomica data zijn vaak veel ontbrekende waarden door beperkingen van de meetapparatuur. Het probleem van deze ontbrekende waarden is dat ze niet willekeurig voorkomen, maar vaker voorkomen bij eiwitten met lagere concentraties. Statistische methoden die hier geen rekening mee houden kunnen dus onbetrouwbare resultaten geven. In deze scriptie vergelijken we het empirical Bayesian random censoring threshold (EBRCT) model met een methode die toch aanneemt dat ontbrekende data volledig willekeurig zijn (MCAR), k-nearest neighbour imputatie (KNN), singular value thresholding imputation (SVTI), een model dat alleen de rangorde van data gebruikt (NCRI) en een fixed censoring model (FCEN). Om modellen te vergelijken hebben we een benchmark dataset gebruikt. Deze dataset bestaat uit peptideconcentraties uit urinemonsters van 134 mannen en 134 vrouwen. Elke methode is getest op zijn vermogen om om te gaan met ontbrekende data, door de methode te combineren met een classifier en zo van proefpersonen het geslacht te voorspellen. Voor zowel EBRCT als FCEN is het beter om op basis van de modellen te imputeren en een support vector machine te gebruiken voor classificatie, dan om een Na¨ıve Bayes classifier te gebruiken met de parameters van het model. EBRCT en SVTI classificeren dan van alle modellen de meeste personen juist.
        URI
        https://studenttheses.uu.nl/handle/20.500.12932/21341
        Collections
        • Theses
        Utrecht university logo