Misschien vindt u dit ook interessant
Summary
Voor NH onderzoek ik welke features de beste classifiers opleveren. Hiervoor maak ik gebruik van PU Learning (Elkan & Noto, 2008). Daarnaast stel ik een manier voor om te beoordelen of lezers een gelezen artikel interessant vonden zonder het te vragen. Deze informatie kan vervolgens gebruikt worden om de classifier op te trainen.
Het blijkt dat de beste features de eerste alinea en de volledige tekst van het artikel zijn. Verder is er met de voorgestelde interessemaat een kleine verbetering zichtbaar in de resultaten van het classificatie algoritme.