Hierarchische clustering van de muziek profielen van BMI

 
  • Hierarchische clustering van de muziek profielen van BMI

    De eerste hierarchische graf, die ik aan het white board heb gemaakt, moet een prototype zijn voor een echte analyse, als ik de tijd kan vinden :)

    Om een aantal commentaren in te brengen in hoe de boom op te stellen:
    * Het aantal dimensies (tags) is veel te groot voor de hoeveelheid datapunten. Die kunnen naar beneden gehaald worden met een PCA. Als we de dimensies extreem laag krijgen (3?) kunnen we een plaatje maken, en kunnen we zelfs elke dimensie benoemen met ... een tag cloud!
    * Het hierarchisch clusteren moet herbekeken worden, specifiek de manier waarop de afstand tussen nodes wordt berekend op basis van de child nodes. Momenteel wordt de nieuwe node de gemiddelde vector van zijn twee kinderen.
    * Er moet een plaatje van een dendrogram geproduceerd worden als output van het hierarchisch clusteren.

    Duidelijk een taakje dat even een avondje concentratie vraagt, maar waar ik momenteel helaas geen tijd voor kan vinden.

    Bij deze nog het prototype van de clustering, welke er danig anders uit kan zien als er wat andere clustertechnieken tegenaan gegooid worden.

    ( ( ( ( ( ( ( ( ( ( ( King_Ron, WinstonKI ), ( Balachmar, eXinion ) ), BroerVanDeHulk ), ( Sjoerd, khamael ) ), _Xandor_ ), b_welding ), MightyJay ), lroumen ), ( ( Zipzzz, gwgr ), v3sn4 ) ), pspijker ), ( aliekens, t1mp ) )

  • Als je nu eens stopt met hacken en echt gaat programmeren, is het misschien leuk om er een gezamelijk project van te maken :)

  • Ik heb nog wel ergens een zooi code liggen van verschillende cluster methodes in C ;)

  • Bij deze de PCA naar 2 dimensies van onze groep data, met onze 10 belangrijkste tags als (vergrootte) vectoren.



    Plaatje is blijkbaar te groot voor last.fm's RSS, hier is het URL: http://anthony.liekens.net/images/pca.png

  • Ah... ik krijg haast medelijden met je Anthony... :) Helemaal alleen ver van de rest...

    Overigens wel leuk dat ik toch wel veel dingen live gezien heb en dat toevallig ook de bands zijn de meeste mensen "seen live" hebben... Maar misschien moeten we die tag er toch maar uit filteren ;)

    • [Deleted user] said...
    • User
    • 26 Mar 2007, 10:23
    dan kun je ook rock eruit filteren aangezien dat ook te pas en te onpas ergens maar aan wordt toegekend.

  • Nieuwe PCA

    Hier is een nieuwe versie van de PCA, na wat opruimwerk in de tags. Nu heb ik enkel de top 10 tags van elke gebruiker genomen om de lijst tags op te stellen die de dimensies van mijn tag-space voorstellen. Dit leidt nu tot slechts 49 tags die in grote lijnen de belangrijkste muziekgenres in ons lab samenvatten, in plaats van de >600 tags die ik voorheen had. Daarmee wil het nog niet zeggen dat een PCA naar 2D goed de variantie van het oorspronkelijke cluster houdt, deze blijft gelijkaardig ... Maar bij het bekijken van het onderstaande plaatje krijg ik toch een gevoel dat iedereen beter geplaatst is in zijn eigen muzieksoort (bvb lroumen leek helemaal op foute plaats te staan in vorig plaatje, lijkt nu beter gepositioneerd).



    Deze PCA lijkt onze groep in 4 "groepen" in te delen: rockers, metalheads, classicrock/pop en electronic.

    URL van dit plaatje: http://anthony.liekens.net/images/pca2.png

  • Heej, nu zit ik weer bij die verrekte metalheads :).
    En electronic is niet echt een groep zo he.

  • Uhm, wat heb je tegen metalheads? Nou? he? he? Kom maar mee naar buiten, gaan we tandjes tuffen :p

    • [Deleted user] said...
    • User
    • 26 Mar 2007, 15:56
    electronic metal... dat klopt wel zo'n beetje voor mij. ik ben nu bezig om de PCA te vernachelen door weer geheel andere muziek te luisteren.

    Dat zal je leren om mij in een hokje proberen te stoppen!

    • eXinion said...
    • User
    • 27 Mar 2007, 11:05
    Ja, dat electronic is geen groep, dat is een 'anomaly' :p

    Yeah baby, YEAH!
Anonymous users may not post messages. Please log in or create an account to post in the forums.