2012-03-26

Data Mining med R

Det blåser starka vindar för R inom analysvärlden. När jag pluggade på universitet så var det Matlab och Octave (open source alternativet till Matlab) som gällde. Samma sak hittills i mitt yrkesliv, Matlab genomgående. De senaste åren har dock R tagit mer och mer mark och just nu känns det som R är det enda som gäller, i alla fall inom BI och Data Mining. Proffessor Andrew Ng på Stanford valde att undervisa sin webbaserade Maskininlärningskurs i Octave, men förutom det så är det sällan jag springer på Matlab numera. Sen om det beror på att jag har hamnat i någon R filterbubbla på Google eller ifall omvärlden faktiskt ser ut så, det återstår att se.

Många "applikationskramare" vägrar släppa "sin" programvara utan fortsätter att förespåka sitt val in i döden. Jag skulle alltså kunna fortsätta köra Matlab, men jag tycker det är kul när man får tillfälle att på ett naturligt sätt för lära sig nya språk/system i sitt dagliga arbete. Då slipper man känna att man borde hinna med att läsa sig även detta utöver alla måste. Det man vill lägga tid på blir ett måste som man enklare kan prioritera.

Nu gäller det bara att friska upp minnet med R syntax samt komma in i arbetsflödet att köra Data Mining i R. Luis Torgos bok "Data Mining with R" har länge varit en storsäljare på Amazon så jag tänkte ge den en chans. Utöver den kommer jag nog att använda denna MATLAB/R Reference guiden ganska flitigt innan jag vant mig med syntaxen.