Collaborative Filtering

Im Auftrag von Lovely Systems lese ich mich grad in die Materie Collaborative Filtering ein. Noch nie etwas davon gehört? Vielleicht läuten beim Begriff Recommendation Systems ein paar Glocken. Auch nicht? Na dann tönt bestimmt zumindest dieser Satz einigermaßen vertraut: “Kunden, die diesen Artikel angesehen haben, haben auch schon von folgenden Produkten geträumt.” Oder so ähnlich.

amazon_cf.gif

Es geht also darum, Vorhersagen über Uservorlieben zu treffen, aufgrund der Vorlieben von anderen, ähnlichen Usern. Doch wann sind sich User ähnlich? Und vor allem: Wie ähnlich sind sie sich? Kann man diese Ähnlichkeit in einer Zahl ausdrücken? Vielleicht auf einer Skala von 1 bis 100? Zwei Dinge braucht man dazu. Einen Haufen Daten und eine Hand voll Mathematik. Es gibt übrigens auch ein, zwei Bücher zu dem Thema.

Bei Amazon gestaltet sich die Sache noch einigermaßen einfach. Gekauft oder nicht gekauft. Das ist hier die (einzig relevante) Frage. Was aber, wenn man solche eindeutigen Anhaltspunkte nicht hat? Wenn Objekte nicht gekauft, sondern nur bewertet, verschlagwortet (also mit Tags versehen) oder frei kommentiert werden? Wie zum Beispiel bei Lovely Books. Dann wird’s etwas kniffliger.

Dass es nicht ganz ohne ist, solche Algorithmen effizient und vor allem exakt hinzubekommen, beweist dieser Wettbewerb: $1.000.000 Preisgeld für denjenigen, dem es gelingt, die Treffsicherheit des CF-Systems von Netflix (amerikanischer DVD-Verleiher) um 10 % zu steigern. Nachdem sich aber bereits einige Teams die Zähne daran ausgebissen haben, könnte man vielleicht ebensogut versuchen, die Goldbachsche Vermutung zu beweisen.

 
1 Kommentar
SystemRoulet  – 12. September 2009 01:51

Tja, das Leben kann so einfach sein, mann muss nur glück haben.

 
Kommentar verfassen