Freelenz

Archive of the category * Algorithms *

Der Immobot geht um

— January 22, 2008 —

Schon vor Längerem habe ich ja bereits angekündigt, dass Freelenz an einem ebenso spannenden wie innovativen Projekt werkelt. Worum es sich dabei in etwa handelt, werden wiederkehrende Besucher wohl bereits obigem Plakat entnommen haben, das seit einiger Zeit an der Tapete hängt. Worum es sich konkret handelt, will ich hier und jetzt verraten. Schließlich sind es nur noch knapp zwei Wochen bis zum offiziellen Start.

Immoment ist eine regionale, semantische Suchmaschine für Immobilieninserate. Regional, weil auf Österreich beschränkt. Semantisch, weil Immoment bestimmte Eckdaten einer Immobilienanzeige im Internet erkennen und verwerten kann, wie zum Beispiel die Wohnfläche, den Preis, ob es sich um ein Miet- oder Kaufobjekt handelt, PLZ/Ort, etc. Nach diesen Kriterien kann eben auch auf Immoment gesucht/gefunden/sortiert werden.

Außerdem lässt das Web 2.0 herzlich grüßen. Durch den verstärkten Einsatz von Ajax wird das ebenso praktische wie innovative Konzept der Livesuche verwirklicht. Will heißen: Hier ein paar Stichworte eintippen, dort den Preisschieber bewegen, dann vielleicht noch ein paar Kästchen ankreuzen – die Suchergebnisse folgen prompt und auf dem Fuße. Und das Beste daran: Die Parameter können laufend verändert werden. Kein mühsames Durcharbeiten mehrerer Webformulare, kein mehrfaches Zurückklicken bei erfolgloser Suche.

Bei Immoment fühlt sich das Suchen eher an wie ein Eichen und Justieren, ein Frage-und-Antwort-Spiel, ein Dialog mit der Datenbank, ein lebendiger Prozess, … okay, genug damit. ;-)

Konkret sieht das ungefähr folgendermaßen aus:

Links spielt die Musik, da werden die Suchkriterien eingestellt, also zum Beispiel wird eine Preisober- und -untergrenze festgelegt. Daneben erscheinen ruckzuck die Resultate. Feine Sache oder was?

Also, am 1. Februar ist es soweit! Inzwischen geht der Immobot fleißig um und indiziert Inserate. So um die 40.000 werden es zu Beginn sein, aber das ist noch stark ausbaufähig.

5 comments | Leave a comment

Million Dollar Baby

— June 22, 2007 —

Aus Spaß an der Freud’ quasi beteiligt sich Freelenz ab sofort am Wettrennen um den Netflix Prize. Wie wo was? Also, von vorne: Netflix ist ein US-amerikanischer DVD-übers-Internet-Verleiher. Die Eckdaten: 80.000 Filmtitel, 42 Millionen DVDs, 1300 Mitarbeiter, 1,6 Millionen DVD-Sendungen pro Tag an knapp 7 Millionen Kunden, von denen etwa 60 Prozent ihre Filme aus automatisch generierten Empfehlungen auswählen. Leicht nachzuvollziehen, dass diese Empfehlungsmaschinerie einen Gutteil des Erfolgs von Netflix ausmacht. Nur, wie kommen diese Empfehlungen zustande?

Jeder Kunde kann (und tut das auch fleißig) die Filme, die er geliehen und gesehen hat, auf der Website von Netflix mit 1-5 Sternen bewerten. Fünf will heißen “Oscar, wenn’s nach mir ginge”, eins hingegen “schwache Vorstellung”, dann gibt’s noch drei Zwischentöne für die Indifferenten. über die Jahre hat Netflix über eine Milliarde solcher Ratings eingesammelt und akribisch in einer riesigen Datenbank verstaut. Auf deren Basis ist ein Algorithmus in der Lage, zukünftige Bewertungen mit einer durchschnittlichen Abweichung von 0,9525 Sternen vorherzusagen. Mit anderen Worten: Die Maschine weiß ziemlich genau, was den Leuten gefallen wird und was nicht.

Doch scheinbar ist das noch nicht ausreichend. Also will Netflix demjenigen $ 1.000.000 (in Worten: Eine Million Dollar) zustecken, der diesen Wert um 10 Prozent zu verbessern weiß, sprich mit einem besseren Algorithmus eine Standardabweichung unter 0,8572 erreicht. Netflix stellt die Daten zur Verfügung. Und da beginnt es auch, schwierig zu werden. Natürlich sind alle privaten Kundendaten zuvor entfernt worden. Der durch soviel Geld entsprechend motivierte Algorithmentüftler bekommt auf Anfrage komprimierte 700 Megabyte an Daten, die im wesentlichen aus 17.000 Filmtiteln, 480.000 nackter Kundennummern und schlappen 100.000.000 abgegebenen Bewertungen bestehen. Dann mal los!

Natürlich bildet sich Freelenz nicht ein, die Nuss knacken zu können. Wieso nicht? Vielleicht deshalb, weil sich bereits ganze Forscherteams an Informatik-Fakultäten seit Monaten die Zähne daran ausbeißen – und das Geld immer noch da liegt wo es ist. Nein, für Freelenz ist das Ganze eine Art Gelegenheit zum Abreagieren an Hard- und Software. Ein Ausreizen der technischen Möglichkeiten, um ein besseres Gefühl für die Leistungsfähigkeit von Algorithmen, Programmiersprachen und Datenbanksystemen zu bekommen. Weiter nichts. Naja, fast nichts. Die Hoffnung stirbt zuletzt. Vorher erwischt es vermutlich meinen 2.4-GHz-Prozessor.

0 comments | Leave a comment

Google’s Pagerank und die Mathematik

— June 19, 2007 —

Das Smashing Magazine hat neuerdings einen Haufen Informationen zu Google’s PageRank Algorithmus zusammengetragen. Wie die Suchmaschine im Detail herumwerkt, ist und bleibt natürlich Betriebsgeheimnis, allerdings geben die gesammelten Artikel einen recht profunden und interessanten Einblick in deren Arbeitsweise.

Vorausgesetzt, man lässt sich nicht von staubtrock’ner Mathematik abschrecken. ;-)

0 comments | Leave a comment

Collaborative Filtering

— March 15, 2007 —

Im Auftrag von Lovely Systems lese ich mich grad in die Materie Collaborative Filtering ein. Noch nie etwas davon gehört? Vielleicht läuten beim Begriff Recommendation Systems ein paar Glocken. Auch nicht? Na dann tönt bestimmt zumindest dieser Satz einigermaßen vertraut: “Kunden, die diesen Artikel angesehen haben, haben auch schon von folgenden Produkten geträumt.” Oder so ähnlich.

Es geht also darum, Vorhersagen über Uservorlieben zu treffen, aufgrund der Vorlieben von anderen, ähnlichen Usern. Doch wann sind sich User ähnlich? Und vor allem: Wie ähnlich sind sie sich? Kann man diese Ähnlichkeit in einer Zahl ausdrücken? Vielleicht auf einer Skala von 1 bis 100? Zwei Dinge braucht man dazu. Einen Haufen Daten und eine Hand voll Mathematik. Es gibt übrigens auch ein, zwei Bücher zu dem Thema.

Bei Amazon gestaltet sich die Sache noch einigermaßen einfach. Gekauft oder nicht gekauft. Das ist hier die (einzig relevante) Frage. Was aber, wenn man solche eindeutigen Anhaltspunkte nicht hat? Wenn Objekte nicht gekauft, sondern nur bewertet, verschlagwortet (also mit Tags versehen) oder frei kommentiert werden? Wie zum Beispiel bei Lovely Books. Dann wird’s etwas kniffliger.

Dass es nicht ganz ohne ist, solche Algorithmen effizient und vor allem exakt hinzubekommen, beweist dieser Wettbewerb: $1.000.000 Preisgeld für denjenigen, dem es gelingt, die Treffsicherheit des CF-Systems von Netflix (amerikanischer DVD-Verleiher) um 10 % zu steigern. Nachdem sich aber bereits einige Teams die Zähne daran ausgebissen haben, könnte man vielleicht ebensogut versuchen, die Goldbachsche Vermutung zu beweisen.

1 comment | Leave a comment

Categories

RSS Feed

Twitter

Picked up somewhere...

We ♥ Icons — probably the most beautiful freeware icons I’ve ever come across.

Pushup aims at getting rid of old browser. Once and for all. Thanks for the hint, designchuchi, who is pushing too, among 316 others.

Did not waste a single millimeter of the browser window: Photographer Anders Bergh from Denmark.

And I thought, Flash was long dead. Well, not yet!

It should have been my idea: One form, many submissions. Indeed, that’s a good 5-dollar-investment into the better website.

Catched a photography-virus on purpose. It’s all Daniel’s fault.

The next President of the United States.

WP’s next admin-interface looks quite promising again.

Let me guess: Google is going to buy this one soon und all people would consider it Adobe’s coffin nail.

SQL Buddy — looks like a handsome and pretty alternative for phpMyAdmin. Haven’t tried it yet.

To all illustrators out there: See what you can do with 960 hours of freetime.

It’s like Starbucks for web backgrounds: Mix your own individual pattern with Tiled backgrounds designer.

“More Photoshop brushes than you’ll ever need.” Could be true.

Pattern Tap, a very nice collection of design elements.

Just in case someone could use a little inspiration for office equipment…

Country logos conglomeration. The cool (Brasil) as well as the ugly (Trinidad & Tobago).

Chris Vincent provides a very good insight into PHP performance through benchmarks.

ICONlook — a search engine for icons. Most of them are under GNU Lesser General Public Licence.

Nettes Flashteil von Andrew Berg, um mal eben ein paar Fotos zum Durchblättern online zu stellen.

Muss wohl ein eingefleischter HTML-Programmierer sein…

Zeigt her eure Füße auf dem Smashing Magazine. Footers In Modern Web Design: Creative Examples and Ideas. Ich würd’s wohl nicht hier erwähnen, wenn nicht Freelenz sich unter den ausgestellten Beispielen befände. ;-)

DevKick sammelt nützliche Javascript-Komponenten. Da ist wohl für jeden Webentwickler etwas dabei.

Google bringt nun eine offene Schnittstelle für Datenvisualisierungen heraus, wie man sie teilweise bereits aus Google Analytics kennt.

Estudio Mopa – der Gipfel des Farbenfrohsinns. Aber echt beeindruckende Illustrationen.

Prototype + Coverflow = Protoflow

i love typography

Ein Musikvideo aus Uruguay, das das Typographenherz höher schlagen lässt

Als zeitweiser Geographie-Student habe ich ja irgendwie eine Schwäche für gut gemachte Visualisierungen geographischer Daten. Diesmal fündig geworden bei NYTE (New Yor Talk Exchange).

So will ich auch fotografieren können!

LAB – eine Handvoll wirklicher cooler Effekte mit Flash und Mathieu Badimon

Internet Love Song :-)

Matchbox labels from around the world from the 1950s and 60s

yooxdoo – ein GUI Toolkit der Sonderklasse. Muss ich mir bei Gelegenheit mal näher ansehen. Komplett open-source, by the way.

Icons Speed Drawing – Marilyn Monroe, Elvis, Terminator oder Sherlock Holmes im Zeitraffer entstehen sehen.

Praktisches Webtool zum Austesten von Regulären Ausdrücken. Gefunden bei Ajaxian.

Darüber spricht die Welt. Großartige Nachrichtenvisualisierung mittels Flash.

Er hängt wieder, der Adventkalender für Webentwickler. Jeden Tag ein neues Artikelchen über ein spannendes Webthema.

Zur rechten Zeit am rechten Ort… auf den Auslöser gedrückt.

Prototype + Tooltip = Prototip

Was schaut aus wie ein iPod-Dock, ist aber keines? USB Disk Dock. So wird Ihre Festplatte zum USB-Stick.

Thomas Fuchs kündigt script.aculo.us 1.8 an.

Ein gewisser Chris Harrison hat ein paar nette Schwarz-Weiß-Grafiken erstellt, die sehr schön veranschaulichen, wie es mit der weltweiten Internet-Vernetzung bestellt ist. Mit anderen Worten: in Nordamerika und Europa spielt die Musik. Auch als High-Resolution-PNGs zu haben.

WordPress in Version 2.3 erschienen. Jetzt mit mehr Features, weniger Fehlern und sogar einem Tagging-System in der Standardausführung. Darauf hat man lange gewartet.

Prototype + Context Menu = Proto.Menu

Posterdesign vom Feinsten.

Nur noch 4x schlafen, bis das Mobile Web Book herauskommt. Vorerst allerdings nur als PDF.

Ein Meisterstück von einem Lehrfilm (besser gesagt: einer Lehranimation) über Farbwirkung und -wahrnehmung. Witzig, spritzig, didaktisch wertvoll. Von Claudia CortÃ©s. Gefunden bei Manuela Hoffmann, pixelgraphix. Sofort ansehen! Lautsprecher einschalten nicht vergessen.

Warum ist der Himmel blau, das gelbe Trikot gelb und der Ferrari rot? Solche und ähnliche Fragen beantworten die Colour Lovers in ihrer Serie “The Great Color Legends” I und II.

Wer (ebenso wie ich) gerade Visitenkarten entwirft und dabei nach Inspiration sucht, der sei hierauf verwiesen.

Type the Sky – oder: Hans Guck-in-die-Luft betätigt sich als Typograph

Color Inspiration from the Masters of Painting.

Bereits 60 Prozent der österreichischen Haushalte haben einen Internet-Anschluss. Go, Austria, go!

Print & Pattern Photos

FreelanceSwitch – Material für meinesgleichen: Tipps, Ratschläge und Diskussionen für Freelancer aller Art.

Nochmal Screendesign in Hülle und Fülle: Screenfluent

“Alles über die schönsten Zeichen der Welt …”, weiß piktogramme-und-icons.de zu vermitteln.

Glanzvolles Screendesign aus – der Ukraine! Wer hätte das gedacht. 73dpi

Lange darauf gewartet, ist der kostenlose FontExplorer X von Linotype jetzt auch für PC-ler zu haben.

Einmal Streifenmuster zum Mitnehmen? Stripe Generator 2.0

Wer Typo3, Joomla & Co satt hat aber keine Alternative weiß, sollte vielleicht mal mit ExpressionEngine liebäugeln.

Das nenne ich ein schmuckes Content-Management-System. Beinahe schöner als die Website selber.

Vorschau auf die neuen Schriften im Schlepptau von Windows Vista. Hallo Calibri, Cambria, Candara, Consolas, Constantia und Corbel. Auf Wiedersehen Arial, Times New Roman, Verdana, …

Baseline Selects 97-07 – A Decade of Design by Daniel Ethan Benderly.

“Don’t break the rules, just add a twist”, spricht swfIR, und verpasst Bildern hübsche Schatten, runde Ecken und sogar Drehungen on-the-fly. Javascript und Flash machen’s möglich.

Die Welt in neuem Gewand. Hier gibt’s gleich einen ~~Verriss~~ Kommentar dazu von Gerrit van Aaken auf praegnanz.de.