Facebook
Twitter
Google+
Kommentare
0

PageRank für Community Ratings nutzen – Teil 2

Im zweiten Teil der Serie nehmen wir uns mal das Datenmodell vor.
Zuerst brauchen wir einen Nutzer, der durch einen Knoten im Graph dargestellt wird. Dieser Nutzer erhält die Eigenschaften „id“, welche in den Lucene Index von Neo4J übertragen wird, und einen PageRank. Vom Nutzer selbst gehen bis zu zwei verschiedene Kantentypen ab. Die „RATE_SUBJECT“ Kante und die „RATE_USER“ Kante. Beide werden mit der Eigenschaft „value“ versehen. Daraus schließt sich schon die erste eingehende Kante, denn der User kann ebenfalls bewertet werden (in Form eines RATE_USER). Die RATE_USER Kante bekommt zusätzlich noch eine Eigenschaft, die einen Bezug zur Bewerteten Bewertung darstellt. Diese ist für unsere Berechnung nicht direkt relevant, lässt sich aber für Visualisierungszwecke gut nutzen. Die RATES_SUBJECT Kante bekommt die subject id aus dem selben Grund verpasst. Man könnte das Subject noch als Cluster Kriterium für den PageRank einsetzen, was aber die Komplexität deutlich steigern würde. Hinzu kommt ein Knoten für das zu bewertende Subject. Dieser bekommt auch die Eigenschaft „id“ und einen aus dem Grahen errechneten Faktor, der in das Ranking der Suche einfließt. Aktuell evaluiere ich die Menge der Nodes, die bei einem Vollimport aller Ratings seit 2008 entstehen würden. 500.000 and counting. Es bleibt zu evaluieren, ob Neo4J sich bei diesen Mengen noch als praktikabel erweist…

Permalink

| Leave a comment  »

Über den Autor

Mario Müller

Link erfolgreich vorgeschlagen.

Vielen Dank, dass du einen Link vorgeschlagen hast. Wir werden ihn sobald wie möglich prüfen. Schließen