seomoz LDA deconstructed

Seit einigen Tagen schmeisst Rand Fishkin von SeoMoz immer wieder mit dem geheimnisvollen Begriff LDA um sich. Er redet von LDA, Topics, Relevanz und Modelling und schmeisst mit wilden Formeln um sich, natürlich nur um einen entsprechenden Spannungsbogen aufzubauen und das dazugehörige neue LDA Tool zu promoten. Doch werfen wir erst einmal einen Blick auf die Formel:

Damit ist für den Fachmann die Sache klar. Insbesondere wenn man zwischendurch einen Blick auf die Toolseite geworfen und sich die wichtigsten Begriffe wie probability, cosine, relevance und likelihood reingezogen hat. Zum Schluss dann noch der entscheidende Satz, der einen Hinweis auf die Kosinus Transformation der Dokumenten Wahrscheinlichkeit gibt:

Cosine relevance will compute the cosine between the vectors of the topics for the document and google search results for the query.

Um auch den weniger bedarften Seos unter unseren Lesern eine Chance zum Verstehen der obigen Formel und des LDA Prinzips zu geben, haben wir unseren Didaktik-Experten Adam Riesling aus Weinheim gebeten, die Sachlage mit einfachen Worten möglichst anschaulich zu erklären. Es geht los:

Ein kurzer Blick auf die obige Formel lässt sofort die Zusammenhänge erkennen. Das Skalarprodukt der bedingten Wahrscheinlichkeiten multipliziert mit dem Kosinus der Korrelationsquotienten und dividiert durch den Erwartungswert des Vektorproduktes der einzelnen Query-Keywörter mit den Links, ergibt den jetzt gar nicht mehr so geheimnisvollen LDA-Faktor. Wenn wir jetzt noch das englische Zitat ins Deutsche übersetzen und entsprechend der gerade gemachten Erkenntnisse einordnen, dabei erkennen dass cosine die Übersetzung von Kosinus, also der schon seit der Sekundarstufe bekannten Winkelfunktion, bedeutet, dann sind wir schon ganz nah dran an der großen Erkenntnis. Nicht wahr?

So langsam müsste auch beim letzten Leser der Groschen gefallen sein. Besonders wegen dem Kosinus. Ist doch klar, die Sache muss was mit dem Winkel zu tun haben. Hier und jetzt also die Erklärung: Mit der Formel wird der Winkel zwischen dem Keywort und dem Dokument in Verbindung mit der Suchanfrage errechnet. Für diesen Text hier und das Keywort LDA bedeutet das zum Beispiel einen Winkel von 3,14159265358979323 Grad.

Wir geben zu, wir haben es künstlich spannend gemacht, hätten wir euch von vornherein verraten dass LDA das Akronym zu Link Document Angle ist, dann hätte ein Blick auf die Formel ja sofort alles aufgeklärt. So blieb für einige Leser noch ein bisschen Rätselspass übrig.

3 Gedanken zu “seomoz LDA deconstructed”

  1. liebe cleo, das mache ich doch gerne. wobei die 5 wodka wahrscheinlich noch zu wenig sind um meinen gedankengängen folgen zu können.

Schreibe einen Kommentar