Neue Formel für SEO-Texte: WDF*IDF

Die WDF IDF Formel

Shutterstock “©Julien Tromeur #95466733″

Kaum ein Thema hat sich in den letzten Monaten so rasant verbreitet wie die WDF*IDF-Formel. Die neue Formel soll eine gezielte Optimierung von Texten ermöglichen. Doch während eben genau diese Formel das Herz manch eines SEOs Luftsprünge machen lässt, sorgt sie bei Autoren und Redakteuren für Widerwillen. Es ist alles andere als aussergewöhnlich, dass sich die schreibende Zunft nur ungern mit solch komplexen Formeln auseinandersetzt. Doch wie viel Wahrheit steckt hinter dieser angeblichen Zauberformel? Ist sie mittlerweile wirkliches jenes Must Have, ohne das die Suchmaschinenoptimierung nicht mehr auskommt?

wdf * idf FormelObwohl die WDF*IDF Formel zweifelsohne Diskussionen und Debatten bestimmt hat und durch sie viel Licht ins Dunkel gebracht wurde, gibt es noch immer viele offene Fragen, mit der sich die SEO-Branche derzeit auseinandersetzt. War die Anwendung der WDF*IDF lange Zeit eher schwierig, gibt es mittlerweile Programme, die die Optimierung eines Textes nach dieser Formel einfach machen. Auch wenn der Unmut gegenüber dieser Formel vor allem auf Seiten der Redakteure alles andere als gering ist, lässt sich letzten Endes nicht vollkommen von der Hand weisen, dass sich durch die Anwendung der WDF*IDF Formel vor allem in einigen Bereichen überraschend schnell Erfolge erzielen lassen.

Im Kern geht es bei dieser Formel schlichtweg darum, die Termgewichtung zu berechnen. Obwohl die WDF*IDF so präsent ist wie nie zuvor, darf nicht in Vergessenheit geraten, dass sie nicht neu ist. Ganz im Gegenteil: Im Grunde handelt es sich bei ihr sogar um einen alten Schuh, der jedoch im Kampf um die besten oder auch meisten Backlinks irgendwann verloren gegangen ist. Für Suchmaschinen selbst ist die WDF*IDF schon seit Langem eine wichtige Grundlage und findet nicht nur bei Google und Bing Anwendung, sondern auch Yahoo.

Berechnung der Text DNA

Im letzten Jahr haben sich die Anforderungen, die an Texte im Internet gestellt werden, erheblich erhöht. Reichte es lange Zeit aus, dass Keyword, mit dem Seitenbetreiber möglichst weit vorn in den Suchmaschinen landen wollten, unter Berücksichtigung einer bestimmten Anzahl in den Content einzubauen, bedarf es nun deutlich mehr. Google ist zusehends dazu in der Lage, die Relevanz eines Beitrags zu bewerten. Diese lässt sich mit der WDF*IDF Formel berechnen.

Damit ein Text bei den Suchmaschinen weit vorn landet, ist es ungemein wichtig, dass er auf die Frage, die vom Suchenden gestellt wird, eine Antwort bietet. Dadurch soll er bei den Suchenden in erster Linie Zufriedenheit auslösen. Die WDF*IDF Formel bezieht sich nicht mehr nur auf die Keyworddichte. Für das Ranking einer Webseite wird von Google die gesamte Seite bewertet. Dabei werden sämtliche Keywords mit dem Inhalt der restlichen Seite verglichen. Google versucht dadurch zu ermitteln, ob alles zusammenpasst und sich ein Sinn ergibt. Durch den Term IDF wird bei der WDF*IDF grundsätzlich auch die Umwelt des Textes, also der Inhalt abseits des eigentlichen Beitrags, betrachtet.

Unter WDF muss das Kürzel für „Within-document Frequenzy“ verstanden werden. Hierbei handelt es sich um die dokumentenspezifische Gewichtung. Durch WDF wird ermittelt, wie häufig ein Wort im Verhältnis zu den anderen Wörtern eines Dokuments vorkommt. Das suchende Wort wird mit „i“ gekennzeichnet. Auf das Dokument weist das Kürzel „j“ hin.

Es gibt auch schon einige Tools zum Analysieren der WDF*IDF Formel. Einige stecken aber noch in der Entwicklung. Ein wirklich gutes Tool findet ihr bei http://www.seolyze.com/

Fakten auf einen Blick

Grundsätzlich steigt der WDF-Wert umso häufiger ein bestimmtes Wort oder eine Wortkombination in dem Dokument auftaucht. Die komplette WDF*IDF Formel gestaltet sich folgendermassen:

WDF(i)=\frac{\log_2(mathrm{Freq}(I,j)}{\log_2(L)}

Unter “i” muss das gesuchte Wort verstanden werden. „J“ entspricht dem Dokument, in dem das Wort vorkommt und L bildet wiederum die Gesamtzahl aller Wörter, die dieses Dokument aufweist. Freq(i,j) beschreibt schliesslich die Häufigkeit, in der das Wort i im Rahmen des Dokuments j vorkommt.

Durch den Logarithmus wird die Häufigkeit eines Keywords grundsätzlich gestaucht. Aus diesem Grund wird stets eine höhere Relevanz eines Textes erreicht, wenn das Wort häufiger verwendet wird. Bei der WDF*IDF werden Stoppwörter nicht berücksichtigt. Dazu gehören Wörter wie „und“, „oder“ und „der“. Anhand der WDF*IDF Formel lässt sich für jeden Text eine Kurve erstellen. Durch sie wird wiederum das Ranking der Worte beschrieben. Damit kann anhand der WDF*IDF im Grunde die DNA eines jeden Dokuments ermittelt werden.

Soviel für heute. Nächste Woche bringen wir noch einen Beitrag wie man diese Formel in die Tat umsetzt.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert