SEO Mythos Keyword Density

  •  

Die “Keyword Density” (deutsch: Suchbegriff-Dichte oder Schlüsselwort-Dichte) ist einfach zu verstehen, leicht zu berechnen und simpel in der Analyse.

Ich begehe heute mal digitalen Selbstmord, indem ich ganz platt sage: Wer mit dem Faktor “Keyword Density” arbeitet, hat SEO nicht verstanden. Danke für Deine Aufmerksamkeit. :-)

Killing Keyword Density

Raus aus den Kinderschuhen

Es vergeht kaum ein Tag, an dem ich nicht über irgend eine Aussage bezüglich der “optimalen Keyword-Dichte für Webseiten” stolpere. Manche schwören auf einen Wert zwischen 3% und 5%. Andere sind sich sicher, dass ab einer Schlüsselwort-Dichte von 7% Google die Suchmaschinen die Seite als Spam abstrafen. Wieder andere sind mutiger und behaupten, dass eine Keyword-Dichte bis 12% vollkommen in Ordnung sei. Hm. Schauen wir uns mal die Mathematik dahinter an.

Die vereinfachte Berechnung der Keyword Density sieht so aus:

Keyword Density ist Bullshit.
Keyword Density » Berechnung

Mit Hilfe dieser Formel kann die Keyword Density eines gegebenen Dokuments berechnet werden: kd steht für die Keyword Density. Die Keyword Density wird als Quotienten aus der Termfrequenz tf und der Termanzahl l berechnet. Die Termfrequenz tf(u,v) gibt an, wie oft der Term u im gegebenen Dokument v vorkommt. Die Termanzahl l(u) gibt an, wieviele Terme insgesamt im Dokument v vorkommen.

Das ist schön einfach … und aus mathematischer Sicht schlicht unnütz. Abgesehen davon sähe die sauberste Lösung eigentlich so aus:

Keyword Density » Erweiterte Berechnung

Die Erweiterung der Berechnung ist dem Umstand geschuldet, dass die Anzahl der Einzelterme innerhalb des zu analysierenden Term größer als “1″ werden kann (z.B. bei einer zwei- oder drei-Wort-Kombination). In diesem Fall würde die Gesamtanzahl der zu analysierenden Terme im Dokument verfälscht werden.

Das Gute ist: Selbst diese (genauere) Berechnung ist genauso unbrauchbar. ;-)

Für die Mümümüs unter meinen Lesern: Nur ein einziges Signal

Dieser Artikel behandelt nur ein einziges Signal, welches mit hoher Wahrscheinlichkeit einen relevanten Ranking-Faktor in Suchmaschinen darstellt. Für eine umfassende Betrachtung einer Website sind selbstverständlich viele unterschiedliche Signale für die Bewertung zu betrachten. Sodele, jetzt zurück zum roten Faden.

Für die Praxis: Wir brauchen einfache Werte

“Bitte erstellen Sie einen Text zum Keyword ‘Risikolebensversicherung Vorteile’ mit einem Umfang von 300 Worten und einer Keyword-Density von 3%.”

So und ähnlich lauten die Textaufträge, die täglich auf Textbroking-Plattformen vergeben werden. Ein versierter Texter weiss nun sofort, was zu tun ist: Er erstellt einen Text mit 300 Worten und führt neun mal den Term “Risikolebensversicherung Vorteile” auf.

Prompt stellen sich Fragen wie:

  • Wenn das Dokument aus 300 Wörtern besteht, kommt das Schlüsselwort 9 mal darin vor. Aber: Mit welcher Keyword-Density kommen andere Terme im Dokument vor?
  • Je nach Verfahren zählen die Schlüsselwörter im Titel und der Description mit – oder auch nicht. Erfährt die Keyword Density im Title eine andere Gewichtung als im Text? Wird zwischen Überschriften und Fließtext differenziert?
  • Schlüsselwort-Kombinationen, die nicht unmittelbar aufeinander folgen, werden nicht mit berücksichtigt. Unterstützt mein Keyword Density Algorithmus Methoden um Proximity / Anti-Proximity der Terme zu berücksichtigen?
  • und so weiter …

Damit macht eine Aussage zur Keyword Density über das Resultat, welches in der Datenbank der Suchmaschine landet, definitiv keinen Sinn mehr. Doch es gibt auch noch eine simple mathematische Beweisführung:

Die Keyword-Density ist rein mathematisch ein irrelevanter Wert

Jens Fauldrath steuerte in den Kommentaren bereits einen lesenswerten Link dazu bei: “Das Cosinus-Maß im Information Retrieval“. Ich habe gemeinsam mit Jana Engelmann die mathematische Herleitung in diesem kleinen Ebook aufgeführt, damit es nachvollziehbarer wird:

Fuck keyword density
Kill keyword density

Download: Ebook “Kill Keyword Density” (2012 Karl Kratz / Jana Engelmann). Für die Lektüre kann ein wenig Know-How zum Thema Vektorrechnung nicht schaden. ;-)

“Des hemmer scho emmer so gmacht.”

“Soll der Kratz doch schreiben, was er will. Wegen diesem Online-Kasper werden wir unsere Tools, Oberflächen und Algorithmen nicht ändern.”

Wer so drauf ist, sollte wenigstens noch diesen Absatz hier lesen. Und dann nochmals nachdenken, ob er sein Investitionsverhalten für die Zukunft nicht doch überdenken möchte …


Hier geht es weiter ...

Der Artikel Termgewichtung w = WDF * IDF ist deutlich intensiver, als der Rest dieses Artikels. Bitte lies dort weiter, danke :-)

 


Juchu – mit WDF*IDF wird die Onpage-Suchmaschinenoptimierung doch zum Kinderspiel!

Die Aufgabe wäre also relativ einfach:

  1. Analysiere eine ausreichende Menge an Mitbewerber-Websites hinsichtlich des oberen Grenzwerte für die WDF*IDF-Faktoren der wichtigsten Terme.
  2. Erstelle daraus die Vorgaben für die Texte des jeweiligen Internet Angebots
  3. Nimm die Texte, setze die restlichen 70 Onpage-Faktoren um und …

… Tadaaaa, fertig!

Naja, so leicht ist es leider nicht – immerhin haben Suchmaschinen in den letzten Jahren einiges an “Erfahrung” gewonnen und in die Algorithmen implementiert. Das bedeutet, dass nun die Arbeit eigentlich erst richtig losgeht. Folgende Parameter möchten ebenfalls analysiert, ausgewertet und angewandt werden:

  • Schlüsselwort-Abstand (Proximity und Anti-Proximity)
  • Schlüsselwort-Verteilung innerhalb des Dokuments
  • Häufung des Schlüsselworts in besonderen Bereichen
  • Einsatz des Schlüsselworts in SEO-relevanten Bereichen wie Title-Tag, Description, Überschriften, Fettschrift, Listen, Bilder, Fliesstext und Links
  • Einsatz artverwandter Schlüsselwörter zur “Festigung” des Textes mit Blick auf die personalisierte Suche

Übrigens: Über die hier beschriebenen Methoden lässt sich trefflich streiten – das ist ein wenig so, als ob jemand eine technische Chartanalyse als Grundlage für seine nächste Investitionsentscheidung in Aktien trifft. Grauenhaft, nicht? 50% der Leser wiederum finden diese Methode gut … Aber am allerwichtigsten: Gute Inhalte für Benutzer schreiben, nicht für Suchmaschinen, gell? ;-)

Ich wünsche Dir eine wilde Zeit,

Karl

Weiterführende Links:

  • Keyword Extraction from a Single Document using Word Co-occurrence Statistical Information http://goo.gl/cn5f (nicht mehr vorhanden)
  • Term Frequency – Inverse Document Frequency http://goo.gl/QcGn

Noch mehr Lesestoff zu "Digitale Findbarkeit"

  •