Gestern hat Google ein neues Patent zur Erkennung von Linkspam angemeldet.
Method for detecting link spam in hyperlinked databases
In dem Patent werden algorithmische Methoden zum Auffinden von Linkspam – genauer Linkfarmen und Linknetzwerken – beschrieben.
Linkfarmen sind Webseiten, auf die viele, eigens für diesen Zweck erstellte, kleine Seiten linken. Diese Seiten haben selber meist kaum eigene Backlinks und wenn dann meist nur unbedeutende. Während normale Seiten in der Regel auch den ein oder anderen hochwertigen Link haben, wodurch sie sich von Linkfarmen unterscheiden.
Ein Linknetzwerk ist ein Verbund von Webseiten, welche sich hauptsächlich untereinander verlinken. Zum Beispiel über Kreuz, um reziprokes Verlinken zu vermeiden. Diese Seiten Linken, je nach Größe, meist nicht sehr oft auf Seiten außerhalb des Netzwerkes. Und versuchen so eine Hauptseite zur Autorität bei einem Thema zu machen.
Google Patent beschreibt wie diese Art von Linkspam erkannt werden kann. Die so erkannten Spamseiten können dann einer genaueren Prüfung unterzogen werden. Sollte sich der errechnete Verdacht, dass es sich bei den Seiten um einen Versuch handelt die Google-Suchergebnisse zu manipulieren bestätigen. Dann können die Links der Seiten ganz oder teilweise entwertet werden.
In dem Patent wird sehr ausführlich auf die Methoden und Mathematik zur maschinellen Erkennung von Spam eingegangen. Wer sich damit etwas tiefergehend beschäftigen möchte, sollte sich den Patenttext selbst einmal durchlesen.
Method for detecting link spam in hyperlinked databases










Das hört sich ja wirklich interessant an. Dass Google so was kann, ist ja schon lange klar. Vielleicht gibt es dann auch eine neue “Währung”, den SpamRank oder so *lol*.
Im Ernst, wäre cool, wenn wir “normalos” auf so was auch Zugriff hätten und damit die Seiten, die wir verlinken sortieren können. Wer hat schon Lust sich in ein solches Netzwerk zu verirren…
Hi Crazy Girl. Irgendwie hat Akismet deinen Kommentar geschluckt.
Wann, wie und wo Seiten so getestet und dann evtl. entwertet werden weiß wohl nur Google. Wobei man dort wohl im Moment immer mehr dazu übergeht zu zählen wie viele Klickts eine Seite von einer “trusted Domain” entfernt ist. Und das dann recht stark einfließen lässt.
Akismet macht das in letzter Zeit mit mir :-( Ich kann nur vertrauen, dass die Blogger mich immer wieder aus ihrem Spam fischen, denn egal was ich mit oder ohne Akismet Unterstützung veranstalte, ich lande immer wieder daran.
Entweder mag mich einer einfach nicht oder Akismet hat Probleme, die sie nicht in den Griff bekommen.
Ist schon nett was Google alles so veranstaltet :-)
Wie kann man das bitte patentieren lassen? Ich kann mir gut vorstellen, dass yahoo und co auch bald solche ideen haben?
Das ist eine gute Frage Reiko. Ich kenne mich allerdings leider garnicht im (amerekanischen) Patentrecht aus.