bloggen » 05/2006
punktpunktblog
Kommentarspammern den Garaus machen
Der Eine oder Andere mag es vielleicht bemerkt haben, seit gut einer Woche haben es die üblen Kommentarspammer auf mich abgesehen. Zwar konnte ich den meisten Spam mit SQL-Statements wie zum Beispiel "DELETE FROM blog_comments WHERE id > 381 AND id < 502" relativ schnell beseitigen, trotzdem war es mir am Dienstag dann zu blöd, als wieder etwa 153 Spamkommentare abgesetzt worden waren.
Also hab ich mir ein auf simplen Textvergleichen und mit ein wenig regulären Ausdrücken angereicherten Spam-Filter geschrieben. Falls ich damit jemanden aus Versehen fälschlich wie einen Spammer behandeln sollte merkt derjenige es daran, daß er, falls er eine Homepage angegeben hat, kommentarlos an eben diese weitergeleitet wird. Falls er keine angegeben hat wird er, gemäß Clynxens Vorschlag, auf FBI Cyber Operations weitergeleitet.
Seit mein Filter nun ab dem 09.05.2006 um 18:19:22 aktiv ist hat er 4228 Spamkommentare erkannt und etwa 50 wurden nicht erkannt, was jedoch vor allem daran liegt, daß ich bis vor einigen Tagen nur ungern einfach nur Domainnamen als Muster vorgeben wollte, doch inzwischen habe ich eine Reihe von Domainnamen, die mit ziemlicher Sicherheit kein Nicht-Spammer in einem Kommentar erwähnen oder als Homepage angeben würde. Außerdem konnte ich auch zwei typische Domain- bzw. Dateinamenmuster mittels regulären Ausdrücken festlegen, so daß ich hoffe mir jetzt mal mehr als einen Tag ohne Filterregel-Update zuverlässig die Spammer vom Hals halten zu können. Und seit zwei bis drei Tagen klappt das nun auch ganz gut. Zwischenzeitlich waren sie zwar auf andere Produktgruppen umgestiegen, doch glücklicherweise matchen trotzdem noch einige meiner Muster, inzwischen sind sie wieder bei dem "üblichem Kram" angekommen, wobei ich gerade eben nochmal geschaut hab und sie nun wieder bei ganz anderem Kram sind ... naja, ist ja auch egal.
Jeena, ein Leidensgenosse, hat eine Spamfilter-Lösung für
Jlog gebaut, die so einfach ist, daß ich kaum glauben kann, daß sie funktioniert, er hat die Lösung von
Christian, und der hat sie irgendwann irgendwo gelesen und ins
Block implementiert und sie scheint zuverlässig zu funktionieren.
Nun, bei mir scheint die Gefahr auch erstmal gebannt.
Aktuelles .. linken .. kommentieren (3) .. von Götz Bürkle am 16.05.2006 um 18:27:45 Uhr
Wofür gibts Suchmaschinen? ;)
Aber hallo Michael,
ich hab mir schon überlegt sowas einzubauen, nur wie auch bisher für meinen geplanten Cache und die Komprimierung zu faul oder anderweitig zu viel beschäftigt.
Ich hab aber bisher mit
Google immer alles gefunden, was ich bei mir gesucht habe.
Du suchtest den Namensverbreitungskartengenerierungsdienst mit Namen Geogen.
Und mit dem Spamfilter hast Du natürlich kein Problem, denn die Quiztante ist mir als spammer bislang nciht aufgefallen ;)
dolle Suchmaschine!
Das ist ja eine wirklich dolle Suchmaschine, die du da empfehlen tust Goetz! Die werde ich mir wohl merken müssen ;))))))))))))
Und was Kommentar-Spam angeht, suche ich auch noch eine wirksame Methode. Bei mir kommt das auch immer öfter vor, weshalb (sehr sehr ungern) ich das Forum anmeldepflichtig machen musste. Das stellt sich die Frage, ob man mit einem verbreiteten Foren-Skript wie phpbb nicht besonders im Fadenkreuz steht. Ich frage mich, wie die sich da an den captchas vorbeimogeln. Sie versuchen es gar mit dem Eintragen als User. Nur um eine ihrer Adressen zu spammen.
Ich konnte bisher auch noch keine Patches finden, die phpbb da etwas sicherer machen.
.. geschrieben von michael .. www .. am 23.05.2006 um 18:56:17
.. kommentieren
(Die rot bzw. mit * markierten Felder müssen ausgefüllt werden.)
SELFer
SELFHTML aktuell Weblog
Jeena Paradies
_Das kleine Seitenschwein
eingebeckert
Top Fives
DECAF°blog - Coffee Benefit
xwolf
- Jan
CK kennt Wayne
Henryk
Ministry of Propaganda
Snowone kennt Wayne
- Benjamin Wilfing
Siechfreds Tagebuch
Stonie kennt Wayne!
- Patrick Canterino
- subLog
- Javascript Blog
kubik
- Pfaffe 3000
- BLOGschokolade
[depone]
schleudergefahr
werkstück
Journeyfiles
- A_Travers_Champ
- kwerfeldein
- kristovs blog
- lebensatem
tautoko ::
bensonofone
- tabea und benjamin
Warnschild
STREUliCHT
text* tan_go
- denk pause
child's play
Madarúsia
- cogitate flubdub
- diesen blok gibt es nich
ich lese:
WorldWideKlein
- bluelectric.de
London Leben
Medienrauschen
praegnanz.de
Tageslosung
- Bibelblog (offline)
ePredigt
- Andacht "Leben ist mehr"
mist!
Mist! Jetzt suche ich gerade wieder den Link zu dieser geo - gen (oder so?) Seite und stelle fest, dass ich all dein Geschreibse gar nicht durchsuchen kann. .-> Feature-Wunsch
... wenn man nich alles bei mister-wong.de ablegt!
http://www.mister-wong.de/user/Quiztante/
hoffentlich falle ich jetzt nicht durch den Spam-Filter ;)
.. geschrieben von michael .. www .. am 21.05.2006 um 23:00:50