mei 7 2008

Vals positief

Deze blog wordt tegen commentspam beschermd door Akismet, een uitstekend systeem dat 98% of zo van de spam weet tegen te houden voor hij hier in de reacties zou belanden.
Heel wat (WordPress)-bloggers gebruiken dit systeem, tot tevredenheid van velen (de bloggers en hun lezers) en ontevredenheid van enkelen (spammers op zoek naar inbound links en Google Pagerank).

Het werkt ongeveer als volgt:

  • een comment, of een trackback als je die op je blog toelaat, die binnenkomt op je blog wordt eerst naar de Akismet-service gestuurd, en daar vergeleken met een database van spam-comments. Er wordt vergeleken op auteur, website van de reageerder, en uiteraard ook op de tekst van de comment en de dikwijls vele weblinks daarin
  • flagt Akismet de comment of trackback niet als spam, komt hij in je gewone comment-werkwijze (in mijn geval: dan vertrekt er een mailtje naar mij zodat ik de comment kan goed- of afkeuren). Als je een reactie die zo door de Akismet-filter is geraakt dan zelf toch als spam aanduidt, krijgt Akismet daar bericht van, zodat het kan leren dat de kenmerken van die reactie wl spam waren.
  • gaat er bij Akismet wel een rood lichtje branden, dan belandt de reactie in een aparte spamlijst. Af en toe kan je die dan eens checken of er per toeval geen legitieme comment in is terechtgekomen. Als je een comment uit die lijst redt, krijgt Akismet daar bericht van, zodat het kan leren dat de kenmerken van die comment gn spam waren.

Spammer, moi?

Prima werkwijze.
Dacht ik. Tot ik een maand of zo geleden begon te merken dat comments of trackbacks die ik op andermans sites achterliet, niet of soms niet meer verschenen.
Op een of andere manier moeten de kenmerken van mijn comments (mijn email, mijn website-adres, of een link naar mijn blog in een reactie), in de Akismet-database beland zijn. Hoe? Moeilijk precies te weten. Misschien een paar bloggers die een comment van mij wilden verwijderen, en dit deden door die als spam aan te duiden? Of een echte spammer die mijn e-mail of url in zijn reacties gebruikte?
En bijna niemand checkt de spamlijst nog op “valse positieven”, want anders zou Akismet na een tijdje wel geleerd hebben dat mijn comments en trackbacks wel legitiem waren.

Veel last had ik er niet van, maar links en rechts werd ik er toch op gewezen. Dan maar eens opgezocht hoe je uit die Akismet-spamlijst zou kunnen verdwijnen.

Het komt precies wel meer voor, want ze beschermen er hun eigen comment-form expliciet niet met hun eigen service. Twee dagen geleden liet ik er een berichtje achter:

People report me my comments end up in their akismet-powered spam box
lately. Sniff!

Een dag later inderdaad een proper berichtje. Van een mens:

Hi, Sorry! Your comments should now be good but any problems do send us emails. Mark.

En mirakel, mirakel, Markske heeft gedelivered. Het werkt terug.

Ik besta terug op andermans blogs… Niet langer verdwijnen mijn wijze woorden in de mist der spamvergetelheid. Niet langer zitten medebloggers wegkwijnend te smachten naar eens een woordje van mijn kant in hun reageerpanelen.
Zie maar bij Bruno (over het lezen van papier versus op het internet), of Huug (over BHV), of Kerygma (over fietsen in de stad), of Gentblogt (over Peter en de Wolf), of e-Mino (over gradaties in het kwaad), of Onnozelheid Mag (over speculaaspasta), of Imke (over stopwoorden)… Het vlaamse blogheir haalt duidelijk hoorbaar opgelucht adem! Koele champagne wordt bovengehaald. Toasts uitgebracht. Deze valse positieve is nu dus weer gewoon negatief!

4 reacties tot nu toe. Reageer zelf...

Zo zielig! Welkom terug 🙂

Comment by bruno — 8 mei 2008 #

Eindelijk! Hoera! Welkom trug, o-gij negatieve ex-vals positieve.

Comment by Huug — 8 mei 2008 #

Als je heel veel spam-comments krijgt, wordt het inderdaad erg lastig om je hele Akismet-spamfolder op vals positieven te doorzoeken.
Om die reden heb ik een tijdje geleden de Defensio-plugin genstalleerd en Akismet gedeactiveerd.

Defensio werkt vergelijkbaar, maar er zijn een paar verschillen:
In de eerste plaats (en dat vind ik het belangrijkste) geeft Defensio aan gefilterde comments een spamminess-score. Als Defensio echt zeker is dat het om spam gaat, is die score (natuurlijk) 100%, anders is ze lager.
In je spam-folder staan de comments met de laagste spamminess-score bovenaan. Het volstaat eigenlijk om de comments met een score lager dan 70% even te overlopen, en vervolgens alles weg te gooien. De kans dat je dan iets mist is vrijwel nihil.

Een tweede verschil met Akismet, is dat Defensio een ‘gepersonaliseerd’ spam-profiel gaat aanmaken.
Stel bijvoorbeeld, dat iemand een blogje heeft waarin hij het verloop van de behandeling van zijn depressie beschrijft, en daarin ook regelmatig refereert naar de medicijnen die hij gebruikt.
Ook in de commentaren zullen die woorden dan vaak opduiken. Maar in plaats van die commentaren als spam te blijven markeren, zal defensio op den duur in de gaten krijgen dat voor die ene specifieke blog commentaren met de naam van een aantal anti-depressiva NIET perse als spam moeten worden beschouwd.

Op dit moment heeft Defensio op mijn blog een acuratesse van 99.8% en dat vind ik heel mooi. (maar ik blijf dus wel altijd controleren of er geen vals positieven inzitten…)

Comment by AnneTanne — 8 mei 2008 #

Lang leve Mollom 😉

Het mooie van Mollom is dat de Turing check gericht wordt aan de reageurder (CAPTCHA) ipv naar de beheerder (moderation queue)

In principe zou slechts een absoluut minieme hoeveelheid onzekere spam terecht mogen komen in de moderation queue van de site.

Anyways, welkom terug 🙂

Comment by Matthias — 14 mei 2008 #

Jouw reactie

XHTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>


En nu?

En, voor u het vergeet, steek zeker mijn mijn RSS in uw favoriete feedreader. Je kan je ook abonneren op updates via e-mail, facebook, twitter...