.: Rychlé menu: navigace .:. odkazy .:. kategorie .:. vyhledávání .:. archivy .:. autoři :.  

18.11.2003



Jirka Kouba a Jiří Bureš hlásí první případy spamu v komentářích. Co s tím? No, snad by něco bylo...

U článku na conBlogu jsem nastínil jisté řešení (založené na triku známém ze spamfiltrů — určitá slova jsou pro spam typická a vyskytnou-li se, je zvýšeno „spamové ohodnocení” a pokud překročí určitou mez, je text prohlášen za spam). S dalším přišel Rony — nenechávat v komentářích žádné odkazy a všechny řešit přesměrováním na vlastní server.

Ronyho řešení má jednu nevýhodu — sice zamezí očekávanému efektu (zvýšení Google ranku), ale nezabrání těm stupiditám, aby u vás na webu strašily.

Mé řešení je pružnější, ale vyžaduje jistou údržbu — „učení” spamfiltru nebo aktualizaci blacklistu. Navíc může docházet k chybnému označení nezávadného komentáře za spam. Ale dokud se na českých deníčcích budou vyskytovat jen anglické spamy, je ta pravděpodobnost nízká.

Rozhodl jsem se zkusit napsat v PHP nějaký nástroj, který by tyto metody aplikoval, a nabídnout ho k použití. Proto vás prosím — pokud se setkáte na vašem weblogu s tímto případem spamu, pošlete mi report na blogspam zavináč maly tečka cz. Pomůžete tím v boji proti tomuhle svinstvu. Děkuji.

PS: Zatím to vypadá, že jsou postiženi ti bloggeři, kteří používají systém b2. Chci proto své řešení upravit přednostně pro tento systém.


Aktualizace (02:50): Tak už mám napsanou malou knihovnu, která implementuje jednak Ronyho metodu (tedy překódování URL), jednak klasický blacklist. Výsledek její práce můžete vidět tady v komentářích. Samosebou je možné ji použít tak, aby se spamové komentáře rovnou zahodily. Pokud o tu knihovnu máte zájem, napište mi, pošlu ji i se stručným návodem.

Pokud by ji někdo chtěl implementovat do b2, budu jen rád, já bohužel nemám teď čas se s tím systémem seznamovat a zjišťovat co a jak. A myslím, že rádi budou i oba Jirkové. {smile}


Zadal Arthur Dent, 18.11.2003 21:18:21, 32 komentářů...,
TrackBack URL tohoto příspěvku je http://www.maly.cz/tb.php/594

Zpět na článek

HotLinks
Zobrazit komentáře v chronologickém pořadí

B2, MT.. - rony (web)

Prečo hromadne majitelia istého systému?
Autori týchto systémov majú na stránkach rôzne vychytávky v zmysle zbierania blogov, ktoré používajú ich systémy. Ďalej je pomerne jednoduché hodit do Google názvy týchto systémov a vyhľadať si primerane veľké množstvo systémov bežiacich na nich. Ja sa možno vyhýbam tým vlnám, pretože som hlášky o použitom systéme ako paranoik odstránil - to isté robím, keď inštalujem SMTP server, linuxový počítač, Apache.

Moje riešenie je takmer okamžité s minimom námahy. Dopovedal som, že človek má potom viacej času na asanovanie komentárov z blogu a nie je stresovaný neprístojnosťami.

Arthur si zvolil väčšiu výzvu a chce programovať analyzer. Osobne tieto "parsery" nemám moc v láske. Podobne mi pripadá prácne blokovať IP adresy (ak už raz bol u mňa, už sa pravdepodobne nevráti).

Osobne by som na autorov blogovacích CMS naliehal, aby tak upravili svoje stroje, aby sa komentáre dali rýchlo eliminovať - ja v MT mám zoznam posledných komentárov hneď po prihlásení sa, takže po 2 kliknutiach je komentár preč.

Nebudem však zatiaľ nijako komentáre na svojom blogu riešiť - ak sa vyskytnú, hneď ich zmažem - WebSky urobil podľa mňa chybu, že nevymazal aspoň URL adresy.

Riešenie mojim návrhom je rýchlejšie a menej prácne - nikde v texte sa nezobrazí cudzie URL, takže cieľ com-spamera sa nesplní. Chcem pôsobiť aj preventívne - takto nasadený systém budem určite oznamovať textom pri formulári.

Druhá cesta sú skripty cez TrackBack - tu je už nutné spracovávať príchodzie requesty ale nie je to odlišné - každú URL proste prevediem na ID.

Navyše, Arthur, keď máš pekný zoradený zoznam URLiek, tak sa s tým dá predsa dobre čarovať, nie?
    

Re: B2, MT.. - Arthur Dent (web)

Máš pravdu... U toho seznamu URL mi ta knihovna jen tak, mimochodem, počítá i kolikrát byl jaký odkaz uveden a kolikrát na něj někdo kliknul {smile}
    

Re: B2, MT.. - Mirun (web)

Ovšem tím se zlikviduje jedna z věcí, kterou se pagerank pro jednotlivé blogy tvoří. Na jednu stranu je to jedno, protože by zůstaly odkazy, které jsou přímo v článku (čili dle výběru autora), na druhou stranu to blogům v kvantitě odkazů sebere výhodu oproti jiným médiím. Navíc mě třeba prudí to, když mi na pooh někdo hodí do komentářů odkaz kterej musím zkopírovat a hodit do okna. Kliknutí je lepší. Proto bych navrhl místo blacklistu udělat whitelist, seznam např. domén, pro které odkazy projdou a zůstanou v přirozené formě. Ostatní se zkonvertují do Id formy.
    

Re: B2, MT.. - Arthur Dent

To není technicky problém... Spíš je to otázka do diskuse - jsou odkazy v komentářích vždycky ty, které by chtěl autor prezentovat? IMHO pokud ano, tak může udělat aktualizaci článku a přidat je do něj.

A s tím kliknutím - to zůstává, jen je URL nahrazeno třeba tím "[odkaz]". Ale nemusí být, může tam zůstat to původní URL... To záleží na nastavení té knihovny.
    

Re: B2, MT.. - Mirun (web)

No já si třeba u komentářů nad odkazy najíždím. Když vidím někoho URL 2x-3x a komentáře toho dotyčnýho mě připadají zajímavý, jdu se podívat k němu do pokojíčku. Pro mě osobně (netvrdím že to přijde důležitý i ostatním) je URL celkem zajímavá informace.
    

Re: B2, MT.. - Arthur Dent (web)

Dobře. Co třeba takto:

Odkaz na Miruna je [http://www.pooh.cz/aktovka-x/]
    

Re: B2, MT.. - Mirun (web)

Bezva. Akorát ještě jestli by sis to nepřidal jako patičku do každé odesílané pošty {smile}
K věci: seznam povolených adres mi přijde jednodušší a menší než seznam zakázaných adres.
    

Re: B2, MT.. - Arthur Dent (web)

Já si právě myslím že ne.

Jde vlastně o kombinaci dvou metod: Ten blacklist je restriktivní metoda na vyhození známého spamu.

Náhrada URL je metoda preventivní, aby to spammery ani nelákalo.

Když někomu píšu do komentáře nějakou URL, je mi jedno, jestli tam bude ta adresa, jestli zvednu té stránce googlerank apod. Píšu to proto, aby si mohl ten, komu je ten vzkaz určen, kliknout (bude-li chtít) a dostal se na tu stránku. To je podle mého primární účel odkazů v komentářích. Používat komentáře proto, abych udělal nějaké GOOGLEčachry mi připadá proti smyslu té funkce.
    


Re: B2, MT.. - Arthur Dent (web)

A pokud se ti jedná o ty odkazy, co se tady skrývají pod nápisem (web), tak si najeď u tohoto... Ale nekoukej do statusbaru, koukej na title... {smile}

Na kliknutí je to pořád stejně funkční, adresu vidíš, ale Google najde href na můj blog.
    

Re: B2, MT.. - Mirun (web)

To by šlo taky. Když bys mi to chtěl ještě víc zpříjemnit, tak při najetí by mohlo vyskočit popup-okno s fotkou {smile} (a soupis nějakých intimnosti) {smile}
    

Re: B2, MT.. - Arthur Dent (web)

Jo. Dám tam fotku. Ale svoji! A pak už nikdo nikdy neklikne! {smile}
    


kde nič nie je ani čert neberie - rony (web)

radikálne riešenie: odstrániť z formulárov pre komentáre kolónku na URL a ešte navyše ničiť všetky zápisy, ktoré sa tvária ako URL {wink}
    


urcite te to uZ napadlo, - wake

ale proc psat analyZer, kdyZ by slo po mensi uprave pouZit existujici engine, treba spam-assasinu
    

Re: urcite te to uZ napadlo, - Arthur Dent

No možná proto, že by to bylo "s kanónem na vrabce", možná taky proto, že spousta weblogů běží někde na hostingu, kde je PHP a těžko tam budeš překládat a instalovat binárku Spamassasinu a nějak to zakombinovávat do skriptu...
    


Re: urcite te to uZ napadlo, - Jerry (web)

Právě jsem něco podobného chtěl napsat. Snad by se ani nemusel upravovat, stačilo by ke zprávě doplnit standardní SMTP hlavičku, prohnat to SpamAssassinem a pak se podívat, jestli to označil za SPAM nebo ne.
    

Re: urcite te to uZ napadlo, - Arthur Dent

Proč ne? Hurá do toho, nezaškodí, když bude víc nástrojů. Tohle by mohli využít ti, co už Spamassasina mají, mají třeba vlastní servery nebo nepoužívají PHP.
    


Test... - Arthur Dent (web)

Testuji první verzi řešení - Ronyho ([odkaz])
    

Re: Test... - Arthur Dent (web)

Pardon. Rony je na [odkaz] a ne na [odkaz]
    

Re: Test... - rony (web)

ked si dnes dobre [odkaz] tak budeme rano uplne [odkaz] cupitat do prace, kde pozdravime [odkaz] tak ako zvycajne: [odkaz]
    

Re: Test... - Arthur Dent (web)

A teď zkusíme něco z blacklistu, ano?
    

Re: Test... - rony (web)

to najlepsie ziskate na www.[spamlink]
    

Re: Test... - rony (web)

[SPAM] test 2 a este raz a poriadne ako kazdy iny spammer: [spam]
    

Re: Test... - HUB (web)

You must buy this ! Free great cool thing ! For Free-Cool-In people ! (hh !)
    

Re: Test... - HUB (web)

Asi jsem to nepochopil{wink} musím si přečíst celý článek... no věřím tomu že to asi funguje{wink}
    

Re: Test... - Arthur Dent (web)

Zkus si to nejdřív přečíst, zkus si přečíst jak ten spam funguje a proč ho dělají...

Tam jde hlavně o "podstrčení" odkazu na nějakou stránku a doufají, že to Google zaindexuje a zvýší jim pagerank. Tady jde o to, že
1. v blacklistu jsou ty spammerské URL
2. žádný odkaz v komentářích nezůstane v té podobě, v jaké jsi ho zadal, takže to Google nezaindexuje.
    


Re: Test... - Arthur Dent (web)

[SPAM] Spam od Jirky Kouby:

hello! I truly appreciated the work . Visitor from href=[spam] blackjack online . Thanx!
    


Re: Test... - Arthur Dent (web)

[SPAM] Spam od Jiřího Bureše:

howdy We really enjoyed your work . Guest from [spam] roulette 3d .. Regards
    


Ach jo - Jirka kouba (web)

Pristaly mi dalsi spamy i do starsich postu, mazu jak barevnej... :o(( To mam fakt sejmout komentare? :o((((
    


jednodussi reseni - PB

Co takhle po submitu komentare zobrazit stranku s nejakym dotazem, ktery normalni clovek zodpovi, ale robot nemuze? Pro zacatek by stacilo napr. vypsat matematicky priklad (7+3=) a clovek do inputboxu vlozi vysledek a zmackne ENTER.
Pokud zadal spravny vysledek, je to clovek -> ulozit komentar. Pokud nezadal, je to robot (nebo clovek, jehoz prispevek by byl stejne nezajimavy) -> zrusit.

PB
    

Re: jednodussi reseni - Arthur Dent (web)

1. Technicky je to složité stejně {smile}
2. Tohle řešení by IMHO velmi prudilo
3. Jednodušší metoda - v případě že chodí robot - zabránit přístupu přes trackback.
    

Re: jednodussi reseni - hranek (web)

opravdu nevím, jestli by to bylo řešení, ale nepomohlo by udělat obyčejnou potvrzovací stránku? bez příkladu? kde uvidím svůj příspěvek a potvrdím, že ho chci skutečně vložit?
já bych tohle chtěl, sice kvůli něčemu jinému, ale nepomohlo by to i tomuhle?
jinak já tomu nerozumím, takže názor lajky (:
    
HotLinks
Zpět na článek