Footprinty
Masz nowego bloga na Wordpressie i nagle dostajesz masę dziwnych komentarzy? Najlepsze w tym wszystkim jest to, że ten blog nie jest popularny i nie ma linków. Więc skąd komentarze? Wszystko za sprawą Google, footprintów i ogólnie dostępnych skryptów.
Trochę teorii
Ta część wpisu jest przeznaczona dla osób początkujących, który pierwszy raz słyszą ten termin lub chcą sobie go przypomnieć.
Takie problemy nie dotykają tylko blogów na Wordpressie. Komentarze, czy też wpisy dostają księgi gości, fora internetowe. Jak to się dzieje, że nasze stronki są znajdowane? Zaawansowani pozycjonerzy pewnie wiedzą o co chodzi i jak to działa. Pamiętacie dwa wpisy:
Chodzi o połączenie tych dwóch wiadomości w jedną. Google za każdym razem mówi, że walczy ze spamem, wynajduje coraz to nowsze sposoby na zapobieganie mu. Jednak, dzięki zaawansowanemu wyszukiwaniu informacji umożliwia (Google) znajdowanie nowych, potencjalnych miejsc, które można zaspamować. Czy nie jest to zabawne? Z jednej strony Google walczy, z drugiej samo jest narzędziem wykorzystywanym przez spamerów - "kto mieczem wojuje, ten od niego ginie" chciało by się rzecz. Jeśli do tego dorzucimy ogólnie dostępne (darmowe) skrypty do blogowania, tworzenia miejsc do dyskusji (fora) to mamy mieszankę wybuchową. Każdy z takich skryptów zawiera kilka kluczowych informacji:
- Informację o autorze skryptu.
- Nazwę skryptu.
- Wersję oprogramowania.
- Specyficzne adresy URL.
- Specjalny (domyślny) tekst.
- I inne ciekawe rzeczy.
Już wiecie o co chodzi? Wszystkie te informacje to tzw. footprinty (ang. odcisk palca) - czyli ślady jakie pozostawiają po sobie. Np.
- Powered by Wordpress.
- Powered by punBB (phpBB, etc.).
- I wiele, wiele innych.
Warto jeszcze dodać, że spamerzy spamując komentarze czy fora, zostawiają unikalny ciąg znaków. Dzięki temu mogą w łatwy sposób określić miejsca w które został dodany ich "wpis".
Teraz dysponując tą wiedzą wiemy czym są footprinty. Tak więc tworząc wpis o tytule "xxxdesdftvnmplk" jednocześnie zostawiłem ślad (footprint) dzięki któremu dowiedziałem się kto i gdzie podbiera moje RSSy :).
Jak to działa w praktyce?
Załóżmy, że mamy jakiś automat do katalogowania lub chcemy stworzyć bazę katalogów do sprzedania pozycjonerom. Z racji tego, że na chwilę obecną jednym z popularniejszych katalogów w naszym kraju jest seokatalog, to listę adresów możemy uzyskać w łatwy sposób wpisując w Google następujące polecenie:
"Powered by SEOKatalog"
Oczywiście jest to bardzo ogólne zapytanie. Jeżeli potrzebujemy np. tematycznych katalogów możemy zapytać Google w następujący sposób:
"Powered by SEOKatalog" turystycznych
Zapytanie to możemy zawęzić do konkretnych domen. Załóżmy, że lubimy tzw. *.com to pytamy w następujący sposób:
"Powered by SEOKatalog" turystycznych site:*.com
Są jeszcze inne katalogi np. Otwarty mini:
"powered by: skrypt katalogu otwarty.pl mini"
Zabawa z footprintami nie kończy się na szukaniu po kawałkach tekstu. Możemy też szukać po specjalnych śladach w adresie URL. Taką technikę używa się często do szukania for, blogów czy ksiąg gości. Do tego służy polecenie "inurl:" po którym wpisujemy jakiś charakterystyczny ciąg znaków. Załóżmy, że idziemy na całość i szukamy linków z domen *.edu, najlepiej fora dyskusyjne:
inurl:*.edu inurl:forum -site:.pl
Najprostsze polecenie. Komenda "-site:.pl" jest po to by wyeliminować domeny *.edu.pl. No dobra, ale co nam po tym? Nie lepiej szukać for (za pierwszym razem) z możliwością założenia profilu? Można to zrobić w następujący sposób:
inurl:*.edu inurl:forum inurl:register.php -site:.pl
Proste, prawda? Powyższe przykłady, to tak naprawdę podstawy i początek zabawy. Każdy z takich poleceń można dowolnie modyfikować:
- Szukanie tematycznych stron.
- Konkretne skrypty np. blogi z komentarzami auto aprove (takie które pojawiają się od razu).
- itp.
Tym wpisem chciałem przybliżyć Wam ten temat. W taki sposób tworzone są różnego rodzaju listy do takich programów jak ScrapeBox czy xRumer. Dzięki ScrapeBox można zautomatyzować nasze poszukiwania i znacznie przyspieszyć parsowanie wyników z Google. W różnych miejscach można kupić tzw. gotowce z zachodu jak i od naszych. Problem w tym, że wszelkie ogólnodostępne listy rozchodzą się z prędkością światła, a wraz z nimi spam.
Komentarze 29
Świetny art, dzięki wielkie za powtórkę. Choć czasem zastanawiam się, czy taka wiedza powinna być ogólnie dostępna ;)
Pozdrawiam
Refresh się przyda, dzięki.
Teraz pytanko: czy jest na to jakiś sposób, żebyśmy nie byli atakowani przez hordy spamerów ? Samo usunięcie "Powered by Wordpress" to za mało :)
Może jakiś poradnik dla WordPressowców chociażby w postaci listy zmian ? ;)
Będę bardzo wdzięczny, pozdrawiam.
@wojtek: myślę, że jest to dobry temat na wpis - jak się bronić przed footprintami :)
A znasz może sposób na znalezienie stron, które mająÂ w kodzie HTML określony komentarz albo fragment kodu JavaScript?
@Marcin :
nie trzeba ani usuwać "powered by" ani zamykać komentarzy - jest kilka pluginów do WP które skutecznie uniemożliwiają dodawanie komentarzy SB czy XR
Podobny temat u Kotka http://pozycjonowanieh.pl/domeny-jak-pozyskac-linka-domeny-edu
Sorka u Kojotka :)
Kilka ciekawych informacji jest. Przyda się z pewnością odświeżyć trochę wiedzę nt footprintów. Dzięki.
Prosty (ale bardzo skuteczny) sposób na obronę przed automatami spamującymi w komentarzach na Wordpressie u mnie na blogu - popełniłem jakiś czas temu, ale nadal korzystam :)
http://www.ljasinski.pl/blog/2011/nadal-o-wordpressie/
@UP
Rzeczywiście, twoja metoda jest najskuteczniejsza, żaden spamer jej nie ominie:)
Screen tutaj, bo może ściągniesz tą "blokadę"
Wycięło link do screena:(
http://img15.imageshack.us/img15/1213/loljpl.jpg
Już słyszałem o tym sposobie :) Obronić się według mnie na 100% nie da - chyba że napiszemy unikalny skrypt bądź też całkowicie zmienimy treść i strukturę linków na naszej www.
Spamerzy zawsze są o krok do przodu
Oprócz SB mamy jeszcze hrefera do pobierania adresów, ale to tylko taki dodatek do całości... Ogólnie artykuł dobry i nie zawsze dla początkujących :)
Jest prosty sposób, wyłączyć komentarze, wtedy nikt nie zaspamuje bloga :)
Z mojego blogowego i generalnie wordpressowego doświadczenia wynika, że Akismet (wtyczka do spamu daje radę). Jeszcze żaden śmieciowy post ani trackback nie przeszedł mi przez Akismeta. Potem tylko jak się uzbiera dajemy wyczyść spam i tyle.
Miało być nie "śmieciowy post", tylko śmieciowy komentarz oczywiście... A sprawa z Akismetem sprawdzona na pożądnej próbce wordpressowych stron. Pozdrawiam, sorry, że w 2 częściach ten komentarz.
dlatego najpierw puszcza się testowego blasta z wymyślaną domeną, tam gdzie przejdzie znaczy że blog jest autoaprove i można smiało dodawać komentarze z prawdziwą domeną bez obaw że wpadnie do akismeta
Masz rację z tym testowym balastem.Wiele osób robi w ten sposób.
Niedługo na blogu nic nie zostanie jak będziemy likwidować informacje, formularze itp. by zablokować działania spamerów. Popatrzcie na reCAPTCHA, kody są coraz trudniejsze do rozszyfrowania przez człowieka, bot zeskanuje kilkakrotnie i wejdzie, user zrezygnuje.
Trzeba wszystko z umiarkowaniem, dobre są zabezpieczenia typu recaptcha, ale za to one często wkurzają potencjalnych użytkowników.
Naprawdę świetne informacje...
Witam,
właśnie zakupiłem scrapeboxa i szukałem informacji jak stworzyć własnego footprinta. Wielkie dzięki za art. Pozdrawiam
uczę się i to jedna z tych stron, dzięki którym idzie mi łatwiej...
Bardzo ciekawy artykuł, dziękuję.
Szukałem informacji w necie - znalazłem a link padł ;(
Footprinty to dobry sposób nie tylko na spamowanie, ale szukanie konkretnych informacji. idealne narzędzie dla pozycjonera, marketera, semowca. Dla każdego, kto w jakikolwiek sposób "żyje z internetu" ;)
Ciekawe informacje, czekam na więcej ;-)
Ten wpis na temat footprintów SEO na pewno zainteresuje wszystkich specjalistów zajmujących się pozycjonowaniem stron internetowych. Autor przedstawia bardzo ważne pojęcie w zakresie SEO, jakim są footprinty, i pokazuje, jak można je wykorzystać w celu zwiększenia widoczności strony w wynikach wyszukiwania. Wprowadzenie czytelnika w temat jest bardzo klarowne, a cały artykuł jest napisany w sposób prosty i przystępny, co pozwala zrozumieć zagadnienie nawet osobom początkującym w SEO. Gorąco polecam ten wpis każdemu, kto chce lepiej zrozumieć, jak działa pozycjonowanie stron i jakie czynniki mają wpływ na wyniki w wyszukiwarkach.