Bitacle und wie man das loswerden könnte

23.September 2006 . Angels Sin

Derzeit haben einige mit einem Dienst, der sich Bitacle nennt - kein Link von mir dahin, ihr Schweine! - ziemliche Probleme. Vielleicht anders ausgedrückt nicht Probleme, sondern der Dienst stinkt ihnen, besonders Bloggern. Klar, aber warum?
Weil Bitacle sich erdreistet - ohne hinweise darauf (also sonst, dazu mehr etwas später) - die RSS-Feeds (bzw. Atom nutzt er bei mir scheinbar) auszulesen und auf der eigenen Seite darzustellen. Im ersten Augenblick einfach eine Übersicht über viele Blogs und deren Inhalt. Wäre ja nicht so schlimm - vgl. BloxBox die inzwischen in Ordnung sind. Unredlich an der ganzen Sache sind vor allem vier Tatsachen:

  • Der gesamte RSS-Inhalt wird eingelesen und dargestellt, sogar Bilder (da bei mir wie gesagt, Atom genutzt wird, der HTML auch verwendet). Hätte ich keine htaccess mit Verbot von Hotlinking drinne, wäre mein Traffic nicht mehr heilig.
  • Kein Nachfragen, kein Hinweis darauf, nichts, nothin', nada, niente - etcpp.
  • Werbung auf den Seiten - bei jedem einzelnen Artikel, der "geklaut" wurde - was eine nicht schlechte Einnahme bedeuten kann. Und was bei den meisten - fast allen - Blogs einen Bruch gegen die CC-Lizenz bedeutet. Und sowieso unbeliebt in dieser Art ist.
  • Kommentieren bitte ab jetzt nur noch bei Bitacle, das Kommentarfeld ist dabei. Braucht man nicht auf die Quellseite, die sowieso nicht unmittelbar angegeben wird. Wer braucht das schon!

Jetzt habe ich dieses Dingens schon vor längerer Zeit bei mir gesehen, hat mich aber damals irgendwie nicht gestört. Weiß auch nicht, auf was ich damals drauf war - vielleicht hab ich die Werbung übersehen und dachte mir, dass wäre ein Ok-Dienst, kann man lassen... jetzt aber hat sich der Dienst sehr unbeliebt gemacht, aber eben nicht nur durch das da oben. Denn die sind ziemlich dämlich im Kopf - sie verschicken inzwischen an alle Blogger, die sie "bestehlen" Trackbacks/Pingbacks, um auf ihre tollen Leistungen hinzuweisen. Linksammlung für Google kann das nicht sein, alle modernen Blogsysteme haben eine Blacklist bzw. Anti-Spam-Methoden die sowas verhindern können. Bullshit, was die da also machen. Aber die Aufregung ist jetzt groß, da besonders viele Blogger darauf aufmerksam gemacht wurden - durch die eigene Dummheit der Anbieter also.

Jetzt habe ich bei Basic Thinking einen sehr tollen Ansatz (man mag schon fast eher von Lösung, zumindest für jetzt) gefunden, wie man dagegen vorgehen könnte. Den User-Agent per htaccess sperren ist eine effektive Sache. Solange sie den User-Agent nicht ändern, bleibt das Untier außen vor. Dazu muss man folgendes in eine .htaccess legen und hochladen. (Z.B. in den Ordner, wo index.php für Blog bzw. die Dateien dafür liegen sowie/oder dahin, wo dein rss-werkel-php-Dingens liegt (z.B. deinedomain.de/rss/ - deinedomain.de/rss.php (dann root!)))

SetEnvIfNoCase User-Agent "Bitacle Bot.*" leecher=yes
Order Allow,Deny
Allow from all
Deny from env=leecher

Etwas modifiziert, nachdem ich auch in ein paar Foren geschaut habe. Schaut doch etwas schöner aus ^^

Natürlich kann dies dann auch für jeden anderen User-Agent genutzt werden, den man loswerden will. Einfach SetEnvIfNoCase User-Agend "hau mich tot" leecher=yes (jeweils einmal pro Zeile). Der Stern nach dem Punkt ist für Versionsnummern, die bei solchen Bots sehr oft verwendet werden, aber sich auch ändern können. Mit dem Stern erreicht man, dass egal welche Versionsnummer da steht, der Bot nicht reinkommt. Hier wäre es z.B. Bitacle bot/1.1 im Klartext.

Man ist aber doch von Haus aus etwas unsicher, ob das Gedöns denn jetzt auch wirklich so funktioniert, wie man will. Kein Problem, kann man sehr gut austesten. Für sich selbst - also ob man selbst noch auf den eigenen Blog kommt - ist ja im Rahmen der Möglichkeiten eines jeden ;) Und ob der User-Agent nemer reinkommt kann man auch probieren. Gibt nämlich einen Simulator für sowas - den man aber bitte auf keinen Fall für illegales Zeugs nutzen sollte... kann und wird böse enden :>
Dort kann man auch andere Dinge simulieren, aber vor allem Interessant ist eben der Punkt Simulate/emulate browser or robot/spider User-Agent: (type in or select from below).
Danach auf Simulate klicken und schauen, ob ein Fehler 403 (etc.) ausgespuckt wird - dann ole ole yay - oder doch nicht - dann ist was falsch oder es liegt an deinem Hoster ( 8| ).

Jetzt hoffe ich einfach mal, dass es sich bald ausgebitacled hat :) Kann ja net sein, dass sowas dreistes durchkommen soll...

Edit 1:
Mir fällt ein, die effektivste Betrachtung, ob das alles funktioniert, ist jetzt gegeben. Wird der neueste Eintrag erfasst bei Bitacle oder nicht. Ich berichte :D

Hinterlasse einen Kommentar

Bisher keine Kommentare für diesen Eintrag...
 

Hinterlasse einen Kommentar

Deine E-Mail Adresse wird nicht angezeigt.
Deine URL wird angezeigt.

Erlaubte XHTML Tags: <p, ul, ol, li, dl, dt, dd, address, blockquote, ins, del, span, bdo, br, em, strong, dfn, code, samp, kdb, var, cite, abbr, acronym, q, sub, sup, tt, i, b, big, small, a>
Willst du einen Link einsetzen, musst du ebenfalls den XHTML-Tag a nutzen.

Du willst auch ein Bild bei deinen Kommentaren haben, wie es einige Kommentatoren tun? Dann schau dich auf gravatar.com um und lese, wie es geht.

.. 2 - 5
Bitte kopiere deinen Kommentar vor dem Absenden!
(Zeilenumbrüche werden zu <br />)
(Setze Cookies für Name, E-Mail und URL)
(Erlaube Benutzern, Dich über ein Nachrichten-Formular zu kontaktieren (Deine E-Mail Adresse wird NICHT angezeigt).)
Bei neuen Kommentaren zum Beitrag benachrichtigen?!


Trackback (1)


Neues zu bitacle.org, Google kümmert sich
Wie hier berichtet habe ich einige Google-Adressen zum Thema bitacle angeschrieben.
Die Reaktion lies nicht lange auf sich warten:


Hallo Herr Herold,
vielen Dank für Ihr nettes Mail und den Hinsweis auf bitacle.org.
Wir kümmern uns natürlich sofor
Kuroi Tenshi's darkness - Startseite