GetPocket, Instapaper und Readability in den Server-Logs finden

GetPocket, Instapaper oder Readability sind „virtuelle Zeitungsstapel“: Findet man einen lesenswerten Artikel im Web, in Twitter oder in Apps wie Reeder reicht ein Knopfdruck, um den Artikel auf den Stapel zu legen und ihn später – auch offline – zu lesen. Je nach Dienst wird dann die Website oder eine reine Text-Ansicht – also ohne Werbung und die übrigen Teile einer Website – angezeigt. Die Dienste sind kostenfrei und ungemein praktisch, weil man damit eine beliebige Menge Text jederzeit abrufen und lesen kann.

Nur Instapaper arbeitet sichtbar

Klickt der User im Browser auf das Plugin des jeweiligen Dienstes wird die Seite vom Server geladen und beim Anbieter gespeichert. Mich interessierte, wie viele User auf diese Weise Seiten abrufen – und ich habe versucht, die Abrufe von GetPocket, Instapaper und Readability in den Server-Logs zu finden.

Nur Instapaper arbeitet transparent und ruft die Seite mit der Browser-Kennung „AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Instapaper/4.0 (+http://www.instapaper.com/)“ ab. Merkwürdig: Direkt hinterher erfolgt ein zweiter Zugriff über die selbe IP, diesmal als „ Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.5; en-US; rv:1.9.0.7) Gecko/2009021906 Firefox/3.0.7“ gekennzeichnet. Möchte Instapaper so prüfen, ob dem Dienst eine andere Version der Seite angezeigt wird als einem Firefox-Browser?

GetPocket und Readability arbeiten versteckt: GetPocket-Abrufe tauchen in den Logs nur als „HTTP_Request2/2.1.1 (http://pear.php.net/package/http_request2) PHP/5.3.2-1ubuntu4.14“ auf und Readability versteckt sich hinter der Angabe „ python-requests/0.12.1„. Analysiert man die IP steht schnell fest: Sowohl GetPocket als auch Readability nutzen die Amazon AWS als technische Plattform.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.