Nawigacja między witrynami WWW. Istnieje wiele sposobów śledzenia przeglądania stron internetowych przez użytkownika, w tym:
* Dane odniesienia HTTP ujawniają poprzednio odwiedzaną witrynę sieci Web w docelowej witrynie internetowej.
* Zewnętrzne sieci reklamowe ujawniają wizyty użytkownika w dowolnej witrynie wyświetlającej reklamy tego samego reklamodawcy.
* Usługi analizy internetowej, takie jak Google Analytics, mogą śledzić ruchy użytkowników w dowolnej witrynie sieci analitycznej.
* Błędy internetowe, małe przezroczyste obrazy GIF 1×1, umieszczane przez współpracujących webmasterów, umożliwiają rejestrowanie działań użytkowników przez strony trzecie.
* Osadzone treści osób trzecich, takie jak filmy i mapy, umożliwiają dostawcom zawartości monitorowanie wizyt użytkowników w dowolnej witrynie, w tym jej zawartości.
* Monitorowanie klikalności ujawnia, który link kliknął użytkownik na stronie internetowej, a tym samym pokazuje kolejne miejsce docelowe tego użytkownika.
Ryzyko związane z danymi referencyjnymi HTTP zostało omówione wcześniej w tym rozdziale. Reklamy innych firm to duży temat, który omówiono w rozdziale 7. Jednak warto teraz omówić śledzenie kliknięć. Podczas normalnego przeglądania sieci, gdy użytkownik klika łącze na stronie internetowej, jak pokazano na rysunku 3-9, bieżąca witryna nie ma możliwości sprawdzenia, czy użytkownik kliknął dane łącze. Jednak nowoczesne przeglądarki internetowe obsługują język programowania JavaScript, który umożliwia osadzenie dodatkowej logiki programowania na stronach internetowych. Twórcze programowanie w JavaScript pozwala aktualnemu serwerowi WWW wykryć, który link użytkownik kliknął na danej stronie, co zwykle nie jest możliwe przy użyciu tradycyjnego HTML. Google stosuje tę technikę, która łączy zapytania użytkowników z linkami, które klikają. Jeśli w przeglądarce użytkownika jest włączony JavaScript, co często się zdarza, rzeczywiste linki zwracane przez Google wskazują z powrotem do Google, ale JavaScript wyświetla rzeczywisty link docelowy do użytkownika po najechaniu kursorem myszy. Śledzenie kliknięć dostarcza Google nieocenionych informacji zwrotnych, pozwalających dostroić jakość algorytmu wyszukiwania, ale może również zapewnić znaczne ryzyko ujawnienia informacji. Na przykład, jeśli szukałeś „czatu wideo” i kliknąłeś link do usługi dla dorosłych, powiedziałeś Google jedną rzecz; Jeśli klikniesz link do popularnego narzędzia do telekonferencji wideo, ujawnisz inny zamiar. W „Najczęstszych pytaniach na temat prywatności” Google można znaleźć następujące informacje na temat śledzenia kliknięć. Po kliknięciu odsyłacza wyświetlanego w Google fakt kliknięcia linku może zostać przesłany do Google. W ten sposób Google może rejestrować informacje o tym, jak korzystasz z naszej witryny i usług. Używamy tych informacji do poprawy jakości naszych usług i do innych celów biznesowych. Na przykład Google może wykorzystać te informacje do określenia, jak często użytkownicy są zadowoleni z pierwszego wyniku zapytania i jak często przechodzą do późniejszych wyników. Podobnie Google może wykorzystać te informacje do określenia, ile razy reklama została kliknięta, aby obliczyć kwotę, jaką powinien zapłacić reklamodawca. Google wyraźnie przyznaje sobie prawo do monitorowania klikalności i, z mojego doświadczenia, robi to. Nie można jednak powiedzieć, że Google robi to w przypadku wszystkich interakcji w sieci. Google może włączyć śledzenie kliknięć dla dowolnego lub wszystkich swoich użytkowników dla kaprysu. Oto przykład. Najpierw użytkownik odwiedza główną stronę wyszukiwania Google, wpisuje zapytanie „rumint” i klika Enter. Google sumiennie zwraca wyniki wyszukiwania. Na normalnej stronie internetowej, gdy użytkownik kliknie łącze zewnętrzne, przeglądarka użytkownika natychmiast żąda obiektu, bez dalszego kontaktu z bieżącą witryną internetową. Dlatego bieżąca witryna internetowa nie może określić łącza, które kliknął użytkownik, ale śledzenie kliknięć odsyła przeglądarkę z powrotem do Google przed wysłaniem przeglądarki do zamierzonego miejsca docelowego (patrz Rysunek 3-12). Zwróć uwagę, że najechanie kursorem myszy na hiperłącze zwykle wskazuje adres URL, z którym zostanie nawiązany kontakt po kliknięciu linku, ale tak nie jest, gdy Google stosuje śledzenie klikalności. Korzystanie przez Google ze śledzenia kliknięć można łatwo potwierdzić, przechwytując rzeczywiste pakiety sieciowe wysyłane i odbierane, gdy użytkownik kliknie link. Na przykład kliknięcie pierwszego wyniku wyszukiwania na rysunku 3-11 powinno skutkować natychmiastowym żądaniem witryny www.rumint.org, ale zamiast tego użytkownik jest odsyłany do Google z następującym żądaniem HTTP
Żądanie zostało wysłane na adres IP 64.233.169.103, co przy odwrotnym wyszukiwaniu adresu IP potwierdza jako Google, zamiast www.rumint.org: