Ile Google wie o Tobie : Generowanie, przechowywanie i anonimizacja danych

Problem udostępniania informacji przez Internet koncentruje się na zatrzymywaniu danych przez firmy internetowe. Przypomnijmy, że brakuje ochrony prawnej i najlepszych praktyk konsumenckich, aby informować (lub zmuszać) firmy internetowe do odpowiedniego zachowania; w związku z tym istnieje wiele różnych polityk korporacyjnych. Jak wspomniałem wcześniej, należy założyć, że ujawniane informacje są skrupulatnie rejestrowane i przechowywane przez czas nieokreślony, z kilkoma wyjątkami. Dane te są cenne dla firm internetowych w celu wspierania modeli biznesowych ukierunkowanych reklam i ich programów badawczych. Jednak dane bezwzględne przechowywanie nie zawsze jest konieczne. Przyjrzyjmy się trzem potencjalnym rozwiązaniom.

Ogranicz lub wyeliminuj generowanie danych

Najskuteczniejszym sposobem na wyeliminowanie problemu ujawniania informacji przez Internet jest przede wszystkim nie generowanie danych. Niestety, skrajny przykład, abstynencja, nie jest praktyczny. Po prostu nie korzystając z potężnych narzędzi, jakimi dysponuje społeczeństwo, unikasz kluczowych korzyści wynikających z bycia częścią współczesnego świata. Możemy jednak ograniczyć generowanie danych, stosując niektóre z rozwiązań technicznych, które przedstawiłem wcześniej w tym rozdziale, wraz ze zdrowym rozsądkiem. Zatrzymując się i zastanawiając się, zanim wyszukasz coś wrażliwego i używając technik takich jak narzędzie do samokontroli Kulsoom Abdullah, podejmiesz znacznie lepsze decyzje i zmniejszysz ryzyko przesyłania danych osobowych przez Internet i przechowywania na serwerach innych osób.

Zmniejsz lub wyeliminuj zatrzymywanie danych

Z punktu widzenia prywatności najlepiej jest, gdy dane użytkownika nie są rejestrowane, ale to rozwiązanie nie jest praktyczne z punktu widzenia większości firm internetowych. Twoje dane zapewniają tym firmom przewagę konkurencyjną i maksymalizują zyski – im więcej danych, tym lepiej. Uważam jednak, że może istnieć kompromis między retencją na czas nieokreślony a brakiem retencji. Na przykład dane użytkownika mogą być próbkowane – można zebrać tylko część ogólnych danych. Nie jest to kompletne rozwiązanie, ale pobieranie próbek może znacznie zmniejszyć ilość gromadzonych informacji. Dane mogą również zostać zniszczone po określonym czasie, co Google obiecał zrobić po 18–24 miesiącach z informacjami o adresie IP w dziennikach zapytań wyszukiwania. Oczywiście kompleksowa polityka obejmie wszystkie aspekty ujawniania informacji, a nie tylko zapytania wyszukiwania. Indywidualni użytkownicy mogliby mieć możliwość wyrażenia zgody na dłuższe okresy zatrzymywania danych, jeśli uważają, że takie przechowywanie naprawdę poprawi ich wrażenia z korzystania z Internetu lub w inny sposób będzie w ich najlepszym interesie.

Uwaga: Viktor Mayer-Schönberger, profesor w JFK School of Government na Uniwersytecie Harvarda, podchodzi do tego rozwiązania w bardzo wnikliwy sposób. On proponuje, aby komputery nauczyły się „zapominać”.

Płać za prywatność

Użyteczni badacze bezpieczeństwa z Carnegie Mellon University zaproponowali interesujące alternatywne rozwiązanie zapewniające prywatność użytkowników. Obecnie cieszymy się „darmowym lunchem”, jeśli chodzi o większość narzędzi online. Firmy takie jak Google udostępniają te narzędzia bezpłatnie, a my po cichu za nie płacimy, korzystając z naszej prywatności. Ale co by było, gdyby firmy oferowały inny model biznesowy, w którym można by zapłacić niewielką kwotę w zamian za brak śledzenia? Badacze Janice Tsai, Serge Egelman, Lorrie Cranor i Alessandro Acquisti przeprowadzili eksperyment, w którym odkryli, że uczestnicy byli gotowi zapłacić więcej za przedmioty z witryn, które miały lepszą politykę prywatności. Grupa skorzystała ze zmodyfikowanej witryny wyszukiwania zakupów oceniający witryny na podstawie ich polityk prywatności i przedstawiający podsumowujący raport na temat prywatności, który ułatwił porównanie zasad w różnych sklepach internetowych. Gdyby ich wyniki można było uogólnić na firmy takie jak Google, być może istnieje realny alternatywny model biznesowy, w którym użytkownicy mogliby płacić za prywatność.

Anonimizacja danych

Anonimizacja danych ma na celu usunięcie informacji umożliwiających identyfikację z dzienników w sposób, który zapewnia anonimowość, ale nadal zapewnia użyteczne informacje. Na pierwszy rzut oka anonimizacja może wydawać się łatwa, ale jest dość trudna. Anonimizacja danych stanowi kompromis między usuwaniem informacji a zachowaniem wartości dla firm internetowych. Usuń zbyt dużo informacji, a pozostanie niewielka wartość. Powszechnym podejściem jest usuwanie określonych danych i łączenie pozostałych w kategorie. Dzisiejsza zła decyzja dotycząca anonimizacji może spowodować utratę znacznej części przyszłej wartości dzięki postępom w eksploracji danych. Usuń zbyt mało informacji, a użytkownicy nie będą chronieni. Widzieliśmy nieudaną próbę anonimizacji wycieku danych AOL, gdy badacze AOL zastąpiono nazwy użytkowników unikalnym identyfikatorem liczbowym. Chociaż to dobry początek, zobowiązanie Google z marca 2007 r. Do anonimizacji adresów IP po 18–24 miesiącach nie jest wystarczające, najwyraźniej usuwając tylko fragmenty adresów IP z dzienników zapytań wyszukiwania.

Jak widzieliście wcześniej, wiele innych usług, które nie są objęte tymi zasadami i same zapytania wyszukiwania, mogą zawierać poufne informacje, nawet jeśli nie można ich przypisać dokładnemu adresowi IP. O ile nie jest to nakazane przez prawo lub kierowane przez rynek, firmy internetowe, które polegają na wysokiej jakości informacjach w celu kierowania reklam, nie mają powodu, aby anonimizować dane. Chociaż obecnie istnieje kompromis między anonimizacją dzienników a ich wartością dla firm internetowych, nie musi tak być. Naukowcy akademiccy pracują nad rozwiązaniami. Naukowcy są żywo zainteresowani poszukiwaniem rozwiązań; potrzebują dzienników wysokiej jakości do badania nowych innowacji. Obecnie tylko badacze wewnętrzni w firmach internetowych i kilku wybranych zaufanych partnerów ma dostęp do wysokiej jakości dzienników. Utrudnia to społeczności naukowej walidację, rozszerzenie i wzajemną weryfikację wkładu w badania osób mających dostęp do zastrzeżonych danych. Z powodu braku publicznie dostępnych dzienników zapytań istnieje tylko kilka opublikowanych badań. Dzięki zaangażowaniu szerszej społeczności naukowej lepsze rozwiązania będą możliwe szybciej. Trwają badania, a rozwiązania mogą ostatecznie wymagać różnych poziomów anonimizacji – gdy dane są przechowywane i wykorzystywane wewnętrznie i kiedy jest udostępniany na zewnątrz.

Podsumowanie

Próba całkowitej anonimizacji działań online jest trudną, jeśli nie niemożliwą propozycją ze względu na informacje semantyczne, które ujawniasz podczas korzystania z narzędzi online. Niestety, nie ma kuloodpornego, anonimowego sposobu przeglądania sieci. W przyszłości może, ale musimy współpracować, aby zapewnić, że rozwiązania nie są przeznaczone tylko dla elity technologicznej, a zamiast tego mogą być używane przez wszystkich internautów. Firmy internetowe są kluczowym elementem umożliwiającym osiągnięcie tego celu. Jednak jednostronne rozwiązanie otoczone marketingowym spinem jest nie do przyjęcia. Firmy muszą współpracować ze wszystkimi stronami – co najważniejsze, użytkownikami końcowymi – aby zapewnić, że wynik jest zadowalający, solidny i użyteczny. W tym rozdziale przeprowadziłem przegląd środków zaradczych opartych na użytkownikach, technologicznych i politycznych, których można użyć, aby ograniczyć ujawnianie tych informacji semantycznych i poufnych informacji na poziomie sieci. Pełna dyskusja zajęłaby całą książkę, ale zastosowanie niektórych z tych technik ograniczy zakres ujawnianych informacji, zmniejszy ekspozycję i zminimalizuje prawdopodobieństwo, że zostaniesz osobiście zidentyfikowany. Kluczem jest znalezienie odpowiedniej równowagi między rozwiązaniami, które są skuteczne i użyteczne. Mając to na uwadze, zachęcam do wyjścia i zbadania rozwiązań teraz i w przyszłości. W ten sposób pomożesz przyspieszyć i ukształtować przyszłość, w której Twoje działania nie będą po cichu rejestrowane, wydobywane i wykorzystywane do niszczenia Twojej prywatności. Scott McNealy, były dyrektor generalny Sun Microsystems, powiedział: „Masz zero prywatności. Pogódź się z tym.” Z całym szacunkiem się nie zgadzam i mam nadzieję, że Ty też.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *