Integre ferramentas automatizadas e opções personalizadas para configurações de privacidade

Resumo do Problema

Os usuários enfrentam desafios significativos na gestão de sua privacidade online devido à complexidade e opacidade das informações relacionadas à privacidade. As configurações de privacidade muitas vezes estão escondidas dentro de sites e aplicativos, exigindo que os usuários naveguem por várias páginas e menus. Mesmo quando localizadas, ajustar essas configurações pode ser complicado e pouco intuitivo, com os usuários muitas vezes desconhecendo todas as opções disponíveis e suas consequências. A disposição e a funcionalidade variadas das configurações de privacidade nas diferentes plataformas complicam ainda mais o processo, pois os usuários precisam aprender como fazer essas configurações para cada site ou aplicativo. Além disso, muitos serviços têm configurações padrão que favorecem a coleta e o compartilhamento de dados, levando à exposição não intencional de informações pessoais. Esses problemas resultam em falta de controle sobre os dados pessoais, deixando os usuários vulneráveis a riscos de privacidade.

Racional

O objetivo é simplificar para os usuários o processo de gerenciamento de suas preferências de privacidade dentro das políticas e páginas de configurações de privacidade.

Solução

Desenvolvimento e integração de ferramentas automatizadas e opções personalizáveis que simplifiquem a gestão da privacidade e aumentem o controle do usuário. Ao integrar ferramentas automatizadas e opções personalizáveis, a solução aumenta a transparência sobre as práticas de coleta de dados e ajuda os usuários a tomarem decisões informadas. A detecção e apresentação automatizadas das opções de privacidade reduzem a complexidade e o esforço necessários para localizar e ajustar as configurações.

Kumar et al. [1] apresentaram um método que automatiza a extração e apresentação de escolhas de opt-out de políticas de privacidade. O método foi realizado por meio do Opt-Out Easy, uma extensão de navegador da web disponível para Google Chrome e Firefox. Essa detecção automática possibilita que os usuários identifiquem e desativem/desmarquem opções (opt-out) facilmente, aprimorando o controle sobre suas configurações de privacidade.
Para desenvolver o Opt-Out Easy, os pesquisadores coletaram um corpus de 236 políticas de privacidade dos 500 principais sites dos EUA na lista Alexa no outono de 2018. Usando Selenium e Geckodriver, eles capturaram o conteúdo dinâmico dessas políticas de privacidade. A API Mercury Parser removeu o conteúdo irrelevante, deixando o texto principal para análise. Este texto foi estruturado em uma árvore DOM (Document Object Model) usando BeautifulSoup e o parser lxml, resolvendo problemas com HTML inválido. Um desafio significativo foi segmentar o texto da política, que muitas vezes carecia de pontuação convencional. Os pesquisadores desenvolveram uma função recursiva para inserir espaços nas quebras de linha, permitindo a segmentação eficaz com o tokenizador de sentenças do NLTK. Hiperlinks dentro das políticas foram meticulosamente anotados para distinguir entre mecanismos de exclusão e outros links. Esse processo envolveu tanto filtragem automatizada quanto inspeção manual. A equipe treinou um modelo de regressão logística para classificar esses hiperlinks, identificando padrões indicativos de mecanismos de exclusão. Eles também exploraram o aprendizado ativo para reduzir a rotulação manual. Essa abordagem avançou significativamente a metodologia para detectar opções de exclusão nas políticas de privacidade. O conjunto de dados resultante está disponível publicamente em https://www.usableprivacy.org/data. Os usuários podem instalar a extensão do navegador e testá-la em políticas disponíveis no site The Usable Privacy Explore ou enviar novas políticas para análise.

Mohammadi, Pampus e Heisel [2] introduziram um padrão de Opções de Política de Privacidade (PPO). O PPO visa fornecer uma representação amigável e intuitiva das políticas de privacidade, capacitando os usuários finais a especificarem suas preferências de privacidade. O núcleo da solução é um padrão de tabela estruturada que categoriza o uso de dados em áreas específicas: serviço e suporte, pesquisa e desenvolvimento, marketing e segurança, junto com categorias para compartilhamento de dados com terceiros e períodos de retenção de dados. A tabela é projetada para mostrar claramente os tipos de dados coletados e como eles são processados, compartilhados e armazenados. Símbolos indicam se a coleta de dados é obrigatória ou opcional, permitindo que os usuários entendam e modifiquem suas preferências de privacidade diretamente na tabela. Este padrão é adaptável a aplicativos móveis e web, visando tornar as políticas de privacidade mais transparentes e personalizáveis para o usuário final, aumentando seu controle sobre o uso de dados pessoais.

Khandelwal et al. [3] propuseram o PriSEC, uma ferramenta baseada em aprendizado de máquina para automatizar a descoberta, apresentação e aplicação de controles de privacidade na web. O PriSEC simplifica a gestão da privacidade, fornecendo uma interface centralizada para os usuários buscarem, modificarem e aplicarem configurações de privacidade em vários sites com intervenção mínima. O backend do PriSEC emprega um rastreador de domínio para navegar sistematicamente pelos sites e identificar páginas potenciais de controle de privacidade usando palavras-chave como "privacidade" e "configurações". O rastreador simula interações de usuários para revelar elementos de controle de privacidade visíveis e ocultos. Um classificador de aprendizado de máquina distingue então páginas de controle de privacidade genuínas das irrelevantes com base em características textuais e visuais. Uma vez identificadas as páginas de controle, o Gerador de Receitas assume o controle. Este componente dinâmico interage com cada página, descobrindo todos os elementos interativos e organizando-os em um gráfico de dependência estruturado. Este gráfico serve como um roteiro, mapeando as sequências de ações necessárias para navegar nas configurações de privacidade. O gerador classifica ainda esses elementos em tipos distintos de UI e cria receitas de controle detalhadas que encapsulam os passos necessários para ajustar automaticamente as configurações de privacidade. O Aplicativo Cliente opera como uma extensão de navegador, fornecendo uma interface amigável para interagir com as configurações de privacidade identificadas pelo backend do PriSEC. Os usuários podem visualizar uma lista de opções de privacidade e emitir consultas em linguagem natural para encontrar rapidamente configurações específicas. O módulo Enforcer então aplica automaticamente as configurações de privacidade selecionadas, executando o código JavaScript necessário, sem exigir mais interações do usuário. Infelizmente, nenhum protótipo está publicamente disponível para testes, e o conjunto de dados das páginas de controle de privacidade mencionado pelos autores ainda não está disponível em https://github.com/wi-pi/prisec_data (em maio de 2024).

Plataformas: computadores pessoais

Exemplo

Tela do Opt-Out Easy para solicitar a análise de uma política de privacidade <a href="#section1">[1]</a>.

O Opt-Out Easy permite que os usuários solicitem que uma política de privacidade seja analisada [1]. (Ver em tamanho maior)

Resultados do Opt-Out Easy <a href="#section1">[1]</a>.

Resultados do Opt-Out Easy para um site com uma política de privacidade já analisada (no exemplo, thewaltdisneycompany.com, disponível no site Usable Privacy Explore [1]. (Ver em tamanho maior)

Página de ajuda do Opt-Out Easy <a href="#section1">[1]</a>.

Página de ajuda do Opt-Out Easy [1]. (Ver em tamanho maior)

Visão geral de um exemplo de realização do padrão PPO para o layout da web <a href="#section2">[2]</a>.

Visão geral de um exemplo de realização do padrão PPO para o layout da web [2]. (Ver em tamanho maior)

Um fluxo de trabalho típico de execução no PriSEC <a href="#section3">[3]</a>.

Um fluxo de trabalho típico de execução no PriSEC [3]. (Ver em tamanho maior)

Casos de uso
  • Facilitação do exercício prático de escolhas de opt-out (desinscrever/desativar) e personalização de preferências de privacidade.
  • Análise sistemática de práticas de opt-out e defesa de melhores padrões para a prática.
Vantagens

  • A extensão Opt-Out Easy aumenta a conscientização do usuário sobre as opções de opt-out disponíveis, contribuindo para um melhor gerenciamento de privacidade. Ela ajuda os usuários a identificar e exercer opções de opt-out mais rapidamente, aumentando o poder do usuário em relação às decisões de privacidade. A extensão também destaca o potencial de esforços de crowdsourcing para pressionar entidades a melhorar a disponibilidade e os tempos de resposta dos serviços de opt-out, defendendo melhores padrões. Além disso, sugere que a coleta sistemática de estatísticas do processo de opt-out pode informar os formuladores de políticas e encorajar a implementação de padrões mínimos para a disponibilidade e a capacidade de resposta do serviço de opt-out [1].
  • O PriSEC reduziu significativamente o tempo que os usuários precisaram para ajustar as configurações de privacidade, com os participantes concluindo tarefas 3,75 vezes mais rápido do que com métodos manuais. Ele simplifica o gerenciamento de privacidade para alguns cliques, evitando navegação extensa, e atinge uma pontuação mais alta no System Usability Scale (SUS) de 72 em comparação com 63 para o método manual, indicando uma melhor interface e experiência geral do usuário [3].
  • O padrão foi testado e projetado para ser aplicável em aplicativos móveis e web, com o objetivo de melhorar a implementação prática de políticas de privacidade para provedores de serviços e usuários finais. Espera-se que o tratamento transparente de dados pessoais e a capacidade dos usuários intervirem em seu processamento aumentem a confiabilidade do serviço. Além disso, que ajudem os prestadores de serviços a demonstrar a conformidade com a GDPR, potencialmente aumentando a confiança do usuário e demonstrando um compromisso com o tratamento transparente de dados e empoderamento dos usuários [2].

Desvantagens

  • Não existe nenhuma obrigação legal para que os provedores de serviços adotem um formato padronizado para políticas de privacidade, o que pode limitar a adoção ampla do padrão. Os provedores de serviços podem restringir a modificabilidade do padrão, negando os benefícios do controle do usuário sobre o processamento de dados, ao esmaecer as opções. Além disso, permitir que os usuários discordem de determinadas atividades de processamento de dados pode restringir a utilização do serviço, dissuadindo tanto os usuários como os prestadores de adotarem totalmente o padrão. Como os provedores de serviços muitas vezes dependem do uso de dados para obter receitas, pode haver resistência à implementação de recursos que permitam aos usuários limitar o processamento de dados [2].
  • O PriSEC pode ter dificuldades para gerenciar configurações de privacidade que exigem interações com múltiplos seletores antes de aplicá-las, e pode falhar ao gerar receitas de controle para sites que usam implementações não padrão de HTML. Seu backend também pode enfrentar dificuldades ao fazer login em sites que não utilizam logins sociais padrão de terceiros, necessitando de intervenção manual. Além disso, as diversas implementações de tecnologias web e mudanças no HTML dos sites podem tornar obsoletas as receitas de controle armazenadas, levando a falhas na aplicação e afetando a eficácia a longo prazo do sistema [3].
  • A extensão Opt-Out Easy focou exclusivamente em links de opt-out usando tags âncora, ignorando aqueles implementados por meio de tags não âncora com manipuladores de eventos JavaScript. Além disso, o estudo considerou apenas políticas escritas em inglês e foi limitado aos sites dos EUA com melhor classificação, perdendo diversidade em políticas de privacidade de sites não americanos e com classificação mais baixa [1].

Escolhas de Privacidade

As escolhas de privacidade sempre envolvem apresentar informações claras e facilmente compreensíveis aos usuários sobre práticas de dados potenciais, opções disponíveis e como comunicar decisões de privacidade. Isso geralmente inclui vários componentes e integra-se com avisos de privacidade relacionados, exigindo consideração cuidadosa das dimensões de design, como tempo, canal e modalidade [4].
Esta diretriz discute soluções relacionadas ao espaço de design de escolhas de privacidade [4], pois elas se concentram em fornecer opções de privacidade diversas e personalizáveis ​​para os usuários.

  • Escolhas binárias > Opt-in/out
    O Opt-Out Easy e similares se encaixa na escolha binária opt-in/out devido ao seu foco em permitir que os usuários optem facilmente por não participar de práticas de coleta de dados, o que envolve inerentemente a tomada de decisões binárias.

  • Sob demanda
    Esta diretriz discute soluções que podem ser aplicadas sob demanda quando os usuários buscam ativamente a contribuição da ferramenta para tomar decisões informadas.
  • No momento oportuno
    Esta diretriz discute soluções que auxiliam os usuários a identificar e exercer opções de exclusão ou negar políticas de privacidade precisamente no momento em que tais opções são relevantes — quando os usuários estão visitando sites e potencialmente sujeitos a práticas de coleta de dados.

  • Visual
    Esta diretriz apresenta e discute soluções projetadas para serem entregues visualmente na forma de texto, imagens e ícones, garantindo uma comunicação clara e compreensível das escolhas de privacidade aos usuários.

  • Feedback
    As soluções examinadas nesta diretriz são projetadas para fornecer aos usuários feedback imediato sobre ações relacionadas à privacidade, como optar por não participar de práticas de coleta de dados. Essas ferramentas oferecem notificações oportunas sobre as ações tomadas, aumentando a conscientização e a tomada de decisões do usuário. No entanto, é importante observar que, embora essas ferramentas forneçam feedback, elas não garantem a aplicação, pois atuam como intermediárias entre o usuário e os mecanismos de privacidade do serviço. Essa distinção destaca o papel das ferramentas no suporte ao empoderamento do usuário e às escolhas informadas, em vez de controlar diretamente as práticas de dados.
  • Apresentação
    As escolhas de privacidade sempre envolvem apresentar informações claras e facilmente compreensíveis aos usuários sobre práticas de dados potenciais, opções disponíveis e como comunicar decisões de privacidade. Isso geralmente inclui vários componentes e integra-se com avisos de privacidade relacionados, exigindo consideração cuidadosa de dimensões de design, como tempo, canal e modalidade [4].
    Esta diretriz apresenta soluções que se alinham com a definição da apresentação de escolhas de privacidade, visando clareza, compreensão das práticas de dados e comunicação eficaz com os usuários em relação às suas decisões de privacidade.

  • Primário
    As soluções discutidas exemplificam o uso do canal principal para facilitar a interação direta e imediata com os usuários em relação às suas escolhas de privacidade inseridas no contexto das atividades online sendo executadas.

Controle

Esta diretriz discute soluções que fornecem aos usuários ferramentas e mecanismos para gerenciar e controlar suas configurações de privacidade. Isso inclui obter consentimento informado, optar por não coletar ou processar dados e permitir que os usuários influenciem como os provedores de serviços lidam com seus dados pessoais. As soluções discutidas enfatizam o aprimoramento do empoderamento do usuário, simplificando o processo de gerenciamento das configurações de privacidade e tornando os controles de privacidade mais fáceis de usar. Outros atributos de privacidade relacionados:

A segurança pode ser considerada como indiretamente relacionada, pois a capacidade de optar por não permitir certos usos de dados pode ser um componente de proteção dos dados pessoais contra acessos ou processamentos indesejados ou maliciosos.

Detectar e destacar mecanismos de controle de privacidade pode melhorar a transparência ao esclarecer como eles podem impedir que seus dados sejam usados ​​para determinados propósitos.

As soluções discutidas alavancam o aspecto de permitir que os usuários controlem e limitem o compartilhamento de seus dados pessoais com terceiros para evitar o compartilhamento não autorizado de dados.


Referências

[1] Vinayshekhar Bannihatti Kumar, Roger Iyengar, Namita Nisal, Yuanyuan Feng, Hana Habib, Peter Story, Sushain Cherivirala, Margaret Hagan, Lorrie Cranor, Shomir Wilson, Florian Schaub, and Norman Sadeh. Finding a Choice in a Haystack: Automatic Extraction of Opt-Out Statements from Privacy Policy Text. In Proceedings of The Web Conference 2020 (WWW '20). Association for Computing Machinery, New York, NY, USA, 2020, 1943–1954 https://doi.org/10.1145/3366423.3380262

[2] Nazila Gol Mohammadi, Julia Pampus, and Maritta Heisel (2019). Pattern-based incorporation of privacy preferences into privacy policies: negotiating the conflicting needs of service providers and end-users. In Proceedings of the 24th European Conference on Pattern Languages of Programs (EuroPLop '19). Association for Computing Machinery, New York, NY, USA, 2019, Article 5, 1–12 https://doi.org/10.1145/3361149.3361154

[3] Rishabh Khandelwal, Thomas Linden, Hamza Harkous, and Kassem Fawaz. {PriSEC}: A Privacy Settings Enforcement Controller. In 30th USENIX Security Symposium (USENIX Security 21), 2021, 465-482. https://www.usenix.org/conference/usenixsecurity21/presentation/khandelwal

[4] Yuanyuan Feng, Yaxing Yao, and Norman Sadeh (2021). A Design Space for Privacy Choices: Towards Meaningful Privacy Control in the Internet of Things. In CHI Conference on Human Factors in Computing Systems (CHI ’21), May 8–13, 2021, Yokohama, Japan. ACM, New York, NY, USA, 16 pages. https://doi.org/10.1145/3411764.3445148

[5] Susanne Barth, Dan Ionita, and Pieter Hartel (2022). Understanding Online Privacy — A Systematic Review of Privacy Visualizations and Privacy by Design Guidelines. ACM Comput. Surv. 55, 3, Article 63 (February 2022), 37 pages. https://doi.org/10.1145/3502288