Canonical pretende coletar dados dos computadores dos usuários com o Ubuntu 18.04 LTS - Diolinux - O modo Linux e Open Source de ver o Mundo.

Responsive Ad Slot

Canonical pretende coletar dados dos computadores dos usuários com o Ubuntu 18.04 LTS

Empresará passará a coletar dados das instalações do Ubuntu para ajudar no desenvolvimento da plataforma.

quinta-feira, 15 de fevereiro de 2018

/ por Dionatan Simioni
Will Cooke, um dos engenheiros da Canonical, comentou através das listas de e-mail do Ubuntu que o sistema da empresa deverá passar a coletar dados dos computadores dos usuários para fins de melhorar o processo de engenharia e correção de bugs, além de gerar informações valiosas para o mercado Linux.

Ubuntu 18.04 Coletando dados






O anúncio de Cooke nos traz as seguintes informações:

"Olá estimados,

Nós queremos poder focar os nossos esforços de engenharia em coisas que realmente importam para os usuários, para poder fazer isso nos precisamos de mais informações sobre em que hardware o Ubuntu está rodando e quais são as condições de uso do sistema.

Nós gostaríamos de adicionar um 'checkbox' no instalador do sistema explicitando esta função (e permitindo que os usuários a desliguem) ao lado de linhas que digam algo como "enviar informações de diagnóstico para ajudar a melhorar o Ubuntu'.

Essa função deverá estar marcada como ativa por padrão.

O resultado de ter esta caixa marcada será:

- A informação da instalação será enviada através de HTTPS para um serviço rodado pelo time Canonical IS. A informação será salva no disco e enviada no primeiro boot, uma vez que haja conexão com internet. O arquivo conterá a seguinte informação e estará disponível para avaliação do usuário antes de ser enviado:

ꔷ Versão do Ubuntu (flavor);
ꔷ Versão do Ubuntu (16.04, 17.10, 18.04, etc);
ꔷ Conexão com internet ou não;
ꔷ CPU utilizado;
ꔷ RAM;
ꔷ Tamanho das unidades de armazenamento;
ꔷ Resolução da tela;
ꔷ Modelo da GPU;
ꔷ OEM (empresas que vendem o Ubuntu pré-instalado);
ꔷ Localização (baseada na seleção que o usuário fizer no instalador, nenhum IP será enviado);
ꔷ Tempo que a instalação demorar;
ꔷ Se o login automático está habilitado ou não;
ꔷ Qual o layout de partições selecionado (dual boot ou não por exemplo);
ꔷ Se os softwares de terceiros estão habilitados ou não na instalação (codecs, etc.);
ꔷ Se a opção de 'baixar atualizações enquanto instala' está ativada;
ꔷ Se o LivePatch do Kernel está habilitado ou não.

O Popcon será instalado. Ele permite que os engenheiros possam entender quais são os pacotes do Ubuntu que os usuários mais gostam, fazendo com que seja mais fácil identificar em quais pacotes os esforços de correções de bugs devem ser mais fortes.

O famoso e incômodo "error apport" será configurado para enviar os dados do erro automaticamente sem interromper mais o usuário.

Todo esse material será disponibilizado de forma pública como forma de transparência e isso nos permitirá mostrar para todos o percentual de usuários que usa o Ubuntu em computadores Dell por exemplo, em um determinado ano ou mês.

O documento 'Ubuntu privacy policy' será atualizado para refletir essa mudança. Qualquer usuário pode simplesmente optar por desativar esse envio de informação apenas desmarcando o "checkbox", o qual apenas modificará um parâmetro simples que pode ser verificado em código: 'diagnostics=false'. 

Haverá uma caixa para desativar essa funcionalidade do próprio painel de controle do GNOME que acompanhará o Ubuntu 18.04 LTS.

E para reiterar, o serviço de coleta de informações NUNCA armazenará informações pessoais, como o seu IP, nome dos seus arquivos, ou relacionados.

Nós esperamos o seu feedback valoroso nos comentários."

OK. Um anúncio muito importante, interessante e que certamente merece um debate. Sinta-se a vontade para expressar a sua opinião através dos comentários, mas não sem antes ler esta segunda parte do artigo. 

Para eliminar as dúvidas...

Mas o Ubuntu já não coletava dados?


Então, sim. Mas não. Pelo menos não como o Stallman comentava. Vamos lá, temos dois tópicos neste aspecto. A lente da Amazon no Unity (que agora não é mais o ambiente padrão) e o "error apport".

A lente da Amazon

Acho que até hoje muita gente não entendeu qual era o propósito da Dash do Unity, e veja bem, até a Microsoft entendeu, porque o menu de pesquisa do Windows 10 faz extamente o que o Unity fazia, só que de forma diferente.

A ideia era você jogar um termo da Dash, como "Pink Floyd" e ela te trazer resultados locais e na internet.

Em "resultados locais" a lente te traria arquivos que estão no seu disco que continham os meta dados "Pink Floyd".

Como resultado das buscas online, a Dash também te sugeriria resultados na internet para o termo pesquisado. Logo você encontraria artigos na Wikipedia sobre "Pink Floyd", fotos no Flicker, etc. (se estas lentes estivessem ativadas, claro). Por conta da parceria da Amazon com a Canonical, a lente da Amazon (que também sempre pôde ser desligada) já vinha ativada por padrão e como a Amazon é uma loja, ao pesquisar por "Pink Floyd" você recebia sugestões de produtos relacionados ao tema dentro da Amazon.

Os seus dados pessoais nunca foram utilizados (acho que poucos leram a documentação) dessa forma. Essa lente simplesmente funcionava como um "sistema de afiliados", dando alguma renda para a Canonical caso o usuário comprasse algo por ali.

Ou seja, a Dash funcionava como um buscador da internet qualquer, como o Google, só que mostrava um resultado considerando apenas sites específicos que você poderia habilitar e desabilitar. Particularmente eu sempre achei muito legal a ideia, até achava que poderiam haver outras lentes para serviços mais interessantes, como o próprio Google mesmo. Lembro que tinha uma que permitia que você pesquisasse no Yahoo direto da Dash. Curiosamente, este conceito é hoje em dia aplicado no menu de pesquisa do EndlessOS e é muito legal (e pesquisa no Google inclusive! 😃)

O error apport

Esse "cara" extremamente chato é aquela janela de erro que aparecia volta e meia mesmo sem ter acontecido nada de relevante para você. Ele importunava tando a galera que a gente fez até um post ensinando a desabilitar/remover ele do Ubuntu.

O error apport (apesar de invasivo) é eficaz ao mostrar bugs eventuais que o próprio sistema detecte, no entanto, era necessário uma ação prática do usuário para enviar as informações do erro pra Canonical e muitas vezes as pessoas acabavam fechando ele sem fazer o envio, coisa que poderia ajudar a empresa a melhorar o sistema.

O Ubuntu tem muitos usuários não técnicos e você sabe muito bem o que quem não entende de informática faz quando vê uma janela de erro, né? 

Essa função também podia ser desabilitada dentro da aba "privacidade" do Unity Control Center.

Coleta de dados é sempre controverso


Eu mesmo já critiquei a prática algumas vezes, mas tudo depende de como as coisas são feitas. Se você é desenvolvedor, sabe o quando um feedback de qualidade pode ajudar a melhorar o seu projeto ou produto, com um sistema operacional não seria diferente.

Uma coisa é você coletar dados em um sistema fechado onde você não tem como ter (tecnicamente) certeza de quais são os dados coletados, de que forma e para onde eles vão, incluindo informações pessoas muitas vezes. Outra totalmente diferente é ter uma plataforma completamente transparente e Open Source que só coleta informações de hardware e software, respeitando a privacidade individual, não é?

Windows, macOS, Android, iOS, etc, já fazem uso da coleta de dados para melhorar o sistema (e talvez pra outras coisas também) há muito tempo. A grande diferença aqui está na transparência, em um sistema de código aberto você realmente pode ver o que está sendo coletado e de que forma. O senhor Cooke inclusive foi bem enfático nisso em seu anúncio na lista de e-mails.

Que malefício isso pode trazer?

Bom, quem não gosta de rastreamento de nenhum tipo tá bem ferrado poderá sempre escolher um outro sistema para usar. A Canonical fazer isso pode abrir precedentes para que outros façam, talvez de forma não tão transparente? Talvez. Mas como todo "talvez", é melhor ver o que pode acontecer antes de condenar e conspirar. Ainda assim, ter um botão de "desligar" é uma liberdade importante.

As pessoas que não gostam de ser rastreadas por nada... bom, provavelmente elas não estão nem lendo este artigo. Afinal, Facebook, Google, YouTube, etc fazem a sua parte nessa máquina de indexação muito bem.

O que essa mudança pode trazer de positivo?

Na verdade, muito mais coisa do que parece. Eu sempre fui favorável a isso, especialmente por um aspecto que eu vou comentar mais abaixo.

Continua lendo aí! 😎

Eu ainda utilizo o Ubuntu com uma certa frequência, mas confesso que depois da mudança do Unity e abandono do projeto para Smartphones, abdicando em parte do Desktop, eu perdi um pouco do interesse nele diretamente. Ainda assim, eu utilizo para a produção dos vídeos do canal (nos últimos tempos pelo menos) um derivado direto, o Linux Mint. Estou com o Ubuntu 18.04 pre-alpha instalado em máquina virtual e em máquina real justamente para ajudar a reportar bugs para o desenvolvimento do sistema, no entanto, esse é um comportamento de uma parcela mínima de usuários do Ubuntu e certamente não é o suficiente para ter uma noção geral de onde o Ubuntu roda.

Uma das coisas que eu gostei no anúncio foi a transparência, deixando mais do que claro tudo o que vai acontecer, como e através de que. Isso é um ótimo sinal.
Talvez eles tenham aprendido a lição com a lente do Unity, que apesar de não fazer nenhum mal na prática, foi introduzida de forma controversa e sem todas as explicações que a comunidade Linux gosta.

Outra coisa boa é que cada ponto comentado para coleta de informação, além de ignorar a identidade do usuário, me parece justificável, vocês não acharam? Todas me parecem ter um função clara, levando dados importantes aos desenvolvedores, que ajudarão os mesmos a tomar decisões e focar em coisas importantes.

Destaques da utilidade dos dados coletados


Pelo que foi descrito, a opção (que pode ser desmarcada) simplesmente coleta informações que o instalador do Ubuntu tem acesso, ou seja, a configuração que você fez para instalar o sistema e em qual hardware.

Sei que pode ser difícil de imaginar, mas a Canonical estima que possua de 25 a 40 milhões de usuários somente no Desktop com o Ubuntu e diferente de distros que "focam em" ou tem um público menor, a variedade de hardware que o Kernel Linux do Ubuntu tem que lidar, assim como seus programas, somadas as condições de uso e interfaces diferentes (temos flavors do Ubuntu com praticamente todas as interfaces populares) é inimaginável. A combinação de variáveis diferentes e que podem eventualmente dar problemas é monstruosa!

Como diagnosticar problemas dessa forma em uma plataforma tão ampla?

A coleta de informações sobre o hardware, além de ajudar os desenvolvedores a entender qual o perfil geral de máquinas em que os usuários estão rodando o Ubuntu, tem um efeito colateral que eu considero extremamente interessante e valioso para o mercado Linux em geral e para nós.

Nós finalmente poderemos saber QUANTAS INSTALAÇÕES ATIVAS DO UBUNTU EXISTEM, em outras palavras, poderemos saber quantas pessoas usam Ubuntu no mundo, ou um valor aproximado disso com uma margem de erro muito mais baixa do que qualquer estatística gerada por mecanismos de pesquisa "super confiáveis". E o melhor, como os dados serão públicos para que qualquer usuário possa consultar, nós mesmos poderemos contar e ver se as pessoas que usam Ubuntu usam mais Intel ou AMD, Nvidia, AMD ou Intel para vídeo, etc.

O Ubuntu sempre foi o "ponta de lança" do mundo Linux para o mercado tradicional, juntamente com o Kali Linux para o "mundo hacker", os dois formam "a cara do Linux" para quem não é do meio, goste você ou não. Se o Ubuntu atrair desenvolvedores interessados a lançar softwares para Linux, todos ganham! Ainda mais agora com os Snaps e Flatpaks que rodam em qualquer sistema, assim como os AppImage.

Eu não sei se você entende as implicações disso, mas um dos maiores problemas para as distros Linux abarcarem parte do mercado Desktop é provar que realmente existe uma quantidade grande o suficiente de usuários que justifique o desenvolvimento de uma ferramenta qualquer.

O único jeito de contar usuários sem coletar dados pessoais (na minha opinião) é coletar o número de instalações do sistema. Assim uma desenvolvedora de jogos ou de um software (como o Evernote que diz até hoje que não tem usuários Linux o suficiente para lançar um cliente nativo) poderá usar estes dados para estimar o mercado. 

Como o Ubuntu é uma distro comercial, os parceiros OEM, como a Dell, que vendem as máquinas com Ubuntu, também tem interesse em saber se os usuários continuam usando o sistema depois da compra e essa é uma das formas de provar este conceito, além de facilitar em caso de suporte.

O próprio Linux Mint possui uma ferramenta para a coleta de informações também, só que o processo é manual, não automático. Ao carregar os dados do sistema dentro do Aplicativo "Informações do sistema", o Linux Mint joga de forma anônima um relatório público de dados do sistema, repositório e hardware do computador para o Git, resultado que pode ser acesso e compartilhado por qualquer um. Aqui você ver o report da minha máquina atual por exemplo. O que Canonical pretende fazer é semelhante, só que automatizado.

Fato curioso: Dentro do mundo Linux o Ubuntu não é a primeira distro a fazer isso. A Red Hat faz isso também (de outra forma, mas faz) e a Endless faz isso com o EndlessOS. Tudo isso serve para mostrar para os seus clientes o quanto popular você é.

Outro ponto que eu achei interessante é o monitoramento dos pacotes mais instalados. Assim você pode criar um ranking de downloads dos programas preferidos (é uma coisa interessante para os Softwares Centers), assim como faz o Linux Deepin atualmente que possui uma categoria de "Aplicativos preferidos" que é baseado simplesmente em quantas vezes um pacote é baixado na Store, mas além desse fator "estético" existe também a motivação para foco em correção de bugs de pacotes que afetam muitos usuários.

Exemplo: Digamos que existam 100 downloads do GIMP e 10 downloads do editor de imagens Pinta. Ambos possuem um bug. Pergunta: Em qual os desenvolvedores devem focar primeiro?

A dedução lógica é "no que tem mais usuários", no bug que afeta mais pessoas. 

O único jeito de saber isso é sabendo quais pacotes são mais usados.

Eu usei o exemplo de dois softwares gráficos correlatos, mas expanda essa visão para outras coisas, como bibliotecas, drivers e até mesmo o Kernel.

Outro exemplo: Usuários que usam o "Cheese" (programa para Webcam do GNOME) estão tendo problemas com uma Webcam que não funciona. Com a coleta de dados é possível que os desenvolvedores saibam qual o Kernel que está rodando na máquina e em qual hardware. Muitas vezes o usuário não está com o sistema atualizado e é isso que está causando o problema. Sabendo que o problema está na atualização, não há necessidade de dedicar esforços para corrigir um bug que já foi corrigido, tudo isso de forma automatizada, graças a mineração de dados.

Atualmente, além do usuário ter enviar deliberadamente  o bug para o Launchpad (o que requer um esforço extra e em alguns casos conhecimento técnico), alguém tem que verificar se este bug é realmente um bug do sistema ou se é algo causado pelo usuário e com ajuda das métricas de desenvolvimento ranquear este bug em uma lista de prioridades, considerando quantidade de impacto, gravidade (se afeta a segurança ou não), se o problema é no Ubuntu, na Câmera, no App de Câmera, do Driver, etc. São muitas variáveis.

Além de coletar dados é importante conseguir organizá-los de uma forma que seja prático e ágil a identificação destes problemas.

Pra finalizar...


Eu até já tinha comentado sobre isso durante o texto, mas algo que eu achei muito legal é que eles vão disponibilizar os dados coletados para consulta, assim eu posso ir lá e ver o que é mais usado, quase do mesmo modo que o "Steam Survey" nos mostra os hardwares e softwares mais utilizados dentro da Steam.

Até o momento as declarações me agradaram. Eu nunca deixei ou deixaria de usar o Ubuntu por conta de coleta de informações, e para quem se importa, sempre haverão outras opções, só não vale reclamar muito disso usando o Facebook, né? Por que não faria o menor sentido essa picuinha seletiva.

Para além disso, as promessas são boas, mas vamos ver a implementação deste plano na prática. Coleta de informações pode ser realmente muito benéfica, mas precisa ser feita com total transparência para que mantenham a confiança dos usuários e dos clientes da Canonical. Felizmente eles parecem estar no caminho certo, esperamos que não desviem.

P.S.: A ideia de fazer o "error apport" não ser invasivo é uma das melhores que eu já ouvi nos últimos anos de desenvolvimento do Ubuntu, ele só dava a impressão de "Ubuntu bugado" mesmo ele tendo os mesmos bugs que outros sistemas Linux que simplesmente não possuem um sistema para exibir os erros. 

Duas palavras pra vocês: "para béns". 😂

Deixe-me saber o que você pensa à respeito do assunto? :)

Até a próxima!

Fonte
_____________________________________________________________________________
Viu algum erro ou gostaria de adicionar alguma sugestão a essa matéria? Colabore, clique aqui.


Blog Diolinux © all rights reserved
made with by templateszoo