Dados abertos e software livre: um match perfeito

Esse artigo é composto pelas anotações da palestra “Dados abertos e software livre: um match perfeito”, apresentada no FLISOL, realizado no IFPE Palmares em 29 abr. 2023. Aqui você também encontrará a apresentação (slides).

Dados abertos e software livre tem muito em comum na sua conceituação, principalmente no que se refere ao objetivo de proporcionar liberdade e autonomia para a sociedade com objetivo de que tenhamos poder debater e contribuir com o desenvolvimento de soluções.

1. parte do match: O Software Livre

“Software livre é uma denominação utilizada para sistemas que respeitam a liberdade e a ideia de comunidade das usuárias quanto a autonomia de executar, copiar, distribuir, estudar, alterar e melhorar o software.” (GNU Operating System, tradução livre)

Isso não significa que toda distribuição de software livre é gratuita, mas significa que todas elas devem ter licença que permita sua cópia e alteração ou mesmo monetização. O termo “livre” é proposital, para que não haja confusão com “gratuidade”. Podemos fazer uma analogia com a nossa liberdade de “ir e vir”, a qual não significa que essa movimentação é livre de custo.

História

Na década de 1980, no Laboratorio de Inteligência Artificial do MIT, onde trabalhava o programador estadunidense Richard Stallman, havia uma impressora que sempre atolava papel e as pessoas só notavam o problema quando iam buscar os documentos, que não estavam impressos, e, além disso, se deparavam com uma fila enorme de impressões. Isso gerava perda de tempo recorrente para as trabalhadoras do laboratório.

Então, Richard teve a ideia de implementar um sistema de monitoramento de impressões e notificação à solicitante quando ocorria alguma falha nessa tarefa. Assim, seria possível sua rápida correção. No entanto, ao pedir o código fonte da impressora para a fabricante, ele recebeu uma negativa.

Esse é um caso anedótico que ilustra a inquietação que deu origem ao movimento chamado “software livre”, o qual Richard é o seu fundador. A partir do desenvolvimento de tecnologias durante a Segunda Guerra Mundial se notava uma tendência de mudança de um dos paradigmas no desenvolvimento de sistemas: fornecimento de código fonte. Logo, naquele momento havia um ambiente propício para o surgimento de um movimento que visasse questões éticas com foco na usuária do produto.

Em 1984, foi iniciado o projeto GNU, desenvolvido de forma colaborativa, que teve como objetivo dar liberdade e controle para as pessoas usuárias no uso de seus computadores, permitindo, a partir da sua licença, a execução do software, distribuição, estudo e modificação.

Em 1985, foi publicado o manifesto GNU, que estabeleceu as bases filosóficas do movimento de software livre. Nesse mesmo ano, também, foi fundada a Free Software Foundation, uma organização sem fins lucrativos, que dá suporte ao citado movimento.

Em 1986, foi publicada a Licença Pública Geral - GNU, a primeira do tipo copyleft, ou seja, que proporciona a liberdade de uso e distribuição de uma obra, exigindo que seja preservado o mesmo tipo de licença nas suas cópias e distribuições.

Liberdades

A filosofia do movimento “software livre” é composta por quatro liberdades para as pessoas usuárias de sistemas, são elas:

  1. Liberdade para usar o programa com qualquer propósito;
  2. Liberdade para estudar como funciona o programa, modificá-lo e adaptá-lo;
  3. Liberdade para distribuir cópias do programa, para ajudar outras usuárias;
  4. Liberdade de distribuir cópias de suas versões modificadas para outras pessoas.

O detalhamento sobre cada liberdade e as fronteiras entre “livre” e não “livre”, você encontra nesse artigo.

Vantagens de usar softwares livres

As vantagens são muitas, mas destaco as seguintes:

Desenvolvimento e melhoria contínua: O fato de o código fonte estar disponível, permite que muitas pessoas possam revisá-lo e testá-lo, como consequência, pode haver uma maior rapidez no tratamento das falhas e resolução de problemas.

Independência tecnológica: As liberdades 2 e 4 garantem que o software possa ser estudado, customizado conforme necessidade da usuária ou sua comunidade e distribuído sem submeter a aprovação ou informar a ninguém.

Economia na aquisição, manutenção e renovação de tecnologias: Ainda que “software livre” não signifique “gratuito”, costuma ter um custo menor de aquisição e atualização.

Permite ser copiado: Como mencionado anteriormente com as liberdades, o software livre permite ser copiado, portanto, sem a necessidade de adquirir novas licenças, pode ser distribuído a todos que precisarem.

2. parte do match: Os Dados Abertos

“Dados abertos são dados que podem ser livremente usados, reutilizados e redistribuídos por qualquer pessoa - sujeitos, no máximo, à exigência de atribuição da fonte e compartilhamento pelas mesmas regras.” (Open Knowledge Foundation)

À essa definição é necessário acrescentar que os dados devem estar em formato de arquivo aberto, ou seja, que suas especificações técnicas estejam publicadas e sob licença não-proprietária.

História

Em 1942, Robert King Merton explicou a importância de que resultados de pesquisas científicas fossem livremente acessíveis a todos. Sua ideia era que cada pessoa pesquisadora deveria contribuir para o “pote comum” e abrir mão dos seus direitos de propriedade intelectual para permitir que o conhecimento avançasse mais rapidamente.

O termo “dados abertos” apareceu pela primeira vez em 1995, em um documento de uma agência científica estadunidense, que estimulava a promoção de um intercâmbio completo e aberto de informações científicas entre diferentes países como pré-requisito para a análise e compreensão de fenômenos globais.

Só em 2006, foi publicado um artigo que trazia a definição do termo: “dados que qualquer pessoa pode acessar, usar e compartilhar”, escrito por Tim Berners-Lee.

Princípios dos dados abertos

Em 2007, durante um encontro do “Open Government Working Group” foram estabelecidos oito princípios para que um dado seja considerado como aberto. São eles:

Completo: Todos os dados públicos devem ser disponibilizados. Dados públicos são dados que não estão sujeitos a restrições de privacidade, segurança ou privilégios de acesso.

Primários: Os dados devem ser coletados na fonte com o maior nível de detalhamento possível, e não de forma agregada ou modificada.

Oportunidade: Sua disponibilidade deve ser feita tão rapidamente quanto necessário para preservar o valor dos dados.

Acessibilidade: Os dados devem estar disponíveis para a mais ampla gama de usuários e as mais diversas finalidades.

Processável por máquinas: Os dados devem ser razoavelmente estruturados de modo a permitir o processamento automatizado.

Não-discriminatório: Os dados devem estar disponíveis para qualquer pessoa, sem necessidade de registro.

Não-proprietário: Os dados devem estar disponíveis em um formato sobre o qual nenhuma entidade tem o controle exclusivo.

Licença livre: Os dados não estão sujeitos a quaisquer direitos de autor, patentes, marcas comerciais ou regulamento secreto. Pode ser permitida uma razoável privacidade e restrições de privilégio e segurança.

Licença

Para garantir a proteção jurídica necessária para que os dados possam ser utilizados, reutilizados e redistribuídos, existe um grupo de licenças específica para base de dados, que explicita condições de uso e favorece a redistribuição. Algumas dessas licenças são:

Idealmente, os dados devem ser publicados sem nenhum tipo de restrição para uso, reuso e distribuição.

Vantagens

Alto nível de transparência de dados nos permite comparar, combinar e realizar conexões entre os dados. Isso possibilita identificar tendências, desafios, desigualdades econômicas e sociais, além de facilitar o monitoramento de programas e serviços públicos.

Um exemplo concreto da importância de ter um alto nível de transparência e abertura de dados, foi a luta coletiva contra a pandemia de COVID-19. Só foi possível acompanhar em tempo real a situação em cada país, monitorar a gestão dos recursos, desenvolver ferramentas tecnológicas e soluções científicas em um curto prazo devido ao esforço coletivo e intencional para abertura de dados e prática de ciência aberta.

O match

Você já percebeu as similaridades entre os temas?

A tabela abaixo relaciona algumas similaridades:

Dados Abertos Software livre
Completo: Todos os dados públicos devem ser disponibilizados. Dados públicos são dados que não estão sujeitos a restrições de privacidade, segurança ou privilégios de acesso.

Primários: Os dados devem ser coletados na fonte com o maior nível de detalhamento possível, e não de forma agregada ou modificada.

Oportunidade: Sua disponibilidade deve ser feita tão rapidamente quanto necessário para preservar o valor dos dados.

Processável por máquinas: Os dados devem ser razoavelmente estruturados de modo a permitir o processamento automatizado.
Código fonte: O programa deve incluir o código fonte e deve permitir a distribuição do código fonte, bem como na forma compilada. Quando algum tipo de produto não for distribuído com código fonte, deve haver um meio bem divulgado de obtê-lo por um custo de reprodução não superior a um custo razoável, de preferência por download gratuito na Internet.
Não-discriminatório: Os dados devem estar disponíveis para qualquer pessoa, sem necessidade de registro.

Acessibilidade: Os dados devem estar disponíveis para a mais ampla gama de usuários e as mais diversas finalidades.
Não discriminação contra pessoas ou grupos: A licença não deve discriminar nenhuma pessoa ou grupo de pessoas, bem como não deve restringir ninguém de usar o programa em uma área específica de atuação.
Não-proprietário: Os dados devem estar disponíveis em um formato sobre o qual nenhuma entidade tem o controle exclusivo. Redistribuição Gratuita: Nenhuma das partes está impedida de vender ou redistribuir o software.

Trabalhos Derivados: A licença deve permitir modificações e trabalhos derivados, e deve permitir que sejam distribuídos nos mesmos termos da licença de software original.
Licença livre: Os dados não estão sujeitos a quaisquer direitos de autor, patentes, marcas comerciais ou regulamento secreto. Pode ser permitida uma razoável privacidade e restrições de privilégio e segurança. Licença aberta: Para uso e redistribuição e modificação


Viu?! Ambos movimentos tem em sua essência o desejo de promover autonomia e liberdade para a usuária, no sentido de desenvolvimento de inovação e solucionar problemas comunitários.

E na prática?

Existe uma revolução global que busca fomentar ações colaborativas em torno a desafios mundiais, proporcionar um monitoramento eficaz das atividades governamentais e privadas, apoiar inovação, desenvolvimento econômico sustentável e criação e expansão de políticas públicas eficientes e eficazes.

Desde uma perspectiva governamental, em 2011, foi firmada a Parceria para Governo Aberto, a qual o Brasil foi um dos 8 primeiros signatários, junto com representantes da sociedade civil e outros países. Com essa Parceria, começamos a pensar sobre estratégias para transformação digital do nosso governo, além disso é notório o incentivo ao uso de softwares de código aberto e softwares livres. Ademais, algumas ferramentas desenvolvidas pelo governo federal começaram a ter licença aberta e seus códigos fonte publicados em repositórios no Github.

Um dos pilares da Parceria para o Governo Aberto é dar poder à sociedade para que possamos participar de forma efetiva das gestões das nossas cidades e dados abertos e software livre são ferramentas potentes para alcançarmos isso.

Desde a sociedade civil organizada, existe desenvolvimento de muitas tecnologias baseada em software livres e incentivando a abertura ou libertando dados, além de consumi-los. O poder está conosco.

Referências


Esse artigo é composto pelas anotações da palestra “Dados abertos e software livre: um match perfeito”, apresentada no FLISOL, realizado no IFPE Palmares em 29 abr. 2023.

Recursos:

Ana Cecília Vieira Analista de dados especializada em qualidade de dados. Entusiasta em dados abertos, código aberto e comunidades autogestinadas como instrumento para transformação social. Embaixadora do programa 'Ciência de Dados para Inovação Cívica' da Open Knowledge Brasil e podcaster no Pizza de Dados.

-----

Leia também: