Clínica Internacional de Campo de Ourique
Pub

Outros Sites

Visite os nossos laboratórios, onde desenvolvemos pequenas aplicações que podem ser úteis:


Simulador de Parlamento


Desvalorização da Moeda

Acerca do DRE Tretas

🔗 Introdução

Este site disponibiliza uma cópia tão fiel quanto possível do Diário da República Electrónico, em caso de dúvida deverá sempre recorrer à fonte oficial.

Em 2012, em resposta directa à baixíssima qualidade que o site oficial apresentava, foi concebido e implementado este site. Na altura os objectivos principais foram:

  • Permitir aos motores de busca indexar os documentos do DRE;
  • Proporcionar um motor de busca moderno, rápido e intuitivo ao utilizador final;
  • Disponibilizar os documentos em HTML (fáceis de visualizar em qualquer plataforma);
  • Permitir criar ligações do exterior para os documentos.

Pensamos que todos estes objectivos foram amplamente alcançados.

Depois de alguns percalços o site oficial foi actualizado em Setembro de 2014. O site apresenta uma interface moderna mas, infelizmente, nessa altura ainda não permitia o acesso livre aos documentos (o acesso era pago). Escrevi em Abril de 2016 um post sobre a situação do DRE.

Finalmente em Novembro de 2016 o DRE foi finalmente aberto. Com a abertura do DRE desapareceram muitos dos motivos para a existência deste site. No entanto, devido às seguintes razões decidiu-se manter o site no ar:

  • O custo da manutenção do site é muito baixo, tanto em tempo como em dinheiro;
  • O site, de forma consistente, tem cerca de 10000 visitas diárias (excluindo a pletora de bots que o assaltam constantemente);
  • Os motores de busca continuam a ter alguma dificuldade em indexar o site oficial, assim começámos a ligar todos os documentos à respectiva fonte oficial. Desta forma os motores de busca ficam com conhecimento das páginas oficiais e indexam-nas;
  • O site oficial continua a não disponibilizar o corpo de documentos para download fácil. Nós disponibilizamos a base de dados para quem a desejar usar, por qualquer motivo;
  • Quando colocámos a hipótese de desactivar o dre.tretas.org vários utilizadores pediram para não o fazermos.

Todos os cidadãos são convidados a utilizar este site. Qualquer comentário, crítica ou sugestão pode ser enviado para: webmaster@tretas.org.

Helder Guerreiro

José Lopes

🔗 Direito ao esquecimento

Nós, no dre.tretas.org, não temos qualquer influência sobre a INCM (Imprensa Nacional Casa da Moeda), que compõe e publica o Diário da República. Se julga que a presença do seu nome ou de quaisquer outros dados pessoais em documentos publicados no Diário da República atenta ao seu direito à privacidade, terá de levar o problema à INCM.

Compreendemos, no entanto, que queira remover conteúdos sensíveis dos motores de busca ao abrigo do Direito ao Esquecimento. Pode tentar fazer com que os motores de busca deixem de listar o seu nome com base numa decisão do Tribunal de Justiça da União Europeia (C-131/12, PDF, 13 de maio de 2014). Para o efeito tem várias alternativas:

Finalmente, se assim o entender, pode enviar-nos um mail para webmaster@tretas.org. Nesse mail deve de indicar o URL das páginas que pretende retirar dos motores de busca, deve também de indicar o motivo para a retirada das páginas. Se considerarmos que o motivo tem mérito, acrescentaremos um código às páginas em questão que fará com que os motores de busca que respeitem esse código não indexem a página. Evidentemente não nos podemos responsabilizar pelas acções dos motores de busca nem garantir que estes irão obedecer às nossas directivas.

🔗 Nota técnica

Este sistema corre sobre Linux, utilizam-se os seguintes sistemas principais:

  • Base de dados PostgreSQL;
  • Índice feito utilizando a biblioteca Xapian;
  • Interface web feita com Django;
  • O brasão de armas (esfera armilar e o escudo português) foi retirado desta página. É uma obra de Vítor Luís Rodrigues e António Martins-Tuválkin contratada pela Presidência da República em Junho de 2004 com o fim expresso de ser posta no domínio público;
  • Os icons utilizados no site foram retirados da colecção de icons do Projecto KDE, estão sob licença GPL v2.

Corre num servidor HP ML310 G8.

🔗 Desenvolvimento deste sistema

Todo o site foi feito usando software livre.

A escolha óbvia para a licença do próprio sistema foi a GPL v3. Pode obter o código fonte do site, colaborar no desenvolvimento, abrir bug reports, etc, na página do projecto no GitLab.

🔗 Base de dados

Pode fazer o download de toda a legislação que recolhemos do 'dre.pt' na ligação seguinte:

  • Download corpo de legislação
    • Base de dados em formato JSON (cerca de 90MB). Neste formato apenas temos os metadados;
    • Dump da base de dados com a ferramenta 'pg_dump' da base de dados PostgreSQL (cerca de 1.2GB), inclui os metadados e o texto dos documentos;
    • Uma base de dados SQLite (cerca de 1.4GB), inclui os metadados e o texto dos documentos. Este formato foi introduzido em Junho de 2024, tem a vantagem, em relação aos outros formatos, de se poder usar imediatamente com qualquer ferramenta compatível com o SQLite.

Note, por favor, o seguinte:

  1. Os ficheiros foram comprimidos usando a ferramenta bzip2. Depois de descomprimidos expandem para ficheiros relativamente pesados, com várias vezes o tamanho original (por exemplo, o ficheiro SQLite comprimido, com 1.4GB, expande para 10GB);
  2. Temos uma explicação sobre o formato dos ficheiros JSON e do dump PostgreSQL neste post. Para mais informações sobre o formato SQLite consultar este outro post;
  3. Estes ficheiros são gerados todos os Domingos por volta das 10:00 (Europa/Lisboa).

🔗 Lista de funcionalidades

  • Procura em texto livre usando a biblioteca Xapian:
    • Procura probabilística;
    • Procura booleana estruturada;
    • Procura usando prefixos;
  • Possibilidade de ordenar os resultados de busca por data;
  • Possibilidade de transformar uma busca num feed RSS, neste caso os resultados são sempre apresentados ordenados por data descendente, desta forma o feed apresenta sempre os últimos diplomas sobre o assunto da busca. Evidentemente não convém usar buscas com modificadores de data pois, se o fizer, o feed RSS será estático para essa data;
  • Navegação por datas:
    • Filtragem por uma série de critérios:
      • Série;
      • Tipo de documento;
      • Palavra chave;
  • Reconhecimento de citações entre documentos (com tooltip e hiperligação);
    • Lista de referencias feitas num dado documento;
    • Lista de documentos que referem um dado documento;
  • Procura de documentos relacionados;
  • Top dos documentos mais consultados no último dia, na última semana ou no último mês;
  • Suporte de utilizadores com áreas próprias:
    • Anotação de documentos (suporta markdown);
    • Manutenção de uma lista de marcadores:
      • Filtragem de marcadores (por datas, palavra chave e etiquetas);
      • Sistema de etiquetagem;
      • Sistema de anotação;
    • Possibilidade de ter os marcadores e anotações públicos ou privados;
    • Ferramentas para gestão do perfil de utilizador:
      • Dados pessoais;
      • Palavra chave;
      • Gestão de etiquetas;
      • Definições várias (controlo geral de privacidade, ajustes da interface).
  • Lista com os trezentos documentos mais recentes adicionados à base de dados - para benefício dos motores de busca.

🔗 Versões deste documento

Tal como referido mais acima todo o código fonte deste sistema é aberto e público. Pode consultar as versões anteriores desta página no GitLab.

Este link serve apenas para proporcionar aos motores de busca um caminho para todo o conteúdo do site.

Clínica Internacional de Campo de Ourique
Pub

Outros Sites

Visite os nossos laboratórios, onde desenvolvemos pequenas aplicações que podem ser úteis:


Simulador de Parlamento


Desvalorização da Moeda