O serviço digital da FCT, desenvolvido pela FCCN, Arquivo.pt, apresenta um conjunto de dados abrangente que vem abrir novas possibilidades para a compreensão e análise dos padrões de conetividade da Web

No total, esta coleção engloba mais de 139 milhões de URLs de páginas Web, cada um acompanhado de metadados (informação detalhada sobre os dados incluídos em cada hiperligação que compõe a arquitetura da web) cruciais sobre as suas ligações de entrada.  

Ao disponibilizar publicamente este conjunto de dados, o Arquivo.pt permite que os investigadores explorarem abordagens inovadoras, semelhantes à análise da Web e ao desenvolvimento de motores de busca, e abre inúmeras possibilidades de investigação em vários domínios, desde o desenvolvimento de novos algoritmos, o estudo da topologia da Web ou a investigação das relações de conteúdo.  

Uma porta aberta para a investigação da Web 

Os dados estão disponíveis gratuitamente num formato que permite um processamento e análise eficientes, tornando-os adequados tanto para estudos em grande escala como para investigações específicas. 

O lançamento do conjunto de dados Links Dataset do Arquivo.pt representa uma contribuição significativa para a comunidade de investigação científica da Web, enquanto base sólida que impulsiona investigações inovadoras e permite uma compreensão mais profunda da complexa estrutura da Web

Toda a informação está disponível na página do website Arquivo.pt.  

Últimos artigos