A QUESTÃO DA QUALIDADE EM DADOS PUBLICADOS COMO LINKED DATA: UM MAPEAMENTO SISTEMÁTICO DA LITERATURA

Authors

  • Ananda Fernanda de Jesus São Paulo State University image/svg+xml Autor
  • José Eduardo Santarem Segundo São Paulo State University image/svg+xml Autor

Abstract

A qualidade de dados é intrínseca à capacidade de atuação satisfatória nas atividades ou aplicações nas quais esses dados vão ser empregados, podendo ser avaliada através de dimensões e métricas específicas para cada domínio. Os dados disponibilizados de acordo com o Linked Data seguem um conjunto de princípios que visam a sua publicação estruturada e conectada no ambiente Web, entretanto, esses também são afetados por questões de qualidade. Nesse sentido, o presente trabalho objetiva compreender os principais enfoques temáticos por meio dos quais se discute a qualidade de dados publicados como Linked Data. Realizou-se um Mapeamento Sistemático da Literatura, no qual foram recuperados 89 artigos. Esses artigos foram agrupados em três categorias temáticas, sendo elas: 1) Propõe um artefato para avaliação ou melhorias de qualidade em dados publicados como Linked Data; 2) Realiza um estudo de avaliação de qualidade em um ou mais datasets; 3) Levantamentos e estudos teóricos sobre qualidade de dados e Linked Data. Conclui-se que a maioria dos artigos tem como foco a elaboração e a discussão de artefatos que permitam avaliar e promover melhorias em diversos aspectos da qualidade de dados publicados de acordo com os princípios do Linked Data.  Conclui-se ainda que são poucos os estudos cujo foco é promover discussões teóricas aprofundadas sobre a temática.

Author Biographies

  • Ananda Fernanda de Jesus, São Paulo State University
    Doutoranda em Ciência da Informação, pela Universidade Estadual Paulista. Mestre em Ciência da Informação, pela Universidade Federal de São Carlos. Bolsista da Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP). Bacharel em Biblioteconomia e Ciência da Informação, pela Universidade Federal de São Carlos (2018). Membro do Grupos de Pesquisa e Estudos em Representação do Conhecimento e Tecnologias da Informação e Comunicação (GPERTIC) . Tem interesse de pesquisas nos temas : Catalogação Descritiva; Linked Data; Web Semântica; Controle de Autoridade.
  • José Eduardo Santarem Segundo, São Paulo State University
    Livre Docente em Informação e Tecnologia pela Universidade de São Paulo (USP), 2020. Pós-Doutorado pela Faculdade de Engenharia da Computação da Western University/Canadá, 2018. Doutor e Mestre em Ciência da Informação pela Universidade Estadual Paulista Júlio de Mesquita Filho-UNESP-Marília/SP; Professor Doutor no Departamento de Educação, Informação e Comunicação, da Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto, da Universidade de São Paulo (USP); Docente do Programa de Pós-Graduação em Ciência da Informação da UNESP/Marília na linha de Informação e Tecnologia. Bolsista de Produtividade em Pesquisa PQ-2 do CNPq. Coordenador do GT8 - Informação e Tecnologia, da Associação Nacional de Pesquisa e Pós-Graduação em Ciência da Informação (ANCIB). Atua na linha de pesquisa - Ambientes Digitais e Tecnologias Aplicadas a Informação e Comunicação - , com ênfase em Web Semântica, Linked Data, Big Data, Aprendizado de Maquina (Machine Learning), Dados Abertos e Acervos Digitais. Lider do NEWSDA - Núcleo de Estudos em Web Semantica e Dados Abertos. Recebeu o Prêmio de Melhor Tese pela Associação Nacional de Pesquisa e Pós-Graduação em Ciência da Informação (ANCIB) - Ano 2011. Recebeu também Menção Honrosa no Prêmio Capes de Teses - 2011 (Ciências Sociais Aplicadas)

Published

2022-09-05

Conference Proceedings Volume

Section

GT 8 – Dados, Informação e Tecnologia