GERAÇÃO AUTOMÁTICA DE METADADOS: ESTUDO DE CASO UTILIZANDO A TÉCNICA DE INDEXAÇÃO AUTOMÁTICA ESTATÍSTICA COM A FERRAMENTA ANNIF

Autores/as

  • Jean Carlos Borges Brito Universidade de Brasília - UNB Autor
  • Dalton Lopes Martins Universidade de Brasília - UNB Autor

Resumen

Esta pesquisa apresenta um estudo de caso com a ferramenta ANNIF, executando a geração automática de metadados através da técnica de indexação automática estatística e aprendizagem de máquina, utiliza algoritmo baseado em regras para extrair valores de metadados dos recursos de informação. O objetivo do trabalho é elaborar um framework para utilização da ferramenta. Criou-se um corpus de conhecimento com 52 artigos da Base Brasileira de Ciência da Informação (BRAPCI), utilizando como vocabulário controlado o Tesauro Brasileiro em Ciência da Informação (TBCI). Após o processo de treinamento do modelo realizou-se teste preliminar de indexação automática estatística sobre uma Tese Completa armazenada no Repositório Institucional da Universidade de Brasília (RiUnB) gerando a recomendação de assuntos/descritores. Os termos atribuídos pelo ANNIF foram comparados com as palavras-chave da tese da RiUnB, obtendo boa similaridade. Conclui-se que o uso do ANNIF, utilizando a técnica de indexação automática estatística contribuiu para automatização da tarefa, obtendo desempenho satisfatório.

Biografía del autor/a

  • Jean Carlos Borges Brito, Universidade de Brasília - UNB
    Doutorando na Universidade de Brasília - UnB em Ciência da Informação, Mestre em Gestão do Conhecimento e da Tecnologia da Informação pela Universidade Católica de Brasília - UCB/2010; Pós-Graduado em Gestão Estratégica pela Universidade Cândido Mendes - UCAM/2014, Pós-Graduado em Gerência de Projetos com Ênfase em Sistemas de Informação - FAST/2005; Bacharel em Sistemas de Informação - FACEB/2004. Trabalha atualmente como Coordenador de Tecnologia da Informação e Comunicação na Agência Espacial Brasileira.
  • Dalton Lopes Martins, Universidade de Brasília - UNB
    Professor no curso de Biblioteconomia e do Programa de Pós-graduação em Ciência da Informação PGGCinf da Faculdade de Ciência da Informação (FCI) na Universidade de Brasília (UnB) e no Programa de Pós-graduação Estudos da Condição Humana da Universidade Federal de São Carlos (UFSCar). Possui graduação em Engenharia Elétrica pela Universidade Estadual de Campinas (2002) e mestrado em Engenharia da Computação pela Universidade Estadual de Campinas (2004). Doutor em Ciências da Informação pela Universidade de São Paulo (2009-2012), trabalhando com o tema de mapeamento, análise estrutural e dinâmica de Redes Sociais em ambientes digitais distribuídos. Pesquisa sobre os temas objetos e repositórios digitais, acervos digitais e estratégias de interoperabilidade de sistemas de informação, dados abertos ligados, ciência de dados e aprendizagem de máquina com ênfase na análise de objetos digitais.

Publicado

2022-08-28