COLETA E INTEGRAÇÃO DE FONTES DE DADOS HETEROGÊNEAS SOBRE PATENTES

Authors

  • Raulivan Rodrigo da Silva <span>Centro Federal de Educação Tecnológica de Minas Gerais (CEFET-MG)</span><br /> Autor
  • Thiago Magela Rodrigues Dias Centro Federal de Educação Tecnológica de Minas Gerais (CEFET-MG) Autor
  • Washington Luís Ribeiro de Carvalho Segundo <span>Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT)</span><br /> Autor

Abstract

No campo da ciência da informação e ciência de dados, a integração e padronização de múltiplas fontes de dados são cruciais para garantir a consistência e comparabilidade dos resultados. Este trabalho aborda a necessidade de integrar dados heterogêneos relacionados a patentes coletadas de diferentes repositórios, destacando os desafios e benefícios dessa prática. Assim, este trabalho tem como objetivo principal estabelecer por meio do processo metodológico fundamento em estudo de caso, um processo sistemático de integração de dados relacionado a patentes provenientes de três fontes distintas: Espacenet, INPI e currículos da Plataforma Lattes. Como resultado, mediante as estratégias delineadas neste estudo foi possível estabelecer um esquema composto por oito entidades que visam normalizar os dados e estabelecer relacionamentos entre as diferentes fontes, de tal forma a viabilizar análises de diversas magnitudes. Embora tenha-se focado em dados oriundos da Espacenet, INPI e Plataforma Lattes, o modelo proposto pode ser adaptado para outras fontes de dados.

Author Biographies

  • Raulivan Rodrigo da Silva, <span>Centro Federal de Educação Tecnológica de Minas Gerais (CEFET-MG)</span><br />
    Doutorando em Modelagem Matemática e Computacional pelo CEFET-MG (2022). Mestre em Modelagem Matemática e Computacional pelo CEFET-MG (2022). Especialista em Engenharia de sistemas baseado em tecnologias JAVA pela PUC Minas campus Coração Eucarístico em BH/MG (2013). Bacharel em Sistema de Informação pela Faculdade Pitágoras campus Divinópolis/MG (2011). Atualmente sou professor efetivo do CEFET MG no campus Divinópolis, lotado no Departamento de Computação (2019), lecionando disciplinas no ensino médio/técnico e graduação. Tendo experiência na área Ciência da Computação e Ciência da Informação, destacando as seguintes temáticas: Patentometria, Cientometria, Análise e Desenvolvimento de Software, Programação para dispositivos móveis, Arquitetura de Software.
  • Thiago Magela Rodrigues Dias, Centro Federal de Educação Tecnológica de Minas Gerais (CEFET-MG)
    Doutor em Modelagem Matemática e Computacional pelo CEFET-MG (2016) tendo trabalhado com Bibliometria, Extração de Dados Científicos e Análise de Redes de Colaboração Científica. Mestre em Modelagem Matemática e Computacional pelo CEFET-MG (2008), trabalhando com Arquitetura Orientada a Serviços e Web Mining com o tema: Uma Arquitetura Orientada a Serviços para emprego em Sistemas de Mineração de Dados na Web. Possui graduação em Ciência da Computação pelo Centro Universitário de Formiga - UNIFOR (2004), além de Especialização em Produção de Software - com Ênfase em Software Livre pela UFLA (2007) e Especialização em Melhoria do Processo de Software, UFLA (2007). Atua como Professor no Centro Federal de Educação Tecnológica de Minas Gerais (CEFET-MG) lecionando disciplinas na Graduação e Pós-graduação da instituição. Professor do Programa de Pós-graduação em Modelagem Matemática e Computacoinal do CEFET-MG e Professor Permanente do Programa de Pós-graduação em Ciência da Informação da Universidade Federal de Santa Catarina (UFSC). Também tem atuação como Colaborador em Projetos no Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT). Tem experiência na área de Ciência da Computação e Ciência da Informação, atuando principalmente nos seguintes temas: Bibliometria, Cientometria, Extração e Integração de Dados, Análise de Redes Sociais, Análise de Redes de Colaboração Científica, Acesso Aberto, Recuperação e Organização da Informação, Ciência de Dados, Data Mining, Text Mining e Web Mining. Membro da Sociedade Brasileira de Computação (SBC) e da Associação Nacional de Pesquisa e Pós-Graduação em Ciência da Informação (ANCIB).
  • Washington Luís Ribeiro de Carvalho Segundo, <span>Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT)</span><br />
    É Doutor e Mestre em Informática pela Universidade de Brasília, com Estágio de Doutorado Sanduíche no King's College London. Possui graduação em Matemática (Bacharelado e Licenciatura) também pela Universidade de Brasília. É Coordenador-geral de Informação Científica e Técnica no Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict / MCTI). É membro e coordena projetos, comitês nas áreas de Ciência Aberta e Ciência de Dados. É líder do Grupo de Pesquisa e Laboratório do Ecossistema da Pesquisa Científica Brasileira (LaEPeCBr) (http://dgp.cnpq.br/dgp/espelhogrupo/9750187028652303, https://pnipe.mctic.gov.br/laboratory/3911).Áreas de interesse em pesquisa: Métodos Formais, Repositórios Digitais Abertos, Repositórios de Dados Científicos, Interoperabilidade entre Sistemas de Informação Abertos, Ciência Aberta e Ciência de Dados.

Published

2024-12-02

Conference Proceedings Volume

Section

GT 8 – Dados, Informação e Tecnologia