RECUPERAÇÃO DA INFORMAÇÃO E INTELIGÊNCIA ARTIFICIAL GENERATIVA COM LARGE LANGUAGE MODEL E RETRIEVAL-AUGMENTED GENERATION

Authors

  • Henrique Leal Tavares Universidade de Marília (UNIMAR), Universidade Estadual Paulista “Júlio de Mesquita Filho” (Unesp) - Campus de Marília<br /> Autor
  • Caio Saraiva Coneglian Universidade de Marília (UNIMAR); Universidade Estadual Paulista “Júlio de Mesquita Filho” (Unesp) - Campus de Marília, Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT)<br /> Autor
  • Emanuelle Torino Universidade Tecnológica Federal do Paraná (UTFPR)<br /> Autor
  • Silvana Aparecida Borsetti Gregorio Vidotti Universidade Estadual Paulista “Júlio de Mesquita Filho” (Unesp) - Campus de Marília<br /> Autor
  • José Eduardo Santarem Segundo Universidade de São Paulo (USP)<br /> Autor

Abstract

A Inteligência Artificial Generativa vem impactando toda a sociedade, impulsionando o desenvolvimento de soluções em diversas áreas do conhecimento. No contexto da Ciência da Informação, Large Language Model e Retrieval-Augmented Generation, amplamente utilizadas em ferramentas como o ChatGPT e Gemini, são técnicas capazes de influenciar e se relacionar de forma ampla com a Recuperação da Informação. Dessa forma, o presente trabalho tem como objetivo apresentar um modelo de Recuperação da Informação utilizando como interface um chatbot e aplicando as técnicas de Inteligência Artificial Generativa – Large Language Model e Retrieval-Augmented Generation. Para tal, realizou-se uma abordagem aplicada junto com a exploração da literatura acerca da temática, o que conduziu à construção do chatbot. Enquanto resultados, a solução desenvolvida, o chatbot, foi capaz de aplicar as técnicas da Inteligência Artificial Generativa, ao mesmo tempo em que demonstrou como a Recuperação da Informação está presente e se relaciona com a solução. Conclui-se, então, que o desenvolvimento de pesquisas aplicadas de Inteligência Artificial no âmbito da Ciência da Informação pode contribuir para novos estudos e para uma maior compreensão  da utilização dessas tecnologias emergentes na área.

Author Biographies

  • Henrique Leal Tavares, Universidade de Marília (UNIMAR), Universidade Estadual Paulista “Júlio de Mesquita Filho” (Unesp) - Campus de Marília<br />
    Doutorando em Ciência da Informação na Universidade Estadual Paulista (Unesp). Mestre em Ciência da Computação com foco em Visão Computacional e Aprendizado de Máquinas na Universidade Estadual Paulista (UNESP) em Bauru. Possuo graduação em Análise e Desenvolvimento de Sistemas - FATEC Garça Deputado Julio Julinho (2017). Tenho experiência na área de Ciência da Computação, com ênfase em Visão Computacional e Aprendizado de Máquina. Atualmente integro o Recogna Biometric Pattern Recognition Research Group, onde desenvolvo pesquisas em Biometria, Tracking e Detecção de Objetos, com foco no processamento e análise de imagens. Faço parte do corpo docente da UNIMAR (Universidade de Marília) ministrando aulas para Tecnólogo em Análise e Desenvolvimento de Sistemas e Bacharel em Ciência da Computação.
  • Caio Saraiva Coneglian, Universidade de Marília (UNIMAR); Universidade Estadual Paulista “Júlio de Mesquita Filho” (Unesp) - Campus de Marília, Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT)<br />
    Doutor e Mestre em Ciência da Informação na UNESP. Possui graduação em Ciência da Computação. Coordenador do cursos de graduação de Análise e Desenvolvimento de Sistemas e Ciência da Computação da Unimar. Coordenador do Núcleo de Inovação e Empreendedorismo da Unimar. Desde 2022 participa do grupo de pesquisa ?Administração de Organizações Inovadoras? da Universidade de Marília (UNIMAR). Professor Colaborador do Programa de Pós-Graduação em Ciência da Informação da UNESP. Docente do curso de graduação de Análise e Desenvolvimento de Sistemas da Unimar. Tem experiência na área de Ciência da Computação e Ciência da Informação, com ênfase em Ciência de Dados, Inteligência Artificial, Processamento de Linguagem Natural, Web Semântica, Banco de Dados e Repositórios Digitais.
  • Emanuelle Torino, Universidade Tecnológica Federal do Paraná (UTFPR)<br />
    Doutora em Ciência da Informação pela Universidade Estadual Paulista Júlio de Mesquita Filho (2022), Mestre em Gestão da Informação pela Universidade Estadual de Londrina (2010), Especialista em Gestão Contemporânea de Recursos Humanos pela Universidade Estadual de Londrina (2005), Bacharel em Biblioteconomia pela Universidade Estadual de Londrina (2003). Menção Honrosa no Prêmio Capes de Tese 2023, na área de avaliação: Informação e Comunicação. Bibliotecária na Universidade Tecnológica Federal do Paraná (UTFPR). Pesquisadora da Rede de Integração Acadêmico-Científica da Pós-Graduação (RICA-PG), por meio do Projeto "Arquitetura de Dados da Avaliação da Pós-Graduação brasileira no contexto da CAPES" (início: 2023). Pesquisadora do Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT/DF) - Projeto Lavoisier: sistema para avaliação sustentável de produtos (início: 2024) e Linha Preservação da Memória Indígena (início: 2023). Atua na área de Ciência da Informação, principalmente nos seguintes temas: informação e tecnologia, arquitetura de dados, ecologia complexa de dados, integração e interoperabilidade de dados, arquitetura da informação, comunicação científica, acesso aberto, ciência aberta, repositórios digitais, periódicos científicos, dados abertos, dados de pesquisa.
  • Silvana Aparecida Borsetti Gregorio Vidotti, Universidade Estadual Paulista “Júlio de Mesquita Filho” (Unesp) - Campus de Marília<br />
    Formação acadêmica: Licenciada em Matemática pelo Instituto de Biociências, Letras e Ciências Exatas da UNESP (1986). Especialista em Ciência da Computação pelo Instituto de Ciências Matemáticas de São Carlos da USP (1987). Mestre em Ciências - área de concentração - Ciências da Computação e Matemática Computacional - pelo Instituto de Ciências Matemáticas de São Carlos da USP (1993). Doutora em Educação - área de concentração Educação Brasileira - pela Faculdade de Filosofia e Ciências da UNESP (2001). Atuação profissional: Professora Assistente-Doutora em Regime de Dedicação Integral à Docência e à Pesquisa da Universidade Estadual Paulista Júlio de Mesquita Filho, Faculdade de Filosofia e Ciências - FFC - Campus de Marília, Departamento de Ciência da Informação. Docente dos cursos de graduação em Arquivologia e Biblioteconomia e dos cursos de mestrado acadêmico e doutorado em Ciência da Informação da Unesp. Coordenadora da Coordenadoria de Tecnologias Aplicadas (COTEA) do Ibict (Início: 2024).Coordenadora do Programa de Pós-Graduação em Ciência da Informação da Unesp (2004-2011). Coordenadora do Doutorado Interinstitucional (DINTER) Unesp e Universidade Federal do Ceará (2010-2014). Assessora da Pró-Reitoria de Pós-Graduação da Unesp - PROPG (2013-2017). Assessora da Pró-Reitoria de Graduação da Unesp - PROGRAD (2017-2024). Parecerista ad hoc de agências de fomento nacionais e membro de Comitês Científicos de periódicos científicos. Membro Titular do Conselho de Gestão Científica do Núcleo de Computação Científica da Unesp - GridUnesp. Coordenadora do Laboratório de Desenvolvimento e Aplicação de Multímidia da FFC - UNESP. Coordenadora acadêmica da Repositório Institucional Unesp (início: 2014). Coordenadora do Portal Docente Unesp (início: 2018). Coordenadora do Comitê Gestor de Acesso Aberto da Unesp (início: 2019). Bolsista em Produtividade em Pesquisa - CNPq/PQ (2014-2020). Membro da Associação Nacional de Pesquisa e Pós-Graduação em Ciência da Informação (ANCIB). Membro e Líder do Grupo de Pesquisa - Novas Tecnologias em Informação (GP-NTI) da Unesp. Membro do Grupo de Pesquisa - Representação Temática da Informação da Unesp. Membro do Grupo de Pesquisa - Web, Representação do Conhecimento e Ontologias da UFPB. Membro do Grupo de Pesquisa - Tecnologia e Gestão da Informação e do Conhecimento da UFRN. Membro do Grupo de Pesquisa - Tecnologias para Construção de Observatórios do IBICT / DF. Membro do Grupo de Pesquisa - BRIET: Biblioteconomia, Representação, Interoperabilidade, E-science e Tecnologia do IBICT / RJ. Bolsista do Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT/DF) - Projeto Rede de conhecimento Científico do Ministério de Ciência, Tecnologia e Inovação (MCTI) (período: 2021-2022). Bolsista do Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT/DF) - Projeto Ecossistema de Informação Governamental - Documentos Governamentais Digitais Acessíveis. (2022-2023) e Projeto Preservação da Memória Indígena (início: 2023). Membro do Go FAIR Brasil e coordenadora do pilar GO-CHANGE. Membro da Rede de Integração Acadêmico-Científica da Pós-Graduação (RICA-PG). Membro do Comitê Gestor do Programa de Governança Colaborativa de Informações da Pós-Graduação (GoPG) da CAPES. Coordenadora do Projeto "Arquitetura de Dados da Avaliação da Pós-Graduação brasileira no contexto da CAPES" - financiamento CAPES/RNP. Representante da Sociedade Civil (GO FAIR Brasil) no 6o. Plano de Ação Nacional - Parceria para Governo Aberto - Compromisso 3 - Práticas colaborativas para a ciência e tecnologia, coordenado pelo Ministério de Ciência, Tecnologia e Inovação (MCTI). Pesquisadora da área de Ciência da Informação, com ênfases em Tecnologias de Informação e Comunicação e em Arquitetura da Informação digital, Arquitetura de Dados, Ecologias informacionais complexas, Ecologias de dados complexas, Encontrabilidade da Informação, Acessibilidade, Usabilidade e Experiência de Usuário.
  • José Eduardo Santarem Segundo, Universidade de São Paulo (USP)<br />
    Livre Docente em Informação e Tecnologia pela Universidade de São Paulo (USP), 2020. Pós-Doutorado pela Faculdade de Engenharia da Computação da Western University/Canadá, 2018. Doutor e Mestre em Ciência da Informação pela Universidade Estadual Paulista Júlio de Mesquita Filho-UNESP-Marília/SP; Professor Doutor no Departamento de Educação, Informação e Comunicação, da Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto, da Universidade de São Paulo (USP); Docente do Programa de Pós-Graduação em Ciência da Informação da UNESP/Marília na linha de Informação e Tecnologia. Bolsista de Produtividade em Pesquisa PQ-2 do CNPq. Membro da Diretoria Executiva da Associação Nacional de Pesquisa e Pós-Graduação em Ciência da Informação (ANCIB). Coordenador do GT8 - Informação e Tecnologia, da Associação Nacional de Pesquisa e Pós-Graduação em Ciência da Informação (ANCIB) 2016-2021. Atua na linha de pesquisa - Ambientes Digitais e Tecnologias Aplicadas a Informação e Comunicação - , com ênfase em Web Semântica, Linked Data, Big Data, Aprendizado de Maquina (Machine Learning), Dados Abertos e Acervos Digitais. Lider do NEWSDA - Núcleo de Estudos em Web Semantica e Dados Abertos. Recebeu o Prêmio de Melhor Tese pela Associação Nacional de Pesquisa e Pós-Graduação em Ciência da Informação (ANCIB) - Ano 2011. Recebeu também Menção Honrosa no Prêmio Capes de Teses - 2011 (Ciências Sociais Aplicadas)

Published

2024-12-09

Conference Proceedings Volume

Section

GT 8 – Dados, Informação e Tecnologia