EXPRESSIVIDADE SEMÂNTICA DO BIG DATA: EXTRAINDO INFORMAÇÕES DE DADOS

Autores

  • Durval Vieira Pereira Universidade Federal do Estado do Rio de Janeiro (UNIRIO) Autor
  • Linair Maria Campos Universidade Federal Fluminense (UFF) Autor
  • Sergio de Castro Martins Universidade Federal do Rio de Janeiro (UFRJ) Autor
  • Mauricio Augusto Cabral Ramos Junior <span>Universidade Federal Fluminense (UFF)</span> Autor
  • Carlos Henrique Marcondes Universidade Federal de Minas Gerais (UFMG) Autor

Resumo

Estuda a relação entre dados digitais e sua expressividade semântica, no contexto do Big Data. Problematiza os dados enquanto recurso semântico, que atingem todo seu potencial quando processados pelas tecnologias da informação. Objetiva examinar como o conceito de expressividade semântica atua no âmbito do Big Data, no que tange a extração de informações de dados. Conceitua dados enquanto artefatos criados a partir de uma intencionalidade, entes semióticos, representações de fenômenos ou entidades do mundo real. Sugere que dados se organizam em diferentes níveis, desde o mais simples dado digital até os agregados mais complexos, formando conjuntos ou sistemas de dados, tornando os dados mais expressivos e capazes de gerar semântica para humanos e para máquinas. Classifica-se como pesquisa de natureza qualitativa, de tipo exploratório, com caráter teórico-conceitual e procedimento bibliográfico. Apresenta como resultado um quadro onde os diferentes tipos de agregados de dados são organizados em níveis crescentes de complexidade. À medida que se tornam mais complexos estes agregados tornam-se mais expressivos semanticamente e, ao serem processados, podem gerar semântica/informação para humanos e para máquinas. Conclui que, em um ambiente de Big Data, a “semântica” emerge dos dados segundo dois eixos: o eixo das representações ou modelagem conceitual (Organização do Conhecimento), e eixo do processamento destas representações, a modelagem estatística (Ciência de Dados). Os resultados mostram que pode haver uma aproximação entre a Organização do Conhecimento e Big Data e Ciência de Dados.

Biografia do Autor

  • Durval Vieira Pereira, Universidade Federal do Estado do Rio de Janeiro (UNIRIO)
    Possui graduação em Biblioteconomia e Documentação pela Universidade Federal Fluminense (2005), mestrado em Ciência da Informação pela Universidade Federal Fluminense (2014) e doutorado em Ciências da Informação pela Universidade Federal Fluminense (2022). Atualmente é professor do Departamento de Processos Técnicos-documentais, no Centro de Ciências Humanas, da Universidade Federal do Estado do Rio de Janeiro. Tem experiência na área de Ciência da Informação, com ênfase em Biblioteconomia, atuando principalmente nos seguintes temas: epistemologia da Ciência da Informação, Organização do Conhecimento e Tecnologia da Informação.
  • Linair Maria Campos, Universidade Federal Fluminense (UFF)
    Possui graduação em Informática, mestrado em Informática pela Universidade Federal do Rio de Janeiro (2004) e Doutorado em Ciência da Informação pelo convênio UFF/IBICT. Professora associada do departamento de Ciência da Informação e do PPGCI da Universidade Federal Fluminense. Analista de TI aposentada da UFRJ, tem experiência de mais de 20 anos na área de Ciência da Computação. Tem interesse nos seguintes temas: ontologias, objetos de fronteira, tecnologias web, web semântica, dados interligados abertos, modelagem conceitual, modelagem ontológica, classificação facetada. Vem atuando em diversas Instituições como consultora em atividades de elaboração de linguagens documentárias
  • Sergio de Castro Martins, Universidade Federal do Rio de Janeiro (UFRJ)
    Doutor em Ciência da informação. Professor e Coordenador do curso de Biblioteconomia e Gestão de Unidades de Informação da UFRJ. Doutor em Ciência da Informação (UFF-RJ) com estágio doutoral na Universidad Carlos III de Madrid, Espanha. Mestre em Ciência da Informação (UFF-RJ). Mestrando em Filosofia (UERJ), com estudos em Filosofia da Mente e Inteligência Artificial. Especialista em Administração e Sistemas de Informação - MBA (UFF-RJ). Bacharel em Biblioteconomia e Documentação (UFF-RJ). Realiza pesquisas abrangendo os seguintes temas: Filosofia das Ciências, Filosofia da Mente, Inteligência Artificial, Tecnologias Cognitivas, Tecnologias Semânticas/Ontologias, Organização e Representação da Informação e do Conhecimento, Sistemas de Informações de Alto Desempenho, Gestão da Informação e Gestão de Documentos (GED/ECM).
  • Mauricio Augusto Cabral Ramos Junior, <span>Universidade Federal Fluminense (UFF)</span>
    Graduação em Administração pela Faculdade Moraes Junior (1997). Especialização em Tecnologia da Informação aplicada à Gestão de Negócios pela Universidade do Estado do Rio de Janeiro (2003). Mestrado em Administração pela Universidade Federal Fluminense (2016). Doutorado em Ciência da Informação pela Universidade Federal Fluminense (2022). Experiência na área de Administração, com ênfase em Estratégia, Gestão de Projetos e Tecnologia da Informação e Comunicação.
  • Carlos Henrique Marcondes, Universidade Federal de Minas Gerais (UFMG)
    Possui graduação em Arquitetura e Urbanismo pela Universidade Federal Fluminense (1978), mestrado em Ciência da Informação pela Universidade Federal do Rio de Janeiro (1992) e doutorado em Ciência da Informação pela Universidade Federal do Rio de Janeiro (1998). Realizou estágio pós-doutoral na Universidade Carlos III de Madrid, 2011. Professor Titular do Departamento de Ciência da Informação e do PPGCI da Universidade Federal Fluminense e pesquisador 1D do Conselho Nacional de Desenvolvimento Científico e Tecnológico e Investigador Colaborador da Universidade Complutense de Madrid. Foi "chair" do I Seminário de Pesquisa em Ontologias no Brasil, UFF, 2008, https://www.youtube.com/watch?si=4-69SpJ29q_KmCw-v=8rxGCdVpt0Yfeature=youtu.be, que hoje é a série de eventos ONTOBRAS. Foi professor visitante da ECI/UFMG de 2019 a 2021. Atualmente é professor credenciado no PPGCI/UFF e no PPG-GOC/ECI/UFMG. Trabalhou em consultorias para o IBICT (Projeto BDTD, 2001), BIREME/OPAS (SCIELO OAI, 2002), CNPq (Programa Prossiga, 2001), IPHAN (Cadastro Nacional de Museus, 2008). É instrutor certificado do Comitê para Documentação Museológica do ICOM. Foi consultor da Rede Web de Museus do Estado do Rio de Janeiro, http://www.museusdoestado.rj.gov.br/rede-web-de-museus/. Foi membro do CTC do IBICT, 2003-2005, É membro do grupo Wikipedia Wiki Educação Brasil, http://www.wikibrasil.org/ e membro do grupo GO FAIR BRASIL SAÚDE, https://portal.fiocruz.br/go-fair-brasil-saude e colaborador do Projeto VODAN-Br, grupo de trabalho sobre proveniência de metadados de pesquisa, https://portal.fiocruz.br/en/vodan-brazil. É autor do livro Datos abiertos enlazados de archivos, bibliotecas y museos en la Web. Barcelona: Editorial UOC, 2018. (EPI scholar). ISBN 978-84-9180-307-2, ver: https://www.e-buc.com/fitxa.php?isbn=978-84-9180-307-2. Tem experiência na área de Ciência da Informação, com ênfase em Organização e representação do Conhecimento em ambientes digitais, atuando principalmente nos seguintes temas: fundamentos teóricos da CI e OC, publicações semânticas, ontologias, tecnologias semânticas e de dados abertos interligados, bibliotecas e museus digitais e interoperabilidade. ORCID: https://orcid.org/0000-0003-0929-8475. Página Acadêmica: http://profmarcondes.ong.br/

Downloads

Publicado

30-09-2024

Volume dos Anais

Seção

GT 2 – Organização e Representação do Conhecimento