Última alteração: 2022-12-09
Resumo
Visando identificar quais são os produtos mais ofertados no setor de capacitação empresarial, bem como, aqueles que têm maior peso no mercado e não são oferecidos por uma empresa de capacitação, foi realizado um estudo em uma base de dados de cursos construída para analisar os dados utilizando mineração de textos. Primeiramente foi necessário definir as áreas de interesse da pesquisa: Financeira, Mercado, Pessoas, Produção, Estratégia e Legal/Jurídica, somente cursos profissionalizantes. Depois, foram mapeados os concorrentes e os cursos. Os dados coletados foram o nome do curso, cidade, estado, área, tipo de oferta, subárea, faixa de preço, duração e maturidade. Com os dados coletados foi gerado o corpus textual da pesquisa, realizada a normalização dos dados por meio da padronização dos caracteres em maiúsculo e removidas as stopwords. Em seguida, foi calculada a métrica de similaridade dos termos com o cálculo de distância de Levenshtein e foram contabilizados os termos mais frequentes e os produtos (títulos) mais semelhantes, apresentando o resultado em uma nuvem de palavras e em uma nuvem de produtos semelhantes para cada área. Por meio do tratamento textual realizada no corpus construído para pesquisa e da apresentação dos resultados com as nuvens de palavras foi possível apresentar à empresa de capacitação empresarial quais são os produtos que ela e seus concorrentes estão oferecendo em maior volume, bem como, quais produtos somente a concorrência oferta e tem indícios para possíveis investimentos e revisão do seu portfólio.