
26/02/2025
Um estudo recém-publicado propõe o uso de ferramentas gratuitas e acessíveis para a gestão de dados do CadGP, a plataforma de acompanhamento de pesquisas científicas do Sistema Ambiental Paulista. O trabalho foi realizado pelo assistente técnico de pesquisa científica e tecnológica do Instituto de Pesquisas Ambientais (IPA) Rodrigo Dias Dutra e publicado na revista Derbyana, um dos periódicos científicos da instituição.
A pesquisa foi proposta a partir do desafio de organizar a grande quantidade de dados gerados pelos órgãos públicos e pelas instituições científicas com dinamismo e transparência, considerando que o tratamento adequado desses dados possibilitam tomadas de decisões assertivas e maior eficiência no uso dos recursos públicos. Para que isso seja possível, a implantação de sistemas de informação é fundamental. Esse processo de transformar dados brutos em informações para tomadas de decisões com o uso de ferramentas tecnológicas é definido como Business Intelligence (BI).
O Cadastro e Gestão de Pesquisas (CadGP) é um sistema de informação onde pesquisadores vinculados a instituições do Sistema Ambiental Paulista submetem seus projetos científicos, seguindo um fluxo de tarefas desde o cadastramento até seu encerramento. Todos os projetos desenvolvidos em unidades de conservação da natureza (UCs) do Sistema Estadual de Florestas do Estado de São Paulo (Sieflor) também devem ser cadastrados na plataforma. O portal foi desenvolvido dentro do Sistema Integrado de Gestão Ambiental (Sigam), plataforma de serviços da Secretaria de Meio Ambiente, Infraestrutura e Logística (Semil) do estado de São Paulo. Abrange projetos nas áreas de biodiversidade, botânica, ciências florestais e geociências. Atualmente, o número total de projetos de pesquisa cadastrados é de 1132. Para este trabalho, foram selecionados projetos de pesquisas de geociências, considerando apenas aqueles em andamento, totalizando 35.
O objetivo do estudo foi aplicar o conceito de BI no sistema CadGP, de modo a aprimorar a organização e apresentação dos dados. Para isso, foi testado o Google Looker Studio, uma ferramenta para a visualização de dados online, de acesso fácil e intuitivo, que permite a confecção de painéis, relatórios e métricas. As representações gráficas, disponibilizadas pela ferramenta, permitem ao usuário a escolha que melhor represente seus dados, possibilitando diferentes abordagens. O acesso aos dados também permite a elaboração de filtros, listas e controles para a consulta.
Integrado à utilização da ferramenta Google Looker Studio, foi adotado o processo ETL (extract, transform, and load /extração, transformação e carregamento), que possibilita filtrar, classificar e processar dados de fontes internas ou externas, facilitando, posteriormente, sua disponibilização. Para isso, foram utilizadas as ferramentas de ETL do Excel e Power Query. Durante a pesquisa, esse processo demandou um tempo maior (cerca de 70% do tempo total) para que os dados fossem tratados e carregados, até que fossem tornados confiáveis.
As ferramentas de visualização da plataforma permitem a apresentação da distribuição espacial das pesquisas científicas. Esta visualização espacial indica pontualmente a localização da área estudada no projeto de pesquisa, bem como permite distinguir as regiões com maior concentração de estudos. No estudo, verificou-se uma concentração expressiva dos projetos de geociências na porção centro-leste do estado. O mapa de distribuição geográfica também permite uma navegabilidade interativa, onde é possível acessar e filtrar as informações de cada projeto (título, local da pesquisa, responsável, quantidade de projetos em desenvolvimento, entre outras).
Entre os principais dados observados no estudo, considerando os projetos de geociências em andamento, observou-se a seguinte distribuição nas subáreas: 17 em geologia, 16 em geografia física e dois em meteorologia. Também foi constatado que a maior parte dos projetos em hidrogeologia são desenvolvidos fora de unidades de conservação, em áreas onde a captação de águas subterrâneas é crucial para o abastecimento público. Em relação às instituições externas responsáveis por projetos de pesquisa (17 entidades), verificou-se a predominância de projetos desenvolvidos pelo Instituto de Geociências e pela Faculdade de Filosofia, Letras e Ciências Humanas, ambos pertencentes à Universidade de São Paulo (USP). Considerando exclusivamente os projetos internos, coordenados por pesquisadores do IPA, as principais fontes de recursos são o Tesouro Estadual de São Paulo, a Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp), além de fontes externas.
O uso da plataforma Google Looker Studio, conjugada com as ferramentas de ETL, mostrou-se eficiente para a análise e visualização dos dados do CadGP. Além de serem ferramentas gratuitas, seu uso é acessível e intuitivo, mesmo para um usuário iniciante. O estudo demonstrou que a adoção das ferramentas de BI por organizações do setor público é viável e necessária, pois grandes volumes de dados são gerados diariamente e sua visualização e análise é essencial para a melhor gestão de pesquisa, beneficiando as tomadas de decisões e ampliando a divulgação ao público externo.
O artigo científico “Aplicação da ferramenta Google Looker Studio para análise e visualização de dados de um sistema de gestão de pesquisa ambiental” foi publicado em dezembro. A Derbyana é uma revista de acesso aberto e peer-reviewed, em continuidade à Revista do Instituto Geológico, do instituto homônimo, publicada de 1980 a 2020. O periódico tem como finalidade publicar artigos relacionados às geociências e áreas correlatas, inéditos e originais, de caráter científico e/ou tecnológico. Destina-se também à publicação de revisões, mapas e cartas, notas prévias, comentários, críticas e réplicas de artigos.
Testando outras ferramentas de BI
Durante o 3º Simpósio do IPA, realizado de 26 a 28 de novembro do ano passado, Rodrigo apresentou painel sobre outro trabalho, no qual testou o aplicativo Power BI, da Microsoft, para viabilizar relatórios geoespaciais dinâmicos dos projetos de pesquisa cadastrados do CadGP e contribuir com o entendimento do perfil das pesquisas realizadas nas áreas protegidas do estado. Para análise e validação dos dados, também foi realizado o processo de ETL com a utilização das ferramentas Excel e Power Query. O resumo do trabalho “Painel de “GeoDados CadGP”: implantação da ferramenta Power BI para análise e visualização de dados”, realizado junto a colegas do IPA e da Fundação Florestal, está disponível nos anais do evento.
Notícias relacionadas
- Revista científica do IPA lança nova seção temática e aborda cartografia geomorfológica para o Antropoceno
- Pesquisadora do Núcleo de Geociências participou do evento “HidroGeoDia|Brasil” na cidade de Bauru
- Instituto de Pesquisas Ambientais é homenageado durante as celebrações dos 47 anos da Defesa Civil do Estado de São Paulo