Agricultura

Embrapa cria repositório de dados de pesquisas gerados pela empresa

O repositório abrange nove categorias temáticas e já oferece acesso a 14 coleções de imagem e informações

O Repositório de Dados de Pesquisa da Embrapa (Redape), implantado com o objetivo de preservar e facilitar a busca por dados de pesquisa gerados pela empresa, está em operação desde abril deste ano (2022). A consulta ao repositório facilita reconhecer características genéticas, diagnosticar doenças que comprometem culturas diversas e analisar a produtividade de lavouras pelos pesquisadores e técnicos em extensão rural, em suporte ao produtor rural.

O Redape abrange nove categorias temáticas compiladas dos portfólios de projetos da Embrapa, sendo eles:

  • Agroecossistemas, recursos naturais e meio ambiente;
  • Alimentos e nutrição humana;
  • Biomassa, bioinsumos e energia renovável;
  • Biotecnologia, nanotecnologia, agricultura de precisão e digital;
  • Economia, desenvolvimento e sociologia rural;
  • Inovação organizacional; produção animal;
  • Produção vegetal e recursos genéticos.

Já estão disponíveis para download 14 coleções, cada uma delas formada por imagens e informações associadas, validadas por um comitê gestor formado por especialistas de diversas áreas. “Outras 200 estão sendo trabalhadas para ser disponibilizadas”, diz Carla Macário, chefe-adjunta de Pesquisa e Desenvolvimento da Embrapa Agricultura Digital.

A ideia de construir um repositório com dados de pesquisa surgiu em 2018, quando a Embrapa Agricultura Digital passou a integrar o grupo de trabalho que projetou e desenvolveu a rede de repositórios de dados de pesquisa das universidades públicas do Estado de São Paulo, coordenado por Claudia Bauzer Medeiros, integrante do Programa Fapesp de Pesquisa em eScience e Data Science.

Essa rede levou três anos para ser construída, envolvendo mais de cem pessoas de oito instituições, uma das quais a Embrapa Agricultura Digital, que disponibilizou em dezembro de 2019 um grande conjunto de imagens de doenças de plantas e que tem em Macário sua representação no grupo de trabalho estabelecido.

As outras instituições que fazem parte dessa rede são a Universidade de São Paulo (USP), a Universidade Estadual de Campinas (Unicamp), a Universidade Estadual Paulista (Unesp), a Universidade Federal de São Carlos (UFSCar), o Instituto Tecnológico de Aeronáutica (ITA), a Universidade Federal de São Paulo (Unifesp) e a Universidade Federal do ABC (UFABC). Os metadados dos repositórios das instituições participantes da rede são coletados em um catálogo único, on-line, por um programa chamado “metabuscador” (buscador de metadados).

Esse grupo de trabalho desenvolveu normas para intercâmbio de dados entre as participantes e fez estudos de desempenho para definir a adoção dos melhores softwares abertos de padrão mundial para criação de repositórios. “Em 2021, a ideia foi encampada pela Embrapa como um todo”, conta Oliveira.

Uma característica importante do Redape é a atribuição de um DOI (Digital Object Identifier), que funciona como um identificador persistente para cada conjunto de dados publicado, permitindo que as coleções sejam referenciadas, tornando-as facilmente acessíveis para quem busca os dados produzidos pela Embrapa.

Além disso, o Redape é aderente aos princípios FAIR, acrônimo em inglês que identifica dados de pesquisa localizáveis (findable), acessíveis (accessible), interoperáveis (interoperable) e reutilizáveis (reusable), alinhando-se aos princípios definidos pelo Grupo de Trabalho de Dados da Fapesp e preconizados em todo o mundo como base para a gestão de dados de pesquisa.

O Redape pode ser acessado por empregados da Embrapa, bolsistas, estagiários, parceiros e comunidade externa. No caso do público interno, o repositório pode ser utilizado tanto para inserir quanto para recuperar dados e metadados. No caso do público externo, pode ser utilizado para recuperar metadados e dados, quando não houver restrição de acesso.

“As coleções de dados armazenadas no Redape estão disponíveis para o metabuscador da rede desenvolvida pelo grupo de trabalho da Fapesp. Uma possibilidade futura é que o repositório possa também disponibilizar coleções de dados agrícolas produzidos em projetos desenvolvidos com apoio da fundação”, afirma Macário.