21 January, 2026

Standardisation of plant–pollinator interaction data under FAIR principles: experience from Pampean agroecosystems

A bee (Melissodes tintinnans) visiting sunflower. 
Photo by Marina Chamer.

by Gonzalez-Vaquero et al.

Plant–pollinator interactions are essential to the functioning of natural and agricultural ecosystems. Although the volume of available data on these interactions is steadily increasing, their utility for integrative studies is limited by heterogeneity in data formats and poor documentation. The WorldFAIR project (https://worldfair-project.eu/) aimed to improve data interoperability and promote the adoption of the FAIR (Findable, Accessible, Interoperable, Reusable) principles. In this study, we evaluated the effectiveness of two standardisation approaches (manual and semi-automated) applied to five datasets with varying levels of cleanliness, complexity, and structure. Our results show that for small datasets (fewer than 637 records), the manual method is more suitable, while for larger datasets, the semi-automated approach—based on tools such as OpenRefine—is more efficient after an initial learning curve. Additionally, we compiled a list of common issues encountered during the standardisation process and suggested possible solutions. This study aims to guide those interested in applying FAIR principles to ecological interaction data, supporting the planning and decision-making process when choosing the most suitable approach.

Read the scientificpublication in JPE HERE.

Spanish version

Las interacciones planta-polinizador son esenciales para el funcionamiento de los ecosistemas naturales y agrícolas. Aunque existe un volumen creciente de datos sobre estas interacciones, su utilidad para estudios integradores está limitada por la heterogeneidad de formatos y la escasa documentación. El proyecto WorldFAIR busca mejorar la interoperabilidad de los datos y fomentar la adopción de los principios FAIR (Findable, Accessible, Interoperable, Reusable). En este trabajo evaluamos la eficacia de dos métodos de estandarización (manual y semiautomático) aplicados a cinco conjuntos de datos con distintos niveles de limpieza, complejidad y estructura. Nuestros resultados muestran que, para volúmenes pequeños (menos de 637 registros), el método manual es más conveniente, mientras que, para conjuntos más grandes, el método semiautomático, basado en herramientas como OpenRefine, resulta más eficiente tras una curva inicial de aprendizaje. Además, elaboramos una lista de problemas comunes durante el proceso de estandarización y sugerimos posibles soluciones. Este estudio busca orientar a quienes deseen aplicar los principios FAIR en estudios de interacciones ecológicas, facilitando la planificación y toma de decisiones sobre el enfoque más adecuado.

No comments:

Post a Comment