Reproducible geospatial data science: Exploratory data analysis using collaborative analysis environments
Conteúdo do artigo principal
Resumo
The answers to planetary problems could be hidden in gigabytes of satellite imagery from the last 40 years. Unfortunately, scientists lack the means for processing such amount of data as they are used to work over small quantities of satellite images. To amend this issue, we propose the use of web services from Big Earth data platforms along collaborative analysis environments. Both Web services and collaborative analysis environments fit the hypothesis-test workflow followed by researchers while writing analysis routines. Besides, the early use of Big Earth data structures eases the subsequent process of scaling analysis up to larger extensions. To test our proposal, we use our own Big Earth observation data platform, on which decades of satellite images are arranged into data cubes. By using our Web services platform, we integrate those data cubes into our collaborative analysis environment (a Jupyter notebook). Since our analysis routines consume the same data structure of the whole data sets, it is easier to scale up the analysis.
Downloads
Métricas
Detalhes do artigo
Autores que publicam nesta revista concordam com os seguintes termos:
- Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Atribuição que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
- Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
- Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (veja "O Efeito do Acesso Aberto").