Skibsfartsstatistik baseret på big data
Artikel
DOI:
https://doi.org/10.54337/ojs.td.v29i1.7433Resumo
Big data passer ofte dårligt inden for rammerne af officiel statistik på grund af deres flygtige og ustrukturerede karakter. AIS-data er en big datakilde præget af stor stabilitet og struktur – til gengæld er datamængden omfattende med et stort behov for filtrering og behandling for at passe ned i den officielle maritime transportstatistiks afgrænsning.
AIS-data er et international aftalt format for udveksling af skibspositioner og er en relevant datakilde for alle lande med kyst. I Danmark overvåger Søfartsstyrelsen fartøjer i dansk søterritorium med en række landbaserede AIS modtagere. Siden 2016 har Danmarks Statistik modtaget et live feed af de indsamlede data og gemt dem og i januar 2020 publicerede Danmarks Statistik sin første månedsstatistik baseret på AIS-data. Da COVID19 ramte bare en god måned senere, kunne AIS-data derfor let omdannes til en høj frekvent indikator.
Artiklen vil vise de processer, Danmarks Statistik bruger for at identificere havne-lignende områder med brug af AIS-data alene og for at konvertere data til overskuelige og mere traditionelle datasæt, som kan bruges som supplement eller erstatning af officiel havnestatistik.
Kernen i databehandlingen er den cluster metode, der ud fra tætheden af fortøjrede fartøjer afgrænser havne. For store havne med afgrænsede kajområder kan der sågar skelnes mellem disse. Afgrænsningen kan dernæst anvendes til at skelne mellem fartøjer, der anløber kaj og dem, der blot passerer havneområderne.