Spring til indhold
Forside

Nyhed

Nyt dataværktøj fremskynder oceanografisk forskning til gavn for klimaet

Lagt online: 21.04.2023

Oceanografi er afgørende for at forstå, hvordan havene påvirker klimaet og omvendt. Forskere fra Aalborg Universitet og Universitetet i Haifa har udviklet nye AI-baserede dataværktøjer, der fremskynder forskningen inden for både oceanografi og andre domæner.

Nyhed

Nyt dataværktøj fremskynder oceanografisk forskning til gavn for klimaet

Lagt online: 21.04.2023

Oceanografi er afgørende for at forstå, hvordan havene påvirker klimaet og omvendt. Forskere fra Aalborg Universitet og Universitetet i Haifa har udviklet nye AI-baserede dataværktøjer, der fremskynder forskningen inden for både oceanografi og andre domæner.

Havene spiller en afgørende rolle i reguleringen af ​​klimaet, fx ved at optage overskydende varme og CO2. I løbet af det sidste århundrede er der foretaget talrige målinger, som har givet forskere inden for oceanografi en stadig større mængde data om havenes fysiske, kemiske, geologiske og biologiske egenskaber. Disse data kan bruges både til at få en dybere forståelse af, hvordan havene påvirker klimaet, og til at udvikle løsninger og strategier til at bekæmpe klimaændringer.

Nu præsenterer forskere fra Aalborg Universitet og Universitetet i Haifa et nyt sæt værktøjer, der styrker forskningen på dette område. For første gang er det muligt at lave automatiseret dataintegration af oceanografiske data, hvilket betyder, at det, der tidligere tog måneder at gøre manuelt, nu kun tager et par timer. Adjunkt Tomer Sagi fra Institut for Datalogi, Aalborg Universitet, fortæller:

- Vi har lavet et system, der giver mulighed for at søge efter oceaniske data og integrere disse data. Resultatet bliver én stor fil, og dermed eliminerer man behovet for manuelt at integrere forskellige datasæt, hvilket er både tids- og arbejdskrævende. 

MANGLER EN FÆLLES ORDBOG

Et af de store problemer med dataintegration er behovet for fyldestgørende ontologier. En ontologi er en formel specifikation af begreberne og relationerne mellem disse begreber inden for et bestemt domæne, f.eks. oceanografi.

  - Når man indsamler og integrerer data fra forskellige steder, systemer og personer, skal man blive enige om en standardiseret beskrivelse. Det er ligesom en ordbog, som alle skal bruge. Indtil nu har der ikke været en ontologi, der dækker hele oceanografiens område, og hvis ontologien er ufuldstændig, har man ikke det nødvendige ordforråd. Dette ordforråd forsøger vi derfor at opbygge som en del af dataintegrationssystemet, forklarer Tomer Sagi. 

DEN INTELLIGENTE AGENT BLIVER EN DOMÆNEEKSPERT

Det første skridt til at opbygge en ontologi har for forskerne været at evaluere de ontologier, der allerede er tilgængelige. For at gøre det udviklede de et ontologisk evalueringssystem. De lod en intelligent agent - en stor sprogmodel - læse 10.000 oceanografiske papirer og skabte derved en automatiseret domæneekspert.

Baseret på denne træning var agenten i stand til at evaluere de aktuelle ontologier inden for det oceanografiske domæne og fremhæve hvilke begreber, der skulle medtages eller korrigeres. Overraskende nok fandt forskerne ud af, at de nuværende og mest brugte ontologier kun dækker i alt mindre end ti procent af begreberne relateret til det oceanografiske domæne. 

- Disse ontologier er hovedsageligt lavet af mennesker, og mennesker laver fejl. Derudover er mennesker kun eksperter på nogle områder inden for et domæne. Så det er en kompleks opgave at bygge ontologier. Man har brug for eksperter, og de bliver trætte, laver fejl og er dyre. Det er der, kunstig intelligens virkelig kan hjælpe os, siger Tomer Sagi.

 Han mener, at oceanografer vil have stor gavn af at have et værktøj, som de kan anvende til integrere data og udføre analyser mere effektivt med. Desuden håber han, at ontologi-evalueringssystemet også kan være til stor nytte uden for oceanografiens domæne:

 - Ontologier bruges overalt – de danner grundlaget for de fleste webtjenester. For eksempel er de mere sofistikerede chatbots alle baseret på vidensgrafer, som er baseret på ontologier. De skal vedligeholdes og verificeres, og til det formål er vores nye systemer fremragende til at fikse og forbedre aktuelle ontologier. 

FORSTÅ BEGREBERNE

DATAINTEGRATION

Dataintegration er processen med at kombinere data i forskellige formater og fra forskellige kilder til en enkelt, samlet visning.Dataintegration giver brugerne mulighed for at samle og få mening ud af data, så de kan bruges til analyse, rapportering og andre formål.

ONTOLOGIER OG UFULDSTÆNDIGE ONTOLOGIER

En ontologi er en formel specifikation af begreberne og relationerne mellem disse begreber inden for et bestemt domæne, f.eks. oceanografi.

Ufuldstændige ontologier kan gøre det til en udfordring at integrere data fra forskellige kilder.

Et eksempel: Nogle oceanografer opdeler Atlanterhavet i nordlige, sydlige og mellematlantiske underregioner. Hvis ontologien kun indeholder "Atlanterhavet"-konceptet, men ikke "det nordlige Atlanterhav", kan det være en udfordring at indsamle data om sidstnævnte. Mangel på en klar skelnen mellem forskellige områder af havet gør nøjagtig kategorisering eller analyse af data relateret til det nordlige Atlanterhav umulig

OM PROJEKTET

Forskningen er udført som en del af projektet ODINI – The Ocean Data Integration Initiative.

ODINI er et samarbejde mellem Aalborg Universitet og Universitetet i Haifa. Projektet er delvist finansieret af The University of Haifa Data Science Research Center

Publikationer: Artificial intelligence for ocean science data integration : current state, gaps, and way forward / Sagi, Tomer; Lehahn, Yoav; Bar, Koby. I: Elementa: Science of the Anthropocene, Bind 8, Nr. 1, 418, 15.05.2020.

KONTAKT
Adjunkt Tomer Sagi
Data, Knowledge and Web Engineering,
Institut for Datalogi, Aalborg Universitet
Mail: tsagi@cs.aau.dk
Telefon: 91644374