Å hente inn og sammenstille kildemateriale er journalistens
mest hverdagslige gjøremål, og det egentlige arbeid. Først
når dette er gjort kan man gå videre med saken, bringe den
opp til overflaten i det mediet man arbeider i. I dette knippet handler
det om de verktøy som gjør det mulig for oss, som journalister,
å trenge ned i det kildemateriale som vi har tilgang på
via nettet OG Å SAMMENSTILLE FUNNENE SLIK BOKEN BESKRIVER
I AVSNITTENE OM MODELLMAKT.
Synspunkter og kommentarer bes sendt som e-post til femte@vitex.no.
Første
versjon av Dataspace Transfer Protocol (DSTP) er klar
Vi ønsker å gjøre det enkelt å legge
ut data slik at andre kan gjøre meningsfulle ting med dem, sier
Robert Grossman til New Scientist (2/9 2000). Han har ledet gruppen
som siste uke i august presenterte DSTP i førsteversjon.
EDB-folk er vel kjent med begrepet «datamining», altså
gruvedrift i mengden av mer og mindre bortgjemte data som enhver
større virksomhet vasser i, ofte uten å få særlig
mye mening ut av det for dem som sitter oppe i kontorene. EDB-biten
i begrepet består i å tilrettelegge dataene der de ligger
på en standardisert måte, slik at det blir lett å
sammenstille dem.
Det er det samme prinsippet som DSTP-gruppen nå anvender på
data som skal gjøres tilgjengelig i WWW. Selve idéen består
i å gi folk adgang til data på forskjellige servere, som
kan ligge hvor som helst på nettet og være så mange
slike kilder som helst i «en jafs», som de kan hente inn
og analysere selv ved hjelp av sammenstilling.
New Scientist har flere eksempler på sammenstillende spørsmål,
det vil si «modellmakt» i denne boks terminologi. Her et
som vel er hentet fra den kulørte presse:
Tar rødhårede belgisere ferie ved Rødehavet?
Eller man kan undres på om større aktivitet på solen
(solflekker) kan ha noe å gjøre med stigende temperaturer
på jordkloden. På nettet finer man både informasjon
om det som skjer på solen og temperaturene rundt om på jordkloden.
Problemet med å sette sammen slike data ligger i at de etter all
sannsynlighet befinner seg i databaser med ulike formater og ulik teknologi
rundt seg, og trolig langt nede i databasedypet sammen med en haug andre
problemstillinger og data som man ikke har bruk for.
DSTP gjør det mulig å hente ut akkurat de data du er ute
etter. Når det gjelder solflekkaktivitetene kan man sortere dem
på dato og ved help av en grafisk presentasjon sammenstille dem
med temperaturene på jorda.
Under DSTP som kalles en protokoll ligger et format;
Predictive Model Markup Language (PMML). Forholdet er det samme som
i WWW: HTTP-protokollen støtter HTML-formatet, og en hel del
andre formater etter hvert.
Selve jobben for dem som vil tilrettelegge dataene sine i henhold til
DSTP består i å navngi og formatere sine «rader og
kolonner», for å bruke regnearkterminologien. Så fort
dette er gjort kan man man søke i og manipulere det man finner
med DSTP.
Standarden, som er åpen, blir utviklet og publisert av en samarbeidsgruppe
der både universiteter og datafirmaer deltar (etter samme mønster
som W3C). Robert Grossman, gruppens leder,
er sjef for Laboratory for Advanced Computing ved University of Illinois
i Chicago. Fra databransjen deltar blant andre IBM, Oracle og NCR.
Claudia Gardner, som er med i «IBM's Intelligent Miner for Data
programme» mener at DSTP «er noe folk har lett etter lenge.
Åpne standarder vil hjelpe til med å gjøre verktøyene
de lager mer utbredt.»
Hun avfeier den åpenbare mulighet for tåpelige sammenstillinger.
Ingen ting kan hindre folk i det.
Dette (DSTP) er til for å hjelpe smarte folk med å
gjøre smarte ting.
I Den femte stasmakts terminologi er DSTP
skarp teknologi.
Som Stortinget pålegger offentlige etater å bruke?
Asker 5. september
2000
© Per Helge Berrefjord