Internationella jämförelser om öppna data-mognad

Skrivet av rikard, Thursday, February 27, 2014

Öppna data fortsätter vara aktuellt i Sverige, vilket märktes inte minst under Open Data Day som hölls världen över den 22:a februari. I Sverige ordnades aktiviteter i inte mindre än tio städer, vilket måste ses som positivt. Förra året var det Karlshamn som ensamt ståtade i listan över 2013 års evenemang i landet.

I slutet på förra året hölls ett eget spår om öppna data på Internetdagarna med en framåtblick på temat “Öppna data – vad händer under 2014?”. Frågan är alltså fortsatt aktuell och ibland nämns olika internationella jämförelser där Sverige ibland hamnar högt och ibland hamnar lägre på listor som undersöker nationernas mognad inom öppna data utifrån olika aspekter.

Morus tänkte här sammanfatta tre olika jämförelser som ofta förekommer för att ge dem uppmärksamhet och samtidigt en överblick över dessa jämförelser och se på vad man mäter inom de olika rankningarna.

Open Data Index

Open Knowledge Foundation har ett index över länders öppna offentliga data (open government data) och bygger på information som samlats in genom Open Data Sensus. Sverige hamnar på sjunde plats av 70 undersökta länder, vilket får sägas vara en hyfsad placering. Vi kammar hem 670 poäng att jämföra med Storbritannien som leder ligan med sina 940 poäng, tätt följda av USA (855) och Danmark (835). Bland de nordiska länderna är den inbördes ställningen Danmark (835), Norge (755), Finland (700), Sverige (670). Island och Färöarna är inte med i jämförelsen.

Indexet undersöker öppenhet ur olika aspekter inom tio vad jämförelsen kallar “key datasets”. De är: Transport Timetables, Government Budget, Government Spending, Election Results, Company Register, National Map, National Statistics, Legislation, Postcodes / Zipcodes och Emissions of pollutants.

Aspekterna som undersöks för dessa datamängder är Finns det data?, Är dessa digitala?, Är de publicerade (publikt tillgängliga)?, Är de kostnadsfria?, Ligger de “online”?, Är det maskinellt bearbetbara data (dvs dataformat snarare än PDF)?, Kan man ladda ned data i bulk (dvs i sin helhet)?, Är villkor eller licensen öppen (enligt The Open Definition)? och Är det aktuella data (up to date)? Sveriges resultat presenteras med poäng för varje datamängd på en egen sida.

Av de 700 datamängderna (70 länder à 10 datamängder) är 84 stycken öppna (enligt kriterierna i The Open Definition). Sverige bidrar med fyra öppna datamängder (Budget, Valresultat, Statistik och Utsläpp). Finansdepartementet, Valmyndigheten, SCB och Naturvårdsverket har således anledning att sträcka på ryggen.

The PSI Scoreboard

En annan ofta refererad jämförelse (på EU-nivå) är The PSI Scoreboard (som av outgrundlig anledning låsts in bakom en inloggningsmur – det är dock gratis att registrera sig) som ePSIplatform har tagit fram. Här är utgångspunkten PSI-direktivet och inte öppna data (se tidigare bloggposter för en genomgång av varför PSI-data och öppna data är två skilda ting). Bakgrunden är naturligtvis att man vill följa upp hur PSI-direktivet efterlevs i medlemsstaterna. Som vi varit inne på många gånger tidigare så leder inte PSI-direktivet till mer öppna data per automatik men det är ändå intressant att titta på denna jämförelse. Det är alltså möjligt att få höga poäng i denna jämförelse utan att för den skull leva upp till de definitioner av öppna data som oftast används. Men det ger en indikation på hur väl Sverige står sig eftersom man även har med frågor kring frivilliga åtgärder som ligger utanför direktivet. Det är just dessa frivilliga åtgärder som kan leda till öppna data i den vanliga bemärkelsen.

Det man tittar på är sju områden: Implementation of the PSI Directive (based on 2 indicators), The practice of re-use (based on 6 indicators), Formats (based on 4 indicators), Pricing (based on 3 indicators), Exclusive arrangements (based on 3 indicators), Local PSI (based on 3 indicators) och Events and activities (based on 4 indicators).

Eftersom de har gjort det krångligt att komma åt resultatet så inkluderar vi ett par bilder här i stället.

Bild på PSI scoreboard med staplar per land

Bild på PSI Scoreboard med poäng uppdelade inom olika områden

Bilderna är (C) ePSIplatform och licensierade med CC BY 3.0.

Sverige hamnar ungefär i mitten i denna jämförelse (drygt 300 poäng av 600 möjliga och ungefär i mitten av topplistan). De områden som är svaga hos Sverige är format, aktiviteter och lokala PSI-data. Det beror på att för att få poäng inom området format så ska regeringen antingen rekommendera att rådata tillgängliggörs och i ett öppet format:

Does at least one level of government in the Member State promote or endorse the publication of PSI for re-use in the form of ‘raw’ data in open standards?

För att få ännu högre poäng ska man också göra det obligatoriskt att publicera rådata i öppna format via lagstiftningen:

Has the Member State adopted a national law creating an obligation for public sector bodies to publish PSI for re-use in the form of ‘raw’ data in open standards?

Här får Regeringen således två konkreta tips på åtgärder som inte bara skulle placera oss högre i jämförelser utan också helt tydligt skulle leda till mer öppenhet i publiceringen av PSI-data. Vad som är ett öppet format (format som beskrivs i en öppen standard) kan naturligtvis diskuteras men det handlar om att välja filformat som inte är bundna till en specifik programvara (bara kan läsas av program som har tillgång till hur formatet fungerar) så att så många som möjligt kan bearbeta data med så liten insats som möjligt. Med “rådata” kan man också tänka sig att själva datamängden avses vilket betyder att data i PDF-format är olämpligt eftersom det blir svårare att urskilja data från ett sådant dokumentformat som lämpar sig bäst för läsning och utskrift. Även om PDF är (delvis) en öppen standard så är det inte ett bra val för datapublicering eftersom extrahering av data blir krångligare än exempelvis kommaseparerade listor eller ett öppet kalkylformat som ODF.

Inom formatområdet får man också poäng om regeringen förespråkar länkade öppna data (data som lätt kan kopplas ihop med andra öppna data genom länkar). Slutligen får man poäng inom detta område om man också har en nationell eller/och regional(a) datakataloger. Vi har ju numer öppnadata.se så vi får väl se om det kan generera poäng i nästa jämförelse.

Den som vill läsa frågor och kriterier för PSI scoreboard, kan göra det i dokumentet som de publicerar på ePSIplattform. Man kan även ladda ned datan från jämförelsen och granska den själv. Datan har de släppt helt fritt (CC0).

Open Data Barometer

The Web Foundation har tillsammans med The Oped Data Initiative (ODI) publicerat The Open Data Barometer. Den studien undersöker tre områden: Readiness – Tittar på grundpelare för politiska, samhälleliga och eknomiska förutsättningar för att realisera nyttan med öppna data. Men studerar mognaden hos regeringen, entreprenörer och företag, så väl som hos medborgare och civilsamhället. Implementation – Tittar på i vilken utsträckning regeringen publicerat så kallade “key dataset”. Här avses 14 datamängder inom olika sektorer. Emerging impacts – Tittar på om det går att se något resultat eller genomslag av de insatser som genomförts.

De 14 datamängder som avses med “key datasets” är:

  • Map Data (full coverage of the country)
  • Land Ownership Data
  • Detailed census data
  • Detailed government budget
  • Detailed data on government spend
  • Company register
  • Legislation
  • Public transport timetables
  • International trade data
  • Health sector performance
  • Primary or secondary education performance data
  • Crime statistics
  • National environment statistics
  • National election results

Sverige placerar sig mycket högt i denna studie med en imponerande tredjeplats. Barometern visualiseras också med spindeldiagram för den som vill veta mer om starka respektive svagare aspekter:

Bild föreställande Databarometer - spindeldiagram för Sverige

Bilden är (C) David Tarrant (visualisering) och har licensen CC BY-SA 2.0 (UK).

Om vi tittar på studiens egna data för just Sverige kan vi för de 14 datamängderna se en del intressanta detaljer. Till exempel är det hela 8 av de 14 datamängderna som är “Open” enligt studiens kriterier: Befolkningsdata, Budgetdata, Utgiftsdata, Lagstiftnignsdata, Transportdata, Handelsdata, Brottsdata och Miljödata. De datamängder som inte är öppna data är således: Kartdata, Landdata, Företagsregisterdata, Hälsodata, Utbildningsdata och Valdata. Den senare mängden är intressant eftersom Valdata räknades som öppna data i OKF:s Open Data Sensus, som beskrivs ovan. Det som diskvalificerade Valdata i denna studie var avsaknaden av en öppen licens. Samtliga datamängder är tillgängliga i maskinläsbart format utom Landdata (Land ownership data). Även tillgänglighet som “bulk” är ganska bra, där är alla utom fyra mängder tillgängliga i bulkform. De mängder som inte går att hämta som bulk är: Kartdata, Landdata, Hälsodata och Utbildningsdata.

Full pott fick endast en datamängd, Lagstiftningsdata. Nästan full pott (95/100) fick Befolkningsdata, Budgetdata, Transportdata, Handelsdata, Brottsdata och Miljödata. Sämst var Landdata (Land ownership data) med ynka 15/100. Denna låga poäng kommer sig av att man inte uppfylde något av kriterierna maskinläsbarhet, bulkform, kostnadsfritt, öppen (och tydlig)licens, aktuella data, hållbarhet eller upptäckbarhet (discoverability).

Använd gärna deras interaktiva verktyg för att jämföra olika länder.

Sammanfattning

Man kan säga att det är svårt att dra några slutsatser av dessa studier och jämförelser, inte minst eftersom Sverige placerar sig olika i dem beroende på vad man mäter naturligtvis. Men man kan ändå få uppslag från dessa jämförelser genom att analysera var vi får höga poäng respektive låga poäng. De myndigheter som publicerar de data som återfinns i de områden vi genomgående får höga poäng förtjänar att lyftas fram och kanske kan bidra med erfarenheter och kunskap. På samma sätt kan man titta på vad det är som vi får nedslag på och utifrån det skapa sig en åtgärdslista för förbättringar.

Man ska dock komma ihåg att det är lika viktigt att undersöka områden som inte omfattas av dessa studier. Det finns säkert en rad goda exempel att lyfta fram runt datamängder som publicerats öppet som inte finns med bland de mängder man tittar på i studierna. Omvänt finns det säkert data som efterfrågas men inte finns öppet tillgängligt utanför de som undersöks i jämförelserna.

Förutom offentliga öppna data…

Dessutom finns det öppna data som inte är offentliga öppna data utan snarare kommer från näringslivet eller civilsamhället. Open Street Map är ett utmärkt exempel på kartor och kartdata som är öppna och fria men inte härstammar från det offentliga utan samlats in av frivilliga användare i projektet. När Open Street Map diskuteras brukar de av kritiker avfärdas på grund av bristande kvalitet eller tillförlitlighet. Det stämmer säkert i vissa fall att det saknas kartering eller kvalitet i karteringen men ofta är faktiskt Open Street Map bättre och mer detaljerad än åtminstone mer kommersiella alternativ som Google Maps. Undersök gärna hur det ser ut i ditt område genom jämförelseverktyget på sautter.com/map/ där man gradvis kan växla mellan OSM och Google.

Poängen med att nämna Open Street Map är dock att det finns data från andra håll än det offentliga och att dessa data ibland är mer öppna än de data som härstammar från myndigheterna. Open Street Map har alltid haft som mål att dess data ska användas öppet och lagligt och erbjuder därför tjänsten med öppna licenser. Man är också väldigt noga med att inte släppa in data från ofria källor eftersom det då skulle bli olagligt att använda dem på OSM och licensiera vidare dem.

En annan poäng är att tjänster så som Open Street Map har en potential att vara mer aktuella eftersom kartorna hela tiden kan rättas, kompletteras och förbättras av alla användare som lär sig redigera dem. Officiella eller kommersiella kartor riskerar vara mer statiska och inte uppdateras i samma takt. Denna interaktivitet där användarna av data bjuds in att rätta och komplettera data tål att fundera kring och kanske inspireras av. Ibland berättas det att en av anledningarna till att det på vissa håll går trögt med att öppna upp data hos myndigheter är en oro att felaktiga data ska komma ut och användas. Det kan leda till fel, vilka skulle kunna avspeglas negativt på myndigheten. Här har vi alla en uppgift i att försöka vända denna oro till en möjlighet. Kan öppna data i stället leda till att fler fel hittas och kanske även rättas? Då är det ett gott skäl att öppna upp. För man använder ju datan man samlat in även internt, innan och efter den öppnas upp som öppna data. Så man har ju anledning att vilja hitta eventuella fel och få dem rättade.

Tags: , , , , , , , ,

Posted in Kommentar, Nyhetsbevakning, öppna data

MediaCreeper Creeper