SOU 1998:111
E-plikt - att säkra det elektroniska kulturarvet
Till Statsrådet och chefen för Utbildningsdepartementet
Regeringen bemyndigade vid regeringssammanträde den 10 oktober 1996 chefen för Utbildningsdepartementet statsrådet Tham att tillkalla en särskild utredare med uppgift att göra en översyn av lagen (1993:1392) om pliktexemplar av dokument. Fr.o.m. den 1 februari 1997 förordnades undertecknad att vara utredningsman. Utredningen har kallat sig E-pliktutredningen.
Till sakkunniga i utredningen förordnades avdelningsdirektören Eva Block och biblioteksrådet Gunilla Jonsson och till experter biblioteksrådet Margareta Benner, överdirektören Claes Gränström, förste bibliotekarien Mats G. Lindquist, kanslirådet Dag Mattsson samt hovrättsassessorn Karin Moberg.
Den 5 maj 1997 förordnades nuvarande avdelningsdirektören Jakob Harnesk att vara sekreterare i utredningen. Jur.kand. Stig Hagelstam har bistått i juridiska frågor.
Den 2 februari 1998 entledigades Dag Mattsson och den 1 juli 1998 entledigades Karin Moberg.
Journalisten Karl-Erik Tallmo har utarbetat den studie över elektronisk publicering som finns i bilaga 2, och civ.ing. Johan Palmkvist har gjort den tekniska analysen i bilaga 3.
Utredningsarbetet är nu slutfört, och jag får härmed överlämna betänkandet E-plikt - att säkra det elektroniska kulturarvet.
Stockholm i augusti 1998
Sven Allerstrand Särskild utredare
Jakob Harnesk
Stig Hagelstam
Förkortningar
ALB Arkivet för ljud och bild ALIS Administration av litterära rättigheter i Sverige Arpanet Advanced research projects agency network BBS Bulletin board systems bet. betänkande BICI Book item and component identifier cd-rom compact disc - read only memory CERN Centre européen de la recherche nucléaire CIS Common information systems DC Dublin core DG Generaldirektorat DIFS Datainspektionens författningssamling dir. direktiv DOI Digital object identifier Ds departementsskrivelse e-post elektronisk post, (‘e-mail’) EG Europeiska gemenskapen EU Europeiska unionen FSI Forskningsgruppen för samhälls- och informationsstudier ftp file transfer protocol HTML Hyper text markup language HTTP Hyper text transfer protocol IFLA International federation of library associations and institutions ISBD International standard bibliographic description ISBN International standard book number ISSN International standard serial number ISO International organization for standardization KB Kungl. biblioteket KLYS Konstnärliga och litterära yrkesutövares samarbetsnämnd KrU Kulturutskottet Mbyte megabyte mkr miljoner kronor
NBR Nationalbiblioteksavdelningen i Mo i Rana NJA Nytt juridiskt arkiv NNTP Network news transfer protocol PII Publisher item identifier prop. proposition PURL Persistent uniform resource locator RA-FS Riksarkivets författningssamling rskr. riksdagsskrivelse SICI Serial item and contribution identifier SOU Statens offentliga utredningar Spar Samordnat person- och adressregister STIM Svenska tonsättares internationella musikbyrå Sunet Swedish university network Tbyte terabyte TCP/IP Transmission control protocol / Internet protocol TEI Text encoding initiative TF tryckfrihetsförordningen TT Tidningarnas telegrambyrå TU Tidningsutgivarna URL Uniform resource locator URN Uniform resource name VHS Verket för högskoleservice www World wide web, webben XML Extended markup language YGL yttrandefrihetsgrundlagen
1. Sammanfattning
1.1. Uppdraget
Enligt direktiven har mitt uppdrag bestått i att
- göra en förutsättningslös översyn av lagen (1993:1392) om pliktexemplar av dokument (pliktexemplarslagen),
- överväga huruvida sådan elektronisk information som inte omfattas av den nuvarande pliktexemplarslagen skall vara föremål för leveransplikt i framtiden,
- överväga och vid behov föreslå ändringar i pliktexemplarslagen i syfte att säkra förutsättningarna för forskning och för bevarande och tillhandahållande av kulturarvet,
- utreda omfattningen av en eventuellt utökad leveransplikt, hur den skall utformas samt av vem den skall fullgöras,
- utreda tekniska frågor om hur leveranserna skall ske samt
- ta ställning till om leveransplikten skall gälla för elektroniska dokument som utgör underlag för sådant tryckt material, som nu är leveranspliktigt.
I direktiven konstateras att pliktexemplarslagen i dag omfattar endast sådana elektroniska dokument som finns i fixerad form, och som kan köpas, lånas, osv. (cd-rom, disketter, videogram och fonogram). Den information som görs tillgänglig via online-förbindelse faller därmed utanför pliktexemplarslagen i dess nuvarande utformning, vilket får till följd att möjligheterna minskar att tillgodose de syften som ligger bakom lagstiftningen om pliktleveranser.
Betänkandet är indelat i två avdelningar. Den första, kapitel 3-9, innehåller en bakgrundsbeskrivning. Den andra, kapitel 10-20, innehåller mina överväganden och förslag. Som bilagor ingår två arbeten utförda av externa konsulter.
1.2. Bakgrund (kapitel 3-9)
I kapitel 4 redogörs inledningsvis för några allmänna överväganden inför uppdraget. Min utgångspunkt har varit att översynen inte skall ompröva hela pliktexemplarslagen, utan förutsättningslöst utreda om allmänt tillgänglig elektronisk information som faller utanför nu gällande pliktexemplarslag bör vara föremål för leverans i framtiden. I en förutsättningslös översyn har jag också inkluderat att pröva alternativ till pliktleverans, eftersom det nu finns nya möjligheter för insamlande av elektronisk online-information.
I kapitel 5 lämnas en beskrivning av gällande lag samt en redogörelse för de två närmast föregående utredningarna inom pliktexemplarsområdet. Vidare redogörs för omfattningen av pliktleveranser vid Kungl. biblioteket (KB), Lunds respektive Göteborgs universitetsbibliotek samt Arkivet för ljud och bild (ALB).
I kapitel 6 ges en översikt av den elektroniska publiceringen av i dag. Den enskilda faktor som betytt mest för den snabba expansionen inom detta område är framväxten av Internet. I dagligt tal är Internet synonymt med World Wide Web (www eller webben) och e-post, men det finns också en rad andra tillämpningar. Internetutvecklingen har lett till att det aldrig varit så lätt att publicera sig som nu. Vem som helst med tillgång till persondator, modem och ett Internetabonnemang kan publicera information på nätet. Vidare identifieras två för denna utredning särskilt viktiga utvecklingstendenser, nämligen konvergens, dvs. att olika medieformer växer samman, och individualisering, dvs. att allt mer av den information som erbjuds allmänheten kommer att få en individuell utformning. Därutöver ges en beskrivning av olika typer av publicering på www i Sverige i dag, i form av dagstidningar, tidskrifter, böcker, ljud och rörliga bilder, privat publicering, online-databaser samt ett urval publicerings- och kommunikationsformer utanför www. Avslutningsvis redogörs i detta kapitel för utvecklingen inom området bibliografisk beskrivning, metadata och identifiering, som kan komma att bli av stor betydelse när det gäller insamlande och bevarande av elektronisk information.
Kapitel 7 innehåller en internationell kartläggning. Den inleds med en
redogörelse för den s.k. Mackenzie-rapportens analys av området pliktleverans av elektroniska publikationer. I rapporten, som finansierats av EU-kommissionen, slås fast att om en nations kulturarv skall kunna bevaras måste pliktexemplarslagstiftningen också inkludera elektroniska publikationer. Eftersom den tekniska utvecklingen är så snabb skall enligt rapportförfattarna lagstiftningen vara så heltäckande som möjligt och utgå från vida definitioner, som är tillräckligt flexibla för att inkludera både existerande och framtida publikationsformer. Författarna me-
nar vidare att man på lång sikt endast kan sträva efter att bevara inne-
hållet i de elektroniska publikationerna. Mediet som informationen är
lagrat på, den s.k. informationsbäraren eller artefakten, kommer att brytas ned med tiden. För långtidsbevarande rekommend eras s.k. migrering.
Den internationella kartläggningen visar vidare att det finns ett stort intresse i världen för att inte enbart inkludera elektroniska dokument i fixerad form i den nationella lagstiftningen om pliktexemplar, utan också för att samla in och bevara den elektroniska information som är tillgänglig via online-förbindelse. De nordiska länderna ligger långt framme i utvecklingen. I Norge medger redan lagen från 1990 insamling av sådan information, i Danmark trädde en ny lag i kraft 1998 som tar sikte på att samla in visst online-material och i Finland har en utredning med ett uppdrag som till stora delar överensstämt med mitt nyligen lagt fram förslag om revision av den finska lagen i den här riktningen.
I kapitel 8 lämnas en redogörelse för relevanta svenska utvecklingsprojekt, såsom det av KB bedrivna Kulturarw3-projektet, vilket syftar till att med hjälp av automatiserad robotteknik samla in och bevara den svenska delen av det som publiceras på Internet. Alla svenska webbsidor som en insamlingsrobot påträffar hämtas till KB och lagras där på magnetband. Tre insamlingar har hittills utförts. Den senaste, utförd under våren 1998, resulterade i att närmare 10 miljoner webbsidor samlades in från mer än 31 000 s.k. domäner. I kapitlet beskrivs dessutom projekten Svesök (KB), Nordic Web Index (Lunds universitetsbibliotek) samt Safari (Högskoleverket).
I kapitel 9 görs en genomgång av den lagstiftning som är av betydelse för möjligheterna att samla in, bevara och tillhandahålla elektronisk information. Restriktioner inom detta område finns i dels upphovsrättslagen (1960:729), dels datalagen (1973:289), som den 24 oktober 1998 ersätts med personuppgiftslagen (1998:204). Det för denna utredning relevanta innehållet i dessa lagar beskrivs. Dessutom ges en redogörelse för viss internationell utveckling inom det upphovsrättsliga o mrådet.
1.3. Överväganden och förslag (kapitel 10-20)
I kapitel 10 konstaterar jag inledningsvis att de mål och syften för pliktexemplar som anförts av tidigare utredningar fortfarande är giltiga. Dessa mål är bl.a. att vi skall bevara och tillhandahålla det s.k. kulturarvet, dvs. yttringar av svenskt liv, svenskt samhälle och svensk kultur för eftervärlden samt att det insamlade materialet så vitt möjligt skall kunna nyttjas av alla. Jag delar vidare tidigare utredningars bedömning att det
inte är möjligt att uppställa kvalitetskriterier för vilket material som är mer värt att bevara än annat, eftersom ”det dåliga belyser vårt samhälle lika väl som det goda”.
Av bakgrundsbeskrivningen framgår klart att det finns stora mängder elektroniskt publicerat material som väl uppfyller de kriterier som anges i de allmänna förutsättningarna för leveransplikt. Det sprids omfattande mängder information i samhälleliga, vetenskapliga och kulturella frågor. Ofta saknar det som publiceras online en tryckt motsvarighet.
För att det inte skall uppstå besvärande luckor i vårt framtida kulturarv är det därför väsentligt att även det elektroniska material som faller utanför dagens pliktexemplarslag samlas in och bevaras på ett systematiskt sätt.
I kapitel 11 prövas frågan om vilken online-information som bör samlas in och bevaras. Insamlandet bör gälla sådan information som är allmänt tillgänglig här i landet och rör svenska förhållanden. Beträffande vad som ska räknas som allmänt tillgängligt gör jag den bedömningen att även sådan information där användaren måste uppge ett lösenord eller erlägga en avgift för att få tillgång till den måste anses vara allmänt tillgänglig, under förutsättning att i princip vem som helst har möjlighet att få tillgång till informationen. Däremot bör t.ex. information som enbart publiceras på företagsinterna s.k. intranät i huvudsak inte räknas som allmänt tillgänglig.
För det material som är avsett att spridas i en större krets bör strävan vara att det samlas in så fullständigt som möjligt. Högsta prioritet bör härvid ges de publikationer som framställs av professionella utgivare och producenter. Informationsintresset för övriga kategorier av onlineinformation (privatpersoners hemsidor, lokal föreningsinformation och liknande) är lägre och av resursskäl kan inte ett fullständigt bevarande motiveras. Ett urval bör här vara tillräckligt och jag föreslår en insamling fyra gånger per år. Även inslagen av ljud och rörliga bilder som publiceras online måste självfallet samlas in och bevaras för framtiden.
Tanken på att inkludera online-databaser i pliktexemplarslagstiftningen har avvisats av tidigare utredningar. Enligt min mening är det dock önskvärt att samhället bevarar även den information som finns i dessa databaser. Detta gäller i synnerhet om informationen inte tillhandahålls i någon annan form. Jag finner det svårt att motivera varför en databas på cd-rom skall omfattas av pliktexemplarslagen men falla utanför lagen, om producenten väljer att enbart tillhandahålla den via onlineförbindelse.
Ett urval av de online-databaser som inte levereras som pliktexemplar i annan form bör därför enligt mitt förslag samlas in en gång per år i den form och med det innehåll de har just då. De databaser som faller inom 2
kap. tryckfrihetsförordningens och arkivlagens områden bör dock i huvudsak undantas från insamling.
Jag finner vidare att fler datorprogram och datorspel bör samlas in än vad som är fallet i dag, eftersom utvecklingen har lett till att det i dag är svårt att upprätthålla klara gränser mellan å ena sidan sådana dokument som innehåller programvara respektive är att anse som leksaker och å andra sidan sådana som innehåller information i pliktexemplarslagens mening. Någon lagändring behövs dock inte.
Däremot finner jag inte att elektroniska förlagor till tryckta skrifter bör inkluderas i pliktexemplarslagen, eftersom dessa aldrig varit allmänt tillgängliga och därmed faller utanför de allmänna kriterierna för leveransplikt. KB bör dock enligt min mening verka för en insamling av vissa sådana förlagor genom frivilliga överenskommelser med producenterna.
I kapitel 12 prövas olika metoder för insamling av det material som här är aktuellt. Den elektroniska publiceringen befinner sig fortfarande i snabb utveckling. Både i Sverige och internationellt pågår arbete för att strukturera och systematisera elektronisk information och för att utveckla standarder. Tekniken för insamling, lagring och migrering är fortfarande i ett tidigt utvecklingsskede. Alltför preciserade förslag kommer sannolikt snabbt att behöva revideras. Min ambition har därför varit att få en så öppen lösning som möjligt, undvika detaljreglering och i stället ge mer allmänna riktlinjer och rekommendationer för insamling och bevarande enligt de grundläggande förutsättningar som gäller för leveransplikt.
Tre olika huvudsakliga metoder för insamling har kunnat identifieras, nämligen traditionell leverans, leverans efter rekvisition samt insamling genom institutionernas egen försorg med hjälp av robotteknik. För- och nackdelar för dessa alternativ har granskats.
Min granskning av de olika alternativen har lett fram till att jag föreslår att den allmänt tillgängliga online-informationen skall samlas in av KB och ALB med hjälp av robotteknik. Den metoden är dock i allmänhet inte möjlig att använda för insamling av innehållet i online-databaser, varför jag där föreslår att ett urval av allmänt tillgängliga sådana skall levereras till KB eller ALB efter anmodan.
I kapitel 13 redovisas de ändringar i pliktexemplarslagen som följer av mina förslag. För att KB och ALB själva skall kunna samla in allmänt tillgängligt online-material föreslår jag en ändring av pliktexemplarslagen så att dessa myndigheter ges rätt att kräva utlämnande av sådana lösenord som i vissa fall är en förutsättning för åtkomst. Kravet på att lämna ut lösenord skall myndigheterna rikta mot den som upprättat lösenordet eller den som tillhandahåller en tjänst för elektronisk förmedling av meddelanden.
Jag föreslår vidare att en ny bestämmelse tas in i pliktexemplarslagen om att två exemplar av sammanställningar (databaser) i digital form som gjorts tillgängliga för allmänheten skall lämnas som pliktexemplar på anmodan av den myndighet som regeringen bestämmer. Leveransskyldigheten bör åvila den som låtit göra sammanställningen tillgänglig här i landet. Sammanställningarna måste levereras i ett format som är möjligt att konvertera vid den mottagande institutionen, eftersom erfarenheterna visar att det annars ofta uppstår problem vid mottagning och bevarande. De insamlande institutionerna ges rätt att föreskriva format, men måste därvid ta hänsyn till producentens tekniska och ekonomiska förutsättningar.
Dessutom skall bestämmelserna i 14 § pliktexemplarslagen ändras så att sådana dokument för elektronisk återgivning som lagrar annat än text eller fast bild skall lämnas i åtta exemplar i stället för som tidigare ett. Exempel på sådana dokument är s.k. multimedia, som oftast utges i form av cd-rom med ljud eller rörliga bilder. Jag delar den åsikt som framförts till utredningen att det är olyckligt att dessa dokument enbart skall levereras till ALB, eftersom det innebär att biblioteken därmed går miste om sådant material som av tradition är att hänföra dit.
Av kapitel 14 framgår att bestämmelserna i 16 § upphovsrättslagen behöver kompletteras med en bestämmelse som ger KB, ALB och Lunds universitetsbibliotek rätt att framställa exemplar av verk som är tillgängliga via online-förbindelse. Bestämmelsen skall inte innehålla någon motsvarighet till förbudet i 16 § mot framställning av exemplar av datorprogram. Bestämmelsen i 21 § upphovsrättslagen om rätt till offentliga framföranden utan upphovsmannens tillstånd kompletteras dock med en bestämmelse om att detta inte gäller datorprogram.
Jag är medveten om att det kan finnas behov hos arkivmyndigheter att omfattas av samma rätt till exemplarframställning. Det ligger dock utanför mitt uppdrag att lämna förslag rörande arkivmyndigheternas område.
Jag har vidare prövat om den föreslagna insamlingen och bevarandet är förenlig med den kommande personuppgiftslagen, eftersom det i den elektroniska information som samlas in kommer att finnas ett stort antal personuppgifter, av vilka vissa är av känslig natur. Min bedömning är att den insamling och det bevarande och tillhandahållande som avses med den nu aktuella verksamheten är motiverat av bl.a. forskningsändamål och måste anses vara av allmänt intresse. Behandlingen av informationen kan därför betraktas som tillåten enligt 10 § personuppgiftslagen. Enligt 13 § är det förbjudet att behandla känsliga personuppgifter. Det är oundvikligt att personuppgifter av detta slag kommer att finnas i det material som avses bli insamlat. I personuppgiftslagen anges vissa undantag från förbudet mot behandling av känsliga personuppgifter. Enligt
19 § får känsliga personuppgifter behandlas för forsknings- och statistikändamål. Den behandling av personuppgifter som är aktuell i det här sammanhanget måste anses ske för forsknings-ändamål och därmed torde undantagsbestämmelsen bli tillämplig på verksamheten.
I kapitel 15 prövas möjligheterna att tillhandahålla det insamlade materialet med hänsyn till upphovsrättslagen och personuppgiftslagen. Jag konstaterar där att medborgarna har behov av en god tillgång till information för att de skall ha förutsättningar att delta i den demokratiska processen. Det önskvärda vore därför fri tillgång till det insamlade materialet för var och en som har ett seriöst behov av informationen. Samtidigt är det viktigt att tillse att samhällets intresse av yttrandefrihet och informationsfrihet inte tillgodoses på ett sätt som gör intrång i det normala utnyttjandet av upphovsrättsligt skyddade verk eller oskäligt inkräktar på upphovsmannens legitima intressen. En rimlig balans mellan upphovsmännens krav och medborgarnas behov är enligt min bedömning att man vid de institutioner som har ett nationellt bevarandeansvar kan få tillgång till det insamlade materialet för forskning, men också för enskilt studium. Den prövning av de rättsliga förutsättningarna för att tillhandahålla den elektroniska information som här är aktuell visar dock sammanfattningsvis att det endast kommer att vara möjligt att låta forskare ta del av materialet. För att kunna vidga kretsen av användare skulle ytterligare förändringar av såväl upphovsrättslagen som personuppgiftslagen vara nödvändiga. Jag har inte sett detta som en framkomlig väg.
I kapitel 16 behandlas frågan om vem som skall svara för insamlingen av det aktuella materialet. Mitt förslag innebär att KB har ansvaret för text och fasta bilder medan ALB har ansvar för det audiovisuella materialet. Fördelningen bör gälla såväl online-information som kan samlas in med hjälp av robotteknik som online-databaser.
Av kapitel 17 framgår att bevarandet av elektronisk information är problematiskt. Lagringsmediet har kort livslängd och nödvändiga tekniska system och programvaror blir snabbt föråldrade. För att bevara informationen krävs därför kontinuerliga aktiva insatser med överföring till nya bärare och system, s.k. migrering. Mycket utvecklingsarbete återstår dock inom detta område och jag föreslår därför att ALB, KB och Riksarkivet snarast ges i uppdrag att gemensamt utarbeta en kartläggning över problemets art och omfattning.
I kapitel 18 föreslår jag, utifrån en bedömning av tänkbara utvecklingstendenser, att ansvariga myndigheter får i uppdrag att vart tredje år göra en fördjupad utvärdering och kostnadsuppföljning av pliktexemplarssystemet samt lämna förslag till eventuellt ändrad inriktning.
I kapitel 19 behandlas kostnadsfrågan. Jag har utgått från den kostnadsberäkning som redovisas i bilaga 3. För investeringar beräknas där
närmare 10 mkr och för den årliga driften drygt 1,5 mkr. Eftersom de ansvariga institutionerna enligt mitt förslag själva kan styra hur mycket material de skall samla in bör frågan om kostnader och finansiering av den löpande hanteringen av elektronisk information ingå i den årliga budgetdialogen. Därvid får på sedvanligt sätt en diskussion föras om behov, prioriteringar och finansieringsalternativ.
Beträffande kostnaderna för olika aktörer finner jag att förslagen för producenternas del torde innebära inga eller begränsade kostnader.
För Kungl. bibliotekets del bygger mina förslag till stor del på att de utvecklingsprojekt som KB redan bedriver, i första hand Kulturarw3, kan fortsätta. För dessa projekt finns medel avsatta i KB:s budget både vad gäller investeringar, utveckling och drift under 1998 och 1999. Under denna period behövs således ingen ytterligare finansiering. Med utgångspunkt från dagens utbud och tekniska lösningar kommer hanteringen av den elektroniska online-informationen därefter att medföra ökade årliga driftkostnader för KB på minst 1,5 mkr.
Lunds universitetsbibliotek ges ansvar för att bevara säkerhetsexemplar av det material som samlats in av KB och därmed uppstår vissa, enligt min bedömning begränsade, kostnader för lagring och hantering.
Arkivet för ljud och bild bör ges möjlighet att bygga upp en egen utvecklingsverksamhet på området. ALB har i sin fördjupade anslagsframställning för 1997-1999 redovisat behov av medel för FoU-verksamhet och beräknat de årliga kostnaderna för denna till 1,2 mkr.
2. Författningsförslag
2.1. Förslag till
Lag om ändring i lagen (1960:729) om upphovsrätt till litterära och konstnärliga verk
Härigenom föreskrivs i fråga om lagen (1960:729) om upphovsrätt till litterära och konstnärliga verk
dels att 16 och 21 §§ skall ha följande lydelse,
dels att det i lagen skall införas en ny paragraf, 16 a §, av följande
lydelse.
Nuvarande lydelse Föreslagen lydelse
16 §
De arkiv och bibliotek som avses i tredje och fjärde styckena har rätt att framställa exemplar av verk, dock inte datorprogram,
De arkiv och bibliotek som avses i tredje och fjärde styckena har rätt att framställa exemplar av verk, dock inte andra datorprogram än sådana som avses
i 16 a §,
1. för bevarande-, kompletterings- eller forskningsändamål,
2. för utlämning till lånesökande av enskilda artiklar eller korta avsnitt eller av material som av säkerhetsskäl inte bör utlämnas i original eller
3. för användning i läsapparater. I de fall som avses i första stycket 2 och 3 får exemplar framställas endast genom reprografiskt förfarande.
Rätt till exemplarframställning enligt denna paragraf har
1. de statliga och kommunala arkivmyndigheterna,
2. Arkivet för ljud och bild,
3. de vetenskapliga bibliotek och fackbibliotek som drivs av det allmänna samt
4. folkbiblioteken.
Regeringen får i enskilda fall besluta att vissa andra arkiv och bibliotek än de som anges i tredje stycket skall ha rätt till exemplarframställning enligt denna paragraf.
16 a §
Kungl. biblioteket, Lunds universitetsbibliotek och Arkivet för ljud och bild har rätt att framställa exemplar av verk som förekommer i elektronisk form över datanät.
21 §
Var och en får framföra utgivna verk offentligt
1. vid tillfällen där framförandet av sådana verk inte är det huvudsakliga, tillträdet är avgiftsfritt och anordnandet sker utan förvärvssyfte samt
2. vid undervisning eller gudstjänst. Första stycket gäller inte Första stycket gäller inte sceniska verk och filmverk och ger inte rätt att sända ut verk i ljudradio eller television.
sceniska verk, filmverk och
datorprogram av vilka exemplar har framställts med stöd av 16 a § samt ger inte rätt att sän-
da ut verk i ljudradio eller television.
Första stycket 2 ger inte rätt att i förvärvssyfte framföra sammanställningar vid undervisning.
____________________________
Denna lag träder i kraft den dag regeringen bestämmer.
2.2. Förslag till
Lag om ändring i lagen (1993:1392) om pliktexemplar av dokument
Härigenom föreskrivs i fråga om lagen (1993:1392) om pliktexemplar av dokument
dels att 14, 25 och 34 §§ skall ha följande lydelse,
dels att det i lagen skall föras in tre nya paragrafer, 18 a , 23 a och
33 a §§, av följande lydelse,
dels att det i lagen skall föras in nya rubriker närmast före 18 a §,
33 a § och 34 § av följande lydelse.
Nuvarande lydelse Föreslagen lydelse
14 §
Av fonogram som har framställts här i landet i minst 50 exemplar och som har gjorts tillgängligt för allmänheten här skall ett pliktexemplar lämnas.
Av fonogram som har framställts utomlands och har gjorts tillgängligt för allmänheten här i landet i minst 50 exemplar skall ett pliktexemplar lämnas, om fonogrammet rör svenska förhållanden.
Vad som sägs om fonogram i första och andra styckena skall tillämpas även på dokument för elektronisk återgivning som är av annat slag än som avses i 10 § och som inte är videogram eller fonogram.
Vad som sägs om fonogram i första och andra styckena skall tillämpas även på dokument för elektronisk återgivning som är av annat slag än som avses i 10 § och som inte är videogram eller fonogram. I stället för ett skall
dock åtta pliktexemplar lämnas.
Föreskrifterna i denna paragraf gäller inte om annat följer av 15 § eller av vad som föreskrivs om kombinerat material i 16 och 17 §§.
Sammanställning i digital form
18 a §
Av sammanställning som föreligger i digital form och som har gjorts tillgänglig för allmänheten här i landet över da-
tanät och rör svenska förhållanden skall på anmodan av den myndighet som regeringen bestämmer två pliktexemplar lämnas, om det inte i anmodan medges att sammanställningen överförs på elektronisk väg.
Föreskrifterna i första stycket gäller inte sammanställning varav pliktexemplar skall lämnas enligt någon av de föregående paragraferna.
I en anmodan enligt första stycket att lämna pliktexemplar skall, under hänsynstagande till leverantörens tekniska och ekonomiska möjligheter, anges i vilket format sammanställningen skall lämnas.
23 a §
Lämnande av pliktexemplar eller överföring på elektronisk väg av sammanställning i digital form åligger den som låtit göra sammanställningen tillgänglig för allmänheten här i landet.
25 §
Pliktexemplar av film, av an-
nat dokument för elektronisk återgivning än sådant som avses i 10 § eller av upptagning av
ljudradio- och televisionsprogram skall lämnas till Arkivet för ljud och bild.
Pliktexemplar av film, video-
gram, fonogram eller av upptag-
ning av ljudradio- och televisionsprogram skall lämnas till Arkivet för ljud och bild.
Av pliktexemplar av dokument för elektronisk återgivning som är av annat slag än som avses i 10 § och som inte är videogram eller fonogram skall ett exemplar lämnas till Arkivet för ljud och
bild samt ett exemplar till vart och ett av Kungl. biblioteket och Stockholms, Uppsala, Linköpings, Lunds, Göteborgs och Umeå universitetsbibliotek.
Utlämnande av lösenord
33 a §
. Om tillgång till lösenord eller liknande utgör förutsättning för tillgång till elektronisk information som görs tillgänglig för allmänheten här i landet över datanät och som rör svenska förhållanden, skall lösenordet på anmodan av den myndighet som regeringen bestämmer lämnas ut av den som upprättat lösenordet eller som tillhandahåller den tjänst för elektronisk förmedling av meddelanden där informationen finns.
Ansvar, överklagande m.m.
34 §
Den som åsidosätter skyldigheten att lämna pliktexemplar enligt denna lag kan av den myndighet som regeringen bestämmer vid vite föreläggas att fullgöra sin skyldighet.
Den som åsidosätter skyldigheten att lämna pliktexemplar enligt denna lag eller att lämna ut
lösenord på anmodan kan av den
myndighet som regeringen bestämmer vid vite föreläggas att fullgöra sin skyldighet.
_______________________
Denna lag träder i kraft den 1 juli 1999.
2.3. Förslag till
Förordning om ändring i förordningen (1993:1439) om pliktexemplar av dokument
Härigenom föreskrivs i fråga om förordningen (1993:1439) om pliktexemplar av dokument
dels att 2, 4, 5 och 8 §§ skall ha följande lydelse,
dels att det i förordningen skall föras in en ny paragraf, 10 a §, av
följande lydelse.
Nuvarande lydelse Föreslagen lydelse
2 §
Dokument som har lämnats till Kungl. biblioteket utgör nationalexemplar och dokument som har lämnats till Lunds universitetsbibliotek utgör nationella reservexemplar. De skall bevaras för framtiden.
Skyldigheten att bevara gäller inte sådana pliktexemplar som, efter respektive biblioteks prövning, befinns utgöra dubblett av ett redan lämnat dokument eller en oförändrad ny utgåva av ett tidigare lämnat dokument.
I fråga om de två exemplar av tryckta dagstidningar som lämnas till Kungl. biblioteket gäller skyldigheten att bevara bara det ena exemplaret.
. Sammanställningar i digital form som överförts till Kungl. biblioteket på elektronisk väg skall föras över till ett dokument som skall bevaras för framtiden. Vad som sägs om pliktexemplar i andra stycket tillämpas även på sådana sammanställningar.
4 §
Dokument som har lämnats till Arkivet för ljud och bild skall bevaras för framtiden.
Skyldigheten att bevara gäller inte sådana pliktexemplar som, efter arkivets prövning, befinnes utgöra dubblett av ett redan lämnat dokument eller en oförändrad ny utgåva av ett tidigare lämnat dokument.
Upptagning av ljudradio- eller televisionsprogram som har gjorts med stöd av 26 e § lagen (1960:729) om upphovsrätt till litterära och konst-
närliga verk får bevaras i arkivet endast om de har dokumentariskt värde eller rättighetshavarna har medgett att upptagningarna bevaras.
Sammanställningar i digital form som överförts till Arkivet för ljud och bild på elektronisk väg skall föras över till ett dokument som skall bevaras för framtiden. Vad som sägs om pliktexemplar i andra stycket tillämpas även på sådana sammanställningar.
5 §
De dokument som förvaras hos Kungl. biblioteket hålls tillgängliga i bibliotekets lokaler i den utsträckning som biblioteket bestämmer.
De dokument som förvaras hos Stockholms, Uppsala. Linköpings. Lunds, Göteborgs och Umeå universitetsbibliotek hålls tillgängliga enligt föreskrifter som meddelas av respektive universitet och beträffande Lunds universitet efter samråd med Kungl. biblioteket.
I fråga om kombinerat material som förvaras hos bibliotek gäller utom vad avser skrift bestämmelserna i 6 och 7 §§.
I fråga om kombinerat material, utom vad avser skrift, och
dokument med sammanställningar i digital form som förvaras
hos bibliotek gäller bestämmelserna i 6 och 7 §§.
8 §
Föreläggande att vid vite fullgöra skyldighet att lämna pliktexemplar meddelas av Arkivet för ljud och bild i fråga om dokument som skall lämnas till arkivet och av Kungl. biblioteket i fråga om övriga dokument.
Föreläggande att vid vite fullgöra skyldighet att lämna pliktexemplar eller lösenord meddelas av Arkivet för ljud och bild i fråga om dokument eller lösenord som skall lämnas till arkivet och av Kungl. biblioteket i fråga om övriga dokument och lösenord.
10 a §
. Föreläggande att lämna ut lösenord meddelas av Kungl. biblioteket och Arkivet för ljud och bild.
______________________________
Denna förordning träder i kraft den 1 juli 1999.
3. Uppdraget
3.1. Tillkallande av särskild utredare
Den 10 oktober 1996 fick statsrådet Carl Tham regeringens bemyndigande att tillkalla en särskild utredare för att göra en förutsättningslös översyn av lagen (1993:1392) om pliktexemplar av dokument (pliktexemplarslagen). Utredaren skulle, mot bakgrund av de snabba informationstekniska förändringarna avseende offentliggörande av dokument, överväga och vid behov föreslå ändringar i pliktexemplarslagen i syfte att säkra förutsättningarna för forskning och för bevarande och tillhandahållande av kulturarvet.
3.2. Direktiven
Mitt uppdrag framgår av utredningsdirektiven (dir. 1996:92), som redovisas in extenso i bilaga 1.
Pliktexemplarslagen omfattar idag bl.a. sådana elektroniska dokument som finns i fixerad form och som kan köpas, lånas, osv. Det rör sig i huvudsak om cd-rom, disketter, videogram och fonogram. Däremot omfattar lagen inte information som görs tillgänglig via onlineförbindelse eller elektroniska dokument som utgör underlag för tryckt material. Den snabba tekniska utvecklingen på informationsområdet leder till att en allt större del av det framtida informationsflödet aldrig framställs som dokument i fixerad form. De kommer därmed att falla utanför pliktexemplarslagen i dess nuvarande utformning, vilket får till följd att möjligheterna minskar att tillgodose de syften som ligger bakom lagstiftningen om pliktleveranser. Kulturutskottet uppmärksammade detta problem i betänkandet Pliktexemplarslagen m.m. (bet. 1995/96:KrU4), där man föreslog att riksdagen skulle ge regeringen till känna att en förutsättningslös översyn skulle göras av pliktexemplarslagen, vilket också blev riksdagens beslut (rskr. 1995/96:60).
Enligt direktiven skall jag ”överväga, och om det behövs, föreslå ändringar i pliktexemplarslagen i syfte att säkra förutsättningarna för forskning och för bevarande och tillhandahållande av kulturarvet”. Om jag kommer fram till att en leveransplikt för denna information bör införas,
skall jag även utreda omfattningen av leveransplikten, hur den skall utformas samt av vem den skall fullgöras. Utredningen skall, med tanke på den stora mängden material, beakta att leveransplikten inte får bli så omfattande att den i praktiken blir svår att upprätthålla. Kostnadsaspekten såväl för staten som för leverantörerna av pliktmaterial skall därvidlag beaktas.
Jag skall vidare beakta de upphovsrättsliga aspekterna av en utvidgad pliktleverans samt utreda tekniska frågor om hur leveranserna skall ske.
Därutöver skall jag ta ställning till om leveransplikten skall gälla för elektroniska dokument som utgör underlag för sådant tryckt material, som nu är leveranspliktigt.
Utredningsarbetet skall bedrivas förutsättningslöst och samråd skall ske med kommittéer och arbetsgrupper inom det informationstekniska området. Pågående utredningar i andra länder bör följas och de pliktexemplarsregler som redan finns i andra länder, främst inom Norden, Europarådet och EU, skall uppmärksammas.
Utredningen skall slutligen arbeta enligt de generella direktiv som utfärdats angående redovisning av regionalpolitiska konsekvenser (dir. 1992:50), om att pröva offentliga åtaganden (dir. 1994:23), om att redovisa jämställdhetspolitiska konsekvenser (dir. 1994:124) samt om att redovisa konsekvenser för brottsligheten och det brottsförebyggande arbetet (dir. 1996:49). Jag har funnit att dessa direktiv inte är relevanta för föreliggande utredning.
Översynen skall resultera i förslag till ändring av pliktexemplarslagen. Om förslagen innebär utökade kostnader skall förslag till finansiering lämnas.
Utredningen skall redovisa sitt uppdrag senast den 1 september 1998.
3.3. Utredningens arbetsformer
Under utredningen har jag tagit del av de resultat som framlagts av andra kommittér och utredningar inom framför allt de informationstekniska och upphovsrättsliga områdena. Jag har vidare tagit del av relevanta direktiv och förslag till direktiv utfärdade inom den Europeiska uni onen.
Genom sakkunniga och experter har jag inhämtat synpunkter från berörda myndigheter, främst ALB, KB och vissa universitetsbibliotek. Jag har bl.a. haft kontakter med Datainspektionen, Tidningsutgivarna, Konvergensutredningen samt organisationer verksamma inom det upphovsrättsliga området (Alis, CopySwede, Klys och Stim).
Tillsammans med sekreteraren har jag besökt Det kongelige Bibliotek i Köpenhamn och Lunds universitetsbibliotek. Jag har även haft över-
läggningar med den arbetsgrupp i Finland som 1998 lagt fram förslag om en reviderad lag om s.k. friexemplar.
Jag har under utredningsarbetet haft 11 sammanträden med utredningens sekreterare, sakkunniga och experter.
Jag har anlitat tre konsulter. Journalisten och författaren Karl-Erik Tallmo har utfört en studie över elektronisk publicering (bilaga 2). Johan Palmkvist har utfört en teknisk analys över området robotbaserad insamling (bilaga 3). Jur. kand. Stig Hagelstam har analyserat de rättsliga förutsättningarna för och konsekvenserna av utredningens förslag.
Vad beträffar betänkandets hänvisningar till information som är publicerad på Internet, har samtliga s.k. länkar kontrollerats i slutet av juni 1998.
4. Inledning
4.1. Utgångspunkter
I sammanfattningen till direktiven anges att utredningen tillsätts ”för att göra en förutsättningslös översyn av lagen (1993:1392) om pliktexemplar av dokument (pliktexemplarslagen)”. En helt förutsättningslös översyn av pliktexemplarslagen skulle inrymma en rad problem och frågeställningar beträffande de dokument som omfattas av pliktexemplarslagen i dag.
Uppdraget är dock mer konkret formulerat så att jag skall ”överväga huruvida sådan elektronisk information som inte omfattas av de nuva-
rande bestämmelserna i pliktexemplarslagen skall vara föremål för le-
veransplikt i framtiden”. Min utgångspunkt har därför varit att översynen skall vara förutsättningslös endast vad avser sådan allmänt tillgänglig elektronisk information som faller utanför nu gällande pliktexemplarslag.
Enligt direktiven skall jag vidare utreda omfattningen av en eventuellt utvidgad leveransplikt samt lägga förslag om vem som skall fullgöra leveransplikten.
I en förutsättningslös översyn av pliktexemplarslagen bör även ingå att pröva alternativa former för pliktleverans. Den snabba tekniska utvecklingen erbjuder nya möjligheter för insamlande av elektronisk information t.ex. genom automatisk robotinhämtning. Jag har därför valt att ge begreppet leveransplikt en vidare betydelse än vad som traditionellt är fallet.
4.2. Definitioner och terminologi
Att finna en heltäckande definition för den elektroniska information som är tillgänglig via online-förbindelse är svårt. I dagligt tal används ofta ordet ”dokument” som benämning på de datafiler en användare skapat på sin persondator. Dokument har på senare tid också kommit att användas som namn på webbsidor. Men dokument är i pliktexemplarslagen definierat som ”ett föremål som lagrar information för läsning, avlyssning eller visning” Som ”dokument för elektronisk återgivning” avses ett
dokument som i fixerad form lagrar text, ljud eller bild och vars innehåll kan återges enbart med hjälp av elektroniskt hjälpmedel.
I lagen används sålunda ordet dokument som benämning på bäraren av information. För informationen ”i sig” är det svårare att finna adekvata begrepp. Man kan visserligen göra en teoretisk åtskillnad mellan ”verk” och ”manifestationer av verk”, men eftersom dessa begrepp ännu inte är förankrade i det allmänna språkbruket riskerar man att åstadkomma förvirring och sammanblandning av begrepp.
Trots att begreppet dokument kommit att vidgas de senaste åren i riktning mot att inte bara avse den fysiskt hanterbara informationsbäraren, har jag valt att i föreliggande betänkande använda ordet i pliktexemplarslagens betydelse. Elektroniska dokument är alltså de föremål (cdrom, disketter) som lagrar information på elektronisk väg.
Vad skall man då kalla sådan elektroniskt lagrad information som är tillgänglig via online-förbindelse?
På internationell nivå har definitionsfrågan behandlats på bl.a. följande sätt: Inom ramarna för den internationella biblioteksföreningen IFLA (International Federation of Library Associations and Institutions) utarbetas sedan 1969 standardiserade regler för bibliografisk beskrivning, ISBD (International Standard Bibliographic Description). Reglerna omfattar sedan 1977 också s.k. ”non-book material”, dvs. sådant material som framställs på annat sätt än via traditionellt tryckförfarande. ISBD-standarden är formellt sett inte någon internationell ISOstandard1, men har i praktiken samma ställning som en sådan.
År 1997 publicerades ISBD(ER)
2 , där ER står för ”Electronic re-
sources”. ISBD(ER) är en revision av de tidigare utgivna ISBD(CF) (CF: Computer files). Att använda begreppet ”datafiler” som överordnat begrepp ansågs vålla alltför stora problem och man har därför valt termen ”elektronisk resurs”. Begreppet definieras på följande sätt:
Material (data and/or program(s)) encoded for manipulation by computer. Includes materials that require the use of a peripheral (e.g. a CD-ROM player) attached to a computer, and online service(s) (e.g. bulletin boards, discussion groups/lists, World Wide Web sites).
3
1 ISO = International organization for standardization.2 International standard bibliographic description for electronic resources : ISBD(ER) ; revised from the ISBD(CF): International standard bibliographic description for computer files / [International Federation of Library Associations and Institutions, IFLA Universal Bibliographic Control and International MARC Programme, Deutsche Bibliothek, Frankfurt am Main]. Recommended by the ISBD(CF) Review Group. – München : Saur, 1997 (UBCIM publications ; N.S., Vol.17)3 Ibid., sid 94
ISBD(ER) håller för närvarande på att översättas till svenska för att kunna infogas i de svenska katalogiseringsreglerna. En översättning av vissa grundläggande delar publicerades i december 19974.
ISBD-definitionen är förhållandevis vid och omfattar all elektroniskt lagrad information utom föremål som är oupplösligt förenade med en viss programvara (”programmed objects”), exempelvis leksaker och miniräknare. Såväl enstaka datafiler som samlingar av datafiler (webbplatser, elektroniska tidskrifter) fångas in under begreppet elektronisk resurs.
Enligt min bedömning är dock begreppet ”elektronisk resurs” för brett för att vara praktiskt användbart i detta sammanhang. Jag har i stället valt att genomgående använda begrepp som ”den elektroniska information som är tillgänglig via online-förbindelse” och liknande.
Begreppet ”databas” är också svårt att entydigt definiera. EU publicerade 1996 ett direktiv om upphovsrättsligt skydd för databaser5. I direktivet definieras databas i kapitel 1, artikel 1, på följande sätt: ”I detta direktiv avses med ‘databas’ en samling av verk, data eller andra självständiga element som sammanställts på ett systematiskt och metodiskt sätt och som var för sig är tillgänglig genom elektroniska medier eller på något annat sätt”. EU-definitionen omfattar alltså inte enbart databaser i digital form. Genomförandet av direktivet i svensk rätt har skett genom vissa ändringar i lagen (1960:729) om upphovsrätt till litterära och konstnärliga verk, vilka trädde i kraft den 1 januari 1998. Härvid har man valt att i stället för ordet databas använda det vedertagna ordet sammanställning. I min framställning har jag valt att i den löpande texten använda begreppet databas. Jag har utgått från EU-direktivets definition men begränsat användningen till att gälla enbart för sådana databaser som innehåller elektronisk information. I förslaget till lagtext har jag valt att använda begreppet sammanställning i digital form.
4 KKS-meddelanden : information om katalogiserings- och klassifikationsfrågor från SAB:s kommitté för katalogisering och klassifikation // 1997: 3-4 december (ISSN 0283-4081)5 Europaparlamentets och rådets direktiv nr 96/9/EG av den 11 mars 1996 om rättsligt skydd för databaser
Beträffande val av termer i övrigt, stavningsformer m.m. har jag valt att följa Svenska datatermgruppens rekommendationer6.
6 Rekommendationerna finns tillgängliga på: http://www.nada.kth.se/dataterm /rek.html
BAKGRUND
5. Nuläge
5.1. Gällande lagstiftning
Bestämmelser om pliktexemplar finns i lagen (1993:1392) om pliktexemplar av dokument (prop. 1993/94:10) och i förordningen (1993:1439) om pliktexemplar av dokument.
5.1.1. Pliktexemplarslagen
I pliktexemplarslagen ges föreskrifter om skyldighet att till bibliotek och Arkivet för ljud och bild lämna exemplar av dokument (pliktexemplar). De dokument som skall lämnas är skrift (5–11 §§), film och videogram (12 och 13 §§), fonogram och vissa andra dokument för elektronisk återgivning (14 och 15 §§), kombinerat material (16 och 17 §§) samt ljudradio- och televisionsprogram (18 §).
Inledningsvis görs i lagen vissa begreppsbestämningar. Enligt 2 § förstås med
dokument ett föremål som lagrar information för läsning, avlyssning
eller visning,
skrift ett dokument som lagrar text eller fast bild, dokument för elektronisk återgivning ett dokument som i fixerad
form lagrar text, ljud eller bild och vars innehåll kan återges enbart med hjälp av elektroniskt hjälpmedel.
Enligt 3 § görs ett dokument tillgängligt för allmänheten här i landet när exemplar bjuds ut till försäljning, uthyrning eller utlåning eller annars sprids till allmänheten eller när informationen i dokumentet återges offentligt eller i förvärvsverksamhet inför en större sluten krets. Förebilden för bestämmelsen är i huvudsak hämtad från 2 § tredje stycket lagen (1960:729) om upphovsrätt till litterära och konstnärliga verk.
Ett dokument skall enligt 4 § anses röra svenska förhållanden, om informationen i dokumentet helt eller delvis är avfattad på svenska språket eller dokumentet helt eller delvis innehåller verk av svensk upphovsman
eller framförande av svensk konstnär eller, om inte någon av dessa förutsättningar föreligger, dokumentet ändå huvudsakligen är avsett att spridas inom landet.
Dokument som skall lämnas
I fråga om skrifter görs skillnad mellan skrift som avses i 1 kap. 5 § tryckfrihetsförordningen, TF, och annan skrift. Skrift som avses i 1 kap
5 § TF är skrift som framställts i tryckpress samt skrift, som mångfaldigats genom stencilering, fotokopiering eller liknande tekniskt förfarande, om utgivningsbevis gäller för skriften eller skriften är försedd med beteckning, som utvisar att den är mångfaldigad, samt i anslutning därtill tydliga uppgifter om vem som har mångfaldigat skriften och om ort och år för mångfaldigandet.
Av skrift som avses i 1 kap. 5 § TF och som har framställts och utgivits här i landet skall som regel sju pliktexemplar lämnas (5 §). Även av sådan skrift som har framställts utomlands skall sju pliktexemplar lämnas, om skriften är sådan periodisk skrift för vilken utgivningsbevis finns eller skall finnas, eller om skriften inte är periodisk och har lämnats ut för spridning här i landet inte bara i enstaka exemplar och rör svenska förhållanden (6 §).
I 7–9 §§ anges vissa undantag från de nämnda bestämmelserna. I 7 § stadgas således bl.a. att endast två pliktexemplar behöver lämnas av en skrift som har samma innehåll och utförande som en tidigare framställd skrift under vissa förhållanden. I 8 § ges vissa särbestämmelser för dagstidningar och i 9 § undantas enklare tryck som visitkort, etiketter, blanketter och liknande, samt protokoll och liknande interna skrifter som framställts hos en myndighet.
Av andra skrifter än sådana som avses i 1 kap. 5 § TF behandlar lagen skrift som utgör dokument för elektronisk återgivning och skrift i mikroform. Enligt 10 § skall normalt sju pliktexemplar lämnas, dels om skriften har framställts här i landet i minst 50 exemplar och har gjorts tillgänglig för allmänheten här, dels om skriften har framställts utomlands och gjorts tillgänglig för allmänheten här i landet i minst 50 exemplar och skriften rör svenska förhållanden. Även här gäller vissa undantag. Enligt 11 § behöver således under vissa förutsättningar bara två pliktexemplar lämnas, om en skrift har samma innehåll som viss annan skrift.
Av film och videogram som har gjorts tillgängligt för allmänheten här i landet (i fråga om videogram i minst fem exemplar) skall med vissa undantag ett pliktexemplar lämnas (12 §). Ett pliktexemplar skall lämnas
även av film eller videogram som har granskats av Statens biografbyrå och därvid inte godkänts för visning.
Av fonogram som har framställts i minst 50 exemplar och har gjorts tillgängligt för allmänheten skall normalt ett pliktexemplar lämnas (14 §). I fråga om fonogram som har framställts utomlands förutsätts att fonogrammet rör svenska förhållanden. Vad som sålunda gäller fonogram gäller också dokument för elektronisk återgivning som är av annat slag än sådan i 10 § angiven skrift som utgör dokument för elektronisk återgivning och som inte är videogram eller fonogram. Skillnaden i förhållande till de dokument som avses i 10 § är att dessa bara lagrar text eller fast bild eller båda, medan det utmärkande för de här aktuella dokumenten är att de lagrar text, ljud, fasta och rörliga bilder i olika kombinationer utan att vara videogram eller fonogram. De kan alltså i vissa fall vara att betrakta som multimedier (prop. s. 42).
I 16 och 17 §§ ges regler om kombinerat material. Härmed förstås material, som innehåller dels en eller flera skrifter, dels ett eller flera dokument som utgörs av film, videogram, fonogram eller dokument för elektronisk återgivning som avses i 14 §. Av kombinerat material skall som regel sju pliktexemplar lämnas.
Slutligen finns i 18 § bestämmelser om ljudradio- och televisionsprogram. Enligt 5 kap. 3 § lagen (1991:1559) med föreskrifter på tryckfrihetsförordningens och yttrandefrihetsgrundlagens områden skall den som sänder radioprogram (ljudradio och televisionsprogram) till allmänheten ombesörja att varje program spelas in. Av sådana inspelningar skall ett pliktexemplar lämnas. Vidare skall ett pliktexemplar lämnas av varje sändning av ljudradio- och televisionsprogram som svenskt programföretag får sända med stöd av tillstånd enligt 2 kap. 2 § första stycket radio-_och_TV-lagen (1996:844). Av andra ljudradio- och televisionsprogram skall ett pliktexemplar lämnas av varje sändning som ägt rum under högst fyra på förhand bestämda veckor om året.
Vem som skall lämna pliktexemplar
Pliktexemplar av skrift som avses i 1 kap. 5 § TF och av skrift i mikroform, framställda här i landet, skall lämnas av framställaren (19 och 21 §§). För periodiska skrifter som framställts utomlands är den svenske utgivaren leveransskyldig. För andra skrifter som framställts utomlands är i första hand den svenske förläggaren leveransskyldig, i andra hand den som låtit lämna ut skriften för spridning (19 §).
För filmer och dokument för elektronisk återgivning är det den som har gjort filmerna och dokumenten tillgängliga för allmänheten som är leveranspliktig (20 §).
Pliktexemplar av kombinerat material som har framställts här i landet skall lämnas av i första hand den som har beställt framställningen och i andra hand den som har låtit göra materialet tillgängligt för allmänheten (22 §). I fråga om material som helt eller delvis har framställts utomlands åvilar leveransskyldigheten i första hand den svenske förläggaren och i andra hand den som har låtit göra materialet tillgängligt för allmänheten.
När det slutligen gäller ljudradio- och televisionsprogram skall pliktexemplar lämnas av den som enligt lagen med föreskrifter på tryckfrihetsförordningens och yttrandefrihetsgrundlagens områden skall ombesörja att programmet spelas in (23 §).
Vem som pliktexemplar skall lämnas till
Av pliktexemplar av skrift eller kombinerat material som skall lämnas i två eller tre exemplar skall ett eller två exemplar lämnas till Kungl. biblioteket, KB, och ett exemplar till Lunds universitetsbibliotek. Av pliktexemplar av sådana dokument som skall lämnas i sju exemplar skall ett lämnas till vart och ett av KB och Stockholms, Uppsala, Linköpings, Lunds, Göteborgs och Umeå universitetsbibliotek (24 §).
Pliktexemplar av film, videogram, fonogram samt av annat dokument för elektronisk återgivning än sådant som avses i 10 § eller av upptagning av ljudradio- och televisionsprogram skall lämnas till Arkivet för ljud och bild, ALB (25 §).
Övriga bestämmelser
I 27–30 §§ ges bestämmelser om tid då pliktexemplar skall lämnas.
Den som åsidosätter skyldigheten att lämna pliktexemplar kan enligt 34 § föreläggas att vid vite fullgöra skyldigheten.
Enligt 36 § får regeringen eller den myndighet som regeringen bestämmer för visst fall medge undantag från skyldigheten att lämna pliktexemplar.
5.1.2. Pliktexemplarsförordningen
I förordningen (1993:1439) om pliktexemplar av dokument återfinns föreskrifter rörande bevarande och tillhandahållande av material som omfattas av pliktexemplarslagen. Av förordningen framgår att KB, Lunds universitetsbibliotek och ALB är skyldiga att bevara de dokument som lämnats som pliktexemplar. Skyldigheten gäller inte sådana pliktex-
emplar som bedöms vara dubblettexemplar eller oförändrade nya utgåvor. Övriga universitetsbibliotek, som mottagit pliktexemplar, har inte någon skyldighet att bevara dessa för framtiden.
Det material som inkommit med stöd av pliktexemplarslagen får tillhandahållas i den utsträckning som KB eller de berörda universiteten bestämmer. Lunds UB måste dock samråda med KB innan föreskrifter om tillhandahållandet meddelas.
För ALB gäller att dokumenten får tillhandahållas i de egna lokalerna, i den utsträckning som ALB bestämmer. Dokumenten får också tillhandahållas vid annan institution efter särskild prövning. Varken ALB eller någon annan institution får låna ut sådana dokument som inkommit som pliktexemplar till ALB. I stället sker tillhandahållandet i form av utlåning av kopior, som framställs med stöd av 16 § lagen (1960:729) om upphovsrätt till litterära och konstnärliga verk. Dessa kopior är tillgängliga endast för forskare.
5.2. Tidigare utredningar
Lagstiftningen om pliktexemplar har ändrats vid flera tillfällen de senaste årtiondena. Reformerna har betingats av utvecklingen av nya medier, men också i viss mån av den högre utbildningens expansion i Sverige. Tidigare utredningar har avlämnat följande betänkanden:
- SOU 1974:94 Bevara ljud och bild
- DsU 1975:4 Dagspress på mikrofilm
- DsU 1977:12 Pliktexemplar av skrift
- SOU 1987:51 Ljud och bild till eftervärlden
- SOU 1989:89 Översyn av lagen om pliktexemplar
- SOU 1992:92 Pliktleverans
Pliktleveransutredningen, som avlämnade det sistnämnda betänkandet, gjorde en samlad översyn av reglerna för bevarande av skrifter och ljud- och bildupptagningar m.m. Nuvarande lag är baserad på de förslag som lades fram i utredningens betänkande Pliktleverans (SOU 1992:92). Där lämnas också en utförlig beskrivning av tidigare utredningars arbeten och förslag, varför detta inte repeteras här, med undantag för de förslag som rör elektroniska dokument.
5.2.1. Biblioteksexemplarsutredningen
Regeringen tillkallade 1988 en särskild utredare med uppgift att se över bestämmelserna om pliktleverans till bibliotek och anpassa dem till då gällande tekniska förutsättningar. Utredaren, som kallade utredningen Biblioteksexemplarsutredningen, konstaterade i betänkandet Översyn av lagen om pliktexemplar (SOU 1989:89) att det var klart otillfredsställande att bevarandet av information i elektronisk form inte var reglerat i lag. Han föreslog därför att leveransplikt skulle införas för sådan elektronisk information som fixerats i någon form av upptagning, avsedd för allmän spridning. Han avvisade däremot tanken på leveransplikt för databaser tillgängliga online, eftersom en sådan ansågs såväl principiellt diskutabel som svår att lösa rent praktiskt. En leveransplikt av onlinedatabaser skulle dessutom medföra krav på betydande resursinsatser.
De flesta remissinstanser tillstyrkte utredningens förslag beträffande elektroniska dokument. En par instanser menade dock att leveransplikt för online-databaser borde övervägas.
Utredningens förslag ledde inte till några lagstiftning såtgärder.
5.2.2. Pliktleveransutredningen
Regeringen tillkallade 1991 en särskild utredare med uppgift att göra en samlad översyn av reglerna för leverans, bevarande och tillhandahållande av skrifter och ljud- och bildupptagningar m.m. Utredningen antog namnet Pliktleveransutredningen. Utredningens förslag redovisas i betänkandet Pliktleverans (SOU 1992:92), vilket avlämnades i september 1992.
I betänkandet konstaterade utredaren inledningsvis att det är väsentligt att vi för eftervärlden kan bevara och tillhandahålla yttringar av svenskt liv, svenskt samhälle och svensk kultur. Ett sådant bevarande kan, menade utredaren, visa vår egenart och förstärka vår identitet i det nya Europa. Insamlandet och bevarandet motiveras alltså med starka humanistiska argument. Det är också väsentligt för medborgarna att kunna få tillgång till dessa dokument för att bl.a. kunna få insyn i hur samhället fungerar. Utredaren jämförde biblioteken och arkivinstitutionerna och menade att det finns stora likheter mellan dem, eftersom det i båda fallen handlar om institutioner med uppgift att bevara och tillhandahålla material åt medborgarna till deras och samhällets gagn. Ett utvidgat samarbete mellan KB, ALB och Riksarkivet på bevarandeområdet föreslogs.
Utredaren ville inte göra någon åtskillnad mellan text-, ljud- eller bilddokument, eftersom ingen kategori kan anses mer värd att bevara än
andra. Några kvalitetskriterier går heller inte att uppställa, eftersom ”det dåliga belyser vårt samhälle lika väl som det goda. Strävan måste i stället vara att behålla så mycket som möjligt av det material som innehåller mycken och unik information” (sid 85).
Beträffande tillhandahållandet ville utredaren inte dra några skarpa gränser mellan forskning, utredning och studier, utan framhöll medborgarens rätt till information och kunskap och betonade att det är en förutsättning för en fungerande demokrati att medborgaren har kunskap om sitt samhälle. För att uppnå detta mål har såväl forskning, utredningsverksamhet som studier behov av ett omfattande material. Pliktleveranserna bidrar till att detta behov kan fyllas. Någon skillnad i tillhandahållandet av detta material borde inte göras, oavsett om materialet används som förberedelse för en doktorsavhandling eller för en tidningsartikel; det borde också anses som likgiltigt om materialet efterfrågas av en privatperson eller av någon som är knuten till en institution.
Utredaren prövade vidare frågan om antalet pliktexemplar och fann att systemet med leverans till nationalinstitutionerna KB och ALB och till universitetsbiblioteken borde behållas. Som främsta skäl för att låta de sistnämnda erhålla pliktexemplar framhåller utredaren att man därmed erhåller svåråtkomligt material, som inte finns i handeln. Ett alternativt förvärvssätt skulle med säkerhet dra högre kostnader för universitetsbiblioteken.
Beträffande elektroniska dokument fastslog utredaren att det går en skiljelinje mellan å ena sidan fixerade sådana, som alltså framställs i ett eller flera fysiska exemplar och därmed kan levereras som avgränsade föremål, och å andra sidan sådan elektronisk information som inte fixeras utan i stället distribueras via direktkoppling till databaser eller via elektroniska nätverk. Som exempel på det senare nämnde utredaren online-databaser, videotex och elektronisk post.
Pliktleveransutredningen avvisade, liksom sin föregångare Biblioteksexemplarsutredningen, tanken på leverans av online-databaser. Utredaren anförde att materialet visserligen är viktigt att omhänderta om man skall uppfylla målen för pliktleveranser, nämligen att bevara en bild av Sverige vid vilken tidpunkt som helst, men de praktiska problemen, liksom kraven på betydande resursinsatser, ansågs tala emot ett införlivande av dessa databaser i lagstiftningen.
Leverans av online-databaser skulle kräva att producenten vid ett givet tillfälle fixerar informationen i databasen i någon form (papper, cdrom, magnetband). Utredaren menade att framställandet av ett sådant exemplar skulle strida mot en av de bärande idéerna bakom pliktexemplarslagen, nämligen att de dokument som är föremål för leverans skall ha gjorts tillgängliga för allmänheten. Det exemplar av databasen som skulle framställas enkom för att uppfylla leveransskyldigheten har
ju aldrig varit tillgängligt för allmänheten i denna form. Dessa konstlade dokument skulle sannolikt inte heller komma att efterfrågas av allmänheten i någon större utsträckning.
Utredaren medgav samtidigt att när det gäller radio- och tv-program gällde redan det omvända: där framställdes särskilda exemplar, som ju aldrig varit avsedda för allmänheten, enbart för att uppfylla leveransplikten. Där fungerade systemet bra och utredaren såg ingen anledning att ändra på det, men anförde att stor restriktivitet borde iakttas när det gällde att införa ytterligare krav på sådan exemplarframställning.
Utredaren ansåg att det inte heller var praktiskt möjligt att på ett enkelt och hållbart sätt skilja mellan dynamiska databaser, dvs. sådana som uppdateras löpande, och statiska databaser, vars innehåll är tänkt att vara fixerat. Gränserna mellan dessa två typer av databaser ansågs vara alltför flytande.
Utredaren prövade också, i enlighet med den norska lagstiftningen, tanken på att utforma lagen på ett så allmänt sätt att den täcker såväl online-överföring som andra eventuella kommande former för informationsöverföring. Utredaren fann inte en sådan modell tillfredsställande, eftersom leveransplikten i så fall skulle behöva förenas med antingen en rekvisitionsrätt eller vida dispensmöjligheter. Bestämmanderätten skulle i alltför stor utsträckning komma att överlåtas till bibliotek och arkiv. Leveransplikten skulle heller inte bli tillräckligt förutsebar och ett selektivt rekvisitions- eller dispensförfarande kunde komma att uppfattas som orättvist.
Ytterligare några slag av elektroniska dokument behandlades av utredningen. Dit hörde:
- Programvaror (operativsystem, ordbehandlingsprogram, m.m.) Här redovisas uppfattningen att dessa dokument inte innehåller information utan snarare är ett redskap för att behandla information. Något konkret förslag lämnas inte av utredningen.
- Elektroniska dokument som utgjort underlag för framställning på andra medier. Tanken på att införa pliktleverans av sådana elektroniska förlagor avvisas, eftersom det skulle strida mot den grundläggande tanken att dokumenten skall levereras i den form de gjorts tillgängliga för allmänheten.
- Videotex, en vid denna tidpunkt förhållandevis vanlig teknik, som innebar att man via telenätet och vanliga tv-apparater kunde komma åt textbaserad information, exempelvis tidtabeller och börsnyheter. Systemet medgav också viss interaktivitet. Enskilda kunde exempelvis beställa biljetter via videotex. Utredaren menar att videotex å ena sidan kan ses som ett kommunikationssystem, och därför inte borde le-
vereras, samtidigt som det å andra sidan kan hävdas att det är ett sätt att tillhandahålla databaser och att videotex-materialet följaktligen borde behandlas som online-databaser. Utredaren intar dock inte någon bestämd uppfattning i frågan och lägger heller inget förslag angående videotex.
- Dataspel. Här lutar utredaren åt uppfattningen att dessa mer är att anse som ett slags tidsfördriv eller leksaker snarare än dokument som lagrar information.
Pliktleveransutredningen skulle också utreda förutsättningar för en sammanslagning av KB och ALB. Utredaren föreslog dock att dessa även i fortsättningen skall verka som två från varandra oberoende institutioner.
Utredningens betänkande remissbehandlades. Förslagen väckte överlag bifall hos remissinstanserna, även om invändningar och synpunkter framfördes beträffande enskilda detaljer. Beträffande de förslag som framfördes angående elektroniska dokument kan påpekas att flera instanser anslöt sig till tankarna på att ett fördjupat samarbete är nödvändigt mellan de institutioner som har till uppgift att bevara kulturarvet. Med något undantag instämde remissinstanserna i utredningens förslag om att KB och ALB även i fortsättningen bör fungera som två från varandra fristående institutioner.
De flesta remissinstanserna delade också utredarens förslag om att avstå från att föreskriva leverans av online-databaser.
Statens provningsanstalt uppgav sig sakna en diskussion om det omfattande konverteringsarbete som skulle bli nödvändigt till följd av den föreslagna nya lagen och uttalade farhågor för att nya material kan orsaka beständighetsproblem i framtiden.
I regeringens proposition 1993/94:10 om pliktexemplar av dokument bekräftades de övergripande mål och syften som framfördes av Pliktleveransutredningen. Enligt föredragande statsrådet skall således pliktleverans ske för att bevara och tillhandahålla yttringar av svenskt liv, svenskt samhälle och svensk kultur för forskning och studier.
I fråga om leverans av online-databaser uttalade föredraganden (s. 20):
”Jag delar utredarens bedömning att information som görs tillgänglig i direktkopplade databaser, s.k. on-lineförbindelse, undantas från leveransplikten. Inte heller datorprogram, såsom operativsystem, kompilatorer, textbehandlingsprogram och administrativa program omfattas av leveransplikten. Sådana datorprogram kan inte definieras som ett dokument som innehåller information av det slag som är av intresse i denna lag, nämligen för senare läsning, avlyssning eller visning. De måste i stället ses som redskap, med vars hjälp man utnyttjar datorn eller be-
handlar informationen. Ett datorprogram är egentligen en logisk följd av instruktioner som talar om för datorn hur den ska behandla inmatat material.”
5.3. Insamling, bevarande och tillhandahållande av pliktexemplar i dag
Samtliga uppgifter i detta avsnitt avser verksamhetsåret 1997.
5.3.1. Kungl. biblioteket och universitetsbiblioteken
Kungl. biblioteket
Kungl. biblioteket (KB) är Sveriges nationalbibliotek. Huvuduppgiften är att samla, beskriva, bevara och tillhandahålla allt svenskt tryck. KB svarar också exempelvis för drift och förvaltning av det nationella biblioteksdatasystemet Libris, samt för samordning och utveckling av landets forskningsbiblioteksväsen genom Bibsam.
KB mottar årligen ca 1 100 hyllmeter svenskt tryck i form av pliktexemplar, varav ca 560 hyllmeter utgörs av dagstidningar.
Av det mottagna materialet katalogiserades och/eller registrerades ca 57 000 enheter. Det rör sig om monografier, serier (inklusive tidskriftshäften, vilka enbart registreras), årsböcker, musiktryck och kartor. Därutöver tillkom drygt 170 000 dokument som inte katalogiserats. Exempel på sådana dokumenttyper är affärstryck, affischer och vykort. Totalt mottogs sålunda ca 230 000 dokument7.
När det gäller elektroniska dokument i fixerad form tog KB emot 106 cd-rom och 65 disketter. Dessutom mottogs 79 fonogram och 17 videogram.
Det inströmmade materialet resulterade i närmare 22 000 poster i den bibliografiska databasen Libris. Av dessa utgjordes 19 590 av monografier, 1 340 av seriella publikationer och 1 053 av kartor och musiktryck.
KB har utarbetat omfattande urvalsprinciper för att avgöra vilket material som skall katalogiseras respektive behandlas på annat sätt. I korthet innebär urvalsprinciperna att förlagsutgivet material går till katalogisering. Därutöver går institutions- eller organisationsutgivet tryck i huvudsak till katalogisering, om det är rikstäckande eller allmänt till sin
7 På grund av KB:s om- och tillbyggnad återstår ca 70 000 dokument att packa upp.
syftning. Detsamma gäller för behandlingen av tidskrifter, vilket exempelvis medför att lokala medlemsblad inte katalogiseras.
KB:s svenska material är tillgängligt för läsning endast i KB:s läsesalar.
Tillhandahållandet av elektroniska dokument i fixerad form sker ännu så länge i obetydlig utsträckning. Under 1997 förekom endast något enstaka lokalt utlån av cd-rom.
Lunds universitetsbibliotek
Enligt pliktexemplarsförordningen utgör dokument, som inkommer till Lunds UB i form av pliktexemplar, nationella reservexemplar. Lunds UB är därmed ålagt att bevara allt svenskt tryck som inströmmar och har således inte, till skillnad från övriga universitetsbibliotek, rätt att gallra ut dokument som man inte önskar införliva med sina samlingar. Verksamheten finansieras från Lunds universitets ordinarie anslag, vilket enligt företrädare för Lunds UB är problematiskt. Kostnaderna för Lunds UB:s hantering av pliktexemplar har beräknats till ca 8 mkr/år.
Till Lunds UB inströmmar årligen ca 1 100 hyllmeter svenskt tryck i form av pliktexemplar8. Antalet mottagna och katalogiserade monografier uppgår till närmare 13 000. Därutöver mottas ca 11 000 rapporter och serier, 39 000 tidskriftshäften och ca 170 hyllmeter i form av okatalogiserat tryck.
De dokument som inkommit med stöd av pliktexemplarslagen tillhandahålls dels lokalt, med endast några smärre restriktioner, dels i form av fjärrutlån till andra bibliotek i Sverige och i utlandet. De lokala restriktionerna avser exempelvis att svensk skönlitteratur inte får lånas hem. Inte heller tidskriftsbilagor i form av cd-rom är tillgängliga för hemlån.
Till skillnad från KB tillhandahålls materialet också för fjärrutlån till andra bibliotek, i likhet med vad som gäller vid övriga universitetsbibliotek. Eftersom Lunds UB behåller allt svenskt tryck, innebär detta i princip att hela den svenska produktionen av böcker, tidskrifter, tidningar och annat tryck är tillgänglig för varje svensk medborgare via fjärrlånesystemet.
De elektroniska dokument i fixerad form som inkommer med stöd av pliktexemplarslagen tillhandahålls enligt samma principer som tryckt material. För närvarande utlånas därför exempelvis det exemplar av en cd-rom som inkommit som pliktexemplar, vilket i sin tur innebär risk för såväl förslitning som svinn.
8 I statistiska sammanhang förekommer ett lägre tal, vilket kan förklaras av olika mätmetoder.
Göteborgs universitetsbibliotek
Göteborgs universitetsbibliotek tas här som exempel för att illustrera verksamheten vid de pliktleveransbibliotek som inte har lagstadgad skyldighet att bevara allt material som inkommer. Dessa är, förutom Göteborgs UB, universitetsbiblioteken i Linköping, Stockholm, Umeå och Uppsala. Det kan antas att de mängduppgifter som nedan lämnas för Göteborgs UB också ungefärligen gäller för dessa andra mottagare, med undantag för att gallringen vid Uppsala UB är mindre omfattande än vid de övriga biblioteken.
Göteborgs UB mottar årligen ca 490 hyllmeter svenskt tryck. Att mängden emottaget material är så pass liten i jämförelse med KB och Lunds UB förklaras av att Göteborgs UB inte erhåller pliktexemplar av dagstidningar. Av detta behölls under 1997 närmare 200 hyllmeter, vilket innebär att ca 60 % av det mottagna materialet gallras bort. Därutöver mottas årligen ca 40 hyllmeter svenska mikrofilmade dagstidningar, som levereras i stället för tryck. Samtliga dessa mikrofilmer införlivas med bibliotekets samlingar.
Huvuddelen av det material som Göteborgs UB behåller registreras i Libris. Den okatalogiserade samlingen växer med ca 30 hyllmeter per år.
Antalet elektroniska dokument i fixerad form, som mottagits som pliktexemplar, uppgick under 1997 till ca 180 st. (120 cd-rom och 60 disketter).
De elektroniska dokumenten görs tillgängliga för användarna enligt samma principer som gäller för tryckt material. Dokumenten beställs fram och kan användas i särskilda datorer i bibliotekets läsesal. Något enstaka dokument, som den av Riksarkivet utgivna NAD (Nationella arkivdatabasen), har monterats i nätverk när det framgått att utgivaren tillåter detta. I praktiken har dock efterfrågan på de elektroniska dokument i fixerad form som mottagits som pliktexemplar hittills varit mycket låg.
5.3.2. Arkivet för ljud och bild
Arkivet för ljud och bild (ALB) mottar årligen ca 63 000 enheter, vilka fyller ca 1 000 hyllmeter.
Knappt hälften utgörs av referensband från radio- resp. tvsändningar. Total leveransplikt för radiosändningar gäller för Sveriges Radio, inkluderande bolagets lokala radiosändningar. Sändningarna från Sveriges Television, TV4 och elva satellit-tv-kanaler levereras i sin helhet. För två satellitkanaler har medgetts undantag p.g.a. att sändningarna innehåller i stort sett samma program som återfinns i andra kanaler.
Dessa sänder endast in fyra veckor per år, analogt med den leveransplikt som gäller för lokala etersändningar, t.ex. lokal kabel-tv, privat lokalradio och närradio.
Enligt 4 § pliktexemplarsförordningen får ALB inte bevara andra radio- och tv-sändningar än sådana som har ”dokumentariskt värde”. Då leveransplikten är kopplad till den s.k. referensbandning som programbolagen måste göra för andra juridiska ändamål, levereras i de allra flesta fall det totala utbudet. Vid en migrering till nya system och bärare kommer en viss gallring att ske. Som nämnts ovan har ALB också medgett undantag för vissa tv-kanaler. I övrigt sker ingen gallring bland pliktexemplaren.
I ALB:s katalogsystem är olika databaser utformade för olika media, beroende på dessas egenskaper. För en stor del av radio- och tvmaterialet sker en enklare registrering med utgångspunkt i t.ex. programtablåer, vilka i de flesta fall levereras i digital form från de sändande stationerna. För vissa kategorier har ALB tillgång till externa kataloger via online-förbindelse. På ALB sker en utförlig katalogisering av Sveriges Radios P1 och P2, av filmer och videogram samt av fonogram och multimedia.
Årligen katalogiseras drygt 2 000 filmer och videogram, ca 3 000 fonogram och multimedia och ca 10 000 radioprogram. Således uppgår det totala antalet objekt som katalogiseras på ALB till ca 15 000 per år.
Upphovsrättslagen ger inte ALB utrymme att tillhandahålla pliktexemplaren annat än för forskningsändamål. Vid varje beställning görs en s.k. studiekopia som forskaren får studera, antingen på plats i ALB:s lokaler eller vid någon av de ca 30 fjärrlåneinstitutioner som godkänts av ALB. Hemlån eller annan utlåning från ALB är inte tillåtet. Varje forskningsändamål måste godkännas av ALB efter ett ansökningsförfarande, och en avgift tas ut för varje studiekopia.
Antalet nyanmälda forskare har ökat varje år sedan ALB:s start. Under 1997 anmäldes 730 nya forskningsändamål. Av forskarna studerade ca 40 % vid fjärrlåneinstitutioner. ALB har även utvecklat ett system för fjärrlån med motsvarande nordiska institutioner, Statsbiblioteket i Århus och Nationalbiblioteket i Mo i Rana.
Efterfrågan på multimedier har hittills varit mycket begränsad. I dessa fall har forskaren fått tillgång till originalexemplaret. Studiekopiering är inte möjlig, då ALB inte har rätt att kopiera datorprogram, ens för forskningsändamål.
ALB kom tidigt till insikt om svårigheterna med att långsiktigt bevara elektronisk information. Bärarnas bristande beständighet och de tekniska systemens korta livslängd har gjort att ALB redan nu har tvingats att börja föra över de äldsta videobanden till ett nytt digitalt system.
6. Elektroniskt publicerad information
En heltäckande beskrivning av den elektroniska information som hittills publicerats är svår att göra. Någon tillförlitlig och samlad statistik, av det slag som finns för böcker och andra papperspublikationer, finns inte. Dessutom tillkommer det faktum att den elektroniska publiceringen expanderar mycket snabbt. Expansionen gäller inte bara den rent kvantitativa tillväxten, utan avser också den förändring som hela tiden sker i och med att nya producenter etablerar sig och därmed vidgar gränserna för vad som publiceras på elektronisk väg.
I nedanstående avsnitt ges en översikt av situationen inom några utvalda sektorer. En fördjupad beskrivning ges av Karl-Erik Tallmo i bilaga 2, ”Elektronisk publicering”.
Inledningsvis kan konstateras att det aldrig varit så lätt att publicera sig som nu. Vem som helst med tillgång till persondator, modem och ett Internetabonnemang kan publicera information på nätet. Ordet ”publicera” används här i betydelsen ”göra allmänt tillgängligt”. En privatperson kan därför i princip vid ett och samma tillfälle ikläda sig rollen som författare, förläggare, tryckare och distributör. Denna form av publicering som ofta, men inte alltid, är av rent privat karaktär behöver således inte alls passera de kvalitetsmässiga och kommersiella spärrar som ryms inom den traditionella förlagsbranschen. Men att publicera något behöver heller inte längre innebära att någon, förutom upphovsmannen själv, någonsin kommer att ta del av informationen.
6.1. Hur mycket information finns det?
Innan jag kommer in på en diskussion om vilken information som samhället skall samla in och bevara för framtiden samt på vilket sätt det skall ske, kan det vara intressant att fråga sig hur mycket information det finns i dag och hur mycket information det är möjligt att lagra.
Vid konferensen Time and Bits9 som hölls i USA i februari 1998, presenterade forskaren Michael Lesk ett räkneexempel med tankeväck-
9 http://www.gii.getty.edu/timeandbits/ksg.html
ande beräkningar angående dessa frågor. De siffror och uppskattningar han presenterar hänför sig till situationen i USA respektive hela vär lden.
Den samlade mängden publicerad information på www upptog vid början av 1997 ett lagringsutrymme om 2 terabyte (Tbyte)10. Med nuvarande tillväxttakt skulle den samlade www-mängden under 1998 komma att uppgå till mer än 20 Tbyte, vilket innebär att den överstiger omfånget på boksamlingarna i världens största bibliotek, Library of Congress. Det kan nämligen enligt Lesk grovt uppskattas att samlingarna där skulle kräva ca 20 Tbyte digitalt lagringsutrymme, om man begränsar sig enbart till böckerna och för enkelhetens skull utgår från att varje bok innehåller 1 megabyte (Mbyte). Därtill kommer alla de andra dokumentslagen: bilder, kartor, fonogram etc., vilket gör att det totala lagringsutrymmet uppgår till ca 2 700 Tbyte. Av nedanstående tabell framgår den totala informationsmängden vid Library of Congress.
Tabell 1: Antal dokument och digitalt lagringsutrymme vid Library of Congress (Lesk)
Antal Lagrings-
utrymme (Tbyte)
Böcker (1 bok = ca 1 Mbyte) Fotografier (1 bild = ca 1 Mbyte) Kartor (1 karta = ca 50 Mbyte) Filmer (1 film = ca 1 000 Mbyte) Fonogram (1 fonogram = ca 600 Mbyte)
20 milj. 13 milj.
4 milj.
½ milj. 3, 5 milj.
20 13 200 500 2 000
Summa
41 milj.
ca 2 700
Lesk fortsätter sedan sitt räkneexempel med att försöka uppskatta hur mycket övrig information som produceras på ett år. Alla former av information har medtagits, utom video inspelad i hemmet, eftersom innehållet där nästan uteslutande består av redan utsända tv-program och filmer. Lesk utgår från amerikansk medie- och telekommunikationsstatistik och extrapolerar talen till att omfatta hela världen genom att utgå från USA:s andel av världens samlade bruttonationalprodukt (BNP).
Mängden professionellt utgiven information uppskattar Lesk till mindre än 1 %.
10 Denna mängduppgift kan kompletteras med en undersökning som uppskattar att antalet unika webbsidor i mars 1998 uppgick till ca 275 miljoner. Ökningstakten uppskattas till ca 20 miljoner sidor i månaden, vilket innebär att antalet fördubblats på mindre än nio månader. Undersökningsresultaten finns publicerade på http://www.research.digital.com/src/whatsnew/sem.html.
Tabell 2: Mängden årligen producerad information (Lesk). Lagringsutrymme angivet i Tbyte.
Antal Lagringsutrymme
(Tbyte)
Professionellt utgivna böcker o peri odica Övriga pappersdokument (A4) Film Bilder/fotografier (inkl. privata bilder) TV/radio (unikt material) Fonogram
0,25
80 41,5 130 000
20 000
15
1 320 166 520 000
80 000
Summa
150 000
600 000
Lesk har i sin ursprungliga tabell dessutom inkluderat det minnesutrymme som krävs för att lagra alla telefonsamtal. Detta har ej medtagits här.
Utifrån en uppskattning av den totala mängden existerande datorminne i världen, kommer Lesk fram till att det, för första gången i historien, är teoretiskt möjligt att digitalt lagra all producerad information.
Naturligtvis kommer inte all denna information att publiceras på www. Men det står samtidigt klart att de 20 Tbyte, som enligt Lesk kommer att utgöra den samlade informationsmängden på www vid utgången av 1998, snabbt kan komma att öka. Sannolikt blir ökningen dramatisk när nätets överföringskapacitet utvecklats så att det blir möjligt att på allvar distribuera rörliga bilder.
Jag menar nu inte att det är samhällets uppgift att samla in och bevara all denna information, utan vill bara visa att det som en rent teoretisk tankemodell skulle vara möjligt. Det är vidare ett faktum att gränsen mellan professionell och privat publicering är flytande i dag och att den privata andelen är växande.
6.2. Internets framväxt
”Användningen av datornät innebär en större revolution på informationsbehandlingens område än någon annan uppfinning, inklusive boktryckarkonsten.”
Så skrev universitetskanslern Stig Hagström och dåvarande generaldirektören i VHS (Verket för högskoleservice) Anitra Steen i en debattartikel i Svenska Dagbladet den 9 januari 1994. Utan att här ta ställning
till huruvida detta påstående i alla avseenden är korrekt, är det ingen tvekan om att dagens avancerade nätverksteknologi och dess närmast obegränsade möjligheter till kommunikation och informationsspridning har fått och kommer att få en mycket stor betydelse för alla samhällssektorer.
I dagligt tal är Internet synonymt med World Wide Web (www eller webben) och e-post. Mer än en tredjedel av den svenska befolkningen har tillgång till Internet, antingen från arbetsplatsen eller från hemmet. Därutöver har många fler provat på att ”surfa” på nätet för att exempelvis söka information. Den elektroniska handeln via Internet ökar snabbt. Allt fler människor gör bankaffärer, inköp och biljettbokningar via Internet.
Som publiceringsform erbjuder Internet nya möjligheter jämfört med de traditionella kanalerna. Publiceringsprocessen kan kortas ned till några minuter, ändringar och uppdateringar kan utföras löpande och kraven på kvalitetskontroll minskar. I princip kan vem som helst publicera texter och bilder.
I takt med att nätets kapacitet byggs ut kommer också radio och tv i ökad utsträckning att distribueras via Internet.
Men Internet är inte enbart www och e-post. Det finns och har funnits flera andra tillämpningar. I följande avsnitt kommer jag att rekapitulera några av de grundläggande tankarna bakom Internets utveckling och beskriva dess tillväxt och utveckling fram till i dag.
6.2.1. Visionärerna
Den amerikanske forskningssamordnaren Vannevar Bush, en av president Roosevelts personliga rådgivare och chef för ”Office of Scientific Research and Development” publicerade 1945 en banbrytande och ofta citerad artikel, ”As we may think”, i tidskriften Atlantic Monthly11. Bush hade varit ansvarig för samordningen av den försvarsrelaterade forskningen under kriget. I artikeln anförde Bush att det nu var dags för vetenskapen att ägna sig åt den stora uppgiften att tillgängligöra de omfattande kunskapsmassor som vetenskapen hittills frambringat. Han presenterade också visioner om den framtida informationsförsörjningen, av vilka den om Memex i dag framstår som särskilt epokgörande.
Bush såg Memex som ett verktyg för att organisera och ge tillgång till närmast obegränsade mängder av information. Han beskrev Memex som ett slags skrivbord med flera bildskärmar och ett tangentbord, dit dokument lagrade på mikrofilm kunde hämtas och presenteras. I Memex
11 Bush, Vannevar, As we may think. Atlantic Monthly, 196(1) s. 101-108.
kunde en mängd olika kategorier av informationsbärande dokument lagras, exempelvis böcker, tidnings- och tidskriftsartiklar, privat korrespondens m.m. Materialet skulle indexeras och därmed vara möjligt att återfinna med hjälp av vad Bush kallade ”Associative indexing”. Det är de sistnämnda tankarna som gjort att Bush ofta nämns som den andlige fadern till vad som senare skulle benämnas hypertext och hypermedia. ”
The process of tying two items together is the important thing”, skriver
Bush. Att utveckla den mekaniska tekniken för att lagra och presentera informationen på Memex-skärmarna ser han inte som särskilt märkvärdigt, utan bara som en naturlig teknisk utveckling.
Även om Bush’s tankar blev föremål för en omfattande diskussion, skulle det dröja till början av 1960-talet innan någon mer omfattande tillämpning av hans tankar kom till stånd. Douglas Engelbart var då ansvarig för NLS-projektet (oN-Line System), i vilket man byggde upp en databas med över 100 000 olika texter. Dessa texter refererade till varandra på ett sätt som påminner om senare hypertextutvecklingar.
Termerna hypertext och hypermedia lanserades 1965 av amerikanen Theodore (Ted) H. Nelson. Hans vision Xanadu bär många likheter med dagens World Wide Web. I Xanadu skulle, enligt Nelson, världshistoriens samtliga texter finnas, alla förbundna med varandra genom s.k. länkar. Nelson använde termen ”docuverse” för att beskriva sin vision.
Med hypertexten överges den traditionella sekventiella, linjära strukturen i en text. Till skillnad från en bok, som har en början och ett slut, är det omöjligt att säga var en hypertext börjar och slutar. Ingen läsning blir därmed den andra lik, eftersom varje läsare kan ta sig fram på olika vägar. Antalet kombinationsmöjligheter blir därmed oerhört stort. Det brukar ofta anföras att hypertekniken mer liknar den mänskliga hjärnans associativa sätt att arbeta.
6.2.2. Det tidiga Internet
Under 1960-talet började det amerikanska försvarsdepartementet att utveckla ett datornät, som bl.a. skulle ha den egenskapen att det inte blev obrukbart efter en eventuell kärnvapenattack. För att åstadkomma detta valdes en modell, som innebar att datanätet gavs en decentraliserad och icke-hierarkisk struktur. Med avsikt byggdes nätet upp utan en central mittpunkt, eftersom man var rädd för att en sådan lätt skulle kunna slås ut vid en fientlig attack. Den information som sändes mellan de anslutna datorerna eller noderna i nätet delades upp i block, s.k. paket. Dessa letade sig fram på olika vägar i nätet för att sedan sammanfogas till sin helhet vid den slutgiltiga destinationen. Om en eller flera nätverksnoder
slogs ut skulle ändå informationen kunna leta sig fram i nätet genom att använda sig av andra noder.
Datornätet, som är en föregångare till Internet, gavs namnet Arpanet (Advanced research projects agency network). Det första året, 1969, omfattade nätverket fyra datorer.
Efter hand anslöts fler och fler datorer till nätverket. Det försvarsmässiga syftet bakom nätet avtog i takt med att det kalla krigets farhågor minskade. I stället blev datornätet i mångt och mycket ett redskap för kommunikation och informationsöverföring mellan universitet sforskare.
6.2.3. Protokoll och tillämpningar
Användandet av standardiserade s.k. protokoll är en förutsättning för att datorer av olika fabrikat skall kunna anslutas till nätverket och kommunicera med varandra. Protokoll kan sägas vara beskrivningar av hur kommunikationen mellan anslutna datorer skall gå till. År 1973 utvecklades TCP/IP (Transmission control protocol/Internet protocol) som möjliggjorde kommunikation mellan och sammankoppling av olika nätverk. TCP/IP är fortfarande det grundläggande protokollet för Internetkommunikation. I samband med födelsen av TCP/IP användes också ordet Internet för första gången (1974).
I början av 1970-talet utvecklades den första riktigt stora applikationen, elektronisk post, som snabbt kom att bli den allra vanligaste formen av Internetanvändning. Det första e-brevet skickades 1971.
Användningen av e-post växte snabbt och efter en tid utvecklades programvara för s.k. sändlistor (eng. ‘mailing lists’), dit en enskild användare kunde anmäla sig genom att skicka ett e-brev till en värddator. Därefter får användaren varje inlägg som postas till listan.
Flera andra protokoll har spelat stor roll för utvecklingen av Internet, däribland telnet och ftp (file transfer protocol) för överföring av filer mellan datorer. Ett antal stora s.k. ftp-arkiv har med tiden byggts upp runtom i världen, där olika kategorier av datafiler lagrats i stort antal. Dessa databaser innehåller i dag texter, bilder, programvara m.m. Speciellt möjligheten att lagra programvara har varit betydelsefull för många programutvecklare, eftersom det möjliggjort distribution av s.k. ”shareware” i stor skala. Med shareware menas att användare ges möjlighet att ladda ner ett datorprogram, installera det på sin egen dator och prova det under en begränsad tid. Som exempel på en sådan databas kan nämnas den som är uppbyggd inom ramen för det svenska universitetsdatanätet Sunet (Swedish university network)12.
12 http://ftp.sunet.se
Ett annat centralt protokoll är NNTP (Network news transfer protocol), som möjliggör uppbyggnad och distribution av Usenet News, s.k. nyhetsgrupper. Med hjälp av en särskild programvara (en s.k. nyhetsläsare) kan enskilda användare ansluta sig till en värddator och där abonnera på valfria nyhetsgrupper. Det finns i dag tusentals sådana grupper i världen. Varje nyhetsgrupp ägnar sig åt att diskutera ett särskilt ämne, ofta mycket aktivt.
Under 1980-talet växte Internet. Antalet anslutna datorer, nätverk och länder ökade i antal. Sverige anslöts 1987-88, i och med att de fyra nordiska universitetsdatornäten kopplades samman via NORDUNET. Sverige hade dock varit anslutet till EUnet sedan 1983.
Med lanseringen av Gopher i början av 1990-talet togs ett viktigt steg i Internets utveckling. I likhet med de protokoll och tillämpningar som beskrivits ovan, byggde Gopher på s.k. client-server-teknik. Här innebar tekniken att information kunde organiseras på en server, dvs. en värddator. Användaren kunde sedan med hjälp av en särskild programvara, en s.k. klient, få informationen presenterad för sig i hierarkiska menyer. Med hjälp av ett menysystem kunde användaren förflytta sig mellan olika Gopherservrar i världen. Dessa servrar innehöll så gott som enbart rena textfiler13.
Allt eftersom mängden tillgänglig information ökade på Internet, utvecklades olika hjälpmedel för att organisera och återfinna informationen. Archie och Veronica är tidiga exempel på sådana tilläm pningar.
6.2.4. World Wide Web
Fram till 1980-talets slut var Internet fortfarande något som främst användes på västvärldens universitet och högskolor. Vid den tidpunkten (1989) skapades World Wide Web (www), vilket kommit att bli den applikation som betytt allra mest för de senaste årens dramatiska utveckling av nätet och dess tjänster. Detta oavsett hur man räknar: antalet anslutna datorer, antalet människor som har tillgång till nätet, eller, vilket är mest intressant för denna utredning, mängden information som publiceras online.
Upphovsman till World Wide Web är datateknikern Tim Berners-Lee, då verksam vid CERN i Genève. Lättheten att konfigurera en wwwserver och möjligheterna till grafisk presentation, där texter, bild och annan grafisk design kunde integreras, gjorde att www fick ett mycket snabbt genomslag. Länksystemet utvecklades från gopherteknikens hie-
13 Ett litet antal gopherservrar existerar fortfarande. För ett exempel se: gopher://kth.se:70/1/
rarkiska menyer och www (webben) blev en hypertextmiljö. HTML (Hyper text markup language), ett system för sidbeskrivning och presentation, utvecklades hand i hand med webbläsare (eng. ‘browsers’), som de första årens Cello och Mosaic och dagens Netscape och Internet Explorer. En närmare beskrivning av HTML ges i bilaga 3.
Dokument vars innehåll är märkt i enlighet med HTML-standarden är plattformsoberoende, vilket innebär att de kan presenteras på olika datorer, olika operativsystem etc., under förutsättning att datorn har en webbläsare installerad. Vissa smärre avvikelser kan förekomma mellan olika datormiljöer, men i stort sett ser dokumenten likadana ut oberoende av vilken dator de presenteras på. Någon konvertering behövs inte. Den inkompatibilitet som präglat delar av datorindustrins programutveckling, och som till exempel inneburit att det varit problematiskt att förflytta en enkel ordbehandlingsfil mellan datorer av olika fabrikat, bröts därmed. På senare tid har dock tendenser kunnat skönjas i riktning mot mer leverantörsspecifika miljöer, vilket gör att dokument som skapats för en viss läsare, exempelvis Internet Explorer, ser annorlunda ut om de presenteras i Netscape. De stora tillverkarna försöker driva igenom egna tillägg till HTML-standarden men riskerar samtidigt en utveckling mot forna tiders inkompatibilitet.
14Flera bedömare anser att HTML:s dominerande position relativt snart kommer att intas av XML (Extended markup language), vilket anses vara ett mer utvecklat och flexibelt språk.
Med www infördes också ett nytt protokoll för överföring, HTTP (Hyper text transfer protocol). Webbläsarna har utvecklats i riktning mot integration av de andra Internet-protokollen, exempelvis de för epost, ftp och gopher. Webbläsarna kan numera också, med hjälp av tilläggsprogram, s.k. plug-ins, spela upp ljudsekvenser och rörliga bilder. Dessa överförs ofta med hjälp av s.k. ”streamade” protokoll, en överföringsform som innebär att informationen presenteras (spelas upp) allteftersom den anländer till användarens dator. Därigenom är det möjligt att kontinuerligt sända radio och tv via nätet.
Integrationen har sedan fortsatt i riktning mot att webbläsarna ”tar över” och utgör gränssnittet mot datorns eget operativsystem. Följden kan bli att användaren inte upplever någon skillnad mellan att arbeta med information som finns lagrad lokalt på den egna datorn och sådan information som finns tillgänglig på www.
6.2.5. Utvecklingstendenser
14 Se exempelvis Berners-Lee, T., The World Wide Web : past, present and future http://www.w3c.org/People/Berners-Lee/1996/ppf.html
Två utvecklingstendenser framstår som särskilt tydliga när det gäller den närmaste framtidens Internetpublicering, nämligen konvergens och indi-
vidualisering. Naturligtvis finns andra faktorer som kommer att ha stor
betydelse, exempelvis kommersialiering, men dessa tas inte upp här.
Med konvergens menas här att allt fler medieformer växer samman och blir svåra att skilja åt. Radio, tv, tidningar, tidskrifter, bokförlag, telefoni etc. har tidigare verkat i sina respektive sektorer och konkurrerat med andra aktörer i samma sektor. Men i takt med att såväl medborgarnas tillgång till nätet som nätets överföringshastigheter (bandbredd) ökar, kommer vi sannolikt att få se allt fler exempel på sådan konvergens.
Som exempel på konvergens av i dag kan nämnas Aftonbladets webbplats, som förutom text och stillbilder också innehåller länkar till rörliga bilder i form av digitalt lagrade videosekvenser. I stället för att bara läsa om en viss fotbollsmatch kan läsaren sålunda se vissa sekvenser från matchen spelas upp på datorskärmen. Ett annat exempel är att man på Dagens Nyheters webbplats kan finna en musikrecension i textform, som försetts med länkar till digitala ljudfiler för uppspelning i webbläsaren. Ett exempel på konvergens i motsatt riktning utgörs av Sveriges Television, som också förmedlar nyheter i textform.
Konvergensen illustreras också av att andra än traditionella medieföretag nu visar intresse för att tillhandahålla information. ‘Content is king’, dvs. att det är innehållet och inte tekniken som är det viktigaste, kan sägas vara slagordet för denna konvergerande rörelse. Framförallt är det företag från dator- och telekommunikationsbranscherna som utökat sina aktiviteter inom detta område.
Med individualisering menas att allt mer av den information som erbjuds allmänheten kommer att få en individuell utformning. Till viss del kommer användaren, dvs. den person vi i dag kallar läsare, lyssnare eller tittare, att kunna styra detta. Denna tendens innebär att vi avlägsnar oss från det traditionella begreppet ”massmedium” som ett ”ett-till-mångafenomen”, där samma information förmedlas, i stort sett samtidigt, till en stor mängd människor (läsare/tittare/lyssnare).
Den individualiserade informationen ser annorlunda ut. Dels kan den presenteras på olika sätt, dels kan innehållet vara helt olika. En del av dessa avgöranden träffas alltså av användaren, en del av producenten/leverantören. I det sistnämnda fallet är detta ofta baserat på information om användarens tidigare beteende.
Som illustration till det ovanstående kan följande exe mpel nämnas:
- Användaren avgör själv om han eller hon vill läsa nyheterna, dvs. läsa en text-fil, eller om samma text-fil skall spelas upp av datorn med hjälp av syntetiskt tal.
- Ett tv-bolag monterar vid ett större sportevenemang upp ett antal kameror, som vardera sänder kontinuerligt. Tittaren avgör själv vilken kameravinkel som skall visas i hans eller hennes egen tv-mottagare. Tekniken kommer i viss utsträckning att prövas av tv-kanalen Canal+ under 1998.
- När en användare besöker en webbplats i USA, med internationellt innehåll, möts han eller hon till sin förvåning av reklam på svenska. Det förklaras av att den amerikanska servern känner av att den besöks av en svensk användare. Det webbdokument som visas är skapat ‘onthe-fly’, dvs. just i det ögonblicket, för just den användaren. För att åstadkomma detta används bl.a. tekniker som ‘cookies’, där information om användaren och dennes tidigare beteende lagras.
- Med hjälp av s.k. push-teknik väljer användaren ur ett antal informationskällor ut sådant som intresserar honom eller henne. Mariebergs ”25 timmar” är ett svenskt exempel på en sådan tjänst. Man kan dels välja de källor man önskar få information från, dels välja vissa kategorier av nyheter och utesluta andra. Man kan vidare begära att nyheter som innehåller vissa ord eller begrepp skall levereras till skärmen. Push-tekniken har av många branschbedömare förutspåtts en mycket stor tillväxt, men den väntar fortfarande på sitt stora genombrott i Sverige.
S.k. intelligenta agenter, ‘butlers’ eller ‘know-bots’, går ytterligare ett steg längre. Agenterna är program som letar information ute på nätet åt en enskild användare efter dennes önskemål.
6.2.6. Tillgången till Internet i dag
Nya undersökningar över tillgången till och användningen av Internet i Sverige publiceras regelbundet. En av de få undersökningar som redovisar longitudinella data är den som genomförs av Forskningsgruppen för samhälls- och informationsstudier (FSI). Den har undersökt datorvanor bland befolkningen sedan 1985 och Internetanvändning sedan våren 1995.
Två FSI-forskare, Torsten Österman och Joachim Timander, publicerade 1997 rapporten Internetanvändningen i Sveriges befolkning15. Av den framgår att andelen regelbundna Internetanvändare (i betydelsen
15 Österman, T., Timander, J., Internetanvändningen i Sveriges befolkning : utvecklingen av attityder och användningen beträffande vissa tekniska hjälpmedel (Internet, dator, modem, CD-ROM och mobiltelefon). Stockholm, 1997 (Teldok rapport ; 115)
surfar på www eller använder e-post) av befolkningen i åldrarna 16-79 år uppgår till 14 % i april 1997. Siffran innebär en ökning med 500 % sedan april 1995, då den första mätningen genomfördes. Om även de som använder Internet mer sällan räknas in, uppgår andelen i april 1997 till ca 25-30 %. Ytterligare ca 10 % uppger att de planerar att ansluta sig till Internet inom en snar framtid.
Av FSI-undersökningen framgår också hur Internetanvändningen fördelar sig i olika befolkningsgrupper. Resultaten redovisas nedan i punktform.
- Storstadsbor använder Internet betydligt mer än de som bor i mindre orter/landsbygd. Andelen Internetanvändare bland personer bosatta i orter med mer än 30 000 invånare är nästan två och en halv gånger större än bland personer bosatta på orter med mindre än 4 000 invånare.
- Högutbildade använder Internet betydligt mer än lågutbildade. Relaterat till facklig tillhörighet använder, under första kvartalet 1997, 23 % av SACO-medlemmarna Internet, mot 17 % av medlemmarna i TCO och 7 % av medlemmarna i LO. (Siffrorna baserade på flytande medelvärden under tre kvartal.)
- Höginkomsttagare använder Internet betydligt mer än låginkomsttagare. Sambandet mellan inkomst och användning är dock inte lika tydligt som det mellan utbildning och användning, vilket kan förklaras av att en stor mängd studenter med låga inkomster använder Internet i hög utsträckning.
- Män använder Internet mer än dubbelt så mycket som kvinnor. Skillnaderna varierar dock mellan olika åldersgrupper: Bland dem som är födda på 1960- och 1970-talet är ”mansöverskottet” flera gånger större än bland dem som är födda på 1940-talet.
En jämförelse mellan 1995 och 1997 av undersökningens demografiska variabler tyder på att skillnaderna mellan olika befolkningsgrupper ökar snarare än minskar. Beroende på svårigheterna att förutse tillväxtförlopp avstår rapportförfattarna från att uttala sig om huruvida dagens stora klyftor kommer att öka eller minska.
De undersökningar av den svenska befolkningens tillgång till och användning av Internet som regelbundet utförs av olika undersökningsinstitut visar så gott som samtliga att den andel av befolkningen som har tillgång till Internet hela tiden ökar. Siffrorna varierar mellan de olika institutens uppskattningar och kan ibland vara svåra att jämföra med varandra. En undersökning utförd av Sifo Interactive Media i maj 1998 visade exempelvis att 38 % av befolkningen mellan 12 och 79 år använ-
der Internet minst en gång i månaden från hemmet, skolan eller arbetsplatsen. Hälften av dessa, ca 1,3 miljoner, använder Internet så gott som dagligen.
6.3. Publicering via www i Sverige i dag
Statliga myndigheter, kommuner, landsting, stora och små företag, organisationer och föreningar använder sig i allt högre utsträckning av www som kanal för att föra ut information eller för att marknadsföra sig. Den information som publiceras på organisationens webbplats kan variera stort i omfattning. Det lilla företaget kanske bara har en eller ett par sidor med grundfakta om företaget och dess produkter. Detsamma kan gälla för en liten amatörteaterförening eller liknande.
Men det finns också ett antal aktörer som publicerar stora mängder professionellt framställd information. Dit hör i första hand de stora medieföretagen: dagstidningar, nyhetsbyråer, Sveriges radio m. fl. Flera av dessa ger också avgiftsbelagd tillgång till sina databaser via Internet och www. Som exempel på sådana databaser kan nämnas Mediearkivet, som innehåller artiklar ur Aftonbladet, Svenska Dagbladet m.fl. tidningar, samt PressText, som innehåller artiklar från Dagens Nyheter, Expressen m.fl. tidningar.
6.3.1. Dagstidningar
I mars 1998 fanns, enligt KB:s förteckning16, 70 svenska dagstidningar tillgängliga på www. Därutöver fanns 5 finlandssvenska tidningar och en svensk-amerikansk. Det finns för närvarande en dagstidning som helt saknar tryckt motsvarighet, nämligen 24 timmar17, en lokaltidning från Örebro.
Omfånget av tidningarnas webbpublicering varierar starkt. Det finns å ena sidan tidningar som Helsingborgs dagblad, som lägger ut allt innehåll i ”papperstidningen” på www, och å andra sidan Hjo Tidning, vars webbplats förutom några utvalda temaartiklar endast innehåller information om tidningen (adress och telefonnummer, prenumerationspriser etc.)
E-pliktutredningen riktade i februari 1998 en enkät till 20 utvalda dagstidningar med www-utgivning. Enkäten innehöll följande frågor:
16 http://www.kb.se/ts/tsonline.htm17 http://www.24timmar.se/
1. När började ni publicera redaktionellt material på webben?
2. Om man jämför med den tryckta tidningen, finns det någon typ av material ni inte publicerar på webben?
3. Innehåller er webbutgåva material som är unikt, dvs. inte publiceras i den tryckta tidningen? Om ”ja”, i så fall i vilken utsträckning?
4. Hur stor del av den tryckta tidningen kan läsas på webben?
5. Hur många gånger per dag uppdaterar ni webbutgåvan?
6. Hur länge lagrar ni normalt de artiklar ni publicerar på webben?
7.
Har ni planer på att inom det närmaste året inkludera annat än text och stillbilder i er webbutgåva av tidningen, exempelvis rörliga bilder och ljudfiler? Om ni redan gör det, planerar ni att utöka det inslaget?
Enkäten besvarades av 8 tidningar. Tidningarnas svar framgår nedan.
- Arbetet började sin Internetpublicering ”lite trevande” i början på 1997. Man uppskattar att 10 % av innehållet i den tryckta tidningen publiceras på www. Något unikt material förekommer inte, dvs. endast sådant material som ingår i den tryckta tidningen publiceras på nätet. Webbplatsen uppdateras en gång per dag. Materialet ligger vanligtvis kvar mellan en vecka och en månad.
- Nerikes Allehanda började publicera redaktionellt material på www i maj 1995. Endast enstaka artiklar (ca 6-12 st) publiceras. Det unika materialet består av interaktiva tjänster och ”senaste nytt”. Den elektroniska utgåvan uppdateras ett par gånger om dagen, vilket man planerar att utöka till 6-10 gånger per dag. Materialet som publiceras på www lagras i en vecka. NA:s artiklar lagras dessutom i databasen Mediearkivet. Ljudinslag förekommer i dag och planer finns på att prova video.
- Norra Västerbotten uppger att uppskattningsvis 30-40 % av den tryckta tidningens innehåll läggs ut på www. Samtidigt innehåller deras webbplats ca 40-45 % unikt material. Uppdateringsfrekvensen är 3-5 gånger per dag.
- Nya Wermlandstidningen (NWT) skiljer sig från övriga tidningar, eftersom den har lagt ner sin Internetsatsning. NWT uppger att man slutade i november 1997 efter ca ett års försök, eftersom det inte gav någonting mer än ett antal utlandsläsare. Man säger sig nu avvakta utvecklingen och ligger nu enbart ute med en välkomstsida, lite hänvisningar och enstaka kåserier.
- Sundsvalls Tidning (ST-Online) är den enda svenska dagstidning som tar betalt av läsarna för www-utgåvan. Tidningen kan delas upp i en ”betaldel” (ST-Online) och en ”gratisdel”. Nedanstående svar avser ST-Online. Man började publicera redaktionellt material på www i
november 1996. Ca 70 % av innehållet i den tryckta tidningen publiceras på www. Som exempel på unikt material nämns en egen debattsida, nyhetstelegram, lokalt, inrikes och utrikes, evenemangsguide, lunchguide, databaser med film- och skivrecensioner, länktips, bakgrundsmaterial till artiklar m.m. Webbplatsen uppdateras 2-4 gånger/dag. Via ST Online planerar man att göra hela sitt textarkiv tillgängligt. Man planerar att införa ljud och video. Gratisdelen, dvs. den del av tidningen som är fritt tillgänglig på www, omfattar jämfört med ST-Online uppskattningsvis 10 % av nyhetsmaterialet och 50 % av det totala materialet.
- Sydsvenska Dagbladet Snällposten (SDS) började publicera redaktionellt material på www 1995. Endast enstaka artiklar publiceras. Det unika materialet består av interaktiva tävlingar, länksamlingar, vissa debatter, TT-telegram, vissa ljudinslag, väderleksinformation m.m. Materialet lagras olika länge, allt från några dagar till något år förekommer.
- Värmlands Folkblad började publicera redaktionellt material på www i november 1997. Ca 60 % av den tryckta tidningen kan läsas på www. Något unikt material förekommer inte. Webbtidningen uppdateras en gång per dag. Man säger sig inte ha några planer på att inom det närmaste året inkludera annat än text och stillbilder i wwwutgåvan.
- ÖstgötaCorrespondenten började sin www-satsning våren 1995, då en nöjesbilaga lades ut. Man publicerar närmare 100 % av den tryckta tidningen på www, med undantag för en ”Kort och Gott-sida” med kåserier, korsord och liknande. Inte heller eftertextannonser eller alltför långa bildreportage läggs ut på nätet. Som exempel på unikt material nämns framförallt byråmaterial och nyheter som händer under dagen (tips från lokalradion, polisradion, reportrar på tidningen). Webbplatsen uppdateras kontinuerligt under dagen, men sällan färre än 10 gånger per dag. Artiklarna finns tillgängliga i ca en månad. Man har i dagsläget inga planer på att komplettera www-utgåvan med rörliga bilder eller ljudfiler.
Än så länge publicerar dagstidningarna främst text och stillbilder i sina www-utgåvor. Viss försöksverksamhet har inletts beträffande publicering av ljud och rörliga bilder och flera av de tidningar som besvarat enkäten uppger att de inom det närmaste året planerar att antingen införa ljud och rörliga bilder eller att utöka redan existerande sådan publicering.
6.3.2. Elektroniska tidskrifter
KB:s förteckning över svenska online-tidskrifter, Svensk Periodica Online18, omfattade i juni 1998 260 tidskrifter. Någon uppgift om hur många av dessa som enbart existerar i www-form finns inte. Beträffande de tidskrifter som ges ut i såväl www- som pappersform varierar, precis som när det gäller dagstidningar, graden av samstämmighet mellan utgåvorna. Vissa lägger ut allt material från pappersutgåvan, andra delar av materialet. Vissa publicerar inte något material som inte återfinns i pappersutgåvan, medan andra har en omfattande publicering av sådant unikt material.
Det allra mesta av det tidskriftsmaterial som publiceras på www är gratis tillgängligt i dag. Ett fåtal tidskrifter, exempelvis ETC, tar på olika sätt betalt.
6.3.3. Elektroniska böcker
Bokförlagens online-publicering består vanligtvis av att man publicerar information om utgivna böcker, recensioner samt kortare utdrag ur böckerna. Däremot är det ovanligt med fulltextpublicering, även om enstaka undantag finns. Det finns dock webbplatser med en omfattande publicering av elektroniska texter i fulltextformat, exempelvis det s.k. Projekt Runeberg, som tillhandahåller mer än 200 äldre svenska litterära texter (romaner, diktsamlingar m.m.).19 Som exempel på en textkritisk edition kan nämnas Svenska vitterhetssamfundets Almqvistutg åva20.
6.3.4. Den offentliga sektorn
Den offentliga sektorn har sammantaget en omfattande webbpublicering. På SverigeDirekt21, som är den offentliga sektorns gemensamma webbplats fanns i februari 1998 länkar till 272 kommuner, 21 landsting och 230 statliga myndigheter.
Statliga myndigheter informerar om sin verksamhet och hur man kommer i kontakt med myndigheten och dess tjänstemän. Myndigheterna publicerar sina nyhetsblad och tidskrifter på sina webbplatser, de informerar om och publicerar relevanta författningar inom myndighetens område, de publicerar rapporter och annat material.
18 http://www.kb.se/nbp/el-per.htm19 http://www.lysator.liu.se/runeberg/20 http://g3.spraakdata.gu.se/vittsam/almqvist.html21 http://www.sverigedirekt.riksdagen.se
En särskild kategori utgörs av de statliga universiteten och högskolorna, vars publicering är än mer omfattande än vad som gäller för den statliga sektorn i allmänhet. Forskningsrapporter, kursinformation, laboratorieresultat samt en stor mängd privata hemsidor är några exempel på vad som återfinns där.
Så gott som samtliga svenska kommuner finns representerade på www. Information om kommunen och dess näringsliv utgör den grundläggande informationskategorin. Målgrupperna är allt från den egna kommunens medborgare till presumtiva turister. Mängden information varierar bland kommunerna. I några fall publiceras kommunala protokoll på www.
6.3.5. Ljud och rörliga bilder
Utbudet av ljud och rörliga bilder har hitintills varit begränsat på www, framför allt på grund av de begränsade överföringsmöjligheterna. Denna typ av information är betydligt mer omfångsrik än text och stillbilder och tar därför lång tid att ladda ned. När ny teknik möjliggör bredbandsöverföring kommer dock utbudet med största sannolikhet att öka mycket snabbt.
Än så länge publicerar dagstidningarna främst text och stillbilder i sina www-utgåvor. Viss försöksverksamhet har inletts beträffande publicering av ljud och rörliga bilder och flera av de tidningar som besvarat den ovan redovisade enkäten uppger att de inom det närmaste året planerar att antingen införa ljud och rörliga bilder eller att utöka redan existerande sådan publicering.
I avsnitt 6.2.5 beskrevs hur Aftonbladet och Dagens Nyheter integrerar ljud och video i sina webbutgåvor.
Beträffande ljud återfinns i dag ett antal radiokanaler och -stationer på Internet. På Sveriges radios webbplats finns möjlighet att ta del av utsändningar från samtliga kanaler (inklusive 25 lokalradiokanaler). Utbudet består i första hand av nyheter, men en rad andra programkategorier förekommer också. Det är dock inte fråga om särskilda utsändningar vid en bestämd tidpunkt av dessa program, utan varje program finns lagrat som en separat ljudfil och kan laddas ner av lyssnaren vid vilken tidpunkt som helst. Dagens Ekos sändningar (”kvartifem-sändningen”) finns exempelvis lagrade från den 1 juli 1996.
Det finns i dag en radiostation i Sverige som sänder kontinuerligt via Internet, nämligen den kommersiella stationen Radio Bandit22. Sändningarna görs med hjälp av s.k. Streaming Audio-teknik. I det här fallet är
22 http://www.bandit.se
det fråga om en utsändning som är identisk med den som sker på stationens ordinarie frekvens på FM-bandet.
I övrigt finns ljudfiler att hämta från olika webbplatser med någon form av musikinriktning. Ofta rör det sig om begränsade avsnitt av ett musikaliskt verk som tillhandahålls som en ”smakbit”.
Utbudet av rörliga bilder är ännu mer begränsat. Nätets kapacitet vad beträffar överföring är ännu så länge ett effektivt hinder för mer än begränsade insatser. En hel del försök görs dock. Dagens industri startade exempelvis tv-utsändningar via www i juni 1998. Ett annat exempel är att man via regeringens webbplats, Information Rosenbad, numera direktsänder via Internet från större presskonferenser. I sammanhanget kan påpekas att dessa utsändningar, till skillnad från Radio Bandits, i hög utsträckning är unika genom att de inte samtidigt eller vid ett annat tillfälle sänds ut via etern.
En beskrivning av innehållet på den svenska delen av www utifrån en formatmässig indelning (text, ljud, bild etc.) återfinns i avsnitt 8.1, där jag redogör för KB:s s.k. Kulturarw3-projekt.
6.3.6. Privat publicering
I takt med att tillgången till Internet ökar, tenderar också gränsen mellan privat och professionell publicering att suddas ut. Det är i dag möjligt för vem som helst att producera välgjorda webbplatser, naturligtvis under förutsättning att han eller hon har tillgång till erforderlig utrustning samt besitter tillräckliga tekniska och ämnesmässiga kunskaper.
Utredningen har utfört en enklare innehållsmässig analys, baserad på ett stickprov, av de dokument som återfinns på webben i dag och som samlats in inom ramen för KB:s Kulturarw3-projekt. Undersökningen visar att en stor del av webbsidorna avser material av privat karaktär. Information som enbart har intresse för den närmaste vänkretsen, skolklassen eller som skapats i syfte att lära sig HTML-kodning svarar för en överraskande stor del av det insamlade materialet. Det som i ”pappersvärlden” bestod av lappar på en anslagstavla, en inlämningsuppgift i skolan eller ett internt protokoll läggs nu ut på nätet i digital form.
Det är i dag svårt, för att inte säga omöjligt, att skilja mellan det som är avsett för en liten krets av personer och det som är avsett att spridas i en större krets. Det finns inte några vare sig formella, tekniska eller i övrigt principiella skillnader mellan dessa kategorier.
Mediekommittén föreslog i sitt slutbetänkande Grundlagsskydd för nya medier (SOU 1997:49) att yttrandefrihetsgrundlagen (YGL) skulle utvidgas. Förslaget innebar att även andra än traditionella medieföretag
skulle kunna ansöka om utgivningsbevis för sådana yttranden som publiceras på Internet. Därigenom skulle dessa yttranden ges ett grundlagsmässigt skydd.23
Kommitténs förslag skulle ha inneburit att ett formellt kriterium hade etablerats, som eventuellt kunde ha använts i en urvalsprocess. Förslaget avvisades dock av regeringen i prop. 1997/98:43. I propositionen anförde regeringen att tiden ännu inte var mogen för en sådan åtgärd (s. 111).
6.4. Databaser
Traditionellt har man kunnat urskilja tre grundläggande typer av allmänt tillgängliga databaser: bibliografiska databaser, faktadatabaser och fulltextdatabaser. Sådana databaser har funnits i flera decennier och har ofta drivits på kommersiell basis. Som exempel kan nämnas nationella bibliografiska databaser som Libris och Artikel-sök, fulltextdatabaser som Rixlex och TT-Nyhetsbanken samt faktadatabaser med statistiska eller ekonomiska data. Gränserna mellan olika databasformer är numera flytande.
För att kunna söka i dessa baser behövde användaren tidigare ofta teckna ett avtal med producenten om villkoren. Genom att sedan med hjälp av modem ringa direkt till databasen eller till en s.k. databasvärd kunde användaren ansluta sig till basen med ett särskilt lösenord för att därefter söka i den. Allt fler databaser görs nu tillgängliga via Internet, men fortfarande behövs i många fall ett avtal och ett lösenord. Däremot behöver man inte ringa direkt till databasen eller databasvärden.
Att databaserna nu har ett www-gränssnitt innebär dock inte att de har blivit gratis utan bara att själva anslutningen, inloggningen, förenklats och att gränssnittet nu kan utformas grafiskt på ett sätt som inte var möjligt tidigare. Samtidigt har principerna för debitering förändrats. Det är ovanligt att databaser i dag debiterar användarna efter ansluten tid.
Det som utmärker en databas är att informationen är systematiskt ordnad, att de enstaka posterna oftast är försedda med sökingångar som indextermer eller nyckelord samt att det finns ett särskilt frågegränssnitt för att söka och hämta information ur basen. Traditionellt har en databas, åtminstone i svenskt språkbruk, också ansetts utmärkas av att den finns lagrad i maskinläsbar form (se avsnitt 4.2).
Databaser är antingen statiska eller dynamiska. De statiska är avslutade och inte avsedda att förändras. De kan jämföras med tryckta bibliografier och är förhållandevis enkla att hantera. Dynamiska databaser är
23 Mediekommittén använder termen ”yttrande” för det som publiceras på Internet.
sådana som förändras genom att information tillförs, ändras eller tas bort.
Den senaste upplagan av den nordiska databasförteckningen Nord-Guide24 innehåller 195 svenska offentligt tillgängliga databaser. I antalet ingår ett mindre antal databaser på cd-rom och diskett. Flertalet förtecknade baser nås via online-förbindelse, de flesta via Internet och www. Sannolikt kommer så gott som samtliga att vara sökbara via www inom något eller några år.
Som exempel på svenska databaser som ingår i förteckningen kan nämnas SPAR (Samordnat person- och adressregister) som innehåller personuppgifter om den svenska befolkningen (8,6 miljoner poster), PressText som innehåller alla artiklar ur Dagens Nyheter och Expressen från början av 1990-talet (450 000 artiklar) och GeoRegister som innehåller referenser till dokument inom geovetenskaperna (27 000 poster). Mängduppgifterna ovan avser 1996.
Databaser skiljer sig från övrig www-information på det sättet att en automatiserad insamling med hjälp av s.k. robotteknik är svår att genomföra (för en beskrivning av tekniken, se bilaga 3). En användare söker ju vanligtvis fram information ur en databas genom att skriva in ett eller flera sökord i ett formulär. Utifrån dessa sökord hämtas sedan relevant information ur databasen. Men för att en robot skulle kunna hämta all information ur en databas skulle den, något förenklat, behöva söka på alla ord som förekommer i det aktuella språket.
6.5. Publicerings- och kommunikationsformer utanför www
6.5.1. Sändlistor
Det finns ett stort antal e-postbaserade s.k.sändlistor (eng. ‘mailing lists’), vars inlägg distribueras via e-post till listans medlemmar. Sändlistor benämns också distributionslistor eller e-postkonferenser. Listorna kan vara såväl öppna för vem som helst som slutna, dvs. enbart tillgängliga för vissa personer. De kan omfatta allt från tusentals medlemmar till bara några få.
En lista fungerar på så sätt att en medlem skickar ett inlägg till en server, dvs. en viss datoradress, som sedan distribuerar inlägget till samtliga medlemmar via e-post. När någon vill besvara inlägget görs på
24 Nordguide 1996 : Nordic databases : nordiska databaser. – Esbo: Nordinfo, 1997 (Nordinfo-publikation ; 35)
motsvarande sätt. För att bli medlem skickar man endast ett enkelt ebrev till servern.
Listor kan vara modererade, där en s.k. moderator granskar inläggen innan de går vidare till medlemmarna, eller öppna, där alla inlägg når medlemmarna omedelbart. Sändlistorna är ofta internationella till sin karaktär och har medlemmar från hela världen. De rent svenskspråkiga listornas medlemmar är, av naturliga skäl, oftast svenskar.
Sändlistornas medlemmar är aktiva i varierande grad. Som exempel kan här nämnas två av de större allmänt tillgängliga svenskspråkiga listorna. Biblist, som behandlar biblioteksfrågor, och Media, som behandlar journalistik, distribuerade under en undersökningsvecka i mars 9 respektive 109 meddelanden. Biblist hade då ca 1 300 prenumeranter och Media ca 1 000.
Det blir allt vanligare att sändlistor publicerar inläggen på www. Samtliga inlägg till Biblist sedan november 1995 återfinns exempelvis under Sunets webbplats25, i likhet med inläggen till många andra av de 326 listor som finns förtecknade där. Många till formen enkla nyhetsbrev sprids också via sändlistor, antingen genom att de postas som ett vanligt inlägg till listan eller genom att de utgör en egen lista. Ett exempel på det senare är Carl Bildts veckobrev, som på det sättet sprids till ca 16 000 mottagare.
6.5.2. Nyhetsgrupper (Usenet news)
Nyhetsgrupper (Usenet News), eller diskussionsgrupper, är en form av Internetkommunikation som ligger utanför www. Det finns i dag tiotusentals diskussionsgrupper i allehanda ämnen. I den internationella söktjänsten Deja News26, som lagrar och tillhandahåller inlägg från mer än 50 000 diskussionsgrupper, fanns 38 grupper inom den s.k. swnet.hierarkin i mars 1998. I dessa grupper förs diskussionerna till övervägande delen på svenska. Totalt fanns vid denna tidpunkt ca 41 000 inlägg från dessa grupper lagrade och sökbara.
Gemensamt för både e-postbaserade sändlistor och nyhetsgrupper är att de i huvudsak förmedlar endast text. Det lagringsutrymme som åtgår för att bevara dem blir därmed förhållandevis begränsat.
Som framgår av avsnitt 7.3.3 har det norska nationalbiblioteket, med stöd av den norska pliktexemplarslagen, sedan ett par år hämtat in och lagrat inläggen i de norska diskussionsgrupperna på Usenet. Lagringsut-
25 http://segate.sunet.se/archives/biblist.html26 http://www.dejanews.com
rymmet som krävs för detta är inte större än att en cd-rom räcker för att bevara samtliga norska inlägg under ett år.
Analogt med ovan beskrivna sändlistor är gränserna något flytande mellan Usenet och www, eftersom en stor mängd av den kommunikation som förmedlas via Usenet också är tillgänglig via www.
6.5.3. BBS:er
Bulletin Board Systems (BBS:er) benämns ibland elektroniska anslagstavlor. Ansvarsfrågorna för de yttranden som sprids via sådana behandlades av den s.k. IT-utredningen, vars förslag lades fram i betänkandet Elektronisk dokumenthantering (SOU 1996:40). Lagen (1998:112) om ansvar för elektroniska anslagstavlor trädde i kraft den 1 maj 1998. Lagen innebär att den som tillhandahåller en elektronisk anslagstavla, dvs. en tjänst för förmedling av meddelanden, skall ha uppsikt över tjänsten. Tillhandahållaren skall vidare vara skyldig att lämna användare av tjänsten viss information och att ta bort vissa slag av straffbara meddelanden.
En BBS kan vara liten och endast användas av ett par personer, men det finns också stora BBS:er som nyttjas av tusentals personer. Typiskt för BBS är att de innehåller olika areor för olika funktioner. En sådan area är vanligtvis reserverad för överföring av filer från den egna datorn (eng. ‘up-load’), varifrån andra sedan kan hämta (eng. ‘down-load’) dessa filer. I andra areor på en BBS pågår ofta ett antal s.k. möten, där olika ämnen diskuteras. Dessa möten liknar ovan beskrivna nyhetsgrupper.
Det är sannolikt att antalet BBS:er minskar i och med att Internet blir allt mer tillgängligt. Fortfarande finns dock ett stort antal BBS:er i drift.
6.6. Särskilda egenskaper hos elektronisk information som är tillgänglig via online-förbindelse
Elektronisk information som är tillgänglig via online-förbindelse, t ex webbsidor, online-databaser och elektroniska anslagstavlor (BBS:er) skiljer sig på ett avgörande sätt från de elektroniska dokument som framställs i fixerad form, t.ex. cd-rom. Online-informationen behöver endast framställas i ett enda exemplar, från vilket informationen sedan kan överföras till användare. Elektroniska dokument i fixerad form framställs däremot vanligtvis i ett antal identiska exemplar, som sedan på olika sätt sprids till allmänheten eller annan målgrupp.
De sistnämnda dokumenten har därmed, åtminstone ur denna utrednings synvinkel, mer gemensamt med traditionella papperspublikationer än med den elektroniska information som tillhandahålls via onlineförbindelse. Den bibliografiska beskrivning som görs av elektroniska dokument i fixerad form liknar också till stor del den beskrivning som görs av böcker och tidskrifter.
6.6.1. Länkning
Länkningsmöjligheterna är sannolikt den enskilda faktor som inneburit mest för webbens starka tillväxt. Från bevarandesynpunkt medför tekniken särskilda problem, eftersom det är svårt, för att inte säga omöjligt, att säga var informationen börjar och slutar. En webbsida kan vara helt sluten och självständig, det vill säga inte innehålla en enda länk. Den är då enkel att hantera. Men det vanligaste är att webbsidor innehåller ett antal länkar till andra sidor, vilka i sin tur ofta innehåller länkar till ytterligare sidor. Dessa sammanlänkade sidor kan antingen vara lagrade på samma server (värddator) eller på olika servrar, belägna i Sverige eller utomlands. Det blir därmed svårt att geografiskt avgränsa den information som är tillgänglig via online-förbindelse, i synnerhet när det är fråga om dynamisk och sammanlänkad information.
Bilder som ingår på webbsidor är ofta lagrade som separata filer, vilka läses in av webbläsaren samtidigt som sidan i sin helhet presenteras. Även här kan bilden vara lagrad på en helt annan server.
Det är numera också vanligt att länkarna är dolda i bilder, s.k. klickbara bilder (‘image maps’). Det är dock ingen principiell skillnad mellan sådana och vanliga textlänkar.
6.6.2. Autenticitet
Förutom problematiken med det fysiska bevarandet av elektroniskt lagrad information kommer samhället inom en inte alltför avlägsen framtid därutöver att konfronteras med de svårigheter som s.k. intellektuellt bevarande medför.
Peter Graham vid Rutgers University i USA, framträdande expert på det s.k. autenticitetsproblemet, har formulerat tre grundläggande frågor som han spår kommer att få ökad aktualitet:
1. Hur vet jag att det här dokumentet är rätt dokument?
2. Hur vet jag att det här dokumentet är detsamma som det dokument du använde och hänvisade till?
3. Hur vet jag att det här dokumentet inte har ändrats sedan förra gången jag använde det?
Förändringar av innehållet är antingen oavsiktliga eller avsiktliga. Till de förstnämnda hör förlust av hela informationen eller, oftare, delar av informationsmängden vid kopiering eller distribution via nätverk. En avsiktlig förändring kan vara gjord i syfte att förbättra eller uppdatera en text, men också i syfte att sprida falsk information eller ta bort information som bedöms vara skadlig.
Intressanta försök pågår runt om i världen för att utveckla s.k. elektroniska sigill, digitala ”vattenstämplar” och liknande metoder, som kan göra det möjligt att avslöja förändringar.
Ett förslag till EU-direktiv om elektroniska signaturer presenterades i maj 199827.
6.7. Bibliografisk beskrivning och identifiering
I detta avsnitt beskrivs olika utvecklingsprojekt beträffande metoder för att beskriva och identifiera elektroniskt lagrad information. Dessa metoder kan komma att bli av stort värde när det gäller insamlande och bevarande av den elektroniska informationen, eftersom det därmed kan bli möjligt att mer effektivt söka fram viss typ av information.
Ett utmärkande drag för Internet i dag är att den stora mängden28allmänt tillgänglig information endast i mycket liten grad är bibliografiskt beskriven. Det innebär att det kan vara svårt och tidsödande att söka fram just den information som önskas. Uttrycket ”som att leta efter en nål i en höstack” är en stundtals alltför träffande beskrivning, eftersom en enkel sökning i någon av de stora söktjänsterna (Altavista, Lycos, Excite etc.) kan ge tusentals, ibland hundratusentals träffar.
6.7.1. Traditionell katalogisering
27 Proposal for a European Parliament and Council Directive on a common framework for electronic signatures – COM(1998)297final. (Dokumentet finns publicerat på: http://www.europa.eu.int/comm/dg15/en/media/infso/com297en.pdf)28 Antalet unika webbsidor i mars 1998 uppskattades till ca 275 miljoner. Undersökningsresultaten finns publicerade på: http://www.research.digital.com/src/ whatsnew/sem.html.
Beskrivningen (såväl katalogisering som indexering) av traditionellt utgivna böcker och tidskrifter karakteriseras av att den så gott som alltid utförts av någon annan än utgivaren. Nationalbibliotek och andra bibliotek har svarat för en stor del av arbetet tillsammans med kommersiella indexerings- och databasföretag. Ett i det närmaste heltäckande system för s.k. bibliografisk kontroll har utvecklats, vilket innebär att flertalet utgivna dokument beskrivs i nationella och/eller internationella databaser och bibliografier.
Pliktleveranser syftar inte enbart till att ”bevara och tillhandahålla yttringar av svenskt liv, svenskt samhälle och svensk kultur för forskning och studier” (prop. 1993/94:10). Pliktexemplaren utgör också ett viktigt underlag för den nationalbibliografiska beskrivning som i första hand utförs vid KB och ALB och som resulterar i utgivningen av den svenska nationalbibliografin (Svensk bokförteckning m. fl. publikati oner).
Det finns i dag internationella riktlinjer för hur s.k. elektroniska resurser skall katalogiseras (se avsnitt 4.2). I Sverige katalogiserar KB sedan en tid vissa elektroniska resurser, som endast är tillgängliga via Internet, i databasen Libris. Verksamheten bedrivs än så länge i försöksform. I mars 1998 fanns 1 539 elektroniska resurser förtecknade i Libris-basen, varav 527 svenska. Därutöver fanns 210 nätpublicerade tidskrifter katalogiserade, varav 119 svenska.
I Danmark har nyligen det s.k. Indoreg-projektet (Internet Document Registration) avrapporterats. Projektet har genomförts av Det kongelige Bibliotek (KB) och Dansk bibliotekscenter (DBC). I slutrapporten föreslås särskilda kriterier för vilka dokument som skall registreras i en nationalbibliografi.
Den allmänna uppfattningen i dag är dock att det inte på långa vägar finns resurser för bibliotek och andra aktörer att katalogisera annat än ett begränsat urval av det som publiceras på www.
6.7.2. Metadata
Metadata är ett begrepp som rönt stor uppmärksamhet i bibliotekskretsar de senaste åren. Ordet översätts oftast med ”data om data”. En traditionell bibliotekskatalog innehåller metadata. Som exempel på några grundläggande metadatakategorier kan nämnas uppgifter om författare, titel, utgivare, utgivningsår etc. Metadata har dock under senare tid oftast kommit att användas i samband med diskussioner om hur man kan förbättra beskrivning, registrering och återvinning av elektroniskt lagrad information, däribland webbsidor.
Till skillnad från de bibliografiska uppgifter som återfinns på ett katalogkort eller i en separat databas, dvs. är skilda från själva publikatio-
nen, brukar de metadata som beskriver en webbsida vanligtvis infogas i själva sidan. De syns dock inte för den vanlige användaren i vars webbläsare sidan presenteras, eftersom de är placerade i dokumentens ”huvud” och därmed inte visas på bildskärmen. Däremot är uppgifterna åtkomliga för insamlings- och indexeringsrobotar.
Syftet med en utökad användning av metadata är detsamma som syftet med att katalogisera och klassificera traditionellt utgivet material, nämligen att förbättra möjligheterna till informationssökning och – återvinning. Det är därför sannolikt att utgivare som har ett starkt intresse av att deras dokument skall återfinnas i en informationssökningsprocess kommer att vara mest aktiva när det gäller att förse sina dokument med metadata. Ett sådant intresse finns naturligtvis hos kommersiella aktörer, men också inom den offentliga sektorn.
Det viktigaste initiativet inom metadataområdet i dag är det s.k. Dublin Core29 (DC). Det innehåller 15 s.k. element, dvs. kategorier av uppgifter. Som exempel på element som ingår i DC kan nämnas ämne, titel, författare eller annan primär upphovsman, utgivare, publiceringsdatum, format, språk etc. En av fördelarna med DC är att det är så pass enkelt att använda att upphovsmän och producenter själva kan förse sina webbsidor med metadata.
De nordiska länderna har spelat en aktiv och framträdande roll i utvecklingen av DC, bl.a. genom The Nordic Metadata Project, ett samnordiskt projekt finansierat av Nordinfo. Från svensk sida har Netlab vid Lunds universitetsbibliotek och SICS (Swedish institute of computer science) deltagit i projektet.
Flera projekt som för närvarande bedrivs i Sverige (Kulturarw3projektet, Svesök, Nordic web index, Safari) och som beskrivs närmare i kapitel 8 stödjer DC och försöker på olika sätt uppmuntra till en utökad användning av metadata på www.
Det finns också andra format för metadata, exempelvis TEI (Text Encoding Initiative), som främst används inom de humanistiska vetenskaperna.
6.7.3. Identifiering av elektroniska publikationer
Flera internationella projekt pågår i syfte att bättre kunna identifiera elektroniskt lagrad information. Projekten bedrivs bl.a. för att förbättra förutsättningarna för en utökad kommersiell hantering och möjliggöra en bättre bevakning av upphovsmännens intressen. Arbetet är också mycket
29 En utförlig beskrivning av Dublin Core återfinns på: http://purl.oclc.org/ metadata/dublin_core/
viktigt för bibliotek, i synnerhet nationalbibliotek, i och med att den bibliografiska kontrollen underlättas.
Att effektivt kunna identifiera elektronisk information är av stort värde för de nationella minnesinstitutionernas möjligheter att samla in denna information. Om standardiserade metoder för sådan identifikation utvecklas och också börjar användas i tillräckligt stor omfattning, kan nationalbiblioteken sannolikt lättare utarbeta urvalsprinciper för det som publiceras på nätet. Hypotesen utgår från att professionellt framställt material kommer att förses med koder för sådan identifikation i betydligt större utsträckning än de enklare webbsidor som exempelvis framställs av privatpersoner eller lokala näringsidkare eller förenin gar.
I nedanstående avsnitt redogörs för några olika typer av sådana s.k. identifierare (eng. ‘identifiers’), såväl traditionella och etablerade som sådana som är under utveckling.
ISBN – International Standard Book Number
ISBN-systemet, som i dag tillämpas i hela världen, utvecklades 1967 och blev en internationell ISO-standard 1970 (ISO 2108). Det omfattar traditionellt böcker och andra monografiska publikationer, men inkluderar numera även videokassetter och vissa elektroniska dokument i fixerad form. ISBN är uppbyggt på följande sätt: landskod-förlagskod-titelnrkontrollsiffra.
Ett ISBN-nr är globalt unikt, dvs. det kan användas endast för en viss bestämd publikation. Olika utgåvor av samma verk, t ex en tryckt utgåva och en cd-rom-utgåva, skall ha olika ISBN.
ISSN – International Standard Serial Number
ISSN används för att identifiera olika seriella publikationer: dagstidningar, tidskrifter, årsböcker, serier m.m. Dessa kan existera i olika format och spridas på olika sätt: på papper, på mikrofilm, i elektronisk offline-form (diskett, cd-rom) eller online-form (Internet/databaser). ISSN är ett globalt unikt system, varför två publikationer inte kan ha samma ISSN. Enligt riktlinjerna skall en tidskrift som ges ut på två olika sätt (t ex papper och Internet) ha två olika ISSN.
ISSN består av två grupper av fyra siffror vardera, åtskilda med ett bindestreck, exempelvis 0374-0536.
Det bör påpekas att ISSN används endast för att identifiera publikationen i dess helhet, alltså inte för att särskilja enstaka volymer, häften
eller enskilda bidrag/artiklar. ISSN är, liksom ISBN, en internationell ISO-standard (ISO 3297).
SICI – Serial Item and Contribution Identifier
SICI bygger på ISSN och används för att identifiera olika enstaka volymer, häften eller enskilda bidrag/artiklar. SICI är antaget som USAstandard (Z39.56). SICI innehåller tre beskrivande huvudavdelningar:
- Fysisk beskrivning: innehåller i sin tur uppgifter om ISSN, tidpunkt för utgivning och häftets (motsvarande) numrering
- Bidrag: Plats för bidraget (exempelvis den enskilda artikeln), vanligtvis i form av pagina
- Kontroll: Innehåller olika koder för att identifiera vilken typ av bidrag som beskrivs, publikationsform, etc.
En SICI-kod är globalt unik. En artikel som publiceras i två olika tidskrifter får två olika SICI. En artikel som publiceras i en tidskrift som ges ut dels på papper, dels via Internet, får likaledes två olika SICI.
BICI – Book Item and Component Identifier
BICI har lanserats som en motsvarighet till SICI för bidrag i böcker och andra monografiska publikationer. BICI har ännu inte antagits som nationell eller internationell standard.
PII – Publisher Item Identifier
PII används för att identifiera en tidskriftsartikel eller något annat verk i sig, dvs. oberoende av dess utgivningsform. PII har utvecklats av förlaget Elzevier Science. Det används främst av utgivare av vetenskaplig information. Det kan användas för att identifiera enskilda artiklar eller kapitel i seriella och monografiska publikationer. I princip kan PII användas på ännu lägre nivåer, exempelvis för enskilda figurer eller diagram i en artikel.
Till skillnad från SICI används PII främst för att identifiera ett verk innan det är publicerat. Genom ett tillägg till SICI 1996 har dock de båda systemen gjorts kompatibla. PII utgör inte nationell eller internationell standard.
URL – Uniform Resource Locator
URL, som ofta kallas för Internetadress, webbadress eller liknande, är egentligen inte avsett för identifikation. I stället används URL för att ange den exakta adressen till en viss webbsida, dvs. på vilken Internetdator (server) den är placerad. För att hitta en webbsida måste webbläsaren känna till den exakta URL:en. Man kan antingen skriva in den för hand eller klicka på en länk på en webbsida. En nackdel är att en sida som flyttas till en annan server eller byter namn inte kommer att hittas av webbläsaren, eftersom sidan då har fått en ny URL.
PURL – Persistent Uniform Resource Locator
PURL-systemet har utvecklats av det amerikanska biblioteksdataföretaget OCLC (Online Computer Library Center). En PURL är en utökad URL, som i stället för att peka direkt till en viss server pekar till en särskild PURL-databas. En användare som klickar på en länk som innehåller ett PURL-element hänvisas till databasen, varifrån den aktuella URL:en returneras. PURL anses vara en temporär lösning och kommer därför troligtvis att minska i betydelse om och när URN (se nedan) får ett bredare genomslag.
URN – Uniform Resource Name
URN har tillkommit som ett svar på det problem som beskrivs ovan angående ”döda länkar”. Syftet med URN är att det skall fungera som ett system som tillhandahåller permanenta och globalt unika namn för de dokument som publiceras på Internet. URN har utarbetats inom IETF (Internet Engineering Task Force). För att URN skall fungera måste särskilda system utvecklas som registrerar var olika dokument befinner sig på www. Strävan är att det i varje land skall finnas en sådan central instans. Kungl. biblioteket samarbetar med Netlab vid Lunds universitetsbibliotek om att etablera en svensk ”URN-central”.
DOI – Digital Object Identifier
Ett identifieringssystem som tilldragit sig stort intresse det senaste året är DOI, som utvecklats av en amerikansk forskningsstiftelse i samarbete med flera av de största förlagen och med aktivt stöd från den amerikanska förläggarföreningen. Den allmänna bedömningen är att DOI kommer att få ett snabbt genomslag när det gäller de kommersiella förlagens
elektroniska publicering. DOI har tillkommit för att dels hantera de olika rättigheter som är förbundna med olika delar av elektroniska publikationer, dels utveckla en kommersiell förmedling av dessa publ ikationer.
DOI kan användas för att identifiera elektronisk information på alla nivåer. Det är exempelvis möjligt att identifiera enstaka bilder i en tidskriftsartikel.
En DOI-kod består av två delar. Den första delen identifierar utgivaren. Den andra delen identifierar själva objektet, eller de delar av ett objekt som utgivaren vill identifiera. Den andra delen av DOI-koden kan inkludera vissa existerande system, som SICI och BICI, vilka ju i sin tur inkluderar ISSN och ISBN.
Förutom DOI-koden innehåller systemet också ett register med uppgifter om var ett visst objekt befinner sig samt en databas med uppgifter om själva objektet, exempelvis rättighetsinnehavare, pris eller andra villkor.
DOI-koderna är globalt unika. De är kompatibla med URN.
CIS – Common Information Systems
CIS har utvecklats av musikindustrin och internationella upphovsrättsorganisationer. CIS inrymmer ett antal olika delar och databaser, som här beskrivs kortfattat.
CAE (Compositeur, Auteur, Editeur) är ett nummer som används för
att identifiera upphovsmän och utgivare av litterära och konstnärliga verk. Det kommer att utvidgas till att omfatta även andra konstarter och döps då om till IP (Interested Party) NumberK.
ISMN (International Standard Music Number) motsvarar ISBN för
musiktryck.
ISRC (International Standard Recording Code) identifierar indivi-
duella musikinspelningar, exempelvis de olika spåren på en cd-skiva.
ISAN (International Standard Audiovisual Number) liknar ISRC,
men används för att identifiera audiovisuella verk som filmer och tvprogram.
EAN/UPC Article Number, som också kan återges i streckkodsform,
används för att identifiera olika bärare av inspelad musik.
ISWC (International Standard Work Code) identifierar det musika-
liska verket i sig, snarare än en viss inspelning eller liknande.
ISWC-L (International Standard Work Code-Literature) är en mot-
svarighet till ISWC för litterära verk. ISWC-L beskriver sålunda endast verket i sig, oberoende av var och i vilken form det publiceras.
7. Internationell kartläggning
7.1. Inledning
De flesta länder har i dag någon form av lagstiftning rörande pliktleveranser av tryckta skrifter och andra dokument (eng. ‘legal deposit’). I ett fåtal länder baserar sig insamlande och bevarande på frivilliga överenskommelser mellan parterna. Många länder, däribland Sverige, inbegriper i lagstiftningen också elektroniska dokument i fixerad form, exempelvis disketter och cd-rom. Däremot finns det inget land som har uppnått en heltäckande lösning vad gäller insamling, bevarande och tillhandahållande av den del av landets kulturarv som publiceras och är tillgängligt online. Man är dock på många håll medveten om problemet och i ett par länder utförs eller har nyligen utförts översyner av existerande lagstiftning. Likaledes bedrivs på flera håll intressanta utvecklingsprojekt i syfte att skapa tekniska och andra förutsättningar för denna verksamhet.
7.2. Europa
Inom EU-kommissionen hanteras FoU-frågor rörande bibliotek och angränsande institutioner inom generaldirektorat (DG) XIII. Ett särskilt biblioteksprogram har funnits sedan 1980-talet.
DG XIII arrangerade i december 1995 en konferens om pliktexemplar av elektroniska dokument där representanter för Europas nationalbibliotek och förlagsbransch närvarade30. Konferensen utmynnade bl.a. i att man allmänt erkände behovet av att utsträcka existerande lagstiftning till att också inkludera elektroniska dokument. Såväl nationalbibliotek som andra deltagare var överens om att mycket av dagens material i annat fall inte kommer att vara åtkomligt för framtidens brukare. Man var
30 W
orkshop on issues in the field of national deposit collections of electronic
publications / Working Group of the Conference of Directors of National Libraries (CDNL). – Luxembourg, December 18, 1995 (http://www2.echo.lu/libraries/ en/depo-rpt.html)
också enig i att biblioteken har ett ansvar för de användare som inte har egen tillgång till den tekniska utrustning som krävs.
Det rådde även enighet om att de lösningar som tas fram måste erkänna producenternas legitima intressen av krav på avkastning och skydd mot ett orimligt utnyttjande av dokumenten. För att uppnå denna balans måste nationalbibliotek och förläggare arbeta tillsammans, exempelvis i olika utvecklingsprojekt.
Ett sådant projekt är det av EU/DGXIII finansierade FoU-projektet COBRA (Computerised Bibliographic Records Action), där åtta europeiska nationalbibliotek samarbetat angående vissa gemensamma fr ågor.
7.2.1. Mackenzie-rapporten
På initiativ av COBRA-gruppen finansierade EU-kommissionen en brett anlagd studie angående pliktexemplar av elektroniska publikationer. Rapporten Deposit collections of Electronic Publications31 publicerades i sin slutgiltiga form 1996. De förslag som lämnas av de två författarna J.S. Mackenzie Owen och J. v.d. Valle, är endast förslag till riktlinjer och har således ingen bindande kraft. I rapporten görs en strukturerad och systematisk genomgång av alla aspekter av problemområdet. Rapporten utgör därför ett väsentligt underlag för ställningstaganden beträffande en eventuell utvidgning av den svenska pliktexemplarslagen. Att utförligt referera alla slutsatser och förslag skulle föra alldeles för långt, men det är ändå ofrånkomligt att här relativt ingående redovisa rapportens förslag angående hanteringen av online-publikationer.
Det bör dock framhållas att vid den tidpunkt studien tillkom var inte den teknik utvecklad, som med hjälp av s. k. robotar möjliggör en automatiserad och rutinmässig insamling av nätpublikationer. Det har medfört att utgångspunkten är traditionell leverans och man har således inte beaktat möjligheten till alternativa former för insamling.
Det bör också framhållas att perspektivet är allmänt europeiskt. Vissa av författarnas slutsatser kan därför te sig främmande för den som är väl insatt i hur det svenska pliktexemplarssystemet fungerar.
Varför behövs pliktexemplar av elektroniska publikationer?
31 Mackenzie Owen, J.S., Valle, J. V.d., Deposit collections of Electronic Publications. Luxembourg : Office for official publications of the European Communities, 1996 (EUR 16910 EN)
Författarna konstaterar inledningsvis att de grundläggande skälen för att över huvud taget ha en lagstiftning rörande pliktexemplar är fullt giltiga även när det gäller elektroniska publikationer. Dessa skäl är:
- Allmänt spridda publikationer ses som ett uttryck för ett lands nationella kultur och utgör en manifestation av ett lands ekonomiska, sociala, vetenskapliga och utbildningsmässiga aktiviteter och behöver därför bevaras till efterkommande generationer. Pliktexemplar anses vanligtvis vara det enda sättet att garantera detta.
- Utifrån de dokument och publikationer som inkommer som pliktexemplar, sammanställer nationalbiblioteken i respektive land en nationalbibliografi. Detta arbete skulle väsentligt försvåras om inte nationalbiblioteket hade rätt att erhålla samtliga publikationer som skall ingå i nationalbibliografin.
- Pliktexemplaren tjänar också som en garanti för en publikations äkthet eller autenticitet. Det är möjligt att kontrollera att en viss publikation inte har förändrats eller att den på något annat sätt inte är vad den utger sig för att vara.
Det finns vidare ett stort behov av att någon institution åtar sig att svara för det långsiktiga bevarandet av elektroniskt lagrad information. Annars riskerar samhället att drabbas av en kollektiv minnesförlust, med tanke på att sådan information sannolikt har en betydligt kortare livslängd jämfört med sådan som tryckts på papper.
Hur kan elektroniska publikationer systematiseras?
I rapporten görs ett försök till systematik för elektroniska publikationer, med utgångspunkt i en beskrivning av femton egenskaper som utmärker dessa. I nedanstående tabell ges vissa exempel på sådana egensk aper.
Tabell 3 Systematisk beskrivning av egenskaper hos elektroniska publikationer (Mackenzie)
Egenskap
Exempel
Källa Traditionella utgivare; organisationer; andra utgivare eller privatpe rsoner. Format Olika ordbehandlingsformat; databa sformat; utskriftsformat (t ex postscript); portabla format (ex Adobe Acrobat); ljud- och bildformat; strukturerade format (SGML, HTML). Typ av publikation Monografier; periodica; olika typer av nätverksdistribuerade publikationer; programvara; datorspel. Publikationsmedium Cd-rom; disketter; online-media; nätverk. Status Publicerad och tillgänglig via förlag eller andra försäljningskanaler; preprint. Upplaga Första officiella upplagan; påföljande upplaga; variantupplaga; ”snapshots” av dynamiska publikationer. Juridisk status Material som omfattas respektive inte omfattas av upphovsrätten; licensierat material. Nationalitet Olika kombinationer av natione lla/utländska upphovsmän och förlägg are. Parallellitet Endast tillgänglig i elektroniskt format; pappersmotsvarighet existerar. Teknisk miljö Operativsystem; databashanterare; distributionsform (telnet/gopher/www); hårdvara. Nationella kriterier Denna kategori hålls öppen för olika nationella kriterier och behov av särskilda beskrivningar. Innehåll och kvalitet Här lämnas möjlighet för att nationellt exkludera material av ringa värde. Ämne Här lämnas möjlighet för att nationellt inkludera eller exkludera material inom vissa ämnesområden. Förväntad användning Ej specificerat Övriga specifika kriterier av lokalt/nationellt intresse
Ej specificerat
Vilka publikationer skall samlas in?
Författarna rekommenderar att urvalsprinciperna i huvudsak bör ansluta sig till dem som gäller för övriga publikationer.
Vidare bör nationaliteten hos en elektronisk publikation avgöras utifrån följande kriterier, i inbördes ordning: Utgivningsland angivet i publikationen; hemvist hos utgivaren; hemvist hos den först nämnde upphovsmannen, författarens nationalitet; var publikationen är lagrad (det sistnämnda gäller enbart online-publikationer).
Urvalet bör enligt författarna begränsas till att enbart avse sådana publikationer som den nationella institutionen själv kan lagra och ha kontroll över. Att enbart ge tillgång till nätpublikationer via länkar skall inte sammanblandas med pliktexemplar.
Online-databaser och andra dynamiska publikationer bör i princip samlas in med sådan frekvens att all information som funnits i publikationen under dess livslängd kan bevaras. Om kostnaderna för detta visar sig alltför stora, bör ett urvalsförfarande användas, som möjliggör ett bevarande av den första och sista versionen av publikationen.
”Officiella” utgivare skall prioriteras, liksom andra organisationer vars främsta aktivitet är att sammanställa olika informationsprodukter. Enskilda personers publikationer bör samlas endast in på frivillig basis, eller undantas helt.
Insamlingen bör göras oberoende av format. Det mottagande biblioteket, eller motsvarande institution, bör om nödvändigt konvertera publikationen till ett hanterbart format.
Urvalet bör inkludera elektroniska monografier och tidskrifter samt andra nätpublikationer som utgör avslutade och självständiga verk. Distribuerade, dynamiska nätpublikationer bör undantas. Programvara bör tas med endast om den har ett informationsinnehåll. Datorspel bör medtas endast om spel i övrigt är inkluderade. Allmän informationsspridning med hjälp av elektroniska nätverk (e-post, Usenet, sändlistor) bör undantas.
Informell kommunikation och pre-prints bör undantas. Om publikationen är parallellt utgiven i såväl en tryckt version som elektronisk version, bör båda tas in. Om publikationen existerar i flera parallella elektroniska versioner räcker det att bevara en av dessa.
Avslutningsvis menar författarna att endast sådana publikationer som biblioteket har förmåga att ta hand om i sin egen tekniska miljö bör samlas in.
Författarna för också ett intressant resonemang om dynamiska publikationer och ställer bl.a. frågan var gränsen går mellan olika på varandra följande editioner av ett verk och ett dynamiskt verk, när båda mer eller mindre ständigt befinner sig i förändring, låt vara med olika grad av frekvens och uppdatering.
Hur sker mottagandet av elektroniska publikationer?
Oavsett om den elektroniska publikationen levereras online (vilket författarna rekommenderar för små eller normalstora publikationer) eller på något fixerat medium som cd-rom eller magnetband (bör vara lämpligt för exempelvis stora databaser), är själva mottagandet av produkten något helt annat än att ta emot traditionella publikationer. För varje publikation måste en omfattande kvalitetskontroll genomföras för att säkerställa att det rör sig om rätt publikation, att den levererats i rätt format och på rätt bärare, att den är felfri, fullt funktionsduglig och inte kopieringsskyddad.
Om publikationen hämtats hem via nedladdning från nätet bör man försäkra sig om att man fått med hela innehållet genom att ladda ned den två gånger och sedan jämföra de båda exemplaren. Därefter bör en omfattande funktionstest genomföras för att kontrollera att installationsprocedurer fungerar samt att nödvändig dokumentation existerar och kan bevaras tillsammans med publikationen.
Hur skall biblioteken ge tillgång till insamlade elektroniska publikationer?
Utgångspunkten måste enligt författarna vara att elektroniska publikationer, i likhet med tryckta, skall tillhandahållas för användare. Detta tillhandahållande kan dock inte vara förbehållslöst och obegränsat. Hänsyn måste tas till upphovsmännens och utgivarnas legitima intressen. Man pekar samtidigt på att det finns ett egenvärde i att de insamlade publikationerna används, eftersom förutsättningarna för ett långsiktigt bevarande därmed förbättras. Om de används tillräckligt ofta kontrolleras deras funktionalitet. Eventuella insatser för att förlänga deras livslängd kan därmed sättas in medan man fortfarande har tillgång till sådan teknisk utrustning som krävs för att läsa publikationen.
Författarna framhåller att tillhandahållandet måste ske i enlighet med gällande bestämmelser och avtal inom det upphovsrättsliga omr ådet.
I rapporten beskrivs ett antal modeller som kan användas för att ge en begränsad och kontrollerad tillgång till insamlade elektroniska publikationer. Dessa är i huvudsak:
- Tillgång endast på plats i bibliotekets lokaler, en lösning som har den nackdelen att den inte alls tar tillvara de möjligheter som finns i och med de digitala nätverken.
- Kontrollerad tillgång via online-förbindelse. Användare kan ges online-tillgång till publikationerna, men tillgång ges endast till registrerade användare.
- Karenstid. Användare ges en förhållandevis fri tillgång till insamlade publikationer, men först när en viss tid har gått sedan den ursprungliga publiceringen. Dessförinnan kan ett restriktivt tillhandahållande diskuteras, exempelvis i form av att tillgång ges endast i bibliotekets egna lokaler.
Man avråder uttryckligen från att användare skall ges möjlighet att framställa digitala kopior, exempelvis genom att kopiera elektroniska publikationer till egna disketter eller genom att överföra dem via nätverken till andra datorer.
Det påpekas i rapporten att det material som insamlats via ‘legal deposit’ i första hand är av sådan karaktär, att det långsiktiga bevarandet sätts högre än det snabba tillhandahållandet. Såväl bibliotek som användare måste acceptera att det kan behövas särskilda skäl för att konsultera det material som insamlats med stöd av lagstiftningen, exempelvis att det inte går att nå på annat sätt. Eftersom användningen av elektroniska publikationer kan antas vara liten kan man överväga att bevara dem i komprimerad form, för att därigenom uppnå kostnadsbesparingar.
Utifrån de erfarenheter som de nationella bevarandeinstitutionerna gör kan de utveckla särskilda tjänster, exempelvis utveckling av specifika arkivfunktioner på uppdrag av förlag etc., dokumentleverans till andra bibliotek samt erbjudande om konsult- och serviceuppdrag beträffande migrering, konvertering och långtidsbevarande av elektroniska publikationer.
Hur skall publikationerna bevaras?
Författarna delar den på de flesta håll allmänna uppfattningen att man på lång sikt endast kan sträva efter att bevara innehållet i de elektroniska publikationerna. Mediet som informationen är lagrat på, den s.k. informationsbäraren eller artefakten, kommer att brytas ned med tiden. I kombination med att det inte längre går att använda vissa typer av datorer eller datorprogram blir därmed publikationerna obrukbara i sin originalversion. I rapporten säger man sig ha konstaterat att denna uppfattning är allmänt accepterad bland biblioteksrepresentanter, medan däremot förläggare och producenter tenderar att inta den motsatta ståndpunkten.
Anledningen för de sistnämnda gruppernas skepsis tros vara en rädsla för att publikationerna kommer att bli svåra att identifiera och ändringar svåra att upptäcka. Man måste också vara medveten om att en strävan efter att enbart bevara själva informationen via kopiering, konvertering och migrering sannolikt kommer att påverka den visuella presentationen
och övrig funktionalitet. Att exempelvis långtidsbevara interaktiviteten i en elektronisk publikation är mycket svårt. I rapporten konstateras därför att man måste koncentrera sig på att bevara det intellektuella innehållet och således acceptera att vissa av originalens visuella och interaktiva aspekter kommer att gå förlorade.
Man rekommenderar dock att ett urval elektroniska dokument bevaras i sin originalform eftersom dessa artefakter, tillsammans med omgivande dokumentation som etiketter, omslag, handböcker etc., säger mycket om det ursprungliga verket.
För långtidsbevarande rekommenderas migrering. Man ansluter sig till den definition av migrering som presenterades av en amerikansk arbetsgrupp, tillsatt av The Commission of Preservation and Access och Research Libraries Group:
Migration is a set of organized tasks designed to achieve the periodic transfer of digital materials from one hardware/software configuration to another, or from one generation of computer technology to a subsequent generation. The purpose of migration is to preserve the integrity of digital objects and to retain the ability for clients to retrieve, display, and otherwise use them in the face of constantly changing technology32.
Allmänt sett kan en av följande strategier för migrering appliceras:
1. Kopiering till nytt medium av samma slag. Exempelvis kan material lagrat på disketter kopieras över till nya disketter av samma slag när orginalen hotas av nedbrytning.
2. Kopiering till nytt medium av annat slag. Utgångspunkten är att informationen kopieras till ett medium av mer hållbart eller standardiserat slag. Ett exempel kan vara kopiering av information lagrad på äldre diskettyper till cd-rom eller magnetband.
3. Formatkonvertering. En institution som skall lagra stora mängder digital information behöver begränsa antalet format. Viss information kommer därför att behöva konverteras till något standardiserat format. Åtgärden är också nödvändig för att undvika att vissa format med tiden blir oläsliga.
4. Migrering av den tekniska miljön. Detta är en betydligt svårare och kostsammare uppgift, eftersom det innebär att dokument skall ges samma funktionalitet i en helt annan hård- och mjukvarumässig miljö.
32
Preserving digital information : report of the task force on archiving digital information / commissioned by the Commission on Preservation and Access and The Research Libraries Group. – 1996 [http://www.rlg.org/ArchTF/]
För interaktiva publikationer skulle det sannolikt innebära omprogrammering av åtminstone delar av produkten.
5. Emulering. Det är möjligt att skriva program som gör att dagens datorer efterliknar gårdagens. Emuleringarna gör det möjligt att i dag läsa och använda program skrivna för en föråldrad teknisk miljö. Metoden framhålls som kostnadseffektiv. Den är samtidigt osäker, eftersom ingen kan garantera att det kommer att framställas emuleringsprogram för olika miljöer allteftersom den tekniska utvecklingen fortskrider.
I rapporten skiljer man på kort- och långsiktig migrering. Den kortsiktiga görs inom ca fem år efter mottagandet av publikationen och innebär att någon av de två ovanstående förstnämnda aktiviteterna genomförs. Den långsiktiga görs inom en period av 10-25 år efter mottagandet.
För att kunna garantera att digital information är möjlig att ta del av i framtiden måste bevarandeinstitutionerna planera omsorgsfullt för migrering redan i dag. Den bibliografiska registreringen bör kompletteras med formatuppgifter, systemkrav, historik över tidigare migrering, förväntad tidpunkt för kommande migrering etc.
Versioner och autenticitet
Elektroniska publikationer ges ofta ut i olika versioner eller editioner, vilket vållar särskilda problem för bibliotek och andra bevarandeinstitutioner. I rapporten rekommenderas att om en publikation ges ut i olika versioner för olika hård- och mjukvarumässiga plattformar, räcker det att förvärva den version som utgetts i det mest standardmässiga utförandet. Om den elektroniska utgivningen skett parallellt med utgivning på papper bör däremot båda dessa versioner bevaras.
En viktig uppgift för bevarandeinstitutioner har alltid varit att garantera autenticiteten, dvs. att innehållet i de mottagna publikationerna kan bevaras i sitt originalutförande. För traditionella tryckta skrifter är den uppgiften inte särskilt problematisk, eftersom det är relativt svårt att förändra eller förfalska en skrift utan att det syns. Dessutom finns dessa skrifter oftast spridda i ett antal exemplar som i sin tur kan användas som jämförelseobjekt.
Elektroniskt lagrad information är betydligt lättare att förändra och dessa förändringar kan vara i det närmaste omöjliga att upptäcka. Metoder för att garantera autenticitet finns utvecklade, men har ännu inte vunnit allmän genomslagskraft. Exempel på sådana metoder är kryptering, digitala signaturer, kontrollsummor och liknande.
Allmänna rekommendationer
Författarna lämnar avslutningsvis följande rekommendationer avseende pliktexemplar (”legal deposit”) av elektroniska publikationer:
- För att en bevarandeinstitution skall kunna klara av uppgiften att bevara nationens kulturarv måste pliktexemplarslagstiftningen också inkludera elektroniska publikationer.
- Bibliotek, förläggare och upphovsmän bör samarbeta i ansträngningarna att bevara kulturarvet. Alla parter har något att vinna på ett sådant samarbete. Exempelvis underlättas upphovsmännens bevakning av upphovsrättsfrågor genom tillgång till en sådan nationell samling.
- Elektronisk publicering är ett område som förändras mycket snabbt. Lagstiftningen skall därför vara så heltäckande som möjligt och utgå från vida definitioner, som är tillräckligt flexibla för att inkludera existerande och framtida publikationsformer.
- Särskild uppmärksamhet måste ägnas åt upphovsrätten, som inte får förhindra bevarandet av det nationella kulturarvet.
- Elektroniska publikationer i fixerad form kan hanteras enligt samma principer som tryckta publikationer.
- På sikt måste bevarandet av själv informationen prioriteras framför bevarandet av artefakten (informationsbäraren).
- Bevarandeinstitutionerna bör ägna sig mer åt förebyggande arbete.
- Tillhandahållandet av elektroniska publikationer är problematiskt. Diskussioner bör föras med förläggare. Tillhandahållandet bör vara restriktivt.
Rekommendationer för vissa elektroniska publikationer
Beträffande vissa särskilda typer av elektroniska publikationer, görs följande rekommendationer och överväga nden:
- Elektroniska böcker, tidskrifter, multimediaprodukter etc. i fixerat format bör inkluderas i lagstiftningen.
- Databaser, av såväl offline- som online-karaktär, är problematiska att hantera. Hur skall man göra med uppdateringar? Behöver alla nya versioner av en databas bevaras för all framtid? Problemen accelererar beträffande online-databaser. Om dessa skall vara föremål för insamling, måste någon form av urval göras.
- Nätverksdistribuerade publikationer bör inte inkluderas i lagstiftningen som en särskild kategori. De är egentligen inte distribuerade, utan snarare gjorda allmänt tillgängliga för direkt åtkomst av enskilda an-
vändare. Mängden av dessa publikationer är mycket stor. Deras kvalitet är ofta osäker.
- Nätverksdistribuerade dynamiska publikationer utgör en ännu svårare kategori. Med ”dynamiska” avses att publikationen innehåller länkar till andra publikationer, bilder, ljudfiler etc. Det är omöjligt att bestämma var en sådan publikation börjar och slutar. Den traditionella uppfattningen om vad som utgör en publikation måste här överges. Även om publikationsformen i sig är värd att bevara, är de tekniska och juridiska svårigheterna så stora att det är mycket svårt, för att inte säga omöjligt att infoga dem i pliktexemplarslagstiftningen. Det kan dock vara relevant att skilja mellan ”öppna” och ”slutna” nätverksdistribuerade dynamiska publikationer. De förstnämnda innehåller då endast länkar till publikationer på den egna servern som är under utgivarens kontroll. De sistnämnda innehåller länkar till publikationer placerade på externa servrar.
- Usenet News och e-postbaserade sändlistor anses inte vara ”publicering”, utan snarare en slags allmän kommunikation. Undantag kan göras för modererade listor som mer liknar elektroniska tidskrifter.
- Programvara anses inte heller utgöra en ”publikation”. Dessutom kan det faktum att dessa ofta inte säljs, utan licensieras till användaren, utgöra ett stort juridiskt problem. Expertsystem kan möjligtvis utgöra ett undantag (som är fallet i Frankrike, se avsnitt 7.4.1).
- Datorspel är normalt heller inte ”publikationer”, även om det numera är svårt att dra gränsen mellan utbildningsprogram och spel.
7.2.2. FoU-projekt inom EU
Ytterligare några projekt som bedrivs inom ramen för DG XIII:s biblioteksprogram bör nämnas.
BIBLINK
BIBLINK-projektet syftar till att utveckla metoder för att förbättra beskrivningen och registreringen av elektroniska dokument samt förbättra samarbetet mellan förläggare och nationalbibliografier i Europa.
Projektet inleddes i april 1996 och kommer att pågå till våren 1999. Deltagare är bl.a. nationalbiblioteken i Spanien, Frankrike, Holland och Norge. Man avser att konstruera en prototyp som gör det möjligt för utgivare av elektroniskt material att själva lägga in grundläggande bibliografiska uppgifter, som kan överföras för komplettering till respektive
lands nationalbibliografi. Väl där kan uppgifterna kompletteras, exempelvis med auktoritetsformer, och sedan återsändas till utgivaren.
Metadata, identifieringssystem, autenticitet och överföring av data mellan förlag och bibliotek är några av de konkreta problemområden som utforskas inom ramen för projektet.
NEDLIB
Networked European Deposit Library (NEDLIB) är ett projekt som startade i januari 1998. Deltagare är nationalbiblioteken i Holland, Norge, Finland, Frankrike, Tyskland, Italien och Schweiz, det holländska riksarkivet samt flera stora internationella förlag inom det vetenskapliga området.
NEDLIB-projektet arbetar med frågeställningar kring insamling, kvalitetssäkring, långsiktigt bevarande och tillhandahållande av elektroniska dokument. Autenticitet, tillgång och bibliografisk kontroll är några konkreta frågor som kommer att behandlas.
Man avser att inom projektet konstruera en gemensam infrastruktur, på vilken ett nätverksbaserat europeiskt elektroniskt bibliotek kan baseras. Bl.a. avser man att inom projektets ram arbeta fram modeller för beräkning av kostnader för att utveckla och driva ett sådant bibliotek. De upphovsrättsliga frågorna kommer att ägnas särskild uppmärksamhet. Vidare kommer migrering, det vill säga överföring av elektronisk information till standardiserade format, att testas i praktiken. Projektet pågår fram till december 2000.
7.2.3. Europarådets konvention för bevarande av det audiovisuella kulturarvet
Sedan flera år har man inom Europarådet arbetat med en konvention som syftar till att garantera bevarandet av de europeiska staternas audiovisuella kulturarv. Arbetet var i första skedet inriktat på pliktleverans av filmer. Under hand utvidgades konventionsförslaget till att omfatta samtliga former av rörliga bilder, inklusive televisionsprogram. Rena ljudinspelningar är dock undantagna. I oktober 1996 uttalade de europeiska kulturministrarna vid ett möte i Budapest att konventionen borde färdigställas för underskrift senast vid utgången av år 1997. Konventionen är ännu inte undertecknad. I de utkast som nu är tillgängliga finns det inga förslag som går utöver den nuvarande svenska pliktexemplarslagstiftningen. Det finns därför ingen anledning att tro att denna kon-
vention kommer att få betydelse för utformningen av en eventuell leveransplikt gällande elektronisk information som görs til lgänglig online.
7.3. De skandinaviska länderna
7.3.1. Danmark
Av de nordiska länderna har Danmark den nyaste pliktexemplarslagen. Den nya lagen, Lov om pligtaflevering af udgivne værker, trädde i kraft den 1 januari 199833.
Danmark har en i det närmaste lika lång tradition av pliktexemplar som Sverige. Skyldighet att leverera tryckt material har förelegat ända sedan 1679, vilket kan jämföras med det svenska begynnelseåret 1661. Till skillnad från Sverige har dock Danmark under de senaste decennierna inte moderniserat lagstiftningen i takt med utvecklingen av nya medier. Den närmast föregående lagen instiftades 1927 och innefattade endast pliktleverans av tryckta skrifter.
Med utgångspunkt i den informationstekniska utvecklingen tillsatte Kulturministeriet 1995 ett ”Utvalg om bibliotekerne i informationssamfundet” (UBIS). Denna kommitté lade 1996 fram ett delbetänkande om en förändrad pliktexemplarslag34. Den nya lagen är i stor utsträckning grundad på de tankar och förslag som återfinns i betänkandet.
Sammanfattningsvis kan sägas att alla utgivna verk, oavsett medieform, omfattas av den nya lagen. Både utgivningskriteriet och verkskriteriet måste vara uppfyllt.
Ett verk räknas som utgivet när exemplar av verket, med upphovsmannens tillstånd, finns tillgängligt i handeln eller på annat sätt spritts bland allmänheten. Definitionen är helt i överensstämmelse med den danska upphovsrättslagen. Man räknar med att detta generella kriterium, vars införande alltså är den största förändringen jämfört med tidigare gällande lag, skall innebära att lagen inte måste ändras varje gång informationstekniken utvecklas mot nya framställnings- och kommunikationsformer.
Enligt lagens definition skall en avgränsad informationsmängd anses som ett verk, under förutsättning att den utgör en avslutad och självständig enhet.
33 Den danska lagen och anvisningarna till den finns publicerade på http:// www.pligtaflevering.dk34 Pligtaflevering : delbetaenkning nr 1 fra Udvalget om Bibliotekerne i Informationssamfundet. 1996. (stenc.) ISBN 87-89147-62-6.
Utgivna verk kan offentliggöras och spridas i en fixerad form. I dessa fall framställs exemplar på utgivarens uppdrag. Dessa verk blir föremål för pliktleverans enligt traditionellt mönster. Men exemplar kan också framställas på uppdrag av användaren, i form av nedladdning av digitala verk via elektroniska nätverk. I det fallet förvandlas leveransplikten till en skyldighet att meddela att utgivningen ägt rum samt en rätt för den mottagande institutionen att själv framställa ett digitalt exemplar av verket genom att ladda ner det från nätet. I förekommande fall måste utgivaren dessutom översända lösenord eller liknande spärrar för åtkomst till Det kongelige Bibliotek.
En avgörande förändring i den nya danska lagen är således att leveransskyldigheten utgår från ett utgivningskriterium i stället för som tidigare ett framställningskriterium. Därigenom omfattar den nya lagen en rad verk och medieformer som tidigare legat utanför lagen: fotografiska reproduktioner, fonogram, videogram, digitala verk samt mikroformer (mikrofilm och mikrofiche). Filmproduktionen är reglerad i den danska filmlagen. Beträffande radio- och tv-sändningar levereras dessa till Statens Mediesamlingar vid Statsbiblioteket i Århus, i enlighet med frivilliga överenskommelser. Man har övervägt att skapa en pliktexemplarslag som omfattar även dessa medieformer, men har tills vidare avstått från detta. Man utgår från att det kommer att bli nödvändigt att revidera lagen inom ett par år, med hänsyn tagen till den snabba IT-utvecklingen.
Endast två pliktexemplar behöver lämnas enligt den nya lagen. Båda exemplaren skall sändas till Det kongelige Bibliotek, som sedan ombesörjer vidare leverans till Statsbiblioteket i Århus.
Syftet med den danska lagen är att säkra insamling av utgivna verk för bevarande av den nationella kulturen, att säkra den framtida tillgången till utgivna verk för forskning och för allmänheten samt att säkra underlaget för registrering av de utgivna verken i nationalbibliogr afin.
Kulturministern framhöll vid framläggandet av lagförslaget inför Folketinget i mars 1997 särskilt att syftet med pliktexemplar inte är att skaffa gratis exemplar till bibliotekens allmänna verksamhet35.
Det kan vidare noteras att den danska lagen enligt det ursprungliga förslaget också skulle omfatta programvara som operativsystem, programmeringsverktyg, ordbehandlings-, kalkyl- och databasprogram m.m. Efter protester från producentsidan undantogs dessa dokument från leveransskyldighet.
En intressant avgränsning görs beträffande online-databaser. Man konstaterar att sådana databaser ofta är föremål för löpande uppdate-
35 Forslag til Lov om pliktaflevering af udgivne vaerker. Fremsat den 12 marts 1997 af kulturministeren (Ebbe Lundgaard). Lovforslag nr L 185 Folketingsåret 1996-97
ring. Eftersom sådana dynamiska informationsmängder enligt det ovan redovisade verksbegreppet inte utgör en avslutad informationsenhet skall de inte heller vara föremål för pliktleverans. Som exempel på sådana databaser nämns olika slags adress- och produktregister, bibliotekens kataloger etc. I normalfallet kan alltså dessa typer av databaser sägas uppfylla utgivningskriteriet men inte verkskriteriet. Med andra ord utgör de inte en avslutad informationsmängd. I vissa fall är också posterna i en databas så integrerade i helheten att de inte heller uppfyller kravet på att vara självständiga enheter. Däremot skall databaser som uppdateras vid vissa bestämda tidsintervaller omfattas av lagen. Man skiljer alltså på databaser som uppdateras löpande och de som uppdateras med regelbundna intervall.
I den mån innehållet i en online-databas uppfyller verkskriteriet blir det däremot föremål för pliktleverans på samma sätt som gäller för andra verk som är tillgängliga på användarens initiativ. Således skall utgivaren upplysa om utgivningen och mottagande institution ges rätt att själv framställa en digital kopia. Databaser som framställs i fixerad form, exempelvis cd-rom, omfattas däremot i samtliga fall av lagen. Det konstateras samtidigt att allt mer material tillgängliggörs via onlinedatabaser och att det därför finns en risk att värdefullt historiskt källmaterial kommer att försvinna. För framtiden bör man därför sträva efter att finna en form som möjliggör pliktleverans även av sådana databaser.
Beträffande tillgängliggörandet av de verk som insamlats med stöd av pliktleveranslagen framhålls att detta skall ske innanför de ramar som anges av upphovsrättslagen. Kulturministern underströk särskilt vid framläggandet av lagförslaget inför Folketinget, att den nya lagen inte ger biblioteken några rättigheter utöver vad som anges i upphovsrättslagen eller i särskilda avtal med rättighetsinnehavarna.
Man har beräknat att den nya lagen kommer att medföra en årlig merkostnad för staten om 4,5 miljoner DKR.
Beträffande de utgivna verk som tillhandahålls via online-förbindelse skall utgivaren anmäla detta på en särskild webbplats36. Därefter hämtas en kopia av verket av Det kongelige Bibliotek. Utgivaren måste hålla verket tillgängligt på den angivna Internetadressen i minst tre mån ader.
7.3.2. Finland
Den nuvarande finska pliktexemplarslagen (Lagen om friexemplar) är från 1980 och omfattar förutom tryckta dokument vissa ljud- och
36 http://www.pligtaflevering.dk
bildupptagningar. Bestämmelser om film och videogram återfinns i Filmarkiveringslagen från 1984.
I Finland pågår för närvarande en översyn av pliktexemplarslagstiftningen. En arbetsgrupp avlämnade i maj 1998 en rapport med förslag till förändringar.
Arbetsgruppens uppdrag beträffande elektronisk online-information har i mångt och mycket stämt överens med föreliggande utrednings uppdrag.
Enligt de förslag som lagts fram avser man i Finland att använda sig av robotteknik för att samla in den fritt tillgängliga delen av det finska Internet på ett sätt som ungefärligen motsvarar det svenska Kulturarw3projektet. Utöver detta kommer man att föreskriva leverans av större kommersiella utgivares material, som skall levereras på ett i föreskrifterna till lagen anvisat format.
För att det skall vara möjligt att tillhandahålla materialet föreslås en förändring av den finska upphovsrättslagen.
7.3.3. Norge
När den nu gällande norska lagen37 beträffande pliktexemplar trädde i kraft den 1 juli 1990 väckte den stor internationell uppmärksamhet för sin modernitet och förmåga att inkludera olika typer av allmänt tillgängliga dokument. Exempelvis inkluderades inte bara elektroniska dokument i fixerad form, utan lagen möjliggjorde också leverans av onlinedatabaser. Den norska lagen är en kortfattad ramlag och kompletteras av särskilda föreskrifter38 och instruktioner39.
I lagens 2 § föreskrivs att alla allmänt tillgängliga dokument omfattas av levereransplikten. Med ”allmänt tillgänglig” menas att exemplar av dokumentet finns till försäljning, uthyrning eller utlån, eller att dokumentet spridits utanför en allmän krets på annat sätt. Om informationen gjorts tillgänglig utanför en privat krets genom framförande, radio/tvutsändning, direktkoppling eller liknande, räknas den också som allmänt tillgänglig.
37 Lov om avleveringsplikt for allment tilgjengelege dokument av 9. juni 1989 nr. 3238 Forskrifter om avleveringsplikt for allment tilgjengelege dokument, fastsette av Kyrkje- og kulturdepartementet 25. mai 1990.39 Instruks for institusjonar som forvaltar dokument innkomne etter lov om avleveringsplikt or allment tilgjengelege dokument, fastsett av Kyrkje- og kulturdepartementet 25. mai 1990.
Beträffande den information som endast är tillgänglig i online-form resonerade man i förarbetena till lagen på följande sätt i Norge:
Både dei distribuerte edb-dokumenta og dei edb-dokumenta som er tilgjengelege ved direktekopling, vil vera avleveringspliktige når dei er tilgjengelege ut over ein intern, privat krins. /.../ Hovudsaka vil ikkje vera kor mange som brukar eit dokument, men at alle kan få tilgjenge til det. /.../ Edb-dokument som er tilgjengelege ved direktekopling, kan reknast som allment tilgjengelege dersom det ikkje finst oversyn over kor mange som har tilgjenge til dokumenta.
40
(NOU 1984:3, s. 94)
Den information som är tillgänglig via direktkoppling skall levereras i två exemplar efter konkret anmodan från den mottagande instituti onen.
Verksamheten bedrivs vid nationalbiblioteksavdelningen i Mo i Rana (NBR), som startade sin verksamhet samtidigt som den nya lagen trädde i kraft. Man har hittills koncentrerat sina insatser på sådana elektroniska dokument som varit förhållandevis lätta att hantera, exempelvis cd-rom och disketter. Beträffande online-material har man gjort endast begränsade försök än så länge.
Ett intressant område rör norska delen av Usenet, där alla inlägg gjorda under de senaste åren på de norska nyhetsgrupperna samlats in. Antalet nyhetsgrupper uppgick i slutet av 1995 till ca 75 st. Det insamlade materialet indexeras och blir därmed tillgängligt för sökning. Att lagra och tillgängliggöra newsgrupper faller in under den norska lagen om personregister, men nationalbiblioteket har erhållit särskilt tillstånd för att bedriva verksamheten.
Längre fram räknar man i Norge med att utöka den här typen av insamling till att också omfatta BBS:er och e-postbaserade sändlistor, vilka man anser principiellt likna newsgrupper.
Den försöksverksamhet som hittills bedrivits beträffande elektroniska tidskrifter avser dels enklare tidskrifter som sprids via e-post och som NBR ”prenumererar” på, dels vissa utvalda tidskrifter som publiceras på www. Ett projekt för den sistnämnda typen av tidskrifter bedrevs under första halvåret 1997. Därvid valdes 20 tidskrifter ut. Deras webbsidor laddades med hjälp av en särskild programvara ner en gång i veckan, med undantag för en dagstidning vars innehåll hämtades en gång om dagen. Av olika tekniska skäl föll dock vissa bilder och annan grafik bort i samband med nedladdningen.
Insamling av online-databaser är ett annat område där man räknar med att komma igång med försöksverksamhet inom den närmaste t iden.
40 Frå informasjon til kulturarv (NOU 1984:3), s. 94
Man bedriver vidare projektverksamhet rörande insamling och bevarande av programvaror. De bör enligt nationalbibliotekets arbetsplan41inrymmas under pliktexemplarslagen eftersom de informerar om sig själva, ger information om de verktyg som används i dagens samhälle samt ofta kan sägas vara informationsbärande, utöver det rent programmässiga. Ett skatteprogram säger exempelvis något om dagens norska skattesystem.
Man delar in programvaror i tre kategorier: systemprogramvara (t ex operativsystem), verktygsprogramvara (t ex ordbehandlingsprogram) och övrig programvara, som innehåller information (t ex utbildningsprogram).
Endast den sistnämnda kategorin samlas i dag in med automatik. Försöksprojekt pågår beträffande övriga kategorier.
I den utvärdering av de första årens verksamhet enligt den nya lagen som publicerades i december 199542, konstaterades att den norska lagen är flexibel och framtidsinriktad. Man såg vid den tidpunkten inget behov av att förändra lagen.
I rapporten förs också ett intressant resonemang om urvalskriterier för elektroniska dokument. Man konstaterar inledningsvis att det knappast finns någon anledning att bevara dokument som inte kan tillgängliggöras för användarna. Om man inte tror sig om att kunna integrera ett visst dokument, eller en viss dokumentkategori i sina samlingar bör man avstå från insamlingen. Viktiga faktorer när det gäller att bestämma bibliotekets möjligheter därvidlag är exempelvis de ekonomiska resurserna, valet av tekniska lösningar, personalen och dess kompetens, den bibliografiska kontrollen samt möjligheterna att uppspåra elektroniska dokument.
I rapporten fastslås vidare att nationalbiblioteket bör föra en dialog med arkiv- och museisektorerna. Spel anses exempelvis generellt höra till museernas ansvarsområde, med undantag för interaktiva spel med berättande inslag.
Beträffande bevarandet av det insamlade elektroniska materialet sägs i rapporten att målet är att det skall kunna läsas efter 1 000 år eller mer. Man rekommenderar guldpläterade cd-rom som primärt lagringsmedium. Minst tre kopior bör framställas av säkerhetsskäl. I övrigt rekommenderas användandet av standardiserade format, metainformation m.m.
41
Forslag til plan for Nasjonalbibliotekets arbeid med pliktavlevert elektronisk materiale fram mot år 2000. – Nasjonalbiblioteket, Desember 199542 Ibid.
7.4. Vissa EU-länder
7.4.1. Frankrike
Frankrike stiftade 1537 världens första pliktexemplarslag. Den nuvarande lagen, antagen i juni 1992 och tillämpad från och med januari 1994, inkluderar förutom traditionella dokumentkategorier också elektroniska dokument i vid bemärkelse, så länge som de utges i ett fixerat format. Online-dokument omfattas inte. Intressant att notera är att man i Frankrike samlar in viss programvara, nämligen s.k. expertsystem, program för artificiell intelligens etc. Övrig programvara samlas inte in.
7.4.2. Storbritannien
Den brittiska lagstiftningen för pliktexemplar är, i likhet med USA och Australien, en del av The Copyright Act. Lagen, som är från 1911, omfattar endast tryckt material. Andra materialkategorier bevaras i relativt stor utsträckning, men då som ett resultat av frivilliga överenskommelser. British Library har bedrivit ett intensivt arbete de senaste åren för att få till stånd en utvidgning av lagen. I januari 1996 överlämnade British Library till Department of National Heritage ett omfattande förslag till ny lagstiftning43.
Ett år senare replikerade nämnda departement, tillsammans med dess motsvarigheter i Skottland, Wales och Nordirland, med en rapport av vilken det framgick att man från regeringshåll inte alls ställde sig avvisande till en utvidgad lagstiftning, men att ett antal frågor först måste diskuteras grundligt 44.
Det mesta av den brittiska diskussionen har hittills rört olika former av dokument i fixerad form (mikroformer, AV-medier och cd-rom) och därför sägs förhållandevis litet i rapporten om leverans av olika former av online-publikationer.
Under våren 1998 tillsatte regeringen en särskild arbetsgrupp som fått till uppgift att utreda hur pliktleveranserna kan förbättras i Storbritannien. Beträffande elektroniska dokument skall arbetsgruppen ta fram riktlinjer för frivilliga överenskommelser om leverans intill dess att regeringen finner tiden mogen för att introducera lagstiftning på omr ådet.45
43 Proposal for the legal deposit of non-print publications to the Department of National Heritage / from the British Library. January, 1996 (stenc.)44 Legal deposit of publications : a consultation paper / Department of National Heritage et. al. – London, 199745 http://www.bl.uk/services/ric/legal/
7.5. Vissa länder utanför Europa
7.5.1. Australien
Australien hör till de länder där man arbetat längst med dessa frågor. På samma sätt som i USA återfinns lagstiftningen rörande pliktexemplar i landets Copyright Act. Traditionellt tryck (böcker, tidskrifter, kartor, planscher) omfattas av lagen. Därutöver har de flesta delstater pliktleveransbestämmelser i sina Libraries Acts.
Elektroniska dokument, vare sig i fixerad eller i online-format, omfattas inte av dagens lag, men National Library of Australia och Natio-
nal Film and Sound Archive har tagit en rad initiativ för att dels föränd-
ra och utvidga den existerande lagstiftningen46, dels bedriva olika former av försöksprojekt.
Man strävar efter att inkludera elektroniska dokument av alla slag i den nya lagen, men menar samtidigt att man inte kommer att kunna spara på allt. När det gäller elektroniska nätverksdokument är detta helt enkelt inte möjligt och kanske inte ens önskvärt, sägs uttryckligen i ett policydokument utgivet av nationalbiblioteket. I stället menar man att utgivaren ansvarar för att göra alla utgivna publikationer tillgängliga för leverans, medan nationalbiblioteket har rätten att välja vad som skall tas emot och vad som kan väljas bort.
Ett av de projekt som bedrivits syftar till att åstadkomma frivilliga leveranser av elektroniska dokument i fixerad form. En särskild policy, som bl.a. täcker frågor om bibliografisk registrering och tillhandahållande, har utarbetats. Från nationalbibliotekets sida ser man detta som en tillfällig lösning i avvaktan på en ny lag.
PANDORA (Preserving and accessing networked documentary resources of Australia) är ett annat projekt som syftar till att insamla, tillgängliggöra och långtidsbevara australiensiska elektroniska onlinepublikationer. Man har valt att koncentrera sina insatser på vissa utvalda publikationskategorier, såsom elektroniska tidskrifter och elektroniska monografier. Man har börjat i förhållandevis liten skala. I november 1997 ingick ca 30 tidskrifter i ”Pandoras ask”.
PADI (Preserving access to digital information) är ett tredje, övergripande projekt, som syftar till att öka kompetensen och medvetenheten i alla frågor rörande insamling, katalogisering, tillgängliggörande och, inte
46 Se t ex submission to the Copyright Law review Committee on Legal Deposit / National Library of Australia, National Film and Sound Archive. August, 1995. (http://www.nla.gov.au/policy/clrcld.html)
minst, bevarande av elektroniska publikationer. Inom projektet upprätthålls en omfattande webbplats med internationell dokume ntation47.
Slutligen bör nämnas SCOAP (Selection Committee on On-line Australian Publications), som är en kommitté med representanter för olika berörda avdelningar inom nationalbiblioteket. Man arbetar främst med att utveckla riktlinjer för urval och bevarande av online-publikationer.
7.5.2. Kanada
Den kanadensiska lagstiftningen om pliktexemplar skiljer sig på ett grundläggande sätt från de flesta andra länders motsvarigheter, eftersom lagen är teknikneutral.
Bestämmelserna rörande pliktexemplar finns inskrivna i ”The National Library Act”. I lagen används det övergripande begreppet ”books” som beskrivning på det som skall levereras till nationalbiblioteket. ”Books” uttolkas i lagen som ”library matter of every kind, nature, and description”. Genom ett tillägg i lagen 1969 utökades definitionen till att omfatta ”any document, paper, record, tape or other thing published by a publisher, on or in which information is written, recorded, stored, or reproduced.”
Lagen stadgar vidare att dokumenten skall vara publicerade i Kanada, dvs. utgivna i Kanada för allmän distribution eller försäljning.
Lagens utformning har medfört att det varit förhållandevis enkelt att inkorporera nya media, såsom AV-dokument, mikroformer och cd-rom, allteftersom de utvecklats och funnit sin plats på marknaden. Vid varje sådant tillfälle har definitionen av begreppet ”book” ansetts vara tillräckligt vid för att omfatta de nya dokumentkategorierna. Elektroniska publikationer i olika fixerade format (magnetband, diskett, cd-rom etc.) har samtliga kunnat inbegripas i ovanstående definition.
För närvarande pågår en diskussion angående sådan elektronisk information som är tillgänglig endast via nätverk, exempelvis Internet. Diskussionen gäller inte i första hand huruvida informationen skall anses vara ”books” eller inte, utan huruvida den är publicerad, dvs. utgiven i Kanada för allmän distribution eller försäljning.
Det kanadensiska nationalbiblioteket har också genomfört ett intressant utvecklingsprojekt, The Electronic Publications Pilot Program (EPPP)48. Syftet med projektet var att identifiera vilka problem ett bibliotek ställs inför vid hanteringen av online-publikationer, att bidra till
47 http://www.nla.gov.au/dnc/tf2001/padi/48 Electronic Publications Pilot Project (EPPP) : Final Report (June 1996) finns publicerad på: http://www.nlc-bnc.ca/e-coll-e/edown.htm
utformningen av en långsiktig policy för hanteringen av elektroniska publikationer vid nationalbiblioteket samt att medverka till en ökad kompetens bland nationalbibliotekets personal.
I pilotprojektet koncentrerade man sig på elektroniska tidskrifter, eftersom de var förhållandevis lätta att identifiera och hade såväl historia som kontinuitet. Ca 45 e-tidskrifter ingick i projektet. Samtliga utgivare kontaktades i förväg för att nationalbiblioteket skulle erhålla tillstånd att samla in och ”lägga upp” tidskrifterna på sin egen server.
7.5.3. USA
Liksom i Storbritannien och Australien, återfinns i USA bestämmelserna om pliktexemplar i Copyright Act. Det bör påpekas att i ingetdera av dessa länder är deponering av ett exemplar hos nationalbiblioteket en förutsättning för att upphovsmannens verk skall vara skyddat. Ett verk är upphovsrättsligt skyddat vid den tidpunkt då det framställs. I USA är det följaktligen inte längre nödvändigt att sätta ut en copyright-symbol (©) för att erhålla skydd, även om många gör det ändå.
I 1993 Code of Federal Regulation återfinns bestämmelser om bl.a. cd-rom, men däremot inte online-material. Copyright Office vid Library of Congress har försökt men inte lyckats hävda att även sådant material skulle vara föremål för obligatorisk leverans, på grund av att det varit oklart hur begrepp i lagtexten som ”publication” och ”transmission” skall uttolkas.
I det här sammanhanget bör också rapporten Preserving digital in-
formation49, som sammanställts av en arbetsgrupp tillsatt av Commis-
sion on Preservation and Access och Research Libraries Group, nämnas. Rapporten har fått ett mycket stort internationellt genomslag, inte minst för sin rekommendation angående migrering (se vidare avsnitt 7.2.1). I rapporten konstateras att det finns ett stort behov av att bevara elektroniska dokument. En nationell samling bör dock inte byggas upp i analogi med nationalbibliotekens och -arkivens traditionella samlingar. I stället förespråkas en decentraliserad, distribuerad lösning, där utvalda och kvalitetsgranskade aktörer själva tar på sig ett bevarandeansvar.
49
Preserving digital information : report of the task force on archiving digital information / commissioned by the Commission on Preservation and Access and The Research Libraries Group. – 1996 [http://www.rlg.org/ArchTF/]
7.6. Sammanfattning av den internationella kartläggningen
Sammanfattningsvis kan konstateras att det finns en vitt spridd uppfattning runt om i världen att även sådan elektronisk information som tillhandahålls via online-förbindelse skall anses utgöra ett viktigt bidrag till ett lands kulturarv och att den därför på något sätt bör samlas in och bevaras för framtiden. Det kan vidare konstateras att de nordiska länderna ligger långt framme i utvecklingen.
Olika uppfattningar finns huruvida man vid insamlandet skall sträva efter att få med så mycket som möjligt av det som publiceras online, eller om man bör koncentrera sig på vissa utvalda dokument eller kategorier av dokument. I och med att robottekniken sprids och utvecklas kan situationen komma att förändras.
Det är också tydligt att utvecklingen går i riktning mot att inkludera såväl online-databaser som olika former av programvara i de nationella pliktexemplarslagarna.
8. Pågående utvecklingsprojekt i Sverige
8.1. Kulturarw3-projektet
År 1996 påbörjade KB det s.k. Kulturarw3-projektet, som syftar till att med hjälp av automatiserad robotteknik samla in och bevara den svenska delen av Internet. Alla svenska webbsidor som en insamlingsrobot påträffar hämtas till KB och lagras där på magnetband. Utöver själva insamlingen ägnas också stor uppmärksamhet åt bevarandeaspekterna, liksom frågor om registrering, metadata och tillgängligg örande.
I en artikel i tidskriften LIBRIS-meddelanden gör projektledaren Johan Mannerheim en liknelse med KB:s årliga förvärv av böcker och annat tryckt material:
Cirka 15.000 svenska böcker beskrivs av KB i databasen LIBRIS varje år. Dessutom sorteras och ordnas drygt 100.000 andra tryck, t.ex. affischer, årsberättelser, reklamfoldrar. Antalet CD-ROM-skivor kan räknas i hundratal. Under vår andra nertankning under 1997 av den svenska delen av Internet, som snart är avslutad, har Kulturarw3hittat över 9 miljoner URL-er! Visserligen ingår ett ännu okänt antal dubletter. Räknar man bort dem och bilderna hamnar man i storleksordningen 5 miljoner webbsidor. De ändras ofta, många gånger per år. Och antalet växer snabbt .50
Till skillnad från många av de utvecklingsprojekt som bedrivs runtom i världen (se kapitel 7), där nationalbiblioteken oftast väljer ut särskilda dokumentkategorier för insamling, har KB valt att angripa problemet med den stora och heterogena massan av elektroniska onlinepublikationer på ett annorlunda sätt. I stället för att göra ett urval vid insamlingen siktar KB på att samla in så mycket som möjligt av det svenska material som publiceras på Internet. Däremot görs ett urval beträffande vad som skall registreras och katalogiseras. Den information
50 Att fånga nätet : projekt Kulturarw3 / Johan Mannerheim // LIBRIS-meddelanden nr 78 (Maj 1998), sid. 22-24
som inte registreras kommer därmed att utgöra en stor okatalogiserad samling. Till skillnad från KB:s traditionella okatalogiserade material i tryckt form kan den ändå göras sökbar.
Att använda en robot för en automatiserad insamling av det här slaget tillämpas också vid The Internet Archive, en privat amerikansk stiftelse. Men KB är än så länge det enda nationalbibliotek i världen som samlat in den nationella webbpubliceringen. Finland ligger långt framme i planeringen (se avsnitt 7.3.2) och intresse för KB:s modell finns hos en rad andra länder. Tilläggas kan att KB, i form av ett SIDA-projekt, bistått Belize, Guatemala, Honduras, El Salvador, Nicaragua, Costa Rica och Panama med en robotinsamling, vars första varv avslutats under våren 1998.
Som främsta skäl för sitt val av metod, dvs. en i det närmaste total insamling i stället för ett noggrant urval, anger KB att man inte kan veta vilket material som i framtiden kommer att anses som värdefullt och efterfrågat. Att göra sofistikerade och manuella urval bland miljontals webbsidor skulle dessutom kräva stora personalinsatser. Eftersom kostnaderna för datalagring är låga finns det enligt KB inga resursmässiga hinder för att lagra de stora datamängder det blir fråga om.
Det material som hittills samlats in är av följande slag: periodica (både elektroniska tidskrifter och tidningar), statiska dokument (exempelvis texter i elektroniska textarkiv) och levande dokument med länkar, exempelvis HTML-sidor.
Lägre prioritet har nyhetsgrupper och e-postbaserade sändlistor, ftparkiv och dynamiska dokument med bakomliggande databaser och tjänster.
Den första nedladdningen genomfördes våren 1997. Efter det att roboten letat sig igenom den svenska delen av webben, vilket tog ett par månader, hade ca 5,5 miljoner webbsidor samlats in. Av dessa var uppskattningsvis hälften dubbletter. Dessa sidor fanns publicerade på ca 15 000 svenska servrar under Internetdomänen ”.se”.
Vid den andra nedladdningen som avslutades i februari 1998 genomsöktes, förutom ovan nämnda servrar och ytterligare 7 000 som tillkommit under det gångna halvåret, också ca 9 000 svenska webbplatser under domänerna ”.org”, ”.com” m.fl. Dessa har identifierats som svenska med hjälp av internationella databaser över domännamn.
Den andra nedladdningen av KB:s robot resulterade i att drygt 9 miljoner webbsidor hämtades hem. Av dessa var uppskattningsvis ett par miljoner dubbletter.
En tredje nedladdning utfördes under våren 1998. Den resulterade i att 9,7 miljoner sidor samlades in från 31 400 domäner. En preliminär bedömning visar att antalet insamlade dubbletter sannolikt var lägre än tidigare.
För närvarande tar det mer än en månad för roboten att söka igenom den svenska delen av Internet. Detta skapar vissa problem vad beträffar möjligheterna att återskapa en viss sida som den ”såg ut” vid en viss given tidpunkt. KB arbetar därför med att utveckla robottekniken så att insamlingen kan ske snabbare. Målet är att komma ner till en vecka.
Det totala lagringsutrymmet för det material som samlades in vid den andra nedladdningen uppgår till ca 200 gigabyte (Gbyte).
Det övervägande antalet insamlade sidor innehåller text, vanligtvis i HTML-format. Därnäst kommer olika bild-format. Sammantaget har roboten hämtat hem information lagrad i hundratals olika format. Fördelningen mellan olika format och dessas krav på lagringsutrymme framgår av nedanstående tabell.
Tabell 4 Innehållet på den svenska webben februari 1998 efter format
Format Antal doku-
ment
(UEL:er)
Andel i % (av antalet)
Genom-
snittlig storlek
(Kb)
Totalt lag-
ringsututrymme
(Gb)
Andel i
% (av
lag-
ringsutrymme)
Text (HTML)
4 843 861 51,2
5
24,2 12,1
Text (övriga format t ex Postscript, pdf)
108 805 1,1
173
18,8 9,4
Ljud
93 738 1,0
161
15,1 7,5
Bild (stillbild)
3 448 288 36,4
16
55,7 27,8
Bild (rörliga bilder/video)
5 559 0,1
902
5,0 2,5
Övriga/okända format
967 680 10,2
85
81,8 40,8
Filtyper < 10 förekomster
546
..
..
..
Summa
9 468 470 100 ,0
47
200,6 100 %
Som framgår av tabellen kräver lagring av ljud och bild, i synnerhet rörliga bilder, ett helt annat utrymme än text. Vanliga enkla textsidor i HTML-format utgör mer än hälften av antalet insamlade sidor, men kräver inte mer än en dryg tiondel av det totala lagringsutrymmet. Rörliga bilder utgör blott 0,1 % av det totala antalet, medan det lagringsutrymme som tas i anspråk är 25 ggr större (2,5 %).
De dokument som samlas in via Kulturarwsroboten ger sammantaget en god bild av hur den svenska webben såg ut vid en viss tidpunkt. Samtidigt innebär metoden i sin nuvarande utformning med nödvändighet att visst material aldrig kommer att samlas in. Det rör sig framför allt om
material som uppdateras ofta, exempelvis dagstidningar, tidskrifter och andra nyhetsmedia. KB har därför för avsikt att utveckla roboten så att den besöker vissa i förväg utvalda webbplatser med tätare intervall. Enligt uppgift är det fullt möjligt att instruera roboten så att den kan besöka en dagstidnings webbplats varje dag.
Man avser också att förse roboten med viss egen intelligens. Därigenom kan den själv lära sig olika webbplatsers uppdateringsfrekvens. Därmed skulle roboten kunna besöka olika webbplatser med en frekvens som svarar mot deras föränderlighet.
I utvecklingsplanerna ingår också en insamling av de kategorier som hittills varit lågprioriterade, såsom nyhetsgrupper på Usenet, sändlistor och dynamiska sidor med bakomliggande databaser.
Den robot som KB använder är ursprungligen utvecklad av Netlab vid Lunds universitet och har använts där för att bygga upp söktjänsten Nordic web index (se avsnitt 8.3).
För det material som behöver samlas in i sin helhet prövas andra metoder, exempelvis frivillig anmälan och aktiv sökning för att identifiera elektronisk periodica. Här samarbetar Kulturarw3 med KB:s periodicaenhet, som skapat förteckningen Svensk periodica online51 och även registrerat mer än 200 elektroniska online-tidskrifter i Libris.
De insamlade dokumenten lagras än så länge på magnetband. De 9,5 miljoner filer som hämtades under den andra nedladdningen kräver som nämnts ovan ett totalt lagringsutrymme om ca 200 Gb. Ett magnetband av det slag som KB använt sig av hittills rymmer ca 20 Gb. Varje sådant magnetband kostar i dag ca 1 000 kr.
Eventuellt kommer lagring på s.k. DVD-skivor (Digital Video Disc) att prövas inom projektets ram. Dessa rymmer 16-17 Gb, varför hela det insamlade materialet skulle kunna rymmas på ett tiotal skivor.
För närvarande tillgängliggör KB inte det insamlade materialet.
8.2. Svesök
Inom ramen för projektet Nytt Libris, som KB i samband med budgetpropositionen hösten 1996 fått i uppdrag av regeringen att driva, har delprojektet Svesök initierats. Projektet, som startade 1997, har följande syften:
- Att skapa ett användarvänligt gränssnitt för att söka och återvinna den information, dvs. de webbsidor, som samlas in inom ramen för Kulturarw3-projektet.
51 http://www.kb.se/nbp/el-per.htm
- Att skapa och underhålla ett systematiskt index över svenska webbplatser av god kvalitet, vilka har utvalts enligt särskilda kriterier som utarbetats inom projektet. Tanken är att Svesök skall fungera som en nationalbibliografi för svenska webbresurser. Svenska bibliotek skall kunna bidra till arbetet med att spåra upp, kvalitetskontrollera och registrera svenska informationsresurser på Internet.
- Att främja användandet av metadata enligt Dublin Core (se avsnitt 6.7.2).
I dagsläget består Svesök av två databaser. Den ena innehåller kvalitetsbedömda och ämnesindelade webbresurser. För att avgöra om en webbplats eller webbsida skall tas med görs en bedömning av innehåll, form och funktion. Den andra databasen utgör ett index till de aktuella sidor som kontinuerligt samlas in med hjälp av Kulturarw3-roboten.
8.3. Nordic web index
Nordic web index (NWI) är ett samnordiskt projekt initierat inom ramen för det s.k. Nord-Elib-programmet, som finansieras av det nordiska samordningsorganet NORDINFO. Nord-Elib har byggt upp tre nordiska kompetenscentra inom området IT och bibliotek. Ett sådant kompetenscentrum är Nordic network centre (NNC), för vilket Netlab vid Lunds universitetsbibliotek och Danmarks tekniske videncenter & bibliotek (DTV) ansvarar.
NWI är finansierat dels av Nordinfo, dels av nationella intressenter som KB:s samordnings- och utvecklingsavdelning Bibsam och Bibliotekstjänst AB.
NWI-projektet startade 1996. Syftet med projektet var att med hjälp av distribuerad teknik bygga upp ett index över nordiska webbsidor. För att åstadkomma detta har en robot använts. Roboten har samlat in sidor genom att följa länkar på webben. Innehållet i dessa sidor har sedan indexerats. De nordiska länder som ingått i projektet har ansvarat för indexeringen av respektive lands webbsidor. Vidare syftade projektet till att möjliggöra sökning på nordiska specialtecken som å, ä, ö m. fl., något som ingen av de internationella söktjänsterna vid tiden för projektets inledning klarade av.
Den robot som utvecklats har anpassats för arkiveringsändamål och används nu av KB i Kulturarw3-projektet.
NWI har i praktiken fungerat som de övriga robotbaserade söktjänster (”sökmotorer”) som finns på Internet, t ex Altavista, Excite eller Lycos. I takt med den snabba utvecklingen av dessa kommersiella söktjänster har betydelsen av en särskild nordisk söktjänst minskat. Inom
NWI vill man därför vidareutveckla vissa delar, bl.a. genom att utveckla särskilda funktioner för sökning med hjälp av metadata.
8.4. Safari
Högskoleverket har av regeringen fått i uppdrag att utveckla och samordna ett system för forskningsinformation på Internet. Systemet, som döpts till Safari, syftar till att förbättra högskolornas möjligheter att fullfölja den s.k. tredje uppgiften, dvs. att informera allmänhet, näringsliv, myndigheter och utbildningsinstitutioner om sin forskning52. Även inom detta projekt är ett av målen att förbättra användningen av metadata.
52 http://www.hsv.se/verksamhet/utredningar/safari/index.html
9. Lagstiftning av betydelse för möjligheterna att samla in, bevara och tillhandahålla databaserat material
9.1. Inledning
Enligt direktiven för utredningen skall övervägas huruvida sådan elektronisk information som inte omfattas av de nuvarande bestämmelserna i pliktexemplarslagen skall vara föremål för leveransplikt i framtiden. I samband med redovisningen för uppdraget (avsnitt 4.1) har jag angett att övervägandena även bör innefatta alternativa former för insamling av sådant elektroniskt material som i dag faller utanför pliktexemplarslagens tillämpningsområde, i första hand insamling genom institutionernas egen försorg.
Restriktioner i fråga om rätten att samla in, bevara och tillhandahålla det insamlade materialet finns i dels upphovsrättslagen (1960:729), dels datalagen (1973:289). I april 1998 har emellertid riksdagen antagit en ny lag, personuppgiftslagen (1998:204), som träder i kraft den 24 oktober 1998, då datalagen skall upphöra att gälla (prop. 1997/98:44, bet. 1997/98:KU18, rskr. 1997/98:180).
Insamling av databaserat material genom institutionernas egen försorg förutsätter att institutionerna har eller ges rätt att enligt upphovsrättslagen framställa exemplar av de verk som finns i elektronisk form. Även insamling av materialet genom pliktleverans torde förutsätta rätt till exemplarframställning för att det skall bli möjligt att ta del av materialet i framtiden. I det följande skall därför en redovisning lämnas för reglerna i upphovsrättslagen om upphovsmannens rätt till exemplarframställning och om inskränkningarna i denna rätt till förmån för arkivmyndigheter och bibliotek.
Upphovsrättslagen innehåller vidare vissa restriktioner när det gäller möjligheterna att tillhandahålla det insamlade och bevarade materialet. Även dessa regler skall redovisas i det följande.
Inom EU behandlas för närvarande EU-parlamentets och rådets förslag till direktiv om harmonisering av vissa aspekter av upphovsrätt och
närstående rättigheter i informationssamhället. Ett kommande direktiv har självfallet stor betydelse för den svenska upphovsrätten och en redovisning skall därför göras för huvuddragen av de delar av direktivet som är av intresse i det här sammanhanget.
Den elektroniska information som det kan finnas anledning att samla in som ett komplement till det material som levereras enligt pliktexemplarslagen innehåller personuppgifter av olika slag, vilka kan läggas till grund för personregister. Grundläggande regler om personregister finns i datalagen. Denna kommer emellertid, som nämnts, att under hösten 1998 ersättas med personuppgiftslagen, som kommer att omfatta bl.a. all automatiserad behandling av personuppgifter. I det följande ges en redovisning för lagen i relevanta delar. Trots att datalagen inte får någon direkt betydelse för de förslag som läggs fram här, skall även den lagen redovisas i korthet som en bakgrund till den kommande personuppgiftslagen.
9.2. Upphovsrättslagen
De upphovsrättsliga rättigheterna
Enligt upphovsrättslagen (1960:729) har den som skapat ett litterärt eller konstnärligt verk upphovsrätt till verket (1 §). Som exempel på skyddade verk anges en skönlitterär eller beskrivande framställning i skrift eller tal, datorprogram, musikaliskt eller sceniskt verk, filmverk, fotografiskt verk eller något annat alster av bildkonst, alster av byggnadskonst eller brukskonst. Förteckningen är inte uttömmande och den avslutas med ”verk som har kommit till uttryck på något annat sätt”.
Förutsättningen för att ett verk skall föreligga i upphovsrättslagens mening är att det är resultatet av en individuell andligt skapande verksamhet. Man använder i detta sammanhang ofta uttrycket ”verkshöjd”. Verket måste ha höjt sig till en viss grad av självständighet och originalitet.
Upphovsrättslagen bygger på tanken att en upphovsman till ett verk skall inneha vissa ensamrättigheter med avseende på utnyttjandet av verket. Dessa rättigheter är av två typer, vanligen kallade ekonomiska rättigheter (2 §) respektive ideella rättigheter (3 §).
I 2 § ges bestämmelser om vilka ekonomiska rättigheter upphovsmannen har till sitt verk. Upphovsrätt innefattar enligt paragrafens första stycke, med de inskränkningar som stadgas i det följande, uteslutande rätt att förfoga över verket genom att framställa exemplar av detta och genom att göra det tillgängligt för allmänheten, i ursprungligt eller änd-
rat skick, i översättning eller bearbetning, i annan litteratur- eller konstart eller i annan teknik.
Enligt huvudregeln om upphovsrättens varaktighet i 43 § gäller upphovsrätten intill utgången av sjuttionde året efter det år då upphovsmannen avled.
Rätten att framställa exemplar av verket
Rätten att framställa exemplar av verket innebär att upphovsmannen ensam har rätt att nedlägga eller fixera sitt verk i ett föremål som gör det möjligt för andra att ta del av det. Rätten gäller oberoende av om framställningen omfattar ett eller flera exemplar. Det är likgiltigt i vilken form verket är nedlagt eller fixerat. Således kan ett litterärt eller musikaliskt verk föreligga i manuskript, tryck, ljudinspelning eller på en cdrom eller vara lagrat i en databas. Även lagring av ett verk i en dator utgör alltså en framställning av ett exemplar av verket. När ett datorprogram används för att styra en dator innebär detta oftast att ett exemplar av programmet framställs i maskinen. Användningen av ett program för att köra en dator omfattas alltså av rätten att framställa exemplar av programmet.
En omdiskuterad fråga har varit huruvida en kortvarig lagring i en dators minne, exempelvis för visning på en skärm, är att anse som ett exemplar eller inte. Frågan har behandlats i propositionen 1996/97:111 Rättsligt skydd för databaser, m.m. (s. 32 och 36). Regeringen konstaterar där inledningsvis att med exemplar av ett verk förstås varje föremål i vilket arbetet är fixerat och att det för att ett exemplar av ett verk skall anses ha framställts krävs att fixeringen är så självständig att den i sig kan spridas bland allmänheten genom t.ex. försäljning. Av detta följer enligt regeringen att enbart det förhållandet att ett verk som är återgivet i digital form kommer upp på en bildskärm inte medför att ett exemplar har framställts av verket, eftersom detta inte fixeras på bildskärmen. Om ett verk i digital form visserligen fixeras inne i en dator, t.ex. på dess hårddisk, men fixeringen är osjälvständig, t.ex. försvinner efter ett ögonblick eller när datorn stängs av, framställs inte heller ett exemplar av verket. Om man däremot gör en självständig fixering av verket, t.ex. genom att lagra det på datorns hårddisk eller på en datadiskett, framställs enligt regeringen ett exemplar av verket. I enlighet med denna syn på rättsläget konstateras att den typ av rent automatiska, mycket kortvariga lagringar som sker när ett verk överförs på Internet inte omfattas av kopieringsrätten.
Dessa uttalanden från regeringen har kritiserats från upphovsmannaoch producenthåll och rättsläget i frågan kan ännu inte betraktas som avgjort.
Inskränkningar i rätten att framställa exemplar av verket
I 2 kap. finns vissa inskränkningar i upphovsrätten. Bl.a. får exemplar framställas utan upphovsmannens tillstånd i vissa fall. I det här sammanhanget är det främst regeln i 16 § om framställning av exemplar inom vissa arkiv och bibliotek som är av intresse. Regeln har följande lydelse:
De arkiv och bibliotek som avses i tredje och fjärde styckena har rätt att framställa exemplar av verk, dock inte datorprogram, för
1. bevarande-, kompletterings- eller forskningsänd amål,
2. för utlämning till lånesökande av enskilda artiklar eller korta avsnitt eller av material som av säkerhetsskäl inte bör utlämnas i original eller
3. för användning i läsapparater. I de fall som avses i första stycket 2 och 3 får exemplar framställas endast genom reprografiskt förfarande.
Rätt till exemplarframställning enligt denna paragraf har
1. de statliga och kommunala arkivmyndigheterna,
2. Arkivet för ljud och bild,
3. de vetenskapliga bibliotek och fackbibliotek som drivs av det allmänna samt
4. folkbiblioteken. Regeringen får i enskilda fall besluta att vissa andra arkiv och bibliotek än de som anges i tredje stycket skall ha rätt till exemplarframställning enligt denna paragraf.
I det här sammanhanget är det främst bestämmelsen i första stycket 1 som är aktuell. Den omfattar, med undantag för datorprogram, alla former av litterära eller konstnärliga verk i vilken form de än föreligger, dvs. både när de finns i skriftlig form eller som tryck på papper och när de föreligger i form av inspelningar. Genom hänvisningarna i 45, 46, 48 och 49 a §§ till utövande konstnärers, framställares av fonogram och av rörliga bilder, radio- och TV-företags, katalogframställares och fotografers rättigheter gäller reglerna också för exemplarframställning av dessa rättighetshavares prestationer.
Med bevarandeändamål avses sådan kopiering som måste ske för att materialet i samlingarna skall kunna bevaras intakt, exempelvis då mikrofilmning eller fotokopiering sker av tidningsmaterial.
Kompletteringsändamål avser att tillföra samlingarna sådant material som de inte innehåller tidigare, exempelvis svåråtkomligt utländskt material eller material som inte finns i handeln. Enligt ett uttalande av riksdagens första lagutskott (NJA II 1961 s. 126) bör fotokopiering för kompletteringsändamål få ske bara om synnerliga skäl föreligger. Dessutom bör fotokopiering av hela böcker som regel inte tillåtas. Dessa regler kompletteras av reglerna i 2 § upphovsrättsförordningen (1993:1212). Enligt dessa avses med framställning av exemplar för kompletteringsändamål två fall. För det första avses fall när ett exemplar av ett verk är ofullständigt. Om verket har kommit ut i delar avses dock endast fallet att den del som saknas inte kan köpas i handeln. För det andra avses fall när exemplar av ett verk inte kan köpas i handeln och exemplarframställningen sker hos ett arkiv eller bibliotek som har rätt att få pliktexemplar av den aktuella produkttypen.
Exemplarframställning får också ske för forskningsändamål. Det får antas att det härvid måste vara fråga om en någorlunda kvalificerad forskning och inte om kopiering för vanliga elevuppsatser eller likna nde.
Undantaget för datorprogram, som fördes in i lagen år 1994, grundar sig på rådets direktiv av den 14 maj 1991 om rättsligt skydd för datorprogram (91/250/EG). Av detta direktiv följer att arkiv och bibliotek inte får ges rätt att kopiera datorprogram (jfr prop. 1992/93:214 s. 68 f.).
Rätten att tillgängliggöra för allmänheten
Till upphovsmannens ekonomiska rättigheter hör, som nämnts, förutom rätten att framställa exemplar även rätten att göra verket tillgängligt för allmänheten. Innebörden av den sistnämnda rättigheten anges utförligare i 2 § tredje stycket. Där sägs att ”verket göres tillgängligt för allmänheten då det framföres offentligt, så ock då exemplar därav utbjudes till försäljning, uthyrning eller utlåning eller eljest sprides till allmänheten eller visas offentligt”.
Rätten att göra verket tillgängligt för allmänheten är således sammansatt av tre olika rättigheter – rätten till offentligt framförande, spridningsrätten och visningsrätten.
Begreppet ”framförande” innebär att verket framförs, uppförs eller utförs, visas genom film eller sänds ut i radio eller TV. Några nya exemplar av verket framställs inte vid denna form av utnyttjande. Upphovsmannens rätt till framförande gäller offentligt framförande. Härmed
avses i princip alla framföranden som inte äger rum inom helt slutna kretsar. Liksom i fråga om mångfaldiganderätten gäller ensamrätten till offentligt framförande av verket i såväl ursprunglig som ändrad form.
Rätten att sprida exemplar till allmänheten framstår i första hand som ett komplement till mångfaldiganderätten.
Den tredje grundläggande rättigheten är visning av exemplar av ett verk för allmänheten. Rättigheten har sin största betydelse i fråga om bildkonst.
Tillhandahållandet genom arkivmyndigheter och bibliotek av det insamlade elektroniska material som är aktuellt här torde huvudsakligen innefatta framförande av de verk som finns i materialet53. I 21 § upphovsrättslagen finns bestämmelser om fall då offentliga framföranden får ske utan tillstånd och utan ersättning till upphovsmannen. Paragrafen har följande lydelse:
Var och en får framföra utgivna verk offentligt
1. vid tillfällen där framförandet av sådana verk inte är det huvudsakliga, tillträdet är avgiftsfritt och anordnandet sker utan förvärvssyfte samt
2. vid undervisning eller gudstjänst. Första stycket gäller inte sceniska verk och filmverk och ger inte rätt att sända ut verk i ljudradio eller television.
Första stycket 2 ger inte rätt att i förvärvssyfte framföra sammanställningar vid undervisning.
Bestämmelserna är alltså tillämpliga på utgivna verk. Enligt 8 § andra stycket anses verket utgivet, då exemplar därav med upphovsmannens samtycke blivit spridda till allmänheten. I bestämmelsen talas alltså om exemplar i pluralis. I Bernkonventionen (art. 3.3), vars bestämmelser får anses vara avgörande för tolkningen av den svenska lagens bestämmelse, anges utgivning (publicering) föreligga när ”exemplaren har gjorts tillgängliga på sådant sätt att, med beaktande av verkets art, allmänhetens rimliga behov blir tillfredsställt”.
Upphovsrättens ideella innehåll
53 Se t.ex. Olsson H., Upphovsrättslagstiftningen: en kommentar. – Stockholm, 1996. (s. 65)
Upphovsrätten omfattar enligt 3 § även ett ideellt skydd för upphovsmännen, nämligen rätt att få gälla som upphovsman till verket och rätt till respekt för verket. Ett verk får således inte ändras så att upphovsmannens litterära eller konstnärliga anseende eller egenart kränks.
De ideella rättigheterna ökar i betydelse genom att ny informationsteknologi ger ökade möjligheter att utnyttja verk och att manipulera dessa digitalt på ett sätt som gör att de ideella rättigheterna riskerar att kränkas.
9.3. Internationella förhållanden
Allmänt
Det finns flera internationella överenskommelser som syftar till att ge upphovsmännen skydd oberoende av nationalitetsgränser. För svensk del finns reglerna om det internationella skyddet i den internationella upphovsrättsförordningen (1994:193).
Skydd för den egentliga upphovsrätten regleras på det internationella planet främst av Bernkonventionen för skydd av litterära och konstnärliga verk (tillkommen år 1886, senast reviderad i Paris år 1971) och Världskonventionen om upphovsrätt (tillkommen år 1952, senast reviderad i Paris år 1971). Sverige är bundet av båda dessa konventioner och är därför skyldigt att ge skydd åt verk från andra länder som har tillträtt respektive konvention. Huvudprincipen är att skyddet skall motsvara det skydd som de egna upphovsmännen har – principen om nationell behandling. Skyddet får emellertid inte underskrida de rättigheter som är särskilt föreskrivna i respektive konvention. Den svenska upphovsrättslagen uppfyller konventionernas krav på minimirättigheter.
Inom den Europeiska Gemenskapen, EG, har på upphovsrättens område ett antal direktiv antagits av Ministerrådet. Särskilt må nämnas direktivet den 14 maj 1991 om rättsligt skydd för datorprogram och direktivet den 11 mars 1996 om rättsligt skydd för databaser. Direktiven har införlivats med svensk lag.
Vid en diplomatkonferens i Genève i december 1996 tillkom två nya internationella överenskommelser, WIPO-fördraget om upphovsrätt och WIPO-fördraget om framföranden och om fonogram. Dessa fördrag är avsedda att reglera en del av de problem som uppkommer när det gäller tillämpningen av upphovsrätten och vissa av de närstående rättigheterna på ny teknologi. Fördragen träder i kraft när 30 stater har tillträtt dem. Till dess torde det dröja en avsevärd tid. Avsikten är att samtliga EU:s medlemsstater så småningom skall tillträda fördragen på samma gång.
I sammanhanget bör också nämnas det s.k. TRIPS-avtalet (Agreement on Trade-Related Aspects of Intellectual Property Rights, Including Trade in Counterfeit Goods), ingånget av länderna inom World Trade Organization, WTO, tidigare GATT. Den svenska lagen uppfyller de krav som TRIPS-avtalet ställer upp och har alltså inte behövt ändras av denna anledning.
EU-parlamentets och rådets förslag till direktiv om harmonisering av vissa aspekter av upphovsrätt och närstående rättigheter i informationssamhället
I december 1997 publicerade EG-kommissionen ett utkast till direktiv om behandlingen inom Gemenskapens medlemsstater av upphovsrätt och närstående rättigheter i informationssamhället. Direktivet grundas på bl.a. de två nämnda WIPO-fördragen och avses att möjliggöra medlemsstaternas ratificering av dessa fördrag.
I artiklarna 2–4 behandlas dels mångfaldiganderätten, dels rätten till överföring till allmänheten och rätten att tillhandahålla verk och annat material, dels spridningsrätten. Enligt artiklarna skall medlemsstaterna ge upphovsmännen ensamrätt i olika hänseenden.
I artikel 5 ges härefter undantag från de restriktioner som avses i artiklarna 2 och 3. Enligt artikel 5.2 får medlemsstaterna föreskriva inskränkningar i ensamrätten till mångfaldigande bl.a. för särskilda fall av mångfaldigande, som utförs av inrättningar som är tillgängliga för allmänheten utan direkt eller indirekt ekonomisk eller kommersiell nytta. Enligt artikel 5.4 skall de undantag och inskränkningar som föreskrivs i bl.a. punkten 2 endast tillämpas på vissa särskilda fall och inte tolkas på ett sådant sätt att deras tillämpning oskäligt inkräktar på rättighetshavarnas legitima intressen eller gör intrång i det normala utnyttjandet av deras verk eller material.
I förslaget finns inget undantag för bibliotekens framförande av digitala dokument på bildskärm.
Slutligen kan anmärkas att tillämpningen av direktivet inte påverkar befintliga gemenskapsbestämmelser om bl.a. skydd för datorprogram.
9.4. Datalagen
Grundläggande regler om inrättande och förandet av personregister med hjälp av automatisk databehandling finns i dag i datalagen (1973:289). Kompletterande bestämmelser om bl.a. licensanmälan, tillståndsansökan och handläggningen hos Datainspektionen finns i dataförordningen (1982:480).
Med personuppgift avses enligt datalagen upplysningar som avser en enskild person. Det kan vara upplysningar om namn, personnummer, födelsedatum, nationalitet, utbildning, familj och anställningsförhållanden. Med personregister förstås register, förteckning eller andra anteckningar som förs med hjälp av automatisk databehandling (ADB) och som innehåller personuppgift som kan hänföras till den som avses med uppgiften.
Det är alltså bara register som förs med hjälp av ADB som omfattas av datalagen.
Bara den som har anmält sig till Datainspektionen och fått licens får inrätta och föra personregister (2 §). Datainspektionen granskar inte anmälan i sak utan ger bara den registeransvarige ett bevis (licens) om att anmälan har gjorts samt ett särskilt licensnummer (10 § dataförordningen). En licens berättigar den registeransvarige att föra ett eller flera personregister.
För vissa typer av register med känsliga uppgifter krävs utöver licens även ett särskilt tillstånd från Datainspektionen (2 § 2 st. datalagen). Känsliga uppgifter som avses här är bl.a. uppgifter om brottsmisstanke, straff, tvångsingripanden m.m. (4 §) samt personuppgifter som utgör omdöme eller annan värderande upplysning om den registrerade (6 § 2 st.). För vissa personregister behövs dock inte tillstånd. Det gäller t.ex. register vars inrättande beslutats av riksdagen eller regeringen (s.k. statsmaktsregister) eller för register som har tagits emot för förvaring av en arkivmyndighet (2 a § 1 st.). För sådana personregister som ofta förekommer inom en viss verksamhet för ett visst ändamål kan det meddelas särskilda föreskrifter (19 §). Följer den registeransvarige sådana föreskrifter, behövs inte något tillstånd (2 a § 1 st. 2).
Föreskrifter enligt 19 § får meddelas av regeringen eller, efter regeringens bemyndigande, Datainspektionen. Med stöd av denna bestämmelse har regeringen i 14 § dataförordningen bemyndigat Datainspektionen att för personregister av det nämnda slaget meddela erforderliga föreskrifter. Datainspektionen har med stöd härav utfärdat vissa föreskrifter för personregister på webbsidor (DIFS 1997-7).
9.5. Personuppgiftslagen
Regeringen har i proposition 1997/98:44 Personuppgiftslag lagt fram förslag till en personuppgiftslag. Lagen skall ersätta den nuvarande datalagen och genomför Europaparlamentets och rådets direktiv 94/46/EG av den 24 oktober 1995 om skydd för enskilda personer med avseende på behandling av personuppgifter och om det fria flödet av sådana uppgifter. Förslaget bygger på det av Datalagskommittén den 2 april 1997 avgivna betänkandet Integritet – Offentlighet – Informationsteknik (SOU 1997:39). Den nya lagen föreslås träda i kraft den 24 oktober 1998.
Lagen, som i huvudsak följer EG-direktivets text och disposition, omfattar all automatiserad behandling av personuppgifter och manuell behandling av personregister.
Syftet med lagen är att skydda människor mot att deras personliga integritet kränks genom behandling av personuppgifter (1 §). Om det i en annan lag eller i en förordning finns bestämmelser som avviker från lagen skall de bestämmelserna gälla (2 §).
Med personuppgifter avses enligt lagen all slags information som direkt eller indirekt kan hänföras till en fysisk person som är i livet.
Med behandling av personuppgifter avses i lagen varje åtgärd eller serie av åtgärder som vidtas i fråga om personuppgifter, vare sig det sker på automatisk väg eller inte, t.ex. insamling, registrering, organisering, lagring, bearbetning eller ändring, återvinning, inhämtande, användning, utlämnande genom översändande, spridning eller annat tillhandahållande av uppgifter, sammanställning eller samkörning, blockering, utplåning eller förstöring.
Med personuppgiftsansvarig avses den som ensam eller tillsammans med andra bestämmer ändamålen med och medlen för behandlingen av personuppgifter.
Lagen innehåller inget krav på att de uppgifter som behandlas på automatisk väg skall vara strukturerade i ett register eller liknande. Datoriserad ord- och textbehandling eller liknande av löpande text som innehåller personuppgifter omfattas därför av lagen.
I 10 § finns bestämmelser om i vilka fall behandling av personuppgifter över huvud taget är tillåten. Om känsliga personuppgifter, uppgifter om lagöverträdelser m.m. eller personnummer skall behandlas, måste behandlingen dessutom vara tillåten i enlighet med bestämmelserna i 13– 22 §§.
När behandling av personuppgifter är tillåten
Den grundläggande bestämmelsen i 10 § har följande lydelse.
Personuppgifter får behandlas bara om den registrerade har lämnat sitt samtycke till behandlingen eller om behandlingen är nödvändig för att
a) ett avtal med den registrerade skall kunna fullgöras eller åtgärder som den registrerade begärt skall kunna vidtas innan ett avtal träffas,
b) den personuppgiftsansvarige skall kunna fullgöra en rättslig skyldighet,
c) vitala intressen för den registrerade skall kunna skyddas,
d) en arbetsuppgift av allmänt intresse skall kunna utföras,
e) den personuppgiftsansvarige eller en tredje man till vilken personuppgifter lämnas ut skall kunna utföra en arbetsuppgift i samband med myndighetsutövning, eller
f) ett ändamål som rör ett berättigat intresse hos den personuppgiftsansvarige eller hos en sådan tredje man till vilken personuppgifterna lämnas ut skall kunna tillgodoses, om detta intresse väger tyngre än den registrerades intresse av skydd mot kränkning av den personliga integriteten.
Uppräkningen i paragrafen stämmer överens med den uppräkning som i detta hänseende finns i artikel 7 i EG-direktivet. Uppräkningen är uttömmande.
Behandling av känsliga personuppgifter
Enligt 13 § är det förbjudet att behandla känsliga personuppgifter. Härmed avses dels personuppgifter som avslöjar ras eller etniskt ursprung, politiska åsikter, religiös eller filosofisk övertygelse, eller medlemskap i fackförening, dels personuppgifter som rör hälsa eller sexualliv.
I 15–19 §§ anges vissa undantag från förbudet mot behandling av känsliga personuppgifter. Av intresse i det här sammanhanget är enbart det undantag som regleras i 19 §. Enligt den bestämmelsen får känsliga personuppgifter behandlas för forsknings- och statistikändamål, om behandlingen är nödvändig på sätt som sägs i 10 § och om samhällsintresset av det forsknings- eller statistikprojekt där behandlingen ingår klart väger över den risk för otillbörligt intrång i enskildas personliga integritet som behandlingen kan innebära. Personuppgifter får lämnas ut för att användas i sådana projekt, om inte något annat följer av regler om sekretess och tystnadsplikt.
I 20 § bemyndigas regeringen eller den myndighet som regeringen bestämmer att i fråga om automatiserad behandling av personuppgifter meddela föreskrifter om ytterligare undantag från förbudet mot behandling av känsliga personuppgifter, om det behövs med hänsyn till ett viktigt allmänt intresse. Enligt EG-direktivet, artikel 8.4, får undantag beslutas under förutsättning att lämpliga skyddsåtgärder vidtas, vilket också framhålls i förarbetena till lagen (prop. s. 69). Denna förutsättning för beslut om undantag har dock inte kommit till uttryck i 20 §.
Undantaget i 19 § saknar uttrycklig motsvarighet i EG-direktivet. Där faller forskning och statistik in under ett sådant viktigt allmänt intresse beträffande vilket medlemsstaterna kan fatta särskilda beslut om undantag. Regeringen anser emellertid i propositionen att forskning och statistik är ett så viktigt område att det bör regleras redan i den nya lagen (prop. s. 69).
Uppgifter om lagöverträdelser m.m. och behandling av personnummer
Enligt 21 § är det förbjudet för andra än myndigheter att behandla personuppgifter om lagöverträdelser.
Slutligen får enligt 22 § uppgifter om personnummer utan samtycke behandlas bara när det är klart motiverat med hänsyn till ändamålet med behandlingen, vikten av en säker identifiering eller något annat beaktansvärt skäl.
Vissa grundläggande krav på behandlingen av personuppgifter
I 9 § anges vissa grundläggande krav på behandlingen av personuppgifter. Den personuppgiftsansvarige skall således bl.a. se till att personuppgifter samlas in bara för särskilda, uttryckligt angivna och berättigade ändamål (1 st. c), att personuppgifter inte behandlas för något ändamål som är oförenligt med det för vilket uppgifterna samlades in (1 st. d), att de personuppgifter som behandlas är riktiga och, om det är nödvändigt, aktuella (1 st. g), att alla rimliga åtgärder vidtas för att rätta, blockera eller utplåna sådana personuppgifter som är felaktiga eller ofullständiga med hänsyn till ändamålen med behandlingen (1 st. h), och att personuppgifter inte bevaras under en längre tid än vad som är nödvändigt med hänsyn till ändamålen med behandlingen (1 st. i).
I överensstämmelse med EG-direktivet är lagring och annan behandling av personuppgifter för historiska, statistiska och vetenskapliga ändamål särskilt gynnad. Senare behandling för sådana ändamål skall inte anses oförenlig med de ursprungliga ändamål för vilka uppgifterna
samlades in (9 § 2 st.) och det är också tillåtet att för sådana ändamål spara personuppgifter under längre tid, dock inte längre än vad som behövs för de angivna ändamålen (9 § 3 st.).
Regeringen eller den myndighet som regeringen bestämmer får enligt 50 § meddela närmare föreskrifter om vilka krav som ställs på den personuppgiftsansvarige vid behandling av personuppgifter.
ÖVERVÄGANDEN OCH FÖRSLAG
10. Allmänna utgångspunkter
M in bedömning:
De mål och syften för pliktexemplar som anförts av
tidigare utredningar är fortfarande giltiga. Det finns i dag stora mängder elektroniskt publicerat material som väl uppfyller de allmänna förutsättningarna för leveransplikt. För att det inte skall uppstå stora luckor i vårt framtida kulturarv är det därför motiverat med ett systematiskt insamlande och bevarande av dagens utbud av online-information.
10.1. Traditionella motiv för att samla in och bevara
Pliktleveransutredningen redovisade i sitt betänkande Pliktleverans (SOU 1992:92) följande övergripande mål för pliktexemplarslagstiftningen (s. 85):
1 Vi skall bevara och tillhandahålla yttringar av svenskt liv, svenskt samhälle och svensk kultur för eftervärlden. 2 Materialet skall så vitt möjligt kunna nyttjas av alla. 3 Målen skall ges lagform under hänsynstagande till tidigare svensk och internationell lagstiftning och erfarenhet.
4
Lösningarna skall ta hänsyn till den senaste tekniska utvecklingen och finna tillfredsställande organisatoriska former.
Utredaren fortsätter:
”Med detta synsätt blir det självklart att den ena typen av dokument, det må vara text-, ljud- eller bilddokument, inte i sig kan anses vara mera värd att bevara än den andra. Kvalitetskriterier är omöjliga att uppställa, då det dåliga belyser vårt samhälle lika väl som det goda. Strävan måste i stället vara att behålla så mycket som möjligt av det material som innehåller mycken och unik information. De restrik-
tioner på bevarande och tillhandahållande som måste uppställas är följaktligen av ekonomisk natur.” Som konkreta mål för pliktleveranserna anger utredaren att såväl myndigheter som enskilda har behov av att kunna bilda sig en uppfattning om samhället. De har också behov av insyn, exempelvis för att kunna kontrollera att lagar efterlevs. Som exempel på det sistnämnda nämner utredaren att upphovsmän till litterära eller konstnärliga verk skall ha möjlighet att jämföra sina verk med eventuella plagiat. För att kunna arbeta för att förändra samhället, exempelvis i form av opinionsbildning, är det nödvändigt att ”det i riket så långt det är praktiskt möjligt finns tillgång till de dokument som är allmänt tillgängliga”(s. 86).
Att materialet tillhandahålls på flera håll i landet är enligt utredaren ett rättvisekrav. Forskning och studier främjas genom att även universitetsbiblioteken erhåller pliktleveranser.
Därutöver framhåller utredaren den s.k. kulturarvsaspekten, nämligen att man önskar bevara för eftervärlden och tillhandahålla allmänt tillgängliga dokument som belyser svenskt liv, svenskt samhälle och svensk kultur. Kulturarvet skall tillhandahållas för att utnyttjas vid forskning, utredningsverksamhet och studier.
I regeringens proposition 1993/94:10 om pliktexemplar av dokument instämde det föredragande statsrådet i vad utredningen anfört beträffande det sistnämnda syftet. Föredraganden anför således (s. 17) att ”Pliktleverans skall ske för att bevara och tillhandahålla yttringar av svenskt liv, svenskt samhälle och svensk kultur för forskning och studier.”
Ovanstående övergripande mål och syften för leveransplikt sammanfattar väl den svenska traditionen på området och står i överensstämmelse med internationellt vedertagen praxis. De kommer därför att tjäna som utgångspunkt för mina överväganden och förslag.
10.2. Skall vi bevara online-informationen?
Dagens utbud, produktion, distribution och konsumtion av elektroniskt publicerad information beskrivs översiktligt i avsnitt 6 och mer utförligt i bilaga 2. Där framgår klart att det finns stora mängder elektroniskt publicerat material som väl uppfyller de kriterier som anges i de allmänna förutsättningarna för leveransplikt. Informationen är allmänt tillgänglig i landet och rör i många fall svenska förhållanden. Här finns också ”mycken och unik information”.
Uppfattningen att det som publiceras på nätet enbart är skräp och meningslösheter framförs ibland i debatten. Nätet har liknats vid ett
klotterplank, vid tonåringars telefonpratande eller vid ett forum för spridande av bombrecept och uppmaningar till illegal verksamhet.
Min kartläggning visar att en sådan uppfattning är felaktig. Mängden ”privat” information, dvs sådan information som i första hand är avsedd för producentens familj och närmaste vänner, är visserligen långt mycket större på Internet än vad som varit möjligt i den tryckeribaserade utgivningen. Som en konsekvens av detta ökar också möjligheten att sprida sådan information som exempelvis faller under brottsbalkens bestämmelser om hets mot folkgrupp, uppvigling eller barnpornografibrott.
Långt viktigare är dock att det i dag sprids mycket stora mängder information i samhälleliga, vetenskapliga och kulturella frågor. Det som publiceras på nätet har i vissa fall en tryckt motsvarighet, men lika ofta är online-publikationerna unika.
I sammanhanget kan det vara värt att påminna om att det i alla tider utgivits ett stort antal tryck som av samtiden ansetts vara av ringa eller intet värde. Paradoxalt nog är det ofta just det materialet, det udda och svåråtkomliga, som är av särskilt intresse för forskningen. Det är därför en stor tillgång hos nationella minnesinstitutioner som KB, ALB, Lunds universitetsbibliotek och övriga mottagare av pliktexemplar att de bevarat de dokument som ingen annan brytt sig om att bevara.
Mycket av det som tidigare publicerades i form av fixerade dokument, antingen det är fråga om skrift, ljud eller rörliga bilder, distribueras i dag även i online-form. I vissa fall har online-versionen helt ersatt den tryckta utgåvan.
Tack vare att dessa tidigare dokument omfattats av pliktexemplarssystemet har de samlats in av KB, sex universitetsbibliotek och ALB. De har därmed gjorts tillgängliga för forskning och studier och kommer även att bevaras för framtiden. För att det inte skall uppstå besvärande luckor i vårt framtida kulturarv är det därför väsentligt att även det elektroniska material som ligger utanför dagens pliktexemplarslag samlas in och bevaras.
Som exempel på sådan information som riskerar att gå förlorad kan här anföras den svenska nationaldiskografin Svensk fonogramförteck-
ning. Denna publikation, som förtecknar alla i Sverige utgivna fono-
gram, producerades tidigare årligen i en tryckt version. Från och med år 1997 finns den bara tillgänglig som en databas via Internet. Den tryckta versionen levererades till KB och universitetsbiblioteken, medan onlineversionen med nuvarande system inte kommer att samlas in och bevaras för framtiden.
Ett annat exempel är dagstidningarnas webbplatser, som ofta omfattar en mängd material som inte publiceras i den tryckta tidningen. Det finns också exempel på dagstidningar (24 timmar) som enbart publiceras
på Internet. När det gäller tidskrifter är utbudet av unika publikationer långt större.
Naturligtvis är den nätpublicering som helt saknar en tryckt motsvarighet allra mest intressant att bevara. Men jag menar samtidigt att vid parallellpublicering, dvs. när en publikation utkommer såväl i tryckt form som i elektronisk, kan det vara önskvärt att samhället bevarar båda uttrycksformerna, eftersom de sannolikt skiljer sig åt i fråga om layout, spridningsform m.m. Man kan därför utgå från att framtidens forskare kommer att ha behov av att studera båda utgåvorna. De förslag jag avser att lägga fram innebär således inte på något sätt att publicering eller utsändning via Internet skulle fungera som ersättning för pliktleverans av sådana dokument som omfattas av dagens pliktexemplarslag.
Exemplen som anförts ovan visar att kontinuiteten i de nationella samlingarna kommer att brytas och att stora irreparabla luckor kommer att uppstå, om inte den elektroniska information som är allmänt tillgänglig via online-förbindelse systematiskt samlas in och bevaras. Jag menar att pliktexemplarssystemet är det bästa instrumentet för insamling och bevarande av offentliggjord information, vilket också all svensk och internationell erfarenhet visar. Därför bör generellt sett även insamlande och bevarande av sådan elektronisk information som är allmänt tillgänglig via online-förbindelse omfattas av lagstadgade re gler.
11. Vilken elektronisk information bör samlas in och bevaras?
M itt förslag:
Beträffande den elektroniska online-informationen bör det
material som är tillgängligt här i landet och rör svenska förhållanden samlas in. För det material som är avsett att spridas i en större krets bör strävan vara att det samlas in så fullständigt som möjligt. Informationsintresset för övriga kategorier av online-information (privatpersoners hemsidor, lokal föreningsinformation och liknande) är lägre och av resursskäl kan inte ett fullständigt bevarande motiveras. Ett urval bör här vara tillräckligt och jag föreslår en insamling fyra gånger per år. Ett urval av de online-databaser som inte levereras som pliktexemplar i annan form bör samlas in en gång per år i den form och med det innehåll de har just då. Fler datorprogram och datorspel bör samlas in än vad som är fallet i dag. Elektroniska förlagor till tryckta skrifter bör inte inkluderas i pliktexemplarslagen, men KB bör här verka för insamling genom frivilliga överenskommelser.
11.1. Allmänna utgångspunkter
I likhet med de allmänna förutsättningarna för leveransplikt, som angetts ovan, är min utgångspunkt för vad som skall samlas in att informationen skall belysa svenskt liv, svenskt samhälle och svensk kultur. Nuvarande leveransplikt bygger på att dokumenten är framställda i Sverige, är allmänt tillgängliga här i landet och rör svenska förhållanden.
Frågan om vad som är framställt i Sverige är svår att besvara när det gäller elektronisk online-information. Den information som distribueras via Internet är till sin natur internationell. Det är för användaren likgiltigt var informationen fysiskt är belägen. En webbsida som har sitt ursprung i Sverige kan läggas på en server i vilket land som helst och vara tillgänglig över hela världen. Det kan därför vara svårt att avgöra om ett dokument är framställt i Sverige eller inte. En webbsidas adress, den s.k. URL:en, kan ge en viss vägledning. Den är oftast uppbyggd så att serverns nationalitet framgår av ett suffix, som anger en s.k. toppdomän.
För Sveriges del är suffixet .se. I Kulturarw3-projektet har man utgått från URL:en och i första hand samlat in webbsidor med suffixet .se.
Många väljer dock att registrera sina webbplatser under andra domännamn. Det är därför inte möjligt att endast använda detta som urvalsinstrument. Inom Kulturarw3-projektet har man med framgång spårat upp tusentals svenska webbplatser utanför .se. Sannolikt kommer metoder för bl.a. metadata och identifiering av elektronisk information att utvecklas under den närmaste tiden vilket gör det möjligt att bättre urskilja det svenska materialet.
För en utförligare redovisning av ovanstående problem hänvisas till avsnitt 6.7 och bilaga 3.
I 3 § pliktexemplarslagen anges att ”ett dokument görs tillgängligt för allmänheten när exemplar bjuds ut till försäljning, uthyrning eller utlåning eller annars sprids till allmänheten eller när informationen i dokumentet återges offentligt eller i förvärvsverksamhet inför en större sluten krets”. Om man överför denna bestämmelse till elektroniskt lagrad information, så torde det innebära att den information som är åtkomlig för i princip vem som helst via Internet är att betrakta som allmänt tillgänglig. Därvidlag är det ointressant om informationen tillhandahålls gratis eller mot avgift.
För många informationstjänster på Internet gäller att användaren måste uppge ett lösenord för att få tillgång till tjänsten. I vissa fall är tillgången förknippad med en avgift. Det finns flera skäl för att upprätta en spärr med lösenord. Ett kan vara att man vill registrera dem som tar del av informationen av statistiska skäl eller för att upprätta en kundkontakt. Ett annat skäl kan vara att man faktiskt vill begränsa tillgången till informationen till en sluten krets. I det förra fallet bör informationen betraktas som allmänt tillgänglig. I det andra fallet blir avvägningen svårare.
Många företag bygger nu upp interna kommunikationsnät, s.k. intranät. Dessa innehåller en blandning av intern och mer allmän information. Även här kommer man till svåra gränsdragningar, som emellertid bör kunna avgöras av den insamlande institutionen efter kontakt med producenten.
Elektroniska nätverk används i dag också som rent privata kommunikationskanaler. Även om det kan finnas ett stort forskningsintresse för det material som förmedlas via nätverken är det naturligtvis inte rimligt att t.ex. e-postmeddelanden eller slutna diskussionslistor samlas in.
Då det slutligen gäller att bedöma om informationen rör svenska förhållanden måste utgångspunkten enligt min bedömning vara 4 § pliktexemplarslagen, som lyder: ”Ett dokument skall anses röra svenska förhållanden, om informationen i dokumentet helt eller delvis är avfattad på svenska språket eller dokumentet helt eller delvis innehåller verk av
svensk upphovsman eller framförande av svensk konstnär eller, om inte någon av dessa förutsättningar föreligger, dokumentet ändå huvudsakligen är avsett att spridas inom landet.” Enbart en schablonmässig automatiserad översättning till svenska språket medför dock inte att informationen skall anses röra svenska förhållanden.
Som framgått ovan är det svårt att avgöra i vilket land elektronisk online-information skall anses vara framställd. Jag föreslår därför att insamlandet bör gälla sådan information som är allmänt tillgänglig här i landet och som rör svenska förhållanden.
11.2. Urval eller fullständighet
Det elektroniska online-materialet, framför allt det som görs tillgängligt via World Wide Web (www) innehåller information av mycket varierande slag. Det rör sig om professionella medieföretags publikationer, statlig och kommunal information, vetenskapliga rapporter men också sådant som är av mer privat eller lokal karaktär, såsom tonåringars hemsidor, amatörforskares skrifter, det lokala föreningslivets medlemsblad m.m.
Även om pliktexemplarssystemet bygger på det faktum att något kvalitetsmässigt urval inte skall göras (det ”dåliga” skall bevaras sida vid sida med det ”goda”) har ändå, som framgår av avsnitt 5.1.1, vissa enklare kategorier av tryck alltid varit exkluderade från pliktexemplarslagen.
Om man vid insamlingen av den information som publiceras på Internet strävar efter en så hög täckningsgrad som möjligt, kommer stora mängder information av en typ som nu faller utanför pliktexemplarssystemet att samlas in och bevaras. Det professionellt framställda materialet, som är avsett att spridas i en större krets, bör enligt min åsikt självfallet samlas in och bevaras i så stor utsträckning som möjligt, men jag vill samtidigt framhålla att det tveklöst är av intresse för framtida forskning att få tillgång även till det som är av mer privat eller lokal karaktär. Däremot anser jag inte att informationsintresset för var och en av dessa sistnämnda kategorier motiverar ett totalt bevarande, med hänsyn till de resurser som i så fall skulle krävas. Här bör ett urval kunna accepteras. Som framgår av föregående avsnitt förekommer urval även i den nuvarande pliktexemplarslagen. ALB har rätt att kräva in fyra veckor per år av de privata lokalmedierna: närradio, privat reklamradio, lokal kabel-tv och radiosända taltidningar.
Liksom tidigare utredningar finner jag övervägande skäl tala för ett urval baserat på tiden och bedömer att en total insamling av allmänt tillgänglig elektronisk information vid ett antal tillfällen per år är tillräck-
ligt. Av kostnadsskäl är det i ett inledningsskede rimligt att tänka sig fyra gånger årligen. Det är en fördel om urvalet samordnas med de fyra veckor ALB väljer som urval för de privata lokalmedierna. Härigenom blir det möjligt för framtida forskare att få en mer komplett bild av medieutbudet i landet vid vissa tillfällen varje år. Om tekniken utvecklas så att kostnaderna för insamlande, bevarande och migrering sjunker, finns det naturligtvis möjlighet att välja tätare intervall för urvalet.
Dessa ”notvarp” måste kompletteras med ett mer fullständigt insamlande av sådant material som är av särskilt intresse. Det kan t.ex. handla om elektroniska monografier och tidskrifter, dagstidningarnas webbplatser, vetenskapliga rapporter, företags och organisationers informationsmaterial, radio- och tv-sändningar via nätet m.m. Jag förutsätter att uppbyggnaden av en nationell elektronisk kollektion måste ske successivt och stegvis. Högsta prioritet bör härvid ges de publikationer som framställs av professionella utgivare och producenter. Det är dock inte tillräckligt. Insamlandet måste utsträckas till att gälla även sådant som inte är utgivet av förlag, tidnings- eller andra medieföretag. Detta förutsätter ett aktivt urvalsarbete hos de insamlande institutionerna, som måste sträva efter att ta fram enkla och väl definierade kriterier för vad som skall samlas in i urval respektive fullständighet.
11.3. Länkar
Som beskrivs i avsnitt 6.6.1 utgör länkningsmöjligheterna ett av de mer specifika karaktärsdragen hos den information som publiceras på www, vilket skiljer den från traditionell publicering. Länkarna medför stora svårigheter då det gäller insamlande och bevarande. Utan hänsyn till länkar blir webbsidorna ofullständiga, samtidigt som det är praktiskt omöjligt att bevara samtliga länkade sidor.
I mitt förslag skall all svensk, allmänt tillgänglig, elektronisk information som publicerats på www samlas in åtminstone fyra gånger per år. Jag föreslår också att vissa typer av www-publikationer bevaras mer fullständigt. För det material som bevaras mer fullständigt kommer länkarna att kunna peka på de svenska sidor i den form och med det innehåll som de finns bevarade i den insamling som jag föreslår skall ske fyra gånger per år. Här finns således en tidsdifferens som kan innebära att länkade sidor har bytt adress, har förändrats eller helt har tagits bort. I genomsnitt ändras en webbsida varannan månad. Det går således inte att med säkerhet säga att den tillgängliga länkade sidan ser likadan ut som när länken gjordes. Detta har stor betydelse för frågan om autenticitet.
Det finns i dag inte någon lösning på det här problemet om man inte kontinuerligt samlar in alla webbsidor eller åtminstone ändringar i dessa. I detta skede måste vi därför acceptera att det i det material som samlas in kommer att finnas länkar som inte leder någonstans.
För att nå länkar till utländska webbsidor, som helt lämnas utanför mina förslag, förutsätts ett motsvarande bevarande i andra länder. Det idealiska vore att varje land ansvarar för att bevara sina nationella elektroniska online-publikationer, i likhet med den ansvarsfördelning som gäller för tryckta skrifter. Dit är emellertid steget långt, även om de andra nordiska länderna är på god väg.
Länkproblematiken är således ett viktigt område för det fortsatta utvecklingsarbetet, även på ett internationellt plan.
11.4. Ljud och rörliga bilder
Jag delar Pliktleveransutredningens uppfattning att typen av dokument inte skall ha betydelse då det gäller att bedöma värdet av information. Det är därför självklart att även inslagen av ljud och rörliga bilder måste samlas in och bevaras för framtiden. Om man bortser från enklare ljudillustrationer och rörliga datoranimationer, är det unika online-utbudet av ljud och rörliga bilder hittills relativt begränsat.
Det som finns av någon omfattning är parallelldistribution av sådant AV-material som även offentliggörs i annan form. Så distribuerar t.ex. den privata reklamradiostationen Radio Bandit sina sändningar både via etern och via Internet. Sveriges Radios nyhetssändningar finns tillgängliga på Internet med viss tidsförskjutning.
De kontinuerliga utsändningar via webben av ljud och rörliga bilder som görs i dag levereras som pliktexemplar på traditionellt sätt. De behöver enligt min mening inte samlas in fullständigt även från webben, men det är naturligtvis av intresse för forskningen att även få ta del av hur sändningarna presenteras på www i form av omgivande texter m.m.
Däremot är det av stor vikt att samla in och bevara sådant unikt material som beskrivs i avsnitt 6.3.5, exempelvis direktsända presskonferenser och liknande material.
11.5. Särskilt om databaser
Pliktleveransutredningen avvisade, i likhet med Biblioteksexemplarsutredningen, tanken på pliktleverans av online-databaser. Skälen var att en
sådan skulle medföra krav på framställning av en konstlad produkt enbart för att tillgodose lagens föreskrifter. Produkterna skulle sannolikt inte komma att efterfrågas av bibliotekens kunder. Formen för leverans skulle bli problematisk och kostnaderna för långtidsbevarande h öga.
Den förstnämnda utredningen förutsåg vidare stora svårigheter med att precisera vilka databaser som skulle vara leveranspliktiga. En principiellt omfattande leveransplikt förenad med antingen en rekvisitionsrätt eller vida dispensmöjligheter fann utredaren inte tillfredsställande, eftersom bestämmanderätten i alltför stor utsträckning skulle komma att överlåtas till bibliotek och arkiv. Leveransplikten skulle inte bli tillräckligt förutsebar och rekvisitions- eller dispensförfarandet skulle kunna uppfattas som orättvist.
Jag har i kartläggningsdelen redogjort för de speciella problem som rör pliktleverans eller annan form av insamling av online-databaser. Där framgår att det finns få internationella exempel där leveransplikt har använts för en systematisk insamling av sådant material. Erfarenheterna är således begränsade. Min definition av ”databas” framgår av avsnitt 4.2.
Jag gör den bedömningen att ett insamlande och inte minst ett långsiktigt bevarande av databaser kan komma att bli mer resurskrävande än insamlandet och bevarandet av övrig elektronisk online-information, eftersom de ofta innehåller mycket stora mängder information.
Informationen som hålls tillgänglig i databaser kan existera i tre grundläggande former: som en online-databas, som ett fixerat elektroniskt dokument (företrädesvis cd-rom) samt i pappersform. De två sistnämnda formerna omfattas av nuvarande pliktexemplarslag. Utvecklingen går mot att publicering i form av cd-rom i många fall ersätts av distribution via nät.
Enligt min mening är det önskvärt att samhället bevarar även den information som finns i dessa databaser. Detta gäller i synnerhet om informationen inte tillhandahålls i någon annan form. Jag finner det helt enkelt svårt att motivera varför en databas på cd-rom skall omfattas av pliktexemplarslagen, men falla utanför lagen om producenten väljer att enbart tillhandahålla den via online-förbindelse.
Om databaserna inte samlas in och bevaras, riskerar vi en utveckling där den framtida forskningen inte kommer att kunna få tillgång till värdefullt källmaterial.
Urval eller fullständighet
Insamling av samtliga i landet allmänt tillgängliga databaser torde dock medföra vissa hanteringsproblem vid den mottagande institutionen. Dessutom skulle en sådan totalinsamling sannolikt kräva tillskott av om-
fattande ekonomiska resurser. Även här bör således ett urval komma i fråga.
En gräns bör dras mot sådana databaser som faller inom arkivverkets område. Den information i form av allmänna handlingar som tillhandahålls via databaser som produceras av statliga och kommunala myndigheter omfattas av 2 kap. tryckfrihetsförordningen (TF) och arkivlagen (1990:782). Exempel på sådana databaser är Rixlex, Libris, Spar och bilregistret. Ansvaret för att bevara informationen i dessa databaser bör även i fortsättningen åvila Riksarkivet med landsarkiven och de kommunala arkivmyndigheterna. Vissa av de databaser som produceras av statliga och kommunala myndigheter är dock av sådan karaktär att de bör insamlas inom ramen för pliktexemplarssystemet. Jag avser här främst sådana databaser som med traditionell teknik hade producerats som leveranspliktiga dokument.
Beträffande de databaser som faller utanför 2 kap. TF och arkivlagens område gör jag den bedömningen att de bör samlas in om de inte publiceras i en sådan form att de i dag omfattas av pliktexemplarslagen, exempelvis som cd-rom eller som tryckt skrift.
Det bör påpekas att jag här åsyftar själva den allmänt tillgängliga
databasen, inte den utgivning i annan form som eventuellt gjorts av de
enskilda posterna eller bidragen. Exempelvis bör databaser som Mediearkivet och PressText, vilka innehåller tidningsartiklar, kunna bli föremål för insamling eftersom dessa databaser inte tillhandahålls på något annat sätt. Att själva artiklarna varit publicerade i olika dagstidningar och därmed levererats som pliktexemplar saknar här betydelse.
När det gäller frågan om vilka databaser som skall vara föremål för insamling har jag ovan redogjort för min uppfattning att de databaser som faller inom Riksarkivets ansvarsområde i huvudsak bör exkluderas, liksom de baser som redan är föremål för leverans som dokument i fixerad form, exempelvis cd-rom eller disketter.
Av de databaser som återstår sedan dessa båda kategorier har exkluderats bör den mottagande institutionen, i enlighet med de övergripande målen för pliktleverans, sträva efter att samla in sådana baser som kan anses utgöra ”yttringar av svenskt liv, svenskt samhälle och svensk kultur”.
Frekvens för insamling
I Mackenzie-rapporten (avsnitt 7.2.1) redovisas olika huvudsakliga ambitionsnivåer när det gäller bevarande av informationen i databaser.
Författarna anser att online-databaser i princip bör samlas in med sådan frekvens att all information som funnits i publikationen under dess livslängd kan bevaras. Om kostnaderna för detta visar sig alltför stora, bör ett urvalsförfarande användas, som möjliggör ett bevarande av den första och sista versionen av publikationen.
Man kan skilja mellan databaser som förändras enbart genom att ny information läggs in och sådana databaser där den existerande informationen dessutom ändras eller raderas. Ett fullständigt bevarande av de sistnämnda databasernas innehåll skulle innebära att den mottagande institutionen regelbundet erhöll all ändringsinformation. Jag bedömer att ett sådant bevarande skulle vara alltför resurskrävande, i synnerhet som de allra flesta databaser torde inrymmas i den kategorin, och föreslår därför att en insamling görs med glesare intervall.
Jag är inte beredd att förespråka att man nöjer sig med att bevara den första och sista versionen av en databas, eftersom ingendera av dessa förmodligen ger en representativ bild av databasens innehåll. Den första versionen kan vara alltför rudimentär för att ha något större värde. Beträffande den sista versionen kan det bli problematiskt att samla in den på grund av att databasens ägare kan ha gått i konkurs eller på annat sätt blir svår att nå. Dessutom är risken stor att databasens kvalitet försämrats under den sista delen av sin livstid.
I stället föreslår jag att de databaser som det är önskvärt att bevara samlas in i sin helhet en gång per år, i den form och med det innehåll de har just då.
11.6. Övrig online-information
Beträffande övrig elektronisk information som den som nås via Usenet, BBS:er, e-postbaserade sändlistor m.m., dvs. sådan information som varken är tillgänglig via www eller är sådana databaser som åsyftas i avsnitt 11.5 gör jag följande bedömning.
Informationen är ofta framställd i Sverige, den är allmänt tillgänglig här i landet och den rör svenska förhållanden. I analogi med vad jag föreslår beträffande www-information i stort anser jag inte att informationsintresset för var och en av dessa kategorier motiverar ett fullständigt bevarande.
Enligt min bedömning är det tillräckligt att med hjälp av stickprov bevara ett begränsat urval av dessa kommunikationsformer.
11.7. Datorprogram och datorspel
I propositionen 1993/94:10 om pliktexemplar av dokument (s. 20) föreslog regeringen att datorprogram såsom operativsystem, kompilatorer, textbehandlingsprogram och administrativa program inte skulle omfattas av leveransplikt, eftersom de inte kan ”definieras som ett dokument som innehåller information av det slag som är av intresse i denna lag, nämligen för senare läsning, avlyssning eller visning. De måste i stället ses som redskap, med vars hjälp man utnyttjar datorn eller behandlar informationen. Ett datorprogram är egentligen en logisk följd av instruktioner som talar om för datorn hur den ska behandla inmatat material.” Lagen utformades i enlighet med regeringens förslag.
Genom ändring i 32 § pliktexemplarslagen 1995 klargjordes att vissa datorprogram i maskinläsbar form omfattas av leveransplikt, nämligen de som kan fordras för att användaren skall kunna tillgodogöra sig innehållet i ett dokument för elektronisk återgivning. I propositionen 1995/96:71 som låg till grund för lagändringen uttalade regeringen att det enligt dess mening inte fanns skäl att utvidga leveransplikten så att datorprogram skulle omfattas av sådan plikt så snart de behandlas i t.ex. en manual som utgör en tryckt skrift.
Teknikutvecklingen har emellertid medfört att det är svårt att upprätthålla klara gränser mellan sådana dokument som innehåller programvara och sådana som innehåller information som är avsedd för senare avläsning, lyssning eller visning.
Beträffande video- eller dataspel hävdade Pliktleveransutredningen att dessa inte är att betrakta som dokument som innehåller information som är avsedd för senare läsning, avlyssning eller visning, utan snarare ”som ett slags tidsfördriv, om man så vill som leksaker” (s. 82).
Innehållet i och utformingen av dessa spel har förändrats så att det numera ofta är svårt att skilja mellan sådana spel som innehåller information i lagens mening och spel som enbart kan anses vara leksaker.
Det finns därför enligt min bedömning anledning att samla in och bevara fler dokument ur dessa båda kategorier än vad som hittills varit fallet. Någon lagändring behövs inte, eftersom dokumenten redan i dag torde rymmas under pliktexemplarslagen.
När det gäller datorprogram är detta helt i linje med den internationella utvecklingen. Som framgår av redovisningen i avsnitt 7.2.1 rekommenderas i Mackenzie-rapporten att sådana datorprogram som innehåller information skall inkluderas i pliktexemplarssystemet, vilket också är vad som föreslås i Finland. I Norge har nationalbiblioteket börjat samla in vissa datorprogram.
11.8. Elektroniska förlagor till tryckta skrifter
Direktiven ger i uppdrag att utreda om elektroniska förlagor till tryckta skrifter bör vara leveranspliktiga. Avsikten skulle vara att möjliggöra för KB att bygga upp fulltextdatabaser för att därigenom väsentligt öka sökbarheten för visst material.
De elektroniska förlagorna är i sig inte utgivna. De kan ses som förberedande led till den färdiga tryckta produkten. En lagreglering skulle således strida mot en av de ovan redovisade grundläggande utgångspunkterna, nämligen att materialet skall ha gjorts allmänt tillgängligt här i landet. Jag föreslår därför inte att elektroniska förlagor skall omfattas av lagstadgad leveransplikt. Även Pliktleveransutredningen prövade frågan och kom till samma slutsats.
Däremot anser jag att KB aktivt bör undersöka möjligheterna att få in sådant material genom frivilliga överenskommelser med producenterna. Särskilt gäller detta dagstidningar, där leveranser av elektroniska förlagor skulle kunna ersätta dagens omfattande och resurskrävande mikrofilmning, vilket på sikt kan medföra en omfattande kostnadsbesparing. Vid samtal med företrädare för Tidningsutgivarna (TU) angående förutsättningarna för att generellt ersätta mikrofilmningen med sådana elektroniska förlagor har framförts att tiden ännu inte är mogen för en sådan reform, i första hand hand på grund av bristande standardisering av lagringsformat. KB bör dock redan i dag undersöka möjligheten att ingå överenskommelser på frivillig väg med några tidningar i syfte att inleda en försöksverksamhet.
12. Metoder för insamlande
M itt förslag:
Allmänt tillgänglig online-information skall samlas in av
Kungl. biblioteket och Arkivet för ljud och bild med hjälp av robotteknik. Ett urval av allmänt tillgängliga online-databaser skall efter anmodan levereras till KB eller ALB.
12.1. Allmänna överväganden
Den elektroniska publiceringen befinner sig fortfarande i ett skede av snabb utveckling. Marknad och utbud förändras från dag till dag och det är mycket svårt att göra en framtidsprognos ens för de närmaste åren.
Som framgår av avsnitt 6.7 pågår arbete, både i Sverige och internationellt, för att strukturera och systematisera elektronisk information framför allt på webben. Ett aktivt arbete bedrivs för att utveckla internationella standarder på området.
Förhållandena kommer därför med stor sannolikhet att utvecklas och förändras då det gäller systemen för adressering, identifikation och beskrivning av elektronisk information, vilka kan komma att påverka förutsättningarna för insamlingsmetoder, urval och lagstiftning. Alltför preciserade förslag angående vilket material som skall samlas in och bevaras kommer troligen snabbt att behöva revideras.
Även tekniken för insamling, lagring och migrering befinner sig ännu i ett tidigt skede. Olika format och standarder avlöser varandra i snabb takt. Metoder för avsökning, insamling, indexering, lagring och bevarande utvecklas och förfinas. Alla försök att ange detaljerade tekniska föreskrifter och anvisningar om hur insamlingen skall gå till, eller på vilken typ av bärare informationen bör lagras, är sannolikt dömda att inom kort bli föråldrade.
Ambitionen bör därför vara att få en så öppen lösning som möjligt. Det är önskvärt att undvika detaljreglering och i stället ge mer allmänna riktlinjer och rekommendationer för insamling och bevarande enligt de grundläggande förutsättningar som gäller för leveransplikt.
Utrymme måste därefter lämnas åt ansvariga institutioner att i takt med utvecklingen ta fram väl definierade urvalskriterier, anpassa rutiner
och system för ett effektivt insamlande, bevarande och tillhandahållande samt att vid behov utfärda föreskrifter.
KB driver sedan något år ett, även med internationella mått, avancerat utvecklingsarbete i projektet Kulturarw3 för att samla in och bevara den elektroniska information som publiceras på Internet. I ett första skede har man uteslutande ägnat sig åt att samla information från webben. I kommande faser av projektet avser man att utveckla metoder och rutiner för återvinning av den insamlade informationen, tillhandahållande och det långsiktiga bevarandet. Erfarenheterna från detta projekt har varit vägledande för mina fortsatta överväganden.
12.2. Alternativa lösningar
Beträffande insamling av de olika kategorier av elektronisk information som behandlats i föregående avsnitt kan tre huvudsakliga metoder identifieras, vilka beskrivs nedan. För enkelhetens skull har jag i detta sammanhang valt att använda ordet ”leveranspliktig” som beteckning på den som är rättsligt ansvarig på producentsidan, trots att det inte alltid är fråga om leveranser i de alternativ som redovisas.
1 Leveransalternativet, dvs. pliktleverans på traditionellt sätt. Det innebär när det gäller sådan information som enbart tillhandahålls via online-förbindelse att den leveranspliktige åläggs att fixera informationen på en bärare (diskett, cd-rom, magnetband), som skickas in till den mottagande institutionen. En modifierad variant innebär att den leveranspliktige skickar in informationen via fil överföring. 2 Rekvisitionsalternativet, dvs. den leveranspliktige skickar in informationen efter rekvisition, antingen som ett fixerat dokument eller via fil-överföring. Den leveranspliktige är den som ombesörjer leveransen på uppmaning från myndigheten. 3 Robotalternativet, dvs. den mottagande institutionen samlar själv in informationen, t.ex. genom sökrobotar. Den som tillhandahåller informationen kan förhålla sig passiv. Ansvaret åvilar helt den insamlande institutionen.
12.2.1. Alternativ 1: Leveransalternativet
Leverans enligt alternativ 1 har den fördelen att man inlemmar det nya materialet i ett traditionellt och etablerat system. Av rättssäkerhetsskäl måste lagtexten klart ange vilka förpliktelser som drabbar en enskild. All information som publiceras på www kan i princip sägas vara likartad ur
teknisk och formell synvinkel. Jag har inte hittat några enkla kriterier som särskiljer det ”privata” materialet från det professionellt framställda. Stora informationsdatabaser och tonåringars hemsidor kan vara uppbyggda på samma sätt och ha samma sorts nätadress osv. I ingendera fallet ställs heller krav på att ange utgivare eller liknande. Det skulle därför stöta på stora svårigheter att i lagtext definiera vad som skall levereras mer fullständigt och för vilka kategorier som det räcker med ett urval. Som framgår av föregående avsnitt anser jag att ett urval bör komma i fråga för den elektroniska information som är allmänt tillgänglig via Internet. Då måste det av lagen klart och entydigt framgå, vilken information ett sådant urval avser. Eftersom det inte finns klart avgränsande formella eller tekniska kriterier uppstår här problem.
En lösning skulle kunna vara att leveransplikten görs generell för allmänt tillgänglig information. Den skulle då behöva kombineras med en omfattande dispensering från lagen, vilket inte är tilltalande från principiella utgångspunkter.
En annan lösning kan vara att i lagen specificera exakt vilken information som skall levereras. Följden blir en detaljerad lagreglering, som med all sannolikhet snabbt kommer att bli föråldrad.
Den publicering som sker på Internet skiljer sig på ett avgörande sätt från den traditionella publicering som sker i form av tryckta skrifter i den meningen att antalet potentiella utgivare är många gånger större. Även om ny teknik har medfört att många andra än etablerade tryckerier kan framställa skrifter så krävs ändå en sådan maskinell utrustning att privatpersoner endast i undantagsfall har möjlighet att själva ge ut tryckta skrifter.
Med Internetpubliceringen förhåller det sig annorlunda. I princip kan vem som helst etablera sig på nätet, till en kostnad som redan i dag är låg och som kan förväntas sjunka.
Förändringen kan uttryckas genom att det i dag finns mellan 3 000 och 4 000 producenter av tryckta skrifter enligt uppgift från KB. Antalet kan tyckas stort och kräver också stora informationsinsatser om pliktexemplarssystemet från KB:s sida. Men antalet tryckerier är ändå blygsamt mot antalet producenter av information på www i dag. KB har vid den insamling av webbsidor som gjordes våren 1998 hittat ca 30 000 webbservrar som rör svenska förhållanden. Enligt uppgifter från några av de större s.k. webbhotellen uppgår antalet svenska personliga hemsidor i augusti 1998 till över 225 00054.
Att kräva in leveranser från alla dessa producenter skulle kräva mycket stora insatser från de mottagande institutionernas sida. Även om man begränsar sig till de ”professionella” och ”semiprofessionella” pub-
54 Pitkänen, S., Egen sida en ny folkrörelse. - Metro, 11 augusti 1998, s. 14
likationerna, vilka dessutom blir svåra att identifiera, blir det här fråga om en mycket stor mängd presumtiva leverantörer. Det är heller inte sannolikt att täckningsgraden, dvs. mängden insamlad information i förhållande till den totala mängden allmänt tillgänglig information, skulle bli så hög som önskvärt.
Alternativet traditionell leverans skulle också innebära att den leveranspliktige, till skillnad från vad som gäller för övrigt leveranspliktigt material, tvingas framställa ett särskilt exemplar enbart för att uppfylla lagens föreskrifter. Detta kan medföra krav på särskild utrustning och särskilda rutiner, vilket kan innebära att den leveranspliktige drabbas av extra kostnader. Leveranserna kommer vidare sannolikt att ske på en rad olika bärare och i olika format och system, som kan vara svåra att hantera för den mottagande institutionen. Det kommer därvid att uppstå speciella svårigheter när materialet måste migreras.
Särskilt om databaser
Av avsnitt 11.5 framgår vilka databaser som enligt min bedömning är önskvärda att bevara. Alternativ 1, leveransalternativet, innebär antingen att producenten måste framställa ett särskilt exemplar av databasen på en särskild bärare (diskett, cd-rom, magnetband etc.) eller låta överföra databasen på elektronisk väg (s.k. filöverföring).
För att det skall vara möjligt för den mottagande institutionen att bevara informationen måste sannolikt antalet leveransformat begränsas. Det innebär att databasens innehåll måste levereras i ett format som är möjligt att konvertera vid den mottagande institutionen. Sådana anvisningar som kan fordras för att materialet skall kunna konverteras måste följaktligen också levereras.
I de fall man väljer att framställa ett särskilt exemplar uppstår en kostnad för producenten i form av arbetstid för kopiering, eventuell konvertering samt för lagringsmedium.
Alternativ 1 innebär en generell leveransplikt för de berörda databaserna. Detta kan i ett inledningsskede medföra problem för den mottagande institutionen eftersom det är material av en helt ny karaktär som kommer att levereras.
12.2.2. Alternativ 2: Rekvisitionsalternativet
Beträffande den information som tillhandahålls på www kan liknande argument som ovan anfördes mot alternativ 1 också anföras mot alternativ 2, dvs. leverans efter rekvisition från den mottagande institutionen.
Såväl informationsmässiga som tekniska och praktiska skäl talar emot en sådan lösning. Det gäller både det material där ett urval är tillräckligt och det material där ett mer fullständigt bevarande bör eftersträvas.
Särskilt om databaser
Liksom alternativ 1 (leveransalternativet) innebär alternativ 2 (rekvisitionsalternativet) att producenten antingen måste framställa ett särskilt exemplar av databasen på en särskild bärare (diskett, cd-rom, magnetband etc.) eller överföra innehållet på elektronisk väg.
För att det skall vara möjligt för den mottagande institutionen att bevara informationen måste sannolikt antalet leveransformat begränsas. Det innebär att databasens innehåll måste levereras i ett format som är möjligt att konvertera vid den mottagande institutionen. De anvisningar som kan fordras för att materialet skall kunna konverteras måste följaktligen också levereras.
För producenten uppstår samma kostnader som enligt alternativ 1. Den norska lagstiftningen anvisar detta alternativ som leveransform för online-databaser.
Den avgörande skillnaden gentemot leveransalternativet ligger givetvis i att den mottagande institutionen själv kan avgöra vilka databaser som skall levereras. Det innebär att den svåra inledningsfasen då rutiner för mottagning, kvalitetskontroll, konvertering m.m. skall utformas kan bli avsevärt lättare att hantera.
12.2.3. Alternativ 3: Robotalternativet
Den teknik som använts av KB i Kulturarw3-projektet visar att det går att samla in den information som publiceras på www på automatiserad väg med hjälp av en utvecklad sök- och insamlingsrobot. Projektet beskrivs i avsnitt 8.1. I bilaga 3 görs en teknisk beskrivning av hur roboten arbetar.
Projektets arbetssätt kan därför användas för att samla in den del av webbpubliceringen där ett urval bedömts vara tillräckligt. Urvalet kan då baseras på ett insamlande av all information som finns tillgänglig på www vid en given tidpunkt.
Insamlingen tar i dag lång tid, men ambitionen hos projektet är att insamlingstiden inte skall vara längre än en vecka. Med denna metod kan den insamlande myndigheten i stor utsträckning själv styra val av teknik, maskinutrustning och lagringsmedium. Detta ger bättre förutsättningar för det långsiktiga bevarandet och underlättar i hög grad en kommande
migrering. Metoden med robotinhämtning är ännu ny och tämligen oprövad i reguljär drift. Här finns naturligtvis en viss osäkerhet hur tekniken i framtiden kommer att utvecklas. Min bedömning är dock att en automatiserad metod även i fortsättningen kommer att kunna användas för detta ändamål.
Vad beträffar den information som publiceras på www där ett mer fullständigt bevarande bör eftersträvas kan roboten instrueras att besöka dessa webbplatser med betydligt tätare intervall. Det är svårt att föreslå något om robotens besöksfrekvens eftersom den kommer att vara beroende av hur ofta sidorna ändras på en viss webbplats. Extremfallet blir dagstidningar som måste besökas dagligen för att inte alltför mycket material skall hinna försvinna. Jag är medveten om att man inte kommer att uppnå ett hundraprocentigt insamlande med denna metod. Täckningsgraden skulle dock sannolikt bli tillfredsställande.
För att inte belastningen på dessa sistnämnda webbplatser skall bli alltför besvärande kan roboten instrueras att förlägga sina besök vid tidpunkter då utnyttjandet är lågt, exempelvis nattetid.
I de fall informationen är belagd med någon form av spärr för åtkomst, exempelvis lösenord eller avgiftsbeläggning, kan systemet kompletteras med skyldighet för den leveranspliktige att se till att den insamlande institutionens robot ges tillträde till informationen. På liknande sätt kan den leveranspliktige åläggas ett ansvar för att tekniska hinder inte sätts upp i avsikt att hindra roboten från att samla in informationen.
Särskilt om databaser
Som framgår av såväl avsnitt 6.4 som bilaga 3 är det i dagsläget oftast inte möjligt att samla in online-databaser med hjälp av robotteknik. Anledningen är att en robot i så fall skulle behöva instrueras att i databasens sökformulär söka på alla ord som förekommer i det aktuella språket för att vara säker på att all information i basen hämtas.
12.3. Sammanfattande bedömning
Av den lämnade redovisningen framgår att man måste skilja mellan databaser och övrig elektronisk publicering. När det gäller det sistnämnda materialet finner jag att det skulle vara helt omöjligt att införa ett krav på leverans i lagen, vare sig ett generellt krav eller ett krav förenat med undantag eller dispensmöjligheter. Skälet härtill är framför allt det överväldigande antalet producenter av information på www. Leveransskyldighet skulle innebära en orimlig belastning för både producenter och
mottagande institutioner. En begränsning av leveransskyldigheten genom undantag eller dispensmöjligheter hjälper inte nämnvärt. Systemet skulle krossas av sin egen tyngd.
Alternativet 2 (rekvisitionsalternativet) kan synas vara något mer hanterbart, men vid närmare betraktande torde även det vara ogenomförbart. Rätten att kräva leverans måste rimligen avse material som redan har tillgängliggjorts på nätet. Den tid under vilken materialet tillhandahålls är emellertid ofta begränsad och de för verksamheten ansvariga institutionerna kan därmed få stora svårigheter att hinna kräva in materialet innan detta försvinner. Och även om institutionerna handlar snabbt, kan producenten undgå leveransplikt genom att radera materialet.
Det enda alternativ som återstår är således alternativ 3 (robotalternativet). Ett genomförande torde visserligen kräva en ändring i upphovsrättslagen enligt min bedömning i avsnitt 14.1, men alternativet måste ändå betraktas som det enda praktiskt genomförbara. Jag förordar alltså att allt material som kan samlas in genom den robotteknik som har utvecklats skall samlas in genom institutionernas egen försorg. De institutioner som är aktuella i sammanhanget är Kungl. biblioteket (KB) och Arkivet för ljud och bild (ALB). Även Lunds universitetsbibliotek kan komma ifråga för framställning av säkerhetsexemplar. Dessa institutioner behöver medel för verksamheten, men något grundläggande lagstöd för denna behövs inte, bortsett från behovet av ändring i upphovsrättslagen.
Som nämnts i det föregående (avsnitt 11.1) upprättas för många informationstjänster spärrar för tillgång till tjänsten. Det ställs således krav på lösenord eller liknande och i vissa fall erhålls ett sådant endast mot en avgift. Trots sådana hinder för tillgängligheten måste informationen ofta anses vara tillgänglig för allmänheten. Det är enligt min mening inte rimligt att insamlandet av betydelsefullt material skall hindras av sådana spärrar och jag föreslår därför att KB och ALB skall ges en laglig rätt att begära att den som förfogar över spärren lämnar ut lösenord eller liknande så att institutionerna ges möjlighet att komma åt informationen. Jag skall utveckla ett förslag till ett sådant lagstöd i det följande (avsnitt 13).
Särskilt om databaser
Det är inte möjligt att samla in merparten av de databaser som förekommer i materialet genom att utnyttja robotalternativet. För databaser-
nas del måste man alltså välja antingen alternativ 1 (leveransalternativet) eller alternativ 2 (rekvisitionsalternativet).
Pliktleverans enligt alternativ 1 förutsätter en tydlig precisering av vilka databaser som skall vara föremål för pliktleverans eftersom de leveransskyldiga måste kunna läsa ut direkt från lagen huruvida leveransplikt föreligger eller inte. En generell leveransplikt skulle vidare behöva förenas med antingen omfattande undantagsbestämmelser eller ett omfattande dispenssystem, eftersom det enligt mina överväganden i det föregående är tillräckligt att ett visst urval av förekommande databaser samlas in och bevaras.
I dessa hänseenden har alternativ 2, rekvisitionsalternativet, vissa givna fördelar. Den omedelbara prövningen av leveranspliktens omfattning företas där av myndigheter, vilket ger möjligheter till mer allmänt hållna bestämmelser i lagtexten om leveransplikt, särskilt som leveransplikt bara skall komma i fråga i viss begränsad utsträckning inom de ramar som anges i lagen.
Min bedömning är att de insamlande institutionerna, det vill säga KB och ALB, kommer att organisera sin verksamhet så att så mycket information som möjligt insamlas på automatiserad väg. Det torde inte föreligga någon risk för ett överdrivet utnyttjande av rekvisitionsrätten, eftersom en robotinsamling blir mindre resurskrävande och mer effe ktiv.
Tidigare utredningar har mot ett system med rekvisitionsrätt invänt att det skulle kunna uppfattas som orättvist. Myndigheternas prövning av leveranspliktens omfattning avses emellertid inte bli slumpmässig utan den bör vila på sådana principer som anges i lagstiftningsärendet. Urval enligt sådana principer bör inte behöva uppfattas som mer orättvist än en lagstiftning med detaljerade undantag.
Mot ett system med leveransplikt i fråga om online-material har också invänts att det kan förutsätta att den leveranspliktige tvingas framställa ett särskilt exemplar enbart för att uppfylla leveransplikten. I och för sig instämmer jag i att man bör undvika ett system som har sådana konsekvenser. I det föregående (avsnitt 12.2.1) har jag påpekat att en leveransplikt som innebär att den leveranspliktige tvingas framställa ett särskilt exemplar kan medföra behov av särskild utrustning m.m. och därmed leda till extra kostnader. De databaser som är aktuella i det här sammanhanget har emellertid framställare som måste antas inneha erforderlig utrustning för exemplarframställning eller filöverföring, varför de extra kostnaderna bedöms bli mycket begränsade. Jag anser därför att den nämnda principen inte bör utgöra något hinder mot lev eransplikt.
För de databaser som inte kan samlas in genom robotalternativet föreslår jag således att insamlandet sker enligt alternativ 2 (rekvisitionsalternativet). I det följande (avsnitt 13) skall läggas fram förslag om den närmare utformningen av en leveransplikt.
13. Ändringar i pliktexemplarslagen
M itt förslag:
För att Kungl. biblioteket och Arkivet för ljud och bild
själva skall kunna samla in allmänt tillgängligt online-material krävs en ändring av pliktexemplarslagen så att dessa myndigheter ges rätt att kräva utlämnande av sådana lösenord som i vissa fall är en förutsättning för åtkomst. Kravet på att lämna ut lösenord skall myndigheterna rikta mot den som upprättat lösenordet eller den som tillhandahåller en tjänst för elektronisk förmedling av meddelanden. Vidare skall en ny bestämmelse tas in i pliktexemplarslagen om att två exemplar av sammanställningar (databaser) i digital form som gjorts tillgängliga för allmänheten skall lämnas som pliktexemplar på anmodan av den myndighet som regeringen bestämmer. Bestämmelserna i 14 § pliktexemplarslagen skall ändras så att sådana dokument för elektronisk återgivning som lagrar annat än text eller fast bild skall lämnas i åtta exemplar i stället för som tidigare ett.
13.1. Inledning
Förslagen i det föregående (avsnitt 12) innebär att Kungl. biblioteket (KB) och Arkivet för ljud och bild (ALB) med hjälp av robotteknik själva skall samla in ett urval av merparten av det material som finns på framför allt Internet. Det enda nya lagstöd för verksamheten som behövs är en rätt till exemplarframställning enligt upphovsrättslagen. Den frågan skall behandlas i det följande (avsnitt 14.1). I vissa fall kan emellertid möjligheterna att komma åt materialet begränsas genom krav på lösenord eller liknande, ibland kombinerat med ett krav på avgift. Enligt min bedömning i det föregående bör institutionerna ges rätt att kräva utlämnande av sådana lösenord. En sådan rätt är av något annan karaktär än de frågor som regleras i lagen (1993:1392) om pliktexemplar av dokument, pliktexemplarslagen. Frågorna har dock sådana beröringspunkter att det framstår som mest ändamålsenligt att regleringen sker i form av en komplettering i den lagen.
Databaser är ofta inte åtkomliga med robotteknik och i fråga om dessa innebär mina förslag i det föregående (avsnitt 12) att lagstiftningen skall kompletteras med en skyldighet att leverera sådana databaser på
begäran av myndighet. Leveransplikten avses kunna fullgöras antingen genom att ett magnetband eller annat lagringsmedium innehållande databasen levereras eller att databasens innehåll överförs på elektronisk väg. I de fall databasen levereras i fixerad form blir det alltså fråga om leverans i pliktexemplarslagens mening och reglerna föreslås därför tas in i pliktexemplarslagen genom en komplettering av bestämmelserna om de leveranspliktiga dokumenten.
Under utredningsarbetets gång har framförts önskemål om en ändring i pliktexemplarslagens bestämmelser om antalet exemplar som skall levereras av vissa dokument. Även den frågan skall tas upp till behandling i det följande.
13.2. Lösenord
Enligt min här redovisade bedömning bör förekomsten av krav på lösenord eller liknande, eventuellt kombinerat med krav på avgift, som förutsättning för tillgång till informationstjänsterna inte få utgöra hinder för de insamlande institutionerna att komma åt materialet. Pliktexemplarslagen bör därför kompletteras med en bestämmelse som ger rätt för den myndighet som regeringen bestämmer att kräva utlämnande av sådana lösenord utan avgift.
Verksamheten med robotinsamling avses att handhas av KB och ALB. Rätten att begära in lösenord bör därför i förordningen (1993:1439) om pliktexemplar av dokument ges åt båda dessa myndigheter. Någon uppdelning i lag av respektive myndighets behörighet torde inte erfordras. Självfallet måste myndigheterna samråda i frågan och underrätta varandra om förelägganden så att dubbla förelägganden undviks.
Utgångspunkten för verksamheten med att samla in elektronisk information är att denna är att betrakta som allmänt tillgänglig och rör svenska förhållanden. Krav på lösenord, eventuellt kombinerat med krav på avgift, innebär inte automatiskt att informationen upphör att vara att betrakta som allmänt tillgänglig. Det finns emellertid fall då kravet på lösenord är motiverat av ett önskemål om att begränsa informationen till en sluten krets. Det kan röra sig om företags intranät eller om elektroniska nätverk som används som rent privata kommunikationskanaler. I sådana fall kan det med fog göras gällande att materialet inte skall vara att betrakta som allmänt tillgängligt. Visserligen kan det uppstå gränsdragningsproblem, men det bör ändå vara tillräckligt att det i lagen anges som förutsättning för krav på utlämnande av lösenord att det skall röra sig om allmänt tillgänglig elektronisk information.
Den naturliga utgångspunkten synes vara att kravet på utlämnande av lösenord skall riktas mot den som har upprättat det. Det kan emellertid vara svårt för KB och ALB att få fram uppgifter om dessa personer, fysiska eller juridiska, varför det finns anledning att undersöka om det går att öppna en möjlighet för myndigheterna att välja en alternativ väg.
I lagen (1998:112) om ansvar för elektroniska anslagstavlor föreskrivs att den som tillhandahåller en elektronisk anslagstavla, det vill säga en tjänst för elektronisk förmedling av meddelanden, skall ha uppsikt över tjänsten. Tillhandahållaren skall också vara skyldig att lämna användare av tjänsten viss information och att ta bort vissa slag av meddelanden.
Här har alltså tillhandahållaren av tjänsten ålagts inte bara ett ansvar i förhållande till användaren av tjänsten utan också en skyldighet att ingripa i förhållande till denne. I analogi med den lagstiftningen bör det i det här sammanhanget finnas möjlighet att ålägga tillhandahållaren av tjänsten att lämna ut lösenord som upprättats av användaren.
En förutsättning för att motsvarande ordning skall kunna gälla här, således att ansvaret för utlämnande av lösenord läggs på den som tillhandahåller förmedlingstjänsten, är naturligtvis att denne disponerar över lösenordet och har rätt att lämna ut det. Även om detta kan antas vara förhållandet i ett flertal fall, finns det sannolikt exempel på det motsatta förhållandet, dvs. att den som upprättat lösenordet ensam disponerar över detta.
Jag föreslår därför att myndigheterna som ett alternativ till att ställa krav på upprättaren av lösenordet att lämna ut detta skall kunna vända sig till den som tillhandahåller den elektroniska anslagstavlan.
Den nu behandlade bestämmelsen om krav på utlämnande av lösenord bör tas in i pliktexemplarslagen i en ny paragraf under en särskild rubrik efter de gemensamma bestämmelserna om pliktexemplar i 32 och 33 §§.
Om den som åläggs att lämna ut ett lösenord inte följer åläggandet, bör vitesföreläggande kunna tillgripas. Bestämmelsen i 34 § pliktexemplarslagen bör således kompletteras i det hänseendet.
13.3. Databaser
Som nämnts är ett stort antal databaser av det slag som är av intresse att samla in oåtkomliga med tillgänglig robotteknik och här föreslås därför att myndighet skall kunna kräva leverans av sådana databaser.
Jag har hittills i min framställning använt begreppet databas och har därvid utgått från den definition av begreppet som finns i Europaparlamentets och rådets direktiv 96/9/EG om rättsligt skydd för databaser. I
direktivet avses med databas en samling av verk, data eller andra självständiga element som sammanställts på ett systematiskt och metodiskt sätt och som var för sig är tillgängliga genom elektroniska medier eller på något annat sätt. Vid genomförande av direktivet i svensk lagstiftning genom ändringar i upphovsrättslagen har man i stället valt att använda det hos oss vedertagna ordet sammanställning. Jag bedömer det som lämpligast att detta ord används även i pliktexemplarslagen.
I det här sammanhanget är det självfallet bara databaser eller sammanställningar i digital form som är aktuella. Såsom begreppen är bestämda är de mycket vida. I regeringens proposition 1996/97:111 Rättsligt skydd för databaser, m.m. (s. 16) ges exempel på systematiska samlingar, dvs. sammanställningar av verk, uppgifter eller annat material. I sådana sammanställningar kan finnas uppgifter om t.ex. recept, telefonnummer, tågtider eller valuta- och börskurser. Det kan också röra sig om annat material, t.ex. noveller, dikter, musikstycken eller fotografier. Som exempel på sammanställningar med uppgifter nämns telefonkataloger, tidtabeller, tidningsbilagor med veckans TV-program och turistbroschyrer med stadens restauranger. Exempel på sammanställningar med annat material än rena uppgifter är kalendrar, läseböcker, diktsamlingar, multimediaprodukter i digital form, samlingsskivor, tidningar, uppslagsverk och vetenskapliga publikationer med bidrag från flera författare.
Merparten av dessa sammanställningar kan finnas i digital form och uppenbarligen kommer ett mycket omfattande material av det som publiceras online att bli att hänföra till sammanställningar. Av min redovisning (avsnitt 11.5) för vilka typer av databaser (eller sammanställningar) som kan kräva stora resurser vid insamling och bevarande framgår att det endast torde vara ett begränsat antal av de ovan exemplifierade sammanställningarna som det finns anledning att kunna rekvirera. Jag har som exempel nämnt Mediearkivet och PressText. Det är emellertid svårt att göra någon precisering av begreppet sammanställning så att rekvisitionsrätten begränsas till de sammanställningar som avses. En formellt omfattande rekvisitionsrätt synes dock inte utgöra något allvarligt problem, eftersom det inte torde finnas någon risk för att den utnyttjas för att rekvirera andra sammanställningar än sådana som är av det exemplifierade slaget.
Vissa preciseringar av rekvisitionsrätten bör dock göras. Det bör således förutsättas att sammanställningarna har gjorts tillgängliga för allmänheten här i landet och att de rör svenska förhållanden.
Vidare bör den begränsningen göras att rekvisition inte får avse sammanställningar av vilka pliktexemplar skall lämnas enligt någon av de övriga bestämmelserna i pliktexemplarslagen.
Enligt mina i avsnitt 11.5 redovisade överväganden anser jag att det är tillräckligt att databaser eller sammanställningar som det finns anled-
ning att rekvirera samlas in i deras helhet en gång per år i den form och med det innehåll de har just då. Det är framför allt hänsynen till de för verksamheten ansvariga myndigheternas begränsade resurser som motiverar så pass glesa insamlingar och det saknas enligt min mening anledning att i lagtexten ta in några restriktioner av detta slag i rekvisitionsrätten.
Verksamheten med insamlande och bevarande av det digitala materialet avses skötas av KB och ALB. I och för sig skulle rekvisitionsrätten kunna anförtros endast endera myndigheten. I likhet med vad som föreslås i fråga om inkrävande av lösenord föreslås dock att båda myndigheterna skall ges rätt att begära in sammanställningar. Genom samråd undviks dubbla rekvisitioner.
Leveransskyldigheten bör åvila den som låtit göra sammanställningen tillgänglig här i landet. En bestämmelse om detta bör föras in i avsnittet om vem som skall lämna pliktexemplar i pliktexemparslagen. Antalet pliktexemplar bör kunna begränsas till två.
Sammanställningarna måste levereras i ett format som är möjligt att konvertera vid den mottagande institutionen, eftersom erfarenheterna visar att det ofta uppstår problem vid mottagning och bevarande. En möjlighet skulle kunna vara att låta den mottagande institutionen utfärda särskilda föreskrifter för leverans i analogi med de föreskrifter och allmänna råd som Riksarkivet utfärdat för överlämnande av ADBupptagningar (RA-FS 1997:7). För att inte binda utvecklingen bedömer jag dock att det är lämpligare att leverantör och mottagare ges möjlighet att på frivillig väg komma överens om leveransformat. I sista hand bör dock den mottagande institutionen ha bestämmanderätten och i rekvisitionen bör alltid leveransformatet anges. För att minimera kostnaderna för databasproducenten är det väsentligt att de insamlande institutionerna tar hänsyn till producentens tekniska miljö och att de själva har kapacitet att konvertera det mottagna materialet från ett flertal av de vanligast förekommande formaten.
Sådana anvisningar som kan fordras för att materialet skall kunna konverteras måste också levereras. Bestämmelser om detta finns i 32 § pliktexemplarslagen och dessa bestämmelser avses även bli tillämpliga på de här aktuella sammanställningarna.
13.4. Antalet pliktexemplar av vissa dokument för elektronisk återgivning
Enligt 14 § pliktexemplarslagen skall sådana dokument för elektronisk återgivning som lagrar annat än text eller fast bild lämnas i ett exemplar till ALB. Exempel på sådana dokument är s.k. multimedia, som oftast utges i form av cd-rom med ljud eller rörliga bilder.
Under utredningens arbete har från flera håll framförts att det är olyckligt att dessa dokument enbart skall levereras till ALB, eftersom det innebär att biblioteken därmed går miste om sådant material som av tradition är att hänföra dit. Som exempel kan nämnas uppslagsverk på cdrom som Nationalencyclopedin och Focus. Även om sådana produkter innehåller obetydliga ljudillustrationer eller avsnitt med rörliga bilder, skall de sålunda endast levereras i ett exemplar till ALB.
Jag delar åsikten att det är olyckligt att dessa dokument inte alls levereras till biblioteken som pliktexemplar.
Jag finner det samtidigt svårt att dra någon bestämd gräns för vilka dokument som bör anses tillhöra bibliotekssfären respektive ALB. Att exempelvis utforma lagstiftningen så att dokument som ”till övervägande delen” består av text skall levereras i sju exemplar till biblioteken medan övriga dokument skall lämnas i endast ett exemplar till ALB skulle medföra att den leveransskyldige tvingas till komplicerade bedömningar. Jag finner det principiellt olyckligt om den enskilde skulle riskera att bryta mot lagen genom att göra en felaktig bedömning.
Det skulle vara minst lika svårt att fastställa en exakt procentuell gräns för att skilja de båda kategorierna åt på grund av att ljud och rörliga bilder kräver ett betydligt större lagringsutrymme än text och fast bild. Fördelningen mellan dessa två kategorier framgår heller inte av förpackning eller annan dokumentation, varför den leveransskyldige skulle tvingas till en omfattande och tidskrävande teknisk inspektion av produkten.
I stället föreslår jag att leveransplikten för dessa dokument i fortsättningen omfattar åtta exemplar. Av dessa bör ett liksom tidigare lämnas till ALB och de andra sju lämnas till KB och Stockholms, Uppsala, Linköpings, Lunds, Göteborgs och Umeå universitetsbibliotek.
14. Möjligheterna att samla in och bevara datorbaserat material med hänsyn till upphovsrättslagen och personuppgiftslagen
M itt förslag:
För att göra det möjligt för KB, ALB och Lunds universi-
tetsbibliotek att samla in och bevara datorbaserat material kompletteras bestämmelserna i 16 § upphovsrättslagen med en bestämmelse som ger dessa institutioner rätt att framställa exemplar av verk som är tillgängliga via online-förbindelse. Bestämmelsen skall inte innehålla någon motsvarighet till förbudet i 16 § mot framställning av exemplar av datorprogram. Bestämmelsen i 21 § upphovsrättslagen om rätt till offentliga framföranden utan upphovsmannens tillstånd kompletteras dock med en bestämmelse om att detta inte gäller datorprogram.
14.1. Upphovsrättslagen
I enlighet med övervägandena i det föregående (avsnitt 12.3) förordas att insamlingen av det datorbaserade materialet med undantag för databaser i huvudsak skall ske genom KB:s och ALB:s egen försorg. KB och ALB avses således kopiera och bevara urval av det material som finns på i första hand Internet. Lunds universitetsbibliotek föreslås bevara ett säkerhetsexemplar av det insamlade materialet.
Det material som skall samlas in innehåller i stor utsträckning verk över vilka upphovsmännen enligt upphovsrättslagen (1960:729) har rätt att förfoga genom bl.a. att framställa exemplar av verket. När materialet uppträder på en institutions bildskärm anses något exemplar av verket inte ha framställts (jfr redovisningen i avsnitt 9.2). Insamling och bevarande av materialet förutsätter således att institutionen framställer exemplar av förekommande verk. Enligt 16 § upphovsrättslagen har arkivmyndigheter och bibliotek rätt att framställa exemplar av verk för bl.a. bevarande-, kompletterings- eller forskningsändamål. Rätten omfattar dock inte datorprogram.
Till en början kan konstateras att det i det material som avses bli insamlat kommer att finnas ett stort antal datorprogram. Dessa kan intesållas bort och även om detta vore möjligt, skulle det omintetgöra möjligheterna att ta del av stora delar av det insamlade materialet. En grundläggande förutsättning för att kunna bevara det kulturarv som finns online är således att exemplar av datorprogram kan framställas.
En upphovsman måste genom att göra ett verk tillgängligt för allmänheten ofta anses ha samtyckt till viss exemplarframställning. Så kan dock inte alltid anses vara fallet utan frågan får på vanligt sätt bedömas med beaktande av samtliga omständigheter (jfr regeringens uttalande i prop. 1996/97:111 Rättsligt skydd för databaser, m.m., s. 36). Det torde således inte vara möjligt att framställa exemplar av alla förekommande datorprogram under antagande av samtycke. Samtidigt bedöms det som praktiskt omöjligt att KB och ALB skulle företa en prövning av frågan om samtycke kan antas föreligga för varje enskilt datorprogram och i förekommande fall avstå från exemplarframställning eller inhämta upphovsmannens tillstånd. Jag finner det därför nödvändigt med en lagändring, som medger undantag från förbudet mot framställning av exemplar av datorprogram.
Innan jag lägger fram ett mera konkret förslag till lagändring finns det anledning att undersöka om en sådan lagändring är tillräcklig för att bibliotek och ALB med stöd av 16 § skall kunna framställa exemplar av det material som förekommer online.
Enligt 16 § första stycket 1 ges rätt att framställa exemplar av verk för bl.a. bevarandeändamål. Enligt förarbetena avses härmed sådan kopiering som måste ske för att materialet i samlingarna skall kunna bevaras intakt. Detta tyder på att tillämpningsområdet för bestämmelsen avses vara begränsat till internt material. För en sådan tolkning talar att det vid sidan av bevarandeändamål även nämns kompletterings- och forskningsändamål. Kompletteringsändamålet tar ju direkt sikte på externt material och den bestämmelsen skall enligt ett uttalande av riksdagens första lagutskott (NJA II 1961 s. 126) tolkas restriktivt. Om emellertid bevarandeändamålet skulle ge utrymme för exemplarframställning av både internt och externt material, skulle rätten till exemplarframställning för detta ändamål bli i princip obegränsad, varvid såväl kompletteringsändamålet som forskningsändamålet skulle sakna självständig betydelse. Övervägande skäl talar således för att exemplarframställning för bevarandeändamål bara får ske i fråga om material som redan finns i samlingarna och i sådana fall för att materialet i samlingarna skall kunna bevaras intakt.
Det material som är aktuellt i det här sammanhanget är av ett helt nytt slag, som det naturligtvis inte fanns möjlighet att beakta vid upphovsrättslagens tillkomst. Frågan om det kan anses tillåtet med fram-
ställning av exemplar av verk som förekommer i sådan form för bevarandeändamål synes inte ha varit föremål för prövning i rättstillämpningen. Det är alltså svårt att med bestämdhet uttala sig i frågan om tillåtligheten av exemplarframställning för bevarandeändamål. Framställning av exemplar av i princip allt som finns på t.ex. Internet synes dock vara av en helt annan karaktär och vila på andra motiv än den exemplarframställning som medges enligt 16 § upphovsrättslagen. Det finns alltså skäl som talar för att sådan exemplarframställning inte kan anses omfattas av den nämnda undantagsbestämmelsen. Det bör dock poängteras att det bland rättssakkunniga råder delade meningar i frågan.
Exemplarframställning för kompletteringsändamål avser visserligen att tillföra samlingarna sådant material som de inte innehåller tidigare, exempelvis svåråtkomligt utländskt material eller material som inte finns i handeln. Som nämnts skall bestämmelsen tolkas restriktivt. Således bör kopiering för kompletteringsändamål få ske bara om synnerliga skäl föreligger. Kopiering av hela böcker bör t.ex. som regel inte tillåtas. Det synes uppenbart att bestämmelsen inte kan åberopas som grund för exemplarframställning av sådant datorbaserat material som är aktuellt här.
Slutligen har arkiv och bibliotek rätt att framställa exemplar av verk för forskningsändamål. I vilken omfattning exemplarframställning skall anses tillåtlig för detta ändamål har inte utvecklats närmare i förarbetena till upphovsrättslagen. Rätten till exemplarframställning för detta ändamål måste dock förutsättas ligga i linje med rätten i fråga om de två andra ändamålen. Det finns därför anledning att utgå från att kopieringsrätten har sin grund i behovet av att vårda originalexemplaren i samlingarna och att det därför är exemplar av sådana verk som får framställas för forskningsändamål. Det synes därför finnas skäl att anta att inte heller denna bestämmelse kan åberopas som grund för framställning av exemplar av verk som finns i det här aktuella datorbaserade materialet.
Sammantaget finner jag att det är tveksamt om det i dag finns rättslig grund för arkivs och biblioteks möjligheter att framställa exemplar av verk som förekommer i det datorbaserade material som här avses.
Rättslig grund för exemplarframställning kan naturligtvis åstadkommas avtalsvägen. Med hänsyn till det stora antal upphovsmän som publicerar sig på framför allt Internet, av vilka många är privatpersoner, går det naturligtvis inte att åstadkomma avtal med varje enskild upphovsman. Förutsättningen för att avtal skall vara en framkomlig väg är därför att det finns organisationer som kan företräda upphovsmännen. Det torde dock vara nödvändigt att ett avtal ger institutionen rätt att framställa exemplar av verk av även andra upphovsmän än de som företräds av organisationen. För att uppnå detta krävs lagstiftning av det slag som gäller om avtalslicenser i upphovsrättslagen. En sådan lagstiftning går emellertid inte att genomföra innan den organisatoriska frågan på upp-
hovsmännens sida har ordnats, vilket kan ta en avsevärd tid i anspråk. Det bör också uppmärksammas att ett system med avtalslicenser torde förutsätta att upphovsmännen ges rätt till ersättning för institutionernas exemplarframställning.
Med hänsyn till att det i dag saknas förutsättningar för en avtalsreglering och till behovet av att institutionernas verksamhet med insamling och bevarande av det datorbaserade materialet kommer i gång så snart som möjligt finner jag att den enda framkomliga vägen är att upphovsrättslagen ändras så att möjligheterna till exemplarframställning vidgas och den oklarhet som i dag råder i fråga om rättsläget undanröjs.
Jag är medveten om att det kan finnas anledning att vänta med reformer av upphovsrättslagen i avbidan på EU-parlamentets och rådets nya direktiv. Men eftersom mitt uppdrag inte kan fullgöras på annat sätt ser jag mig nödsakad att lägga fram förslag till lagändring med visst bortseende från det kommande direktivet.
Jag föreslår således att bestämmelserna i 16 § upphovsrättslagen kompletteras med en bestämmelse om att vissa institutioner ges rätt att framställa exemplar av verk som är tillgängliga via online-förbindelse. Det finns ingen anledning att låta rätten till exemplarframställning tillkomma alla de arkiv och bibliotek som anges i 16 § utan rätten bör begränsas till vissa institutioner med ett nationellt bevarandeansvar, nämligen KB, Lunds universitetsbibliotek och ALB. Jag är medveten om det kan finnas behov hos arkivmyndigheter att omfattas av samma rätt. Det ligger dock utanför mitt uppdrag att lämna förslag rörande arkivmyndigheternas område.
Den nya bestämmelsen bör utformas så att den inte innehåller någon motsvarighet till förbudet i 16 § mot framställning av exemplar av datorprogram. När institutionerna har framställt exemplar av verk som förekommer över datanät har de rätt att enligt 16 § i det följande framställa nya exemplar av verken för bevarande eller forskningsändamål. För att den rätten skall omfatta även datorprogram av vilka exemplar sålunda har framställts föreslås en erforderlig ändring i 16 §.
De föreslagna lagändringarna kompliceras av att undantaget för datorprogram i 16 § grundar sig på ett EG-direktiv, rådets direktiv av den 14 maj 1991 om rättsligt skydd för datorprogram (91/250/EG), av vilket följer att arkiv och bibliotek inte får ges rätt att kopiera datorprogram. En lagändring torde därför behöva föregås av en ändring av EGdirektivet. Det kan anmärkas att EU-parlamentets och rådets förslag till nytt upphovsrättsligt direktiv inte avses påverka befintliga gemenskapsbestämmelser om skydd för datorprogram.
Även i andra länder arbetar man med de problem som är förknippade med bevarandet av det kulturarv som finns i form av datorbaserat material. Förbudet mot kopiering av datorprogram är således inte ett problem
som begränsas till Sverige. Det förordas därför att Sverige skall verka för en ändring av EG-direktivet.
Med hänsyn till de motiv som ligger bakom skyddet för datorprogram finner jag dock att andra stycket i 21 § upphovsrättslagen bör kompletteras med en bestämmelse om att rätten till offentligt framförande enligt paragrafens första stycke inte heller skall gälla datorprogram.
Eftersom det inte går att förutse hur lång tid det kan ta att få till stånd en ändring av EG-direktivet föreslås att lagändringen skall träda i kraft den dag regeringen bestämmer.
14.2. Personuppgiftslagen
Det datorbaserade material som avses bli insamlat av KB och ALB innehåller ett stort antal personuppgifter. Den planerade verksamheten förutsätter därför en behandling av personuppgifter i den kommande personuppgiftslagens mening. Eftersom det i lagen inte ställs något krav på att de uppgifter som behandlas skall vara strukturerade i ett register eller liknande blir lagen tillämplig på det aktuella materialet.
Till en början finns det anledning att beröra möjligheterna till tolkning av lagen. Lagen bygger på rådets direktiv 94/46/EG. I fråga om lagens förhållande till direktivet uttalas i propositionen 1997/98:44 bl.a. följande (s. 38):
Enligt EG:s rättsordning är det EG-domstolen som är exklusivt behörig att göra auktoritativa uttalanden om innebörden av EG:s rättsregler. Sverige har genom anslutningen till Europeiska unionen också förbundit sig att verka för en enhetlig tolkning och tillämpning av regler i EG-rätten. Genom det aktuella EG-direktivet har det dessutom inrättats en särskild arbetsgrupp med uppgifter som syftar till att bidra till en enhetlig tillämpning av de nationella bestämmelser som genomför direktivet. Av dessa skäl anser vi att regeringen i sin proposition till riksdagen i princip bör avstå från att uttala sig om hur direktivet i olika delar bör tolkas.
Propositionen ger alltså föga ledning vid tolkning av lagen. I anslutning till det citerade uttalandet sägs emellertid att de överväganden om tolkningen av EG-direktivet och av föreslagen lagtext som Datalagskommittén i betänkandet Integritet – Offentlighet – Informationsteknik (SOU 1997:39) hade redovisat dock kan utgöra en god grund för dem som har att tillämpa den nya lagen.
De grundläggande bestämmelserna om när behandling av personuppgifter är tillåten finns i 10 §. Enligt dessa bestämmelser får personuppgifter behandlas bara om den registrerade har lämnat sitt samtycke till behandlingen eller om behandlingen är nödvändig av vissa skäl, angivna i punkterna a–f.
Inhämtande av samtycke kan självfallet inte komma i fråga i samband med den insamling av material som avses här. För att det skall vara möjligt att behandla personppgifterna måste behandlingen således kunna betraktas som nödvändig enligt någon av de angivna punkterna. Uppräkningen i paragrafen stämmer överens med den uppräkning som i detta hänseende finns i artikel 7 i EG-direktivet. Uppräkningen är uttömmande. Det är främst punkterna b och d som kan tänkas vara tillämpliga i förevarande sammanhang.
Enligt punkten b får behandling utan samtycke ske, om behandlingen är nödvändig för att den personuppgiftsansvarige skall kunna fullgöra en rättslig skyldighet. Tillämplighet av detta undantag förutsätter att det i författningsbestämmelser ställs krav på att KB och ALB samlar in och bevarar datorbaserat material. Enligt Datalagskommittén är det dock osäkert huruvida författningsbestämmelser om myndigheters verksamhet kan anses grunda sådana rättsliga skyldigheter för myndigheten som avses i detta sammanhang (bet. s. 360).
Närmare till hands torde ligga att pröva den här aktuella behandlingen av personuppgifter mot punkten d enligt vilken behandling av personuppgifter utan samtycke får ske, om behandlingen är nödvändig för att en arbetsuppgift av allmänt intresse skall kunna utföras. Av utformningen av 13 § jämfört med EG-direktivet framgår att forskning och statistik är arbetsuppgifter som kan vara av allmänt intresse. Den insamling och det bevarande och tillhandahållande som avses med den nu aktuella verksamheten är motiverat av bl.a. forskningsändamål och måste således anses vara av allmänt intresse. Enligt 10 § skall behandlingen av personuppgifter vara nödvändig för att arbetsuppgiften skall kunna utföras. Detta krav torde vara uppfyllt i fråga om den nu aktuella verksamheten. Denna kan ju över huvud taget inte utföras utan att personuppgifter behandlas (jfr bet. s. 359). Den erforderliga behandlingen av personuppgifter måste därför betraktas som tillåten enligt 10 §.
Enligt 13 § är det förbjudet att behandla känsliga personuppgifter. Härmed avses dels personuppgifter som avslöjar ras eller etniskt ursprung, politiska åsikter, religiös eller filosofisk övertygelse, eller medlemskap i fackförening, dels personuppgifter som rör hälsa eller sexualliv. Det är oundvikligt att personuppgifter av detta slag kommer att finnas i det material som avses bli insamlat.
I 15–19 §§ anges vissa undantag från förbudet mot behandling av känsliga personuppgifter. Enligt 19 § får känsliga personuppgifter be-
handlas för forsknings- och statistikändamål. Med forskning avses i paragrafen i första hand den verksamhet som bedrivs vid etablerade institutioner, som universitet och högskolor eller privata, väletablerade forskningsinstitut. Släktforskning faller utanför, liksom annan forskning eller utredningsverksamhet av mera privat natur. Det måste finnas ett samhällsintresse av att forskningen bedrivs, och den måste vara vetenskaplig i någon mening (prop. 1997/98:44 s. 127). Den behandling av personuppgifter som är aktuell i det här sammanhanget måste anses ske för forskningsändamål och därmed torde undantagsbestämmelsen bli tillämplig på verksamheten.
I 19 § första stycket finns en avvägningsnorm. Det krävs för det första att behandlingen av personuppgifter för det aktuella forskningsändamålet är nödvändig enligt 10 §. I det föregående har konstaterats att så är fallet beträffande förevarande verksamhet. Vidare krävs att samhällsintresset av det forskningsprojekt vari behandlingen ingår klart väger över den risk för otillbörligt intrång i enskildas personliga integritet som behandlingen kan innebära.
Det är i första hand den personuppgiftsansvarige som har att på eget ansvar tillämpa avvägningsnormen. I 19 § andra stycket finns visserligen en möjlighet att få behandlingen godkänd av en forskningsetisk kommitté, varvid den personuppgiftsansvarige inte behöver göra någon egen avvägning, men ett sådant förfarande torde inte vara aktuellt i det här sammanhanget.
Det kan på goda grunder antas att den avvägning som skall göras enligt den nämnda normen för förevarande verksamhet utmynnar i att förutsättningarna enligt normen skall anses uppfyllda. Förbudet mot behandling av känsliga personuppgifter bör således inte medföra något hinder mot den här planerade verksamheten.
I överensstämmelse med direktivet finns i 10 § en skyddsregel om att personuppgifter som behandlas för bl.a. vetenskapliga ändamål får användas för att vidta åtgärder beträffande den registrerade bara under vissa förutsättningar. I den verksamhet som avses här torde det dock inte bli aktuellt att det vidtas åtgärder beträffande den registrerade.
I personuppgiftslagen finns även restriktioner såvitt avser behandlingen av personuppgifter om lagöverträdelser m.m. (21 §) och behandlingen av personnummer (22 §). Förbudet enligt 21 § gäller för andra än myndigheter och berör alltså inte KB och ALB som är myndigheter. Uppgifter om personnummer får utan samtycke behandlas bara när det är klart motiverat med hänsyn till bl.a. något beaktansvärt skäl. En insamling av material av här aktuellt slag bör kunna hänföras till ett sådant skäl.
I personuppgiftslagen finns även vissa grundläggande krav på behandlingen av personuppgifter som är av betydelse i det här samman-
hanget. Bl.a. föreskrivs i 9 § första stycket punkten i att den personuppgiftsansvarige skall se till att personuppgifter inte bevaras under en längre tid än vad som är nödvändigt med hänsyn till ändamålet med behandlingen. Lagring och behandling av personuppgifter för historiska, statistiska eller vetenskapliga ändamål är enligt tredje stycket särskilt gynnad, men inte heller i dessa fall får personuppgifterna bevaras under längre tid än vad som behövs för dessa ändamål.
Syftet med den här aktuella verksamheten är att materialet skall bevaras för alltid. Det kan synas tveksamt om uttrycket ”längre tid än vad som är nödvändigt med hänsyn till ändamålet med behandlingen” ger utrymme för ett så långtgående bevarande. Det finns dock skäl som talar för att så är fallet. Ändamålet med behandlingen kräver ju ett långsiktigt bevarande.
I 9 § första stycket g och h föreskrivs att det skall tillses att de personuppgifter som behandlas är riktiga och, om det är nödvändigt, aktuella samt att alla rimliga åtgärder skall vidtas för att rätta, blockera eller utplåna sådana personuppgifter som är felaktiga eller ofullständiga med hänsyn till ändamålen med behandlingen.
Vidtagande av rättelse i det här aktuella materialet skulle strida mot principerna för bevarandet och det bör kunna underlåtas eftersom det knappast kan sägas att det kan komma att finnas några personuppgifter som är felaktiga med hänsyn till ändamålet med behandlingen.
Sammantaget finner jag att den kommande personuppgiftslagen inte lägger hinder i vägen för kopiering och bevarande av det datorbaserade material som nu är aktuellt, men att den leder till viss begränsning i möjligheterna till tillgängliggörande av det insamlade materialet.
15. Möjligheterna att tillhandahålla materialet med hänsyn till upphovsrättslagen och personuppgiftslagen
M in bedömning:
Regleringen i både upphovsrättslagen och den kom-
mande personuppgiftslagen medför att tillhandahållandet av det datorbaserade material som har kopierats måste begränsas till forskare.
Yttrandefrihet och informationsfrihet är grundläggande värden i det svenska samhället. För att medborgarna skall kunna ha förutsättningar att delta i den demokratiska processen i form av inlägg i den allmänna debatten eller annan form av opinionsbildning krävs en god tillgång till information.
Från den utgångspunkten vore det därför önskvärt med fri tillgång till det insamlade materialet för var och en som har ett seriöst behov av informationen. Samtidigt är det viktigt att tillse att samhällets intresse av yttrandefrihet och informationsfrihet inte tillgodoses på ett sätt som gör intrång i det normala utnyttjandet av upphovsrättsligt skyddade verk eller oskäligt inkräktar på upphovsmannens legitima intressen. Ett väl fungerande skydd för upphovsrätten är en nödvändig förutsättning för samhällets konstnärliga, intellektuella och vetenskapliga utveckling.
En rimlig balans mellan upphovsmännens legitima krav på ersättning för sina prestationer och medborgarnas behov av tillgång till information är enligt min bedömning att man vid de institutioner som har ett nationellt bevarandeansvar kan få tillgång till den elektroniska informationen för forskning, men också för enskilt studium.
I de följande avsnitten (15.1 och 15.2) kommer jag att granska de rättsliga förutsättningarna för ett sådant tillhandahållande. I likhet med vad som gäller för insamlingen av det här aktuella materialet är det även beträffande tillhandahållandet främst två lagar som är aktuella, upphovsrättslagen och personuppgiftslagen.
15.1. Upphovsrättslagen
Till upphovsmannens ekonomiska rättigheter hör, förutom rätten att framställa exemplar, även rätten att göra verket tillgängligt för allmänheten. Den sistnämnda rätten består i rätten till offentligt framförande, spridningsrätten och visningsrätten.
Tillgängliggörande av verk som är aktuella i det här sammanhanget torde i huvudsak ske genom framförande av verket. Som nämnts tillkommer rätten till offentligt framförande upphovsmannen. I 21 § upphovsrättslagen anges emellertid under två punkter fall då ett offentligt framförande får ske utan tillstånd. Enligt punkten 1, som är aktuell i det här sammanhanget, får var och en framföra utgivna verk offentligt vid tillfällen där framförandet av sådana verk inte är det huvudsakliga, tillträdet är avgiftsfritt och anordnandet sker utan förvärvssyfte. Bestämmelsen gäller dock enligt paragrafens andra stycke inte sceniska verk och filmverk.
Undantagsregeln gäller utgivna verk. Enligt 8 § andra stycket anses verket utgivet, då exemplar därav med upphovsmannens samtycket blivit spridda till allmänheten. I bestämmelsen talas alltså om exemplar i pluralis. I Bernkonventionen (art. 3.3), vars bestämmelser får anses vara avgörande för tolkningen av den svenska lagens bestämmelse, anges utgivning (publicering) föreligga när ”exemplaren har gjorts tillgängliga på sådant sätt att, med beaktande av verkets art, allmänhetens rimliga behov blir tillfredsställt”. Detta tycks kunna ge stöd för antagandet att digitalt överförda verk skall anses som utgivna. Frågan är dock tveksam, vilket framgår av följande uttalande av Henry Olsson, Upphovsrättslagstiftningen En kommentar, 1:a uppl. 1996, s. 96:
Att utgivning förutsätter att exemplar har gjorts tillgängliga för allmänheten innebär att en utgivning – åtminstone enligt förhärskande uppfattning – inte kan anses föreligga exempelvis när ett outgivet verk överförs digitalt till mottagare som framställer egna exemplar av detta. På denna punkt pågår emellertid en livlig internationell diskussion.
För att undantagsregeln skall vara tillämplig krävs också att verket framförs vid tillfällen där framförandet av sådana verk inte är det huvudsakliga. Härmed avses enligt förarbetena exempelvis framförande av marschmusik vid militära parader, processioner eller vid olika andra evenemang, såsom idrottsevenemang och officiella högtidligheter. Här är musiken visserligen viktig men dock inte det huvudsakliga vid händelsen i fråga. Det är svårt att från dessa exempel dra några paralleller till de
fall då verk framförs i ett arkivs eller biblioteks lokaler genom att de visas på en bildskärm. Naturligtvis kan det sägas att framförande av de här aktuella verken inte är det huvudsakliga, men själva verksamheten att tillhandahålla verk av olika slag måste dock betraktas som det huvudsakliga i institutionernas verksamhet. Enligt min bedömning är därför undantagsregeln i 21 § inte tillämplig i förevarande fall.
Även om de nämnda förutsättningarna för regelns tillämplighet skulle anses vara uppfyllda, leder det absoluta förbudet mot framförande av filmverk till problem. Begreppet filmverk är så vitt att det material som är aktuellt i det här sammanhanget kommer att innehålla en stor mängd sådana verk, som är svåra att vid ett framförande separera från övriga verk. Följden torde i praktiken bli att institutionen måste begränsa möjligheterna till framförande i mycket stor utsträckning.
I det föregående har jag föreslagit att inskränkningen i upphovsmannens rätt till offentligt framförande inte heller skall omfatta datorprogram. Även denna begränsning av undantagsbestämmelsen torde leda till att denna, om den skulle anses tillämplig, får en mycket begränsad praktisk betydelse.
Den nu redovisade bedömningen innebär att institutionerna inte har rätt att framföra de här aktuella verken offentligt. Framförandet måste därför begränsas så att det inte är att betrakta som offentligt. Upphovsmannens ensamrätt gäller nämligen enbart offentligt framförande. Andra fall av framförandet omfattas över huvud taget inte av upphovsrättslagens bestämmelser. Frågan inställer sig då om en begränsning av framförandet till forskare kan medföra att framförandet inte är att betrakta som offentligt.
Pliktleveransutredningen konstaterade i betänkandet Pliktleverans (SOU 1992:92) att de upphovsrättsliga reglerna innebar att restriktivitet måste iakttas vid tillhandahållande av ljud- och bildmaterial hos ALB, varför personkretsen vid uppspelning måste begränsas till forskare (bet. s. 154). Enligt den gällande förordningen (1993:1439) om pliktexemplar av dokument förutsätts ALB hålla det förvarade materialet tillgängligt (6 §). I överensstämmelse med Pliktleveransutredningens ståndpunkt torde därvid förutsättas att tillhandahållandet begränsas till forskare, vilket måste innebära att framförandet därigenom inte anses vara offentligt. Jag har ingen anledning att inta någon annan ståndpunkt.
Det bör avslutningsvis påpekas att när den upphovsrättsliga skyddstiden har gått ut, 70 år efter upphovsmannens död, föreligger inga restriktioner för tillhandahållandet. Med upphovsmannens tillstånd finns naturligtvis också möjlighet till ett utvidgat tillhandahållande.
15.2. Personuppgiftslagen
Jag har vid bedömningen i det föregående (avsnitt 14.2) av frågan om den här aktuella verksamhetens förenlighet med den kommande personuppgiftslagen utgått från att den behandling av känsliga personuppgifter som är nödvändig måste anses ske för forskningsändamål. Tillåtligheten av behandling av känsliga personuppgifter måste därvid förutsätta att personuppgifterna inte lämnas ut till andra än forskare. För tillhandahållandet av material som inte innehåller känsliga personuppgifter gäller dock de något mindre restriktiva reglerna i 10 § personuppgiftslagen.
Jag vill slutligen konstatera att för sådant material där uppgifterna hänför sig till avlidna personer innebär personuppgiftslagen inga restriktioner för tillhandahållandet.
15.3. Tillgång till det insamlade materialet
Jag har i det ovanstående redovisat att jag finner det rimligt att den insamlade elektroniska informationen inte enbart blir tillgänglig för forskning, utan också för enskilda studier.
Det kan synas paradoxalt att det insamlade materialet skulle behöva omgärdas med särskilda restriktioner, eftersom det ju ofta tillhandahållits helt fritt på Internet. Min prövning av de rättsliga förutsättningarna för att tillhandahålla den elektroniska information som samlats in visar dock att det endast kommer att vara möjligt att låta forskare ta del av materialet. Som framgått av avsnitt 14.1 ser jag inte avtal som en möjlighet för detta material. För att kunna vidga kretsen av användare utöver forskare skulle därför ytterligare förändringar av såväl upphovsrättslagen som personuppgiftslagen vara nödvändiga. Jag har inte sett detta som en framkomlig väg. För forskning finns dock inga geografiska restriktioner, utan forskare i hela landet kan få tillgång till informationen genom fjärrlån eller annan överföring.
För tryckta skrifter gäller att de fritt kan tillhandahållas vid KB och universitetsbiblioteken. De elektroniska medierna blir däremot endast tillgängliga för forskare. Det är enligt min mening otillfredsställande att medborgarnas möjligheter att ta del av publicerad information skall vara beroende av medium och publiceringsform. I en kommande översyn av lagstiftningen på området bör strävan vara att sådana skillnader undanröjs. Inom den Europeiska unionen pågår diskussioner om ändrade regler med anledning av den nya informationstekniken. Här bör Sverige arbeta för att sådana förändringar inte vidtas, som leder till att medborgarnas tillgång till information försämras.
16. Organisation
16.1. Vem skall samla in?
För insamling och bevarande av den elektroniska online-informationen förutsätter jag att nuvarande myndighetsstruktur och ansvarsgränser kvarstår. KB har ansvaret för text och fasta bilder medan ALB har ansvar för det audiovisuella materialet. Enklare ljudillustrationer eller datoranimerade rörliga bilder bör inte medföra att informationen faller under ALB:s ansvarsområde. Det måste gälla sådan information där ljudet och/eller de rörliga bilderna är det huvudsakliga innehållet. Den insamling som jag föreslår skall ske fyra gånger per år utförs av KB. AVmaterialet skickas sedan vidare till ALB. För det mer fullständiga urvalet bör båda myndigheterna ha resurser att själva svara för insamling. En förutsättning för att insamlingen skall kunna ske centraliserat är att det sker ett närmare samarbete i pågående och framtida utvecklingsprojekt.
Samma fördelning bör gälla för databaser. KB ges ansvar för att rekvirera, ta emot och bevara databaser som innehåller text och/eller fast bild. För databaser där det huvudsakliga innehållet utgörs av ljud och/eller rörliga bilder ges motsvarande ansvar till ALB.
Kriterier för att fastställa hur fördelningen skall ske bör utarbetas i samråd mellan KB och ALB.
16.2. Fördelningen av exemplar
Jag föreslår som framgår av avsnitt 12.3 att vissa databaser antingen skall levereras som pliktexemplar i två exemplar, eller överföras på elektronisk väg till de mottagande institutionerna. I det fallet bör ett exemplar överlämnas till Lunds universitetsbibliotek.
I det följande behandlar jag den online-information som KB och ALB enligt mina förslag skall samla in på automatiserad väg.
Anledningen till att tryckta skrifter levereras i sju exemplar är att lagstiftaren velat försäkra sig om en geografisk rättvisa för medborgarna samt främja forskning och studier. Tack vare fjärrlånesystemet och det s.k. sambiblioteket kan i princip varje medborgare, oberoende av bostadsort, ta del av varje skrift som ges ut här i landet.
Det nu framlagda förslaget innebär en principiell förändring och ett trendbrott. Pliktleverans har av tradition varit det sätt på vilket de sex universitetsbiblioteken förvärvat svenskt tryck. Detta material har också gjorts tillgängligt för folkbiblioteken över hela landet genom fjärrlån. Nu undantas en kategori därför att den publiceras i en ny form och berörs av andra rättsregler. Material publicerat på detta sätt kommer sannolikt att visa sig bli allt viktigare för studier och allmän information.
De dokument som innehåller ljud- och rörliga bilder levereras i ett exemplar till ALB. Anledningen till skillnaden i antalet exemplar mellan de olika dokumenttyperna är av ekonomisk och praktisk natur, inte principiell.
När det gäller den elektroniska online-information som samlats in av KB och ALB är det inte antalet exemplar som är avgörande för tillgängligheten. Om informationen finns bevarad på ett ställe i landet kan den tillhandahållas via nätverksförbindelse.
I betänkandet Pliktleverans behandlas frågan om säkerhetsexemplar (s. 91). Med säkerhetsexemplar avsåg utredaren ett exemplar som förvaras skyddat under mycket goda förhållanden och endast används som förlaga till en kopia om alla exemplar av publikationen försvunnit. Utredaren menade att det visserligen vore bra att ha säkerhetsexemplar, men att det skulle bli för dyrt.
Den elektroniska information som görs tillgänlig via onlineförbindelse är till sin natur flyktig. Det kommer i många fall att vara så att den kopia som finns vid KB eller ALB är den enda som finns kvar. Behovet av säkerhetsexemplar blir då naturligtvis extra angeläget. För information som huvudsakligen innehåller text och fasta bilder blir kostnaden för att framställa säkerhetsexemplar relativt låg. För ljud- och bildinformation däremot kan en sådan hantering bli förknippad med betydande kostnader, både för hantering och för själva lagringsmediet. För sådant material som samlas in av KB bör säkerhetsexemplar därför framställas. För sådant material som samlas in av ALB bör, i likhet med vad som gäller för ljud- och bildupptagningar i övrigt, av ekonomiska skäl tills vidare endast ett exemplar bevaras.
Jag föreslår att KB svarar för framställningen av säkerhetskopior, vilka sedan överlämnas till Lunds universitetsbibliotek. I likhet med vad som gäller för övriga dokument som biblioteken mottar genom pliktleverans bör detta exemplar tillhöra Lunds universitetsbibliotek.
17. Bevarandefrågor
Bevarandet av elektroniskt lagrad information ställer helt andra krav än bevarandet av tryckta skrifter. Dels är lagringsmediet mindre beständigt, dels blir de tekniska systemen och programvarorna som är en förutsättning för att informationen skall bli tillgänglig snabbt föråldrade. För att bevara informationen krävs kontinuerliga aktiva insatser med överföring till nya bärare och system, s.k. migrering (se avsnitt 7.2.1.).
Migrering av elektroniskt lagrad information har visserligen diskuterats inom arkiv- och biblioteksvärlden under de senaste åren, men mycket arbete återstår. Det kommer att krävas högt specialiserad kompetens för att utveckla automatiserade migreringsfunktioner för de varierande format som den elektroniska informationen lagras i. För att ta hand om de stora mängder som det blir tal om, krävs en väl utvecklad driftorganisation. I betänkandet (SOU 1992:92) Pliktleverans (s.180) föreslogs en utredning där KB, ALB och Riksarkivet skulle samarbeta för att ta reda på vilka behov av insatser som finns, vilken finansiering som behövs samt var och hur arbetet skall utföras. I propositionen 1992/93:1170 Forskning för kunskap och framsteg föreslogs att medel skulle anslås till KB för ett projekt med syfte att undersöka metoder att bevara främst elektroniska dokument. Projektet bedrevs av KB i nära samarbete med ALB och Riksarkivet, och i oktober 1995 presenterades rapporten Långsiktigt bevarande av elektroniska dokument55. Där gavs bl.a. rekommendationer om val av teknik, val av form, val av åtkomstmekanism och val av mekanism för tillgängliggörande.
Bevarandet av den elektroniska informationen är ett stort och växande problem, som påverkar många sektorer i samhället. Metoder och teknik för bevarandet kan sägas vara teoretiskt relativt väl underbyggda. När det gäller bevarande av den här typen av material finns dock i praktiken begränsade erfarenheter att bygga på.
Enligt min uppfattning kvarstår behovet av ett utredningsarbete på det här området. ALB, KB och Riksarkivet bör därför snarast ges i uppdrag att gemensamt utarbeta en kartläggning över problemets art och
55 Lindquist, M., Långsiktigt bevarande av elektroniska dokument : metoder och överväganden. Stockholm : Kungl. biblioteket, 1995 (Rapport / Kungl. biblioteket ; 22)
omfattning. Om det visar sig nödvändigt bör som ett nästa steg en särskild utredning tillsättas för att gå vidare med en fördjupad studie.
18. Framtida utveckling
Om man ser på några års sikt är det sannolikt att nya former för att sprida elektronisk information har uppstått. Jag har i avsnitt 6.2.5 identifierat individualiseringen av information samt konvergens av olika slag som två av de viktigaste utvecklingstendenserna. Individualiseringen tar sig uttryck i att mer och mer av den information som görs allmänt tillgänglig kan anpassas och skräddarsys för lokala eller personliga behov. Exempelvis utges de rikstäckande dagstidningarna för närvarande i upp till ett 15-tal olika editioner. Antalet editioner kan ha mångdubblats inom en inte alltför avlägsen framtid. Vidare kan videouthyrning ha ersatts av filmdatabaser, ur vilka kunderna själva överför önskade filmer för uppspelning i hemmet. Radio- och TV-sändningar som vi känner i dag kan åtminstone delvis ha ersatts av ett interaktivt sökande i lagrade programdatabaser. Var och en kan komponera sin egen TV-kväll.
Konvergensen mellan olika tjänster och publiceringsformer medför att gränserna mellan tidningar, radio, TV och andra aktörer kommer att bli otydliga. När överföringshastigheterna till hemmen så medger kommer rörliga bilder och ljud att användas i allt ökad utsträckning av t.ex. tidningsföretagen.
Allt detta kommer troligen att innebära att förutsättningarna för den nuvarande leveransplikten kommer att ändras. För att återknyta till det ovan anförda exemplet med dagstidningar så är det relativt okomplicerat att samla in och bevara alla 13 editioner av Aftonbladet som utkommer varje dag (uppgiften avser augusti 1998). Men situationen kan komma att radikalt förändras den dag Aftonbladet, eller någon annan tidning, ges ut i 500 lokalt framställda editioner eller då varje läsare sätter samman sin egen, personliga tidning.
Införandet av digital marksänd TV kommer vidare att utvidga möjligheterna att sända television, vilket med stor sannolikhet medför en kraftig volymökning hos ALB. Utvecklingen på radio- och TV-området kan föranleda ändringar i de lagar som styr leveransplikt av radio och TV. Konvergensutredningen (dir. 1997:95) utreder för närvarande behovet av en samordning mellan lagstiftningen för radio-, TV- och televerksamhet. Den skall också bedöma om det behövs ytterligare lagstiftning för att säkerställa yttrandefrihet, tillgänglighet och mångfald och för att
motverka skadliga konkurrensbegränsningar. De förslag som blir följden av konvergensutredningens arbete kan här komma att ha stor betydelse.
Även om mina förslag är avsedda att vara så öppna och teknikneutrala som möjligt kan nätet, eller näten, dessutom komma att struktureras och formaliseras så att det blir möjligt och önskvärt att applicera traditionellt pliktleveranstänkande på vissa elektroniska materialkategorier.
Det finns skäl att under den närmaste framtiden noga följa utvecklingen. Jag föreslår därför att de ansvariga myndigheterna får i uppdrag att vart tredje år göra en fördjupad utvärdering och kostnadsuppföljning av pliktexemplarssystemet och lämna förslag till eventuellt ändrad inriktning.
19. Kostnader och finansiering
I den tekniska rapporten (bilaga 3) finns beräkningar över vilka kostnader som uppstår till följd av mina förslag. Det är fråga om dels investerings- och utvecklingskostnader, dels driftkostnader för insamling, lagring, åtkomst och migrering. För investeringar beräknas närmare 10 mkr och för den årliga driften drygt 1,5 mkr. Beräkningarna grundar sig på dagens utbud och tekniska lösningar. Beloppen innehåller inte kostnader för indexering, beskrivning etc av det insamlade materialet.
Det är sannolikt att den ökade utgivningen av elektroniska dokument inte kommer att medföra en motsvarande minskning av traditionella publikationer. Det blir i stället en total ökning av mängden information. Det går därför inte att peka på besparingar inom ansvariga institutioner när det gäller den nuvarande hanteringen. De kostnader som uppstår som en konsekvens av en utökad insamlingsverksamhet måste därför finansieras på annat sätt. Eftersom de ansvariga institutionerna enligt mitt förslag själva kan styra hur mycket material de skall samla in bör frågan om kostnader och finansiering av den löpande hanteringen av elektronisk information ingå i den årliga budgetdialogen. Därvid får på sedvanligt sätt en diskussion föras om behov, prioriteringar och finansieringsalternativ.
19.1. Producenter
För insamlandet av merparten av den elektroniska online-informationen kommer producenterna inte att drabbas av några ökade kostnader, eftersom de enbart behöver tillse att KB och ALB:s robotar ges tillträde till informationen. I jämförelse med traditionella pliktleveranser innebär mina förslag att kostnaden för lagringsmediet överflyttas från producenten till den insamlande institutionen.
Eftersom tillhandahållandet enligt mitt förslag skall begränsas till forskningsändamål torde verksamheten inte heller innebära något nämnvärt försäljningsbortfall.
Beträffande de databaser som antingen skall levereras i form av pliktexemplar eller överföras på elektronisk väg kommer, i de fall man väljer att framställa ett särskilt exemplar, en kostnad att uppstå för pro-
ducenten i form av arbetstid för kopiering, eventuell konvertering samt för lagringsmedium. De databaser som är aktuella i det här sammanhanget har emellertid framställare som måste antas inneha erforderlig utrustning för exemplarframställning eller filöverföring, varför kostnaderna enligt min bedömning blir begränsade. De insamlande myndigheterna skall dock sträva efter att minimera producentens kostnader genom att ta erforderlig hänsyn till dennes tekniska miljö och själva ha kapacitet att ta emot materialet i flera vanligen förekommande format.
När det gäller sådana dokument för elektronisk återgivning som lagrar annat än text eller fast bild (företrädesvis multimediaprodukter på cd-rom) föreslår jag (avsnitt 13.4) att dessa skall levereras i åtta exemplar i stället för ett. Kostnaden för att framställa ytterligare sju exemplar av en cd-rom är relativt låg. Utbudet är i dag av den storleken att ett mindre antal titlar kommer att bli föremål för levererans. Jag gör därför den bedömningen att den totala kostnaden för producentsidan blir förhållandevis låg.
19.2. Kungl. biblioteket
Som framgår av tidigare avsnitt bygger mina förslag till största delen på att de utvecklingsprojekt som KB bedriver, i första hand Kulturarw3, kan fortsätta. För dessa projekt finns medel avsatta i KB:s budget både vad gäller kostnader för investeringar, utveckling och drift under 1998 och 1999. Under denna period behövs således ingen ytterligare finansiering. Många av de faktorer som behövs för att göra en mer detaljerad kostnadsanalys för tiden därefter är fortfarande okända, som t.ex. omfattningen av det material som skall tas om hand, vilken åtkomst som krävs och vilken teknisk standard som kommer att utvecklas. Det står dock klart att med utgångspunkt från dagens utbud och tekniska lösningar kommer hanteringen av den elektroniska online-informationen att medföra ökade årliga driftkostnader för KB på minst 1,5 mkr. Jag har då räknat med att KB bär kostnaden för att framställa det säkerhetsexemplar som skall överlämnas till Lunds universitetsbibliotek.
En förändring av rutinerna beträffande hanteringen av dagstidningar så att den kostnadskrävande mikrofilmningen kan minska och till vis del ersättas av leveranser av digitalt lagrade tidningssidor (se avsnitt 11.8) kommer sannolikt att på sikt frigöra resurser som åtminstone delvis kan täcka dessa tillkommande kostnader.
19.3. Lunds universitetsbibliotek
Enligt min modell skall KB och ALB svara för insamling och lagring och tillhandahållande av materialet, medan Lunds universitetsbibliotek får ansvar för att bevara säkerhetsexemplar av det material som samlats in av KB.
För Lunds universitetsbibliotek kommer vissa kostnader för lagring och hantering att uppstå. Dessa är emellertid svåra att i dagsläget beräkna, men jag gör den bedömningen att de, åtminstone i ett inledande skede, kommer att vara relativt begränsade. Dessa kostnader bör beaktas i den utvärdering jag föreslår skall ske vart tredje år. Framställningen av säkerhetsexemplaret kan ske centralt vid KB och det blir då endast fråga om att vid Lunds universitetsbibliotek bereda utrymme för mindre än hundra magnetband per år.
Jag har inte räknat med något behov av bandrobot eller liknande i Lund, eftersom det exemplar som förvaras där utgör ett säkerhetsexemplar som endast skall användas i undantagsfall.
Det är först då säkerhetskopiorna skall migreras som större kostnader kommer att uppstå. Det rimliga bör dock vara att även migreringsarbetet sköts centralt. Jag föreslår i avsnitt 17 att ALB, KB och Riksarkivet gemensamt skall utreda frågor som rör det långsiktiga bevarandet av elektronisk information. I detta uppdrag bör även ingå att belysa frågan om migrering av de nationella säkerhetsexemplaren.
19.4. Arkivet för ljud och bild
I mitt förslag skall ALB få ansvar för urval och insamling av den audiovisuella delen av den elektroniska online-informationen. Eftersom utbudet av ljud och rörliga bilder hittills varit relativt begränsat har ALB inte haft anledning att på egen hand utveckla rutiner och metoder för automatisk insamling av webbmaterial. Det finns dock skäl att anta att en större andel av den elektroniska online-informationen i framtiden kommer att bestå av ljud och rörliga bilder. För att kunna utföra sitt uppdrag bör ALB därför snarast ges möjlighet att bygga upp en egen utvecklingsverksamhet på det här området. Det är angeläget att arbetet samordnas med de utvecklingsprojekt som bedrivs inom KB. ALB har i sin fördjupade anslagsframställning för 1997-1999 redovisat behov av medel för FoU-verksamhet och beräknat de årliga kostnaderna för denna till 1,2 mkr.
Beträffande de framtida kostnaderna för insamling, lagring, tillhandahållande och migrering av den ljud- och bildinformation som är tillgänglig online kan det bara bli fråga om spekulationer. Det finns inga
tillförlitliga prognoser om hur omfattningen av ljud- och bildupptagningar på webben kommer att förändras. Det kan dock konstateras att elektronisk lagring av ljud och framför allt rörliga bilder är mycket utrymmeskrävande och därmed betydligt dyrare än lagring av textinfo rmation.
20. Författningskommentar
20.1. Förslaget till lag om ändring i lagen (1960:729) om upphovsrätt till litterära och konstnärliga verk
Förslaget såvitt avser denna lag har behandlats i den allmänna motiveringen, avsnitt 14.
16 § De arkiv och bibliotek som avses i tredje och fjärde styckena
har rätt att framställa exemplar av verk, dock inte andra datorprogram än sådana som avses i 16 a §,
1. för bevarande-, kompletterings- eller forskningsändamål,
2. för utlämning till lånesökande av enskilda artiklar eller korta avsnitt eller av material som av säkerhetsskäl inte bör utlämnas i original eller
3. för användning i läsapparater. I de fall som avses i första stycket 2 och 3 får exemplar framställas endast genom reprografiskt förfarande.
Rätt till exemplarframställning enligt denna paragraf har
1. de statliga och kommunala arkivmyndigheterna,
2. Arkivet för ljud och bild,
3. de vetenskapliga bibliotek och fackbibliotek som drivs av det allmänna samt
4. folkbiblioteken. Regeringen får i enskilda fall besluta att vissa andra arkiv och bibliotek än de som anges i tredje stycket skall ha rätt till exemplarframställning enligt denna paragraf.
Ändringen innebär att undantaget för datorprogram i rätten till exemplarframställning enligt paragrafen inte gäller datorprogram av vilka Kungl.biblioteket, Lunds universitetsbibliotek och Arkivet för ljud och bild har framställt exemplar enligt den nya 16 a §.
Kungl. biblioteket, Lunds universitetsbibliotek och Arkivet för
16 a §
ljud och bild har rätt att framställa exemplar av verk som förekommer i elektronisk form över datanät.
Paragrafen är ny. Enligt 16 § upphovsrättslagen har vissa arkiv och bibliotek rätt att framställa exemplar av verk, dock inte datorprogram, för bl.a. bevarande-, kompletterings- eller forskningsändamål. I förevarande paragraf ges Kungl. biblioteket, Lunds universitetsbibliotek och Arkivet för ljud och bild även en rätt att framställa exemplar av verk som förekommer i elektronisk form över datanät. Något undantag för datorprogram görs inte. Även exemplar av sådana får alltså framställas.
Var och en får framföra utgivna verk offentligt
21 §
1. vid tillfällen där framförandet av sådana verk inte är det huvudsakliga, tillträdet är avgiftsfritt och anordnandet sker utan förvärvssyfte samt
2. vid undervisning eller gudstjänst. Första stycket gäller inte sceniska verk, filmverk och datorprogram av vilka exemplar har framställts med stöd av 16 a § samt ger inte rätt att sända ut verk i ljudradio eller television.
Första stycket 2 ger inte rätt att i förvärvssyfte framföra sammanställningar vid undervisning.
I paragrafens andra stycket har undantagen från framföranderätten enligt första stycket kompletterats med datorprogram av vilka exemplar har framställts med stöd av den nya 16 a §.
20.2. Förslaget till ändring i lagen (1993:1392) om pliktexemplar av dokument
Förslaget såvitt avser denna lag har behandlats i den allmänna motiveringen, avsnitt 13.
Av fonogram som har framställts här i landet i minst 50 exemplar
14 §
och som har gjorts tillgängligt för allmänheten här skall ett pliktexemplar lämnas.
Av fonogram som har framställts utomlands och har gjorts tillgängligt för allmänheten här i landet i minst 50 exemplar skall ett pliktexemplar lämnas, om fonogrammet rör svenska förhållanden.
Vad som sägs om fonogram i första och andra styckena skall tilllämpas även på dokument för elektronisk återgivning som är av annat slag än som avses i 10 § och som inte är videogram eller fonogram. I stället för ett skall dock åtta pliktexemplar lämnas.
Föreskrifterna i denna paragraf gäller inte om annat följer av 15 § eller av vad som föreskrivs om kombinerat material i 16 och 17 §§.
Ändringen i paragrafen består i att det i tredje stycket föreskrivs att det av de dokument för elektronisk återgivning som anges där skall lämnas åtta pliktexemplar i stället för, som tidigare, ett. Föreskrifter om till vem pliktexemplaren skall lämnas finns i 25 §.
Av sammanställning som föreligger i digital form och som har
18 a §
gjorts tillgänglig för allmänheten här i landet över datanät och rör svenska förhållanden skall på anmodan av den myndighet som regeringen bestämmer två pliktexemplar lämnas, om det inte i anmodan medges att sammanställningen överförs på elektronisk väg.
Föreskrifterna i första stycket gäller inte sammanställning varav pliktexemplar skall lämnas enligt någon av de föregående paragraferna.
I en anmodan enligt första stycket att lämna pliktexemplar skall, under hänsynstagande till leverantörens tekniska och ekonomiska möjligheter, anges i vilket format sammanställningen skall lämnas.
Paragrafen är ny. Med sammanställning avses detsamma som i lagen (1960:729) om upphovsrätt till litterära och konstnärliga verk (exempelvis 12 och 21 §§). Begreppet där har i huvudsak samma innebörd som begreppet databas i Europaparlamentets och rådets direktiv 96/9/EG om rättsligt skydd för databaser. Med sammanställning avses således en samling av verk, data eller andra självständiga element som sammanställts på ett systematiskt och metodiskt sätt.
Enligt paragrafens första stycke skall två pliktexemplar av sammanställning som föreligger i digital form lämnas på anmodan av den myndighet som regeringen bestämmer. Förutsättning för leveransplikt är att sammanställningen har gjorts tillgänglig här i landet över datanät och rör svenska förhållanden.
För att en anmodan att lämna pliktexemplar skall kunna efterkommas krävs att särskilda dokument framställs. Ofta kan det både för den som skall lämna sammanställningen och den mottagande myndigheten vara enklare att överlämnandet sker genom överföring på elektronisk väg. I en anmodan om pliktleverans kan medges att överlämnandet i stället sker på ett sådant sätt.
Om innehållet i den sammanställning som har gjorts tillgänglig över datanät överensstämmer med innehållet i en sammanställning som skall överlämnas som pliktexemplar enligt bestämmelserna i de föregående paragraferna i lagen, får pliktleverans inte åläggas enligt förevarande paragraf.
För den mottagande myndigheten är det angeläget att sammanställningen levereras i ett format som är möjligt att konvertera. I första hand bör myndigheten samråda med den leveranspliktige i frågan om format. Om parterna inte kan komma överens, är det myndigheten som har bestämmanderätten. Vid prövningen av frågan om format skall dock myndigheten beakta leverantörens tekniska och ekonomiska möjligheter. Det måste tillses att leveransplikten inte blir alltför betungande.
Regler om till vem anmodan skall riktas finns i 23 a §. I en anmodan enligt paragrafen att överlämna en sammanställning som pliktexemplar eller på elektronisk väg skall självfallet anges till vilken myndighet leveransen skall ske.
23 a § Lämnande av pliktexemplar eller överföring på elektronisk väg
av sammanställning i digital form åligger den som låtit göra sammanställningen tillgänglig för allmänheten här i landet.
I paragrafen, som är ny, ges föreskrifter om vem som ansvarar för överlämnande av pliktexemplar eller överföring på elektronisk väg av sammanställning i digital form.
Pliktexemplar av film, videogram, fonogram eller av upptagning
25 §
av ljudradio- och televisionsprogram skall lämnas till Arkivet för ljud och bild.
Av pliktexemplar av dokument för elektronisk återgivning som är av annat slag än som avses i 10 § och som inte är videogram eller fonogram skall ett exemplar lämnas till Arkivet för ljud och bild samt ett exemplar till vart och ett av Kungl. biblioteket och Stockholms, Uppsala, Linköpings, Lunds, Göteborgs och Umeå universitetsbibliotek.
Enligt ändringen i 14 § tredje stycket skall åtta pliktexemplar av dokument som avses där lämnas i stället för som tidigare ett. Förevarande paragraf har ändrats så att det i ett nytt andra stycke anges till vem exemplaren av de nämnda dokumenten skall lämnas.
33 a § Om tillgång till lösenord eller liknande utgör förutsättning för
tillgång till elektronisk information som görs tillgänglig för allmänheten här i landet över datanät och som rör svenska förhållanden, skall lösenordet på anmodan av den myndighet som regeringen bestämmer
lämnas ut av den som upprättat lösenordet eller som tillhandahåller den tjänst för elektronisk förmedling av meddelanden där informationen finns.
Paragrafen är ny. Bestämmelsen har sin bakgrund i att Kungl. biblioteket (KB) och Arkivet för ljud och bild (ALB) avses samla in och bevara elektronisk information som görs tillgänglig för allmänheten här i landet över datanät. I vissa fall behövs tillgång till lösenord för att den eftersökta informationen skall kunna nås. Enligt förevarande paragraf ges den myndighet som regeringen bestämmer rätt att kräva utlämnande av ett sådant lösenord.
Kravet på utlämnande av lösenordet skall riktas till den som har upprättat det. Det kan emellertid ofta vara svårt för myndigheten att inhämta uppgift om vem denne är. Enligt paragrafen kan därför kravet alternativt riktas till den som tillhandahåller den tjänst för elektronisk förmedling av meddelanden där informationen finns. En sådan tjänst benämns i lagen (1998:112) om ansvar för elektroniska anslagstavlor för elektronisk anslagstavla.
Om kravet inte följs, kan vitesföreläggande utfärdas enligt 34 §. Vid handläggningen av vitesföreläggande är lagen (1985:206) om viten tilllämplig. Enligt 2 § andra stycket den lagen får vite inte föreläggas, om adressaten kan antas sakna faktisk eller rättslig möjlighet att följa föreläggandet. Innan krav på utlämnande av lösenord enligt förevarande paragraf ställs mot den som tillhandahåller en elektronisk anslagstavla måste således tillses att adressaten verkligen har möjlighet att lämna ut lösenordet.
Den som åsidosätter skyldigheten att lämna pliktexemplar enligt
34 §
denna lag eller att lämna ut lösenord på anmodan kan av den myndighet som regeringen bestämmer vid vite föreläggas att fullgöra sin skyldighet.
Ändringen innebär att vitesföreläggande kan tillgripas även mot den som åsidosätter skyldigheten att på anmodan enligt 33 a § lämna ut lösenord.
Kommittédirektiv
Översyn av pliktexemplarslagen
Dir 1998:92
Beslut vid regeringssammanträde den 10 oktober 1996
Sammanfattning av uppdraget
En särskild utredare tillkallas för att göra en förutsättningslös översyn av lagen (1993:1392) om pliktexemplar av dokument (pliktexemplarslagen).
Mot bakgrund av de snabba informationstekniska förändringarna avseende offentliggörande av dokument, skall utredaren överväga och, om det behövs, föreslå ändringar i pliktexemplarslagen i syfte att säkra förutsättningarna för forskning och för bevarande och tillhandahållande av kulturarvet.
Bakgrund
Enligt pliktexemplarslagen skall exemplar av dokument lämnas till vissa bibliotek och arkiv för att där bevaras och tillhandahållas för forskning och studier. Med dokument avses här ett föremål som lagrar information för senare läsning, avlyssning eller visning.
Den lagstadgade leveransplikten omfattar bl.a. vissa typer av elektroniska dokument, nämligen sådana som finns i fixerad form och i utgåvor som kan köpas, lånas, osv. såsom cd-rom, disketter, videogram och fonogram.
Däremot omfattas inte information som görs tillgänglig via s.k. on line-förbindelse och inte heller elektroniska dokument som utgör underlag för tryckt material.
Syftet med pliktexemplarslagen är att bevara och tillhandahålla yttringar av svenskt liv, svenskt samhälle och svensk kultur för eftervärlden och att ge kunskap om och insyn i vårt samhälle. Detta främjar ett fritt meningsutbyte, en fri och allsidig upplysning och ett fritt konstnärligt skapande, visar vår egenart och ger oss vår identitet i Europa och världen (prop. 1993/94:10 s. 17).
Som en följd av den snabba utvecklingen inom såväl tryckeri- som informationstekniken kommer en allt större del av det framtida informationsflödet inte att omfattas av pliktexemplarslagen i dess nuvarande utformning.
Detta problem uppmärksammades av kulturutskottet i betänkandet Pliktexemplarslagen, m.m. (bet. 1995/96:KrU4).
Utskottet konstaterade att information allt oftare lagras enbart digitalt. Det är inte ovanligt att material såsom vetenskapliga uppsatser, tidskrifter m.m. endast finns tillgängligt via datanät. Elektroniska dokument, som inte lagrar information i fixerad form utan är tillgängliga endast genom direktkoppling, är inte leveranspliktiga enligt pliktexemplarslagen. Samtidigt blir datanäten, främst via Internet, tillgängliga för allt fler medborgare.
Utvecklingen av tryckeri- och informationstekniken innebär bl.a. att allt fler dokument aldrig får fixerad form i pliktexemplarslagens mening. Som en följd härav minskar möjligheterna att tillgodose det syfte som ligger bakom reglerna i pliktexemplarslagen. Med gällande lagstiftning kommer en allt större del av informationsflödet i framtiden inte att omfattas av reglerna om leveransplikt. Utskottet föreslog därför att riksdagen skulle ge regeringen till känna att en förutsättningslös översyn skulle göras av pliktexemplarslagen. Riksdagen beslöt i december 1995 i enlighet härmed (rskr. 1995/96:60).
Pliktexemplarslagen har under de senaste decennierna utretts flera gånger, vilket resulterat i betänkandena SOU 1974:94 Bevara ljud och bild, DsU 1975:4 Dagspress på mikrofilm, DsU 1977:12 Pliktexemplar av skrift, SOU 1987:51 Ljud och bild till eftervärlden, SOU 1989:89 Översyn av lagen om pliktexemplar samt SOU 1992:92 Pliktleverans.
Den senaste utredningen, Pliktleveransutredningen, redovisade alltså sina förslag i betänkandet SOU 1992:92 Pliktleverans. Detta låg till grund för den nu gällande pliktexemplarslagen (prop. 1993/94:10, bet. 1993/94:KrU8, rskr. 1993/94:25). Med anledning av den snabba utveckling av tryckeri- och informationstekniken, som skett sedan dess, och för att i möjlig mån förhindra att material i allt högre utsträckning undanhålls forskningen liksom att delar av kulturarvet förloras, bör, som riksdagen uttalat, hithörande frågor åter utredas.
Inom flera länder arbetar man med likartade legala frågeställningar. Utredningar pågår i bl.a. England och Danmark.
Uppdraget
Utredaren skall överväga huruvida sådan elektronisk information som inte omfattas av de nuvarande bestämmelserna i pliktexemplarslagen
skall vara föremål för leveransplikt i framtiden. Tekniska frågor om hur leveranserna skall ske skall även utredas.
Om utredaren bedömer att sådan leveransplikt bör införas, skall omfattningen av denna, hur den skall utformas samt vem som skall fullgöra leveransplikten, utredas. Förslag till ändring av pliktexemplarslagen skall lämnas. Med hänvisning till den stora mängden material finns det skäl att under utredningsarbetet beakta att leveransplikten inte får bli så omfattande att den i praktiken blir svår att utträtthålla. Härvidlag skall även kostnadsaspekten såväl för staten som för leverantörerna av pliktmaterial beaktas. Förslag till finansiering skall lämnas till eventuellt utökade kostnader. Utredaren skall även beakta de upphovsrättsliga aspekterna av en utvidgad pliktleverans.
Utredaren skall ta ställning till om leveransplikten skall gälla för elektroniska dokument som utgör underlag för sådant tryckt material, som nu är leveranspliktigt.
Arbetet skall bedrivas förutsättningslöst. Samråd skall ske med kommittéer och arbetsgrupper inom det informationstekniska området.
Utredaren bör följa pågående utredningar i andra länder. De pliktexemplarsregler som redan finns i andra länder, främst inom Norden, Europarådet och EU, skall uppmärksammas.
För utredningsarbetet gäller regeringens direktiv till samtliga kommittéer och särskilda utredare angående redovisning av regionalpolitiska konsekvenser (dir. 1992:50), om att pröva offentliga åtaganden (dir. 1994:23), om att redovisa jämställdhetspolitiska konsekvenser (dir. 1994:124) samt om att redovisa konsekvenser för brottsligheten och det brottsförebyggande arbetet (dir. 1996:49).
Redovisning av uppdraget
Utredaren skall redovisa sitt uppdrag senast den 1 september 1998.
(Utbildningsdepartementet)
Elektronisk publicering
Karl-Erik Tallmo
Mars 1998
1 Kort historik om elektroniska publikationer
1.1 Begreppet elektronisk publikation
Redan frågan vad elektronisk publicering innebär är inte helt oproblematisk. Åsyftar man exempelvis att överföra ord eller text med elektroniska medel, så skulle ju radio passa in här. Begränsar man det till digital överföring, kan man börja tala om datanätverk som videotex eller Minitel, och kan det vara analog överföring av text med elektroniska medel, så skulle man kanske kunna inkludera telex och text-TV. Även om man inte räknar radio som elektronisk publicering, så kanske man räknar distribution av radioprogram i form av ljudfiler på Internet som en sorts publicering. Gränserna är alltså något diffusa och beror på från vilket håll och med vilket synsätt man nalkas företeelsen.
Meddelandena bör till att börja med inte vara bilaterala förbindelser från person till person eller företag till företag, utan ord, bild eller text som görs tillgängligt för flera – elektroniska anslag, nyhetsbrev, översikter, handböcker, scheman etc.
Nationalencyklopedin definierar elektronisk publicering som utgivning eller offentliggörande av material i elektronisk form, dvs. i en form som kräver elektronisk apparatur för att läsaren/användaren skall kunna tillgodogöra sig materialet. Och det kanske inte är en så dum definition, för då får man med även print-on-demand, trots att sista ledet i den publikationsformen inte innebär läsning på skärm eller med hjälp av någon annan apparatur, utan på en pappersutskrift. Det är rimligt att man räknar med print-on-demand, eftersom det är en distributionsform som bygger på den nya informationstekniken och samtidigt ändrar på många av den traditionella publiceringens villkor när det gäller upplagor och lagerhållning, tillgänglighet, uppdateringsmöjli gheter osv.
Men då kan man ju fråga sig: om elektronisk publicering alltså kan förekomma med tryck på papper som slutprodukt, kan vilken bok eller tidskrift som helst gjord med desktop publishing-metoder eller elektronisk prepress räknas som elektronisk? För några år sedan användes uttrycket elektronisk publicering just för denna typ av trycksaksframställning (exv. fanns en tidskrift om desktop publishing vid slutet av 80-talet med just namnet ”Elektronisk publicering”, utgiven av Populär Kommunikation i Göteborg).
Personligen gissar jag att ju mer all publicering i alla stadier genomsyras av de nya teknikernas alla möjligheter, desto mer självklart blir det att hela processen kommer att räknas till elektronisk publicering – även
sådant som idag bara kallas prepress. Även de av framtidens böcker som binds in och trycks på papper kommer säkerligen att räknas till en annan era än Gutenbergs, därför att så många av bokens andra förutsättningar radikalt ändrats.
1.2 Utveckling
Den tidigaste formen av e-publicering förekom troligen på olika företags interna e-postsystem, liksom förstås på det tidiga Internet, under 70talet. Meddelanden som spreds centralt till alla medarbetare i en organisation eller brev med flera adressater, som skickades mellan de olika medarbetarna inbördes, kan betraktas som en form av publicering, ibland jämförbar med personaltidningar. Digital Equipment hade t.ex. i början av 80-talet ett e-postsystem för de anställda, som omfattade 120 000 personer i olika länder.1 I Sverige hade under 70-talet utvecklats datorstödd meddelandeväxling med systemet FORUM, senare konferenssystemet KOM, som utvecklades vid Stockholms Datacentral (QZ). Systemet utvecklades först för FOA:s räkning och spreds sedan det i hela högskolevärlden. Ett annat var MEMO, som skapades vid Volvo Data.
KOM-systemet blev förresten skådeplatsen för det första – och hittills enda – svenska rättsfallet gällande förtal, där brottet skett i ett digitalt medium. 1985 förde FOA-forskaren Eskil Block en diskussion om filmaren och debattören Maj Wechselmann och utpekade henne som sovjetisk spion. En KOM-användare skickade texten i fråga till Wechselmann som stämde Block. Han dömdes till 15 000 kronor i böter plus de egna och motpartens rättegångskostnader. Block ålades också att publicera domen på KOM-systemet.
På 70- och 80-talen fanns även en del föregångare till de onlinetjänster vi har i dag. Text-TV (teletext) startade i England 1976 med systemet Ceefax (=seefacts). Ungefär samtidigt uppstod Minitel i Frankrike. Videotex startades i Sverige 1982. Via videotexterminalerna (eller med ett speciellt kommunikationsprogram på en persondator) kunde man beställa t.ex. biljetter och taxi, annars bestod den rena publiceringen främst av olika katalogtjänster.
Vid den här tiden uppstod också de amerikanska onlinetjänsterna för persondatorägare, Compuserve, America Online etc., en sorts gigantiska BBS:er med diskussionsgrupper, onlineshopping, referenser i form av
1 Enligt Mary Jensen, tidigare på Digital Equipment, numera i Postens affärsutvecklingsgrupp, intervjuad i ”Pawlos prudentliga” 9708 på http://www.algonet. se/~mpawlo/pp9708.html
uppslagsverk och databaser, nyhetsförmedling, e-postfunktioner m.m. Compuserve existerade redan på 70-talet som ett tiddelningssystem (timesharing – en större dator delar sin tid mellan flera användare), men inspirerad av Europas videotex började man vid mitten av 80-talet att satsa mer på en onlinetjänst för den växande skaran PC-ägare. 1985 startades America Online och 1988 Prodigy. Även en del företags interna nätverk byggdes ut för att kunna betjäna t.ex. kunder och återförsäljare. Så hade t.ex. Apple sitt forum AppleLink under första halvan av 90-talet. Alla de här tjänsterna (utom Apples, som är helt nedlagd) tenderar att knytas alltmer till Internet. Här förekommer publicering i flera former: nyhetsutskick, nyhetsbrev, produktkataloger och anslag samt databaser, ofta exv. fulltextdatabaser med tidningsartiklar eller särskilda gateways till stora databasvärdar som Dialog/Knowledge Index. Här samsas – precis som på Internet – officiella och inofficiella publikationer, upphovsrättsligt skyddade och sådana som får användas fritt.
På t.ex. Compuserve och America Online, liksom på mängder av BBS:er, spreds enkla elektroniska fanzines (e-zines) och nyhetsbrev i rent ASCII-format. Det var oftast fritt att sprida dem vidare, vem som helst kunde ladda upp dem på sin egen server och därifrån tillhandahålla dem. Här fanns e-zines för hackers som exv. CDC (Cult of the Dead Cow, startad 1984), Phrack, och andra datororienterade publikationer som CUD (Computer Underground Digest), den mer rumsrena TidBIts för Macanvändare samt många andra mer generella som MOOSE och MiLK. Oftast fick man själv hämta (ladda ned) dem från en server eller en diskussionsgrupp.
För dem som inte hade tillgång till något datanätverk eller modemuppkoppling gjordes också många sådana här publikationer tillgängliga på diskett. Och på Internet kunde de erhållas genom ett prenumerationsförfarande, då man skickade in sin e-postadress till en mailrobot som sedan automatiskt skötte utskicken.
Någon gång runt 1983-84 kom de första cd-rom-skivorna. Under de tidiga åren gavs det mest ut börsinformation, vetenskapliga databaser, exv. kemisk-tekniska eller medicinska; varumärkesregister, bibliografier etc., av förlag som Silverplatter, McGraw-Hill, Compton, Bowker m.fl. Den stora katalogen The Cd-rom Directory (TFPL Publishing) innehöll 1986 48 titlar, 1995 var de 9 500 och 1997 19 000.
Inom företagen förekom tidigt dokumentation av arbetsprocesser, liksom handböcker i elektronisk form, ofta i helt egna format som utvecklats av företagets egen dataavdelning. Ericsson hade t.ex. tidigt hela sin dokumentation av AXE-växlarna på cd-rom.
En tidig humanistisk utgåva var ”Theasurus Linguae Graecae” med 700 klassiska grekiska texter som kom ut 1985. Året därpå kom ”Books in Print” på cd, liksom ”Grolier Encyclopedia” (som innehöll Academic
American Encyclopedias samtliga 21 volymer i en till en början huvudsakligen textbaserad version). Franska ordboken ”Grand Robert” kom på cd 1989 och ”Oxford English Dictionary” kom 1992.
Men går man till Libriskatalogen visar det sig att cd-skivor och disketter inte var de tidigast registrerade digitala publikationerna, de som kategoriserats som ”elektronisk resurs”. I Libris är den första elektroniska posten från 1962, ”American national election study” i en utgåva från University of Michigan i OSIRIS-format. De tidiga filerna är ofta olika statistiska undersökningar. Den första svenskspråkiga posten är Jörgen Westerståhls ”Gruvstrejkens behandling i radio och TV” från 1970, utgiven av Göteborgs universitet (också OSIRIS). 1987 kom flexskivan (floppy disk) ”Förteckning över författningar rörande Gotland 1276-1900” av Ingvar Engeström, utgivare Argus i Visby.
Den första svenska cd-rom-skivan, Termdok, utgavs 1987 av Walters Lexikon i samarbete med Tekniska nomenklaturcentralen. Den första upplagan av Termdok på cd-rom innehöll 25 000 tekniska termer och definitioner samt 100 000 översättningar till engelska, franska, tyska, danska, norska, finska och spanska.
Uttrycket elektronisk bok är inte så nytt. Redan för 25 år sedan använde Andries van Dam vid amerikanska Brown University termen för alla dokument som spreds och var avsedda att läsas på datorskärm. Vid slutet av 80-talet florerade en mängd projekt för elektronisk läsning och dokumentproduktion, både läsapparater och olika format. Ofta försökte tillverkarna låsa användarna till det företagsegna formatet.
En viktig händelse i den elektroniska publiceringens historia var förstås när Charles Goldfarb skapade textmärkningsspråket SGML (Standard Generalized Markup Language). Avsikten var att kunna beskriva en texts struktur, med hjälp av olika märkkoder för rubrik, underrubrik, bildtext, citat, litteraturhänvisning etc. Tanken var bl.a. att göra informationen oberoende av program och datorplattform och samtidigt möjlig att återanvända, texten skulle kunna presenteras på bildskärm, som syntetiskt tal, blindskrift eller fogas in i ett desktop publishingprograms redan färdiga typografimallar för vidare befordran till konventionellt tryck. SGML blev ISO-standard 1986.
2Inom den humanistiska sektorn började man inom ramen för projektet Text Encoding Initative (TEI) tidigt använda SGML, och ett av de mera iögonenfallande resultaten av detta var Chadwyck-Healeys cd-utgåva 1992 av all engelsk poesi på ”The English Poetry Full-Text Database” med motsvarande 4 500 tryckta volymer på två skivor (paketet prissattes till 25 000 pund!).
2 SGML kan man läsa om i tidskriften ”TAG The SGML Newsletter” på http://tag.sgml.com/
1990 kom en del cd-rom skivor ut i Sverige med uppslagsverk, exv. Esseltes ”Engelsk-svensk, svensk-engelsk ordbok” och Stora Focus version 1. Verbum gav 1991 ut Nya testamentet på diskett, och 1992 kom min egen elektroniska originalroman ”Iakttagarens förmåga att ingripa” (tre disketter i en tryckt omslagskassett).
Ett par milstolpar i den svenska utgivningen var Sveriges Rikes lag på cd-rom(”CD-Lag”) som Fritzes gav ut 1993 och Libris på cd, som utkom 1992. Numera söker man i Libris främst via Internet. Vid 80talets slut sökte man ofta i sådana här databaser online via en företagsspecifik, kostsam, uppringd telnetförbindelse – i databaser som Dialog, Knowledge Index, Prophile, British Newspaper Index etc. Sedan kom en mellantid, när man skulle ha dem på cd, och nu finns mycket av detta på Internet. Vad som hänt under denna förflyttning från en fjärrförbindelse, till cd och till en annan fjärrförbindelse, nämligen Internet, är främst att priserna sjunkit kraftigt.
1992-93 var det också vanligt med konferensdokumentation på cd. Förutom när det förekommer mycket digitaliserad video, så är sådan dokumentation i dag vanligare på Internets World Wide Web. Det gäller då både förhandsinformation och information i efterhand till alla dem som inte kunnat närvara. Ibland förekommer även ”direktsändning”, nära nog omedelbar uppladdning på nätet av texter och bilder från konferenser, något som förstås inte var möjligt med cd.
Vid 90-talets början skapades också en hel del verktyg för tillverkning av hyperböcker. Amerikanska Voyager hade sitt Toolkit, Rune Körnefors och Lennart Lundberg vid Växjö högskola utvecklade 1990-1994 tillsammans med Apple Computer sitt Hyperbook Tools,3 och jag själv gav också ut ett enkelt verktyg under namnet ”Low Budget Hyperbook Tool” (1993). Alla dessa byggde på Macintosh Hypercard och utnyttjade en sorts bokmetafor i så måtto att texten visades mot bakgrund av en bild av en boksida. Bläddring och sökning gjordes oftast med hjälp av en s.k. flytande palett med knappar på – en sorts fjärrkontroll för boken.
Samtliga dessa verktyg var nog inspirerade av Bookbuilder, en Hypercardmall för e-boktillverkning utvecklad av Chris Pelkies vid Cornell University 1988.4 En del böcker och tidskrifter gavs nu ut på diskett, gjorda med verktyg av den här typen, exv. tidskriften Macintoshed Libraries (1990-96) och Hyperbole Magazine (1990-93), där Greg Roach's elektroniska roman ”The Madness of Roland” gick som följetong och
work in progress tills den slutligen publicerades i färdigt skick på cd-
rom 1993.
3 Se http://www.masda.hv.se/Multimedia/rapporter/HBTartikel.html4 Nibble Mac, volym 3, nummer 7, 1988.
Ett intressant verktyg är Storyspace, som säljs av Eastgate Systems. Det är ett system för Macintosh, där texter upp till 30 000 tecken kan skrivas in i ett fönster som representerar en hyperlänknod, sedan kan man skapa namngivna länkar mellan alla dokumenten i systemet och de kan också visas i olika grafiska översikter, trädstrukturer osv. Ett tidigt skönlitterärt verk som skapades med Storyspace var ”Afternoon, a story” av Michael Joyce, som kom 1989
.
Ofta försöker företagen tjäna royalty på verktygen. Voyagers Toolkit fick man inte använda gratis, och Sony tänkte sig nog att tjäna en slant på alla som använde sig av Sony Electronic Book Authoring System (SEBAS) för deras Bookman.
En rad format för elektroniska böcker skapades, Bellcore kallade sitt Superbook, Electronic Book Technologies kom med Dynatext, IBM lanserade Bookmaster och Interleaf WorldView. Mest kända blev dock NoHands Common Ground och Adobes Acrobat, eftersom de mera vände sig till PC-ägare och därmed till privatkunder och småföretag.
Electronic Book Viewer var ett format som var någorlunda populärt i i Tyskand och Japan vid 90-talets början. Franklin Digital Book System, är en s.k. personal digital assistant, som används en del inom bl.a. medicinen. 1991 gav Franklin också ut en elektronisk Bibel med thesaurus och möjlighet till fonetisk sökning.
Det flesta av dessa verktyg var plattformsberoende och ofta inte ens särskilt flexibla inom den egna plattformen. Därför slog de aldrig på allvar. SGML slog i så fall bättre, men lite mer i skymundan för den stora publiken. När HTML började breda ut sig på Internets World Wide Web uppstod med ens en sorts de facto-standard som kunde vinna mycket bred acceptans, och i förlängningen kommer troligen HTMLintresset att göra att bredare grupper också får upp ögonen för SGML. Den vägen går säkerligen via den standard som nu lanseras som en förbättring av HTML, kallad XML (Extensible Markup Language).5 XML är en DTD (document type definition), alltså en delmägd i SGML, medan HTML snarare kan betraktas som ett degenererat derivat, en ostyrig kusin till SGML.
På PC-sidan använde sig en del mindre utgivare och privatpersoner av hjälpfunktionen i Windows för att ge ut tidskrifter och böcker med en sorts hypertext. Filerna sparades alltså i Windows speciella hjälpfilformat och kunde sedan öppnas av alla som hade Windows. Och snart började en del pdf-filer cirkulera med egenpublicerat material. Michael Björn gav t.ex. ut sin bok ”Flaskpost” i detta format 1994.
Redan tidigare hade olika konverteringstillägg till desktop-program kunnat användas för att skapa programoberoende representationer av
5 Fakta om XML finns på http://www.gca.org/conf/xml/xml_what.htm
textsidor, på ungefär samma sätt som Acrobat och Common Ground fungerar, fast oftast utan möjlighet att redigera eller kopiera textinnehållet – textsidorna representerades bara av en bild. Apples DocViewer är ett sådant exempel. Apples nätverk för återförsäljare, utvecklare och användare, Apple Link, hade också en funktion för att konvertera dokument till en sådan här minsta gemensam nämnare. Systemet fanns inbyggt i kommunikationsprogramvaran som en speciell skrivardrivrutin kallad LinkSaver. De här dokumentformaten användes t.ex. för prislistor och tekniska manualer och var ofta ett sätt att dubblera informationen; sådant som medföljde ett dataprogram i form av en tjock handbok förekom också som rent elektronisk läsning i form av en sådan fil på den medföljande cd-rom-skivan. Den här dubbleringen var (och är) en avspegling av producentens tvehågsenhet inför mediet, man måste erbjuda kunden något konkret och påtagligt och då är en tung handbok konkurrenskraftig. (Samtidigt ligger det förstås en viss poäng just i att en datorhandbok bör vara läsbar även när datorn krånglar.) Men dessa format var viktiga som föregångare för de filtyper som idag florerar för nätdistribution av elektroniska dokument.
Idag kan man nog konstatera att World Wide Web står i centrum för den elektroniska publiceringen, i varje fall i termer av antalet aktörer och dokument, men kanske inte alltid i termer av antalet läsare.
Att så mycket är och har varit gratis på Internet gör att utrymmet för dyra företagsspecifika lösningar utanför Internet nog har minskat, om man inte hittar någon mycket speciell tillämpning med avancerade funktioner, som helst ändå (t.ex. i reklamsyfte) bör vara möjlig att överföra till www, åtminstone i en begränsad form med mindre finesser. Typiskt är också kombinationsprodukter, uppslagsverk på cd-rom som anropar kompletterande fakta på Internet med hjälp av länkar till någon URL.
Encyclopedia Britannicas redaktionschef Paul Hoffman säger i en intervju med BBC:
We want to rely on other people and point to their content when they’re doing a good job. And we don’t want to reinvent the wheel. I think the encyclopaedia of the future is going to be a combination of our own original content in our tradition; other people’s content that we work with; and then our ability as encyclopaedists to organise what’s out there.
That’s what we’ve always done in print and we can do that on the Web too.6
6 Se BBC News 17 dec. 1997 på http://news.bbc.co.uk/hi/english/business/newsid %5F40000/40033.stm (sic!)
I förlängningen väcker detta förstås ändå frågan om varför man över huvud taget skall skaffa sig ett uppslagsverk om informationen ändå finns certifierad ute på nätet.
Cd-rom-tillverkning var till en början oerhört kostsam, men under 1995-96 började s.k. cd-brännare att sjunka kraftigt i pris, så små publicister kan nu lättare sköta hela framställningsprocessen själva, åtminstone när det gäller mindre upplagor.
1.3 Bevarandeproblematik och autenticitet
En kombinerad skepsis och entusiasm inför de nya mediernas risker respektive möjligheter utkristalliserade sig så småningom, och blev märkbar inom arkiv- och biblioteksvärlden redan på 70-talet, men mera utbrett blev detta under 80-talets senare del. På problemsidan diskuterade man nu förutom databands, disketters och cd-skivors hållbarhet även hur snabbt datautrustningen åldras, vilket ju är ett mera intrikat problem när det gäller möjligheterna att i framtiden kunna läsa dagens digitalt lagrade information.
1989 skrev Janet Vratny-Watts och Edward J. Valauskas en artikel om migrationsproblem: ”Prospective Conversion: Data Transfer between Fossil and New Microcomputer Technologies in Libraries”.7 Michael Day vid The UK Office for Library and Information Networking skrev 1989-90 avhandlingen ”Preservation problems of electronic text and data.”8 Library of Congress arrangerade sommaren 1992 en ”Workshop on Electronic Texts”, där många av problemen med bevarande och även autenticitets-, identitets- och upphovsrättsproblem vädrades.
Stora användargrupper var alltså redan oroade. Men hur var det med databranschen? När jag skrev mitt upprop ”Thoughts on the Electronic Revolution”, i Apple Library Users Group Newsletter nr 4/19939 visade det sig hur yrvaken man i de flesta fall var i tillverkarledet.10 Farhågor betraktades ofta som teknikfientlighet. För bredare grupper började nog den här problematiken att uppmärksammas via Jeff Rothenbergs artikel ”Ensuring the Longevity of Digital Documents” i januarinumret 1995 av Scientific American. Mer om vad som skrivits sedan dess och olika
7 Se Information Technology and Libraries, March 1989, American Library Association, 1989.8 East Midlands Branch of the Library Association, Occasional papers, no. 3. Loughborough: EMBLA Publications, 19909 Se http://home5.swipnet.se/~w-50996/930800.html10 Uppropet resulterade sedan i en serie om tre artiklar om den elektroniska bevarandepropblematiken publicerade i Svenska Dagbladet, Politiken och The Art Bin (http://art-bin.com/art/imemory1.html).
kommittéer kan man hitta på Peter Grahams sida på Rutgers University11och Michael Days sida ”Preservation of electronic information: A bibliography”.12
Organisationen Council on Library and Information Resources skriver på sin webbsida:13 ”If William Shakespeare had written Hamlet on a word processor, would his great achievement still be available to us today?” En relevant fråga förstås, för i den analoga världen försvinner texter in i den stora glömskan antingen p.g.a. att papper eller pergament förstörs, eller också hamnar de i inkompatibilitetens mörker därför att vi inte förstår språket. Shakespeare går hyfsat, men bortåt Chaucer börjar det bli knepigt. 500 år är ändå ett fantastiskt långt tidsmässigt panorama, jämfört med livslängden hos många digitala dokument som kan bli oläsliga efter ett par år.
Trots det kan nog den enorma utvecklingen av World Wide Web och lagringen av mängder av kopior av dokument på olika servrar världen runt ha förändrat det dystra läget för digitalt lagrad information en aning de senaste åren. Rena texter har nog rätt goda chanser att överleva länge. Frågan är dock fortfarande hur det ska gå med mera komplicerade multimediadokument. Kommer de att kunna spelas upp så som upphovsmannen tänkt sig om 30 år? Om 100? Eller kommer det att krävas månader av efterforskningar för att finna rätt konfiguration av gamla datorer, cd-spelare och operativsystem?
Samtidigt som mängden av identiska eller nästan identiska elektroniska kopior ökar säkerheten om några skulle förstöras, ökar därmed också autenticitets- och identitetsproblemet. Vilken kopia skall räknas som original? Vilken version av nästan identiska dokument är korrekt? Angående boten för detta, t.ex. checksummor och auktoriserade kopior, se avsnitt 6.3.
Tilläggas kan att förekomsten av identiska kopior är ett problem inom journalistik (och förstås även annan research), där man söker efter oberoende källor för att bekräfta något innan man publicerar. En amerikansk undersökning från Middleburg + Associates visar att en majoritet journalister först söker efter en levande person för bekräftelse, när de inte får tag på någon, går majoriten ut på nätet.14 50 procent av de 2 500 intervjuade journalisterna sade att de är online varje dag (mot 33 procent när en liknande undersökning gjordes året före). 93 procent av journalistrna sade att de åtminstone använde onlinetjänster då och då. Under
11 Se http://aultnis.rutgers.edu/texts/ElectLibBib.html12 Se http://homes.ukoln.ac.uk/~lismd/preservation.html13 Se http://www.clir.org/14 Se http://www.mediasource.com/intro.htm
Lewinsky-affären 1998 användes Internet flitigt av journalister som källa, ofta alltför okritiskt enligt många.
1.4 Upphovsrättsfrågor
Ett vanligt problem på Internet är att webbpublicister använder sig av material som de inte har laglig rätt att publicera – det kan gälla såväl text, bild som musik. Fenomenet är naturligtvis inte nytt, men det har blivit vanligare i och med att kopiering i kombination med publicering, (inte bara för eget bruk alltså) är så enkelt att utföra på Internet. Dessutom har ju mängder av personer som tidigare aldrig behövt fundera över vilka lagar som gäller i samband med offentliggörande, nu äntrat den publicistiska scenen.
Upphovsrättsfrågorna började diskuteras ungefär samtidigt med autenticitetsproblemen, vilket inte är så konstigt, eftersom dokument som förvanskats eller presenteras i sammanhang som upphovsmannen inte tänkt sig, ju direkt hänger samman med den ideella delen av upphovsrätten.
Särskild fart tog upphovsrättsdebatten under 1996 i samband med WIPO-konferensen i Genève och ett par uppmärksammade rättsliga tvister. En sådan uppstod mellan Shetland Times och Shetland News om rätten att enbart länka på www till ett dokument som man inte har rättigheterna till.15 Andra fall var striden om TotalNews (se även avsnitt 4, senare delen) och i Sverige diskussionerna kring tidningarnas rätt att återpublicera redan tryckta artiklar i elektronisk form i databaser och på webbsidor.
De upphovsrättsliga organisationerna har också drivit kraftfulla kampanjer för att öka medvetenheten – inte minst bland amatörpublicister – kring upphovsrättsliga frågor vid publicering på Internet. ALIS (Administration av litterära rättigheter i Sverige) sammanställde 1997 rapporten ”Litterära verk & upphovsrätt på Internet” om upphovsrättsligt skyddade texters förekomst i digitala medier.
16
Personligen tror jag dock inte man skall överdriva problemet. Det är min erfarenhet att webbplatsredaktörer som blir upplysta om att de har olagligt material på sina sidor oftast tar bort detta frivilligt, eller åtminstone om man förklarar att man annars tänker ta kontakt med deras tjänsteleverantör – med risk för att deras abonnemang dras in. Dessutom verkar det som om medvetenheten om de här frågorna ökar. Jag skulle
15 Parterna gjorde upp i godo. Se http://www.shetland-news.co.uk/headline/ 97nov/settled/settled.html16 Se http://www.alis.org/lupp0.htm
vilja likna det vid medvetenheten om grafisk formgivning i början av DTP-revolutonen, då mängder av människor som aldrig framställt en trycksak nu glatt kastade sig in i sådan verksamhet. Bredare grupper än man någonsin kunnat förreställa sig vet numera vad Times och Garamond är och att man inte bör blanda alltför mänga typsnitt på en sida. På samma sätt tror jag breda grupper inom elektronisk publicering kommer att lära sig mer och mer om design och läsbarhet, men även om – juridik.
I september 1997 berättade Johnny Cash vid en hearing i Representanthuset att han upptäckt att hans sång ”Ring of Fire” spreds via Internet från en server i Slovenien.17 Han var en av flera som vittnade till förmån för den amerikanska ratificeringen av WIPO-traktaten om upphovsrätt från december 1996. En ofta bortglömd sidopoäng med alla de rapporter om upphovsrättsliga brott på Internet som nu kommer, är ju dock att motsvarande försyndelser i den fysiska världen knappast skulle ha upptäckts. Men i nätvärlden underlättar ju de kraftfulla sökverktygen detektivarbetet.
1.5 Reklam och betalsystem
För utgivare som inte redan har en stark organisation eller ett stort företag bakom sig (t.ex. dagstidningar med tryckta förlagor som ger sig ut på nätet eller kundtidningar) blev det främsta sättet att finansiera nätutgivning att låta sig sponsras eller ta emot annonsering i form av s.k. banners. Detta tog fart under 1995-96 och även om Internetkulturen sedan gammalt haft ett icke-kommersiellt drag, var inställningen hos breda grupper ändå ganska positiv till annonsfinansiering, som ju trots allt är en möjlighet att fortfarande få tillgång till mera genomarbetade professionella publikationer gratis. Men under 1997 började man märka en viss iritation, annonserna blev mera påträngande, ofta visas de i särsilda fönster som lägger sig över det man just läser. Frågor som varit självklara länge inom t.ex. TV-världen, om styrning och redaktionellt beroende av annonsörer, började ställas. Den kände debattören och gränssnittsexperten Jakob Nielsen på Sun skrev en kolumn i januari 1998 om just detta:
I predict that most sites that are not financed through traditional product sales will move to micropayments in less than two years. Users should be willing to pay, say, one cent per Web page in return for getting quality content and an optimal user experience with less intrusive ads. Once
17 Se http://www.news.com/News/Item/0,4,14364,00.html
users pay for the pages, then they get to be the site’s customers, and the site will design to satisfy the users’ needs and not the advertisers’ needs.18
En sorts reklampublikationer utgörs av den ökande mängden av s.k. spamming (obeställda massutskick) som kommer via e-post. Mest handlar de om hur man kan tjäna snabba pengar, eller är reklam för olika sexställen på www men även för sådant som man kan se säljas på TV-shop och liknande – kantgräsklippare eller fläckborttagare till sensationspris etc.
Sådana här massutskick har ökat märkbart senaste året. De görs av lycksökare som inte bryr sig om att de får dåligt rykte. Man räknar kallt med att om man skickar ut t.ex. 50 000 meddelanden, så kanske åtminstone 500 blir allvarligt intresserade och då är vreden från de andra värd att utsätta sig för.
Ofta skickas dessa meddelanden ut anonymt, så det är svårt att spåra avsändaren. Ofta står det i meddelandena att skickar man bara ett svar och talar om att man inte vill ha sådana erbjudanden i fortsättningren, så blir man struken från listorna. Detta är dock ofta bluff, för svarar man, så visar man spam-utskickarna att adressen är korrekt och så kan de fortsätta skicka reklam eller sälja adressen till andra.
S.k. e-mail extraction programs används ofta i de här sammanhangen, en sorts robot som går ut på nätet och samlar e-postadresser, främst bland Usenets nyhetsgrupper. Här ligger ju dessutom användarna snyggt sorterade efter intresse.
Allt detta bidrar till en ökad skepticism mot reklam hos breda användargrupper. Kanske blir det som Jakob Nielsen förutspår att detta öppnar vägen för flera betaltjänster. Mycket tyder på att många utgivare under 1998 ligger i startgroparna för att börja ta betalt med hjälp av olika system. En svensk tidning som tar ut avgift är Sundsvalls tidning (se avsnitt 5.2.6). Svenska Dagbladet har också aviserat att man snart ska sjösätta en mera renodlad webbupplaga med material som inte finns i den tryckta versionen, och då ska man också ta betalt.
2 Internets framväxt
2.1 Internationellt
18 Se ”Jakob Nielsen's Alertbox”, January 25, 1998, på http://www.useit. com/alertbox/980125.html
Som ju är tämligen välbekant har Internet sitt ursprung i det amerikanska militära kommunikationsnätet ARPANET, vilket kom till 1969, efter cirka sju års förberedelser och forskning. Än i dag sker mycket av beslutsfattandet inom Internet med hjälp av s. k. Requests for Comments (RFC), och i den allra första av dessa från den 7 april 1969 skrev Steve Crocker vid UCLA om det planerade nätet:
As with any new facility, there will be a period of very light usage until the community of users experiments with the network and begins to depend upon it. One of our goals must be to stimulate the immediate and easy use by a wide class of users.19
Med den smått otroliga tillväxt som Internet fått, särskilt de allra senaste åren, kan man bara konstatera att Crocker fick som han ville. 1971 hade ARPANET 23 värddatorer (hosts) anslutna, 1981 var de 213 – en ny tillkom vid den här tiden var tjugonde dag. 1987 var värddatorerna över 10 000 och 1988 60 000. 1996 var de 10 miljoner och 1998 29,7 miljoner.20
Några viktiga hållpunkter i framväxten av Internet var exv. 1979, då Usenet skapades, och 1982 då Internet i den form vi känner till det idag skapades i och med att TCP/IP-protokollet började användas. Det är det som gör att så många olika typer av datorer kan samverka. I och med persondatorns framväxt ökade också antalet anslutna mycket kraftigt vid mitten av 80-talet, en ökning vi knappast sett slutet på än.
1991 var året då Tim Berners-Lee vid CERN i Genève postade koden till sin nya idé – om ett världsomspännade nät av länkar – på en liten obskyr nyhetsgrupp på Usenet, ”alt.hypertext”. Redan 1989 hade han dock dragit upp riktlinjerna för vad ett sådant nät skulle kunna åstadkomma. I det förslaget från mars 1989 står det bl.a.:
In providing a system for manipulating this sort of information, the hope would be to allow a pool of information to develop which could grow and evolve with the organisation and the projects it describes. For this to be possible, the method of storage must not place its own restraints on the information. This is why a ”web” of notes with links (like references) between them is far more useful than a fixed hierarchical system.21
19 RFC 1 finns på http://www.cis.ohio-state.edu/htbin/rfc/rfc1.html20 Enligt Network Wizards, se http://www.nw.com/zone/WWW/report.html21 Tim Berners-Lees förslag finns på http://www.w3.org/History/1989/ proposal.html
Berners-Lee tog naturligtivs inte de här tankarna från ingenstans, många hade i åratal haft idéer om stora länkade textmassor (Vannevar Bush) eller hela ”rymder” av dokument (Ted Nelsons docuverse).
Det dröjde dock till 1993 innan Marc Andreessen vid NCSA (National Center for Supercomputing Applications) vid University of Illinois i Urbana Champaign skapade den första grafiska webbläsaren, Mosaic (version 1.0 kom i november detta år), den som också var början till Netscape (som kom i en första betaversion i oktober 1994).
Microsoft lanserade sin konkurrentprodukt Cello 1994 och i augusti 1995 Internet Explorer. Sedan uppstod på nätet närmast ett ”kallt krig” mellan plattformar och standarder som i förlängningen gällde hela Internets mer eller mindre underförstådda ideologi, med frågor om yttrandefrihet, monopol o. dyl. Sensationellt nog avblåste Netscape ensidigt striden i viss mån i januari 1998 genom att offentliggöra källkoden till programmet, med hänvisning till bl.a. Internets stolta traditioner av fritt utbyte av idéer och det utvecklarvänliga klimat som varit rådande.22
1996 tog Tim Berners-Lee till orda mot okynnet att så många webbdesigner gjorde sina sidor för endast en viss webbläsare:
Anyone who slaps a ’this page is best viewed with Browser X’ label on a Web page appears to be yearning for the bad old days, before the Web, when you had very little chance of reading a document written on another computer, another word processor, or another network.
23Som en reaktion mot just detta startades kampanjen ”Best Viewed With Any Browser”, som verkar för en återgång till grundidén, att www ska vara ett plattformsoberoende och programoberoende medium.
2.2 Internets framväxt i Sverige
1980 installerades Swedish University Network (SUNET) som ett försök på initiativ av STU (Styrelsen för teknisk utveckling) och FRN (Forskningsrådsnämnden). Då fanns knappast alls dagens trafik mellan enskilda datorer, utan mest mellan terminaler och X.25-anslutna datorer.
22 I pressmeddelandet hänvisade Netscape direkt till Eric S. Raymonds tal ”The Cathedral and the Bazaar”, som hölls vid flera konferenser under 1997, som den utlösande faktorn för detta radikala steg. Talet finns på http://sagan.earthspace. net/~esr/writings/cathedral-bazaar/.23 Technology Review, juli, 1996.
Runt 1983-84 beslutades att projektet skulle fortsätta och FRN tog ansvaret för fortsatt utbyggnad. Man moderniserade beståndet av X.25växlar och utrustning anskaffades för att underlätta kommunikationen med Digitals DEC-datorer, som var vanliga i universitetsvärlden.
1987-88 skaffade man fasta linjer från Televerket och bättre utrustning som medgav kommunikation med även andra datorer än Digitals. Antalet anslutna datorer var nu 2 000.
SUNET är numera knutpunkt för både den akademiska och den privata användningen av Internet. Central för denna verksamhet, liksom även för det nordiska forskningsnätsamarbetet NORDUNET är Tekniska Högskolan i Stockholm (KTH).
1990-91 anslöts även de flesta mindre högskolor till SUNET via 64 kbps linjer, och SUNET skapade också en regional driftsorganisation. Vid den här tiden lät man också SWIPNET ta över den mesta trafiken med användare utanför universitetsvärlden.
1994 höjdes hastigheten i SUNETS nät. Det s.k. ryggradsnätet fick nu en kapacitet på 34 Mbit/s, och även de mindre högskolornas förbindelse blev snabbare, från 64 kbit/s till 2 Mbit/s.
Under 1998 kommer de mindre högskolorna att få förbindelser på 34 Mbit/s och de stora 155 Mbit/s. Dessutom är dessa förbindelser tänkta att dubbleras av säkerhetsskäl.
Antal anslutna datorer vid Sunet var 1989 ca 2 900 , 1993 ca 28†000, och per den 12 januari 1998 var de 137 946. Största enskilda domänen är Lunds universitet med 16 694 anslutna datorer.
Antalet värddatorer och domäner kan räknas, men antalet anslutna datorer utanför SUNET blir ofta en uppskattning, så siffrorna växlar starkt. Computer Industry Almanac angav för Sveriges del 1,311 miljoner användare i januari i år, medan Expressen och Infratest Burke24 utifrån en undersökning gjord i april 1997 kom fram till 2,9 miljoner användare. Enligt den undersöningen skulle nära hälften av alla svenskar mellan 15 och 74 år (2000 personer i det åldersintrvallet hade då intervjuats) ha tillgång till Internet.
Enligt Nikos Markovits nyhetsbrev Inetmedia25 fanns det i januari 1997 36 500 domännamn i Sverige, vilket innebar att 22 600 domäner hade tillkommmit eller förändrats under 1996. Under 1997 var det 23 582 namn som ändrades eller tillkom. Summan i januari 1998 var totalt 59 170 domäner.
Enligt Computer Industry Almanacs siffor från januari 199826, där man jämfört de 15 Internettätaste länderna ligger Sverige på åttonde
24 Se http://www.expressen.se/artiklar/burke97/25 Se http://www.markovits.com/inetmedia/26 Computer Industry Almanac, se http://www.c-i-a.com/199801pr.htm
plats med sina 1,311 miljoner användare. USA leder förstås med 54,6 miljoner användare. Glappet är stort till tvåan Japan, som har 7,9 miljoner och trean England som har 5,8.
När man diskuterar det enorma genomslag som Internet har fått de senaste åren och jämför detta med andra medier, är det viktigt att komma ihåg att mycken Internetstatistik tar fasta på tillgången till nätet, vare sig man kommer åt det hemifrån eller på arbetet eller i skolan och oavsett hur mycket denna möjlighet utnyttjas. När man läser statistik om telefonens, radions, TV:ns eller videons segertåg över världen, handlar det ofta om när dessa apparater kom in i hemmen. Utnyttjandegraden var kanske högre i sådana fall där man satsade egna pengar på en ny och relativt oprövad produkt.
3 Hur styrs Internet?
Internet är ju en mycket löslig, för att inte säga nebulös organism. Ändå finns förstås människor som bestämmer, och de återfinns i en mängd olika organisationer som ofta vuxit fram ad hoc.
Internet Society (ISOC) samordnar mycket av aktiviteterna på Internet. Det är en medlemsorganisation som bygger på frivillighet, det mera idella målet är att verka för globalt informationsutbyte. För att samordna utarbetandet av tekniska standarder har man en sorts utskott som heter Internet Architecture Board (IAB).
Internet Engineering Task Force (IETF) är en stor internationell sammanslutning av nätkonstruktörer, operatörer, tillverkare och forskare, intresserade av att utveckla Internetarkitekturen. Vem som helst som är intresserad får bli medlem.
För det praktiska arbetet använder sig IETF av olika arbetsgrupper, för saker som routing, portning, säkerhetsfrågor m.m. Regionalt finns
area directors som i sin tur ingår i Internet Engineering Steering Group
(IESG).
Det finns också en Internet Research Task Force (IRTF), som dock är experimentell mera på lång sikt och aldrig bedriver sin forskning i full skala. Här är det individer som är medlemmar, inte organisationer.
Ett annat viktigt institut på Internet är RFC (Requests for Comments), en serie dokument som inleddes med Steve Crockers tidigare citerade förslag från 1969.27 De här utkasten handlar oftast om nätverksprotokoll och program, men kan ibland röra mera allmänna åsikter om Internets utveckling.
27 Se avsnitt 2.1.
För www finns World Wide Web Consortium (W3C) som startades 1994 för att utveckla gemensamma protokoll för webbens vidare utbyggnad. W3C har nära samröre med MIT och CERN. Ledande inom W3C är bl.a. pionjären Tim Berners-Lee och Jean-François Abramatic. W3C står öppet för varje organisation som vill bli medlem och man är noga med att verksamheten skall vara helt leverantörsoberoende – det är ju mycket det som är en bärande idé inte bara med www utan med Internet i sin helhet.
InterNIC (Internet Network Information Center) kom till i januari 1993 och är ett samarbetsorgan för hanteringen av Internets alla domännamn, databasen över dessa samt registreringsrutinerna. Numera finns också en svensk avdelning av InterNIC, NIC-SE (Network Information Centre Sweden AB), som ägs av Stiftelsen Internetinfrastruktur. NIC-SE ska koordinera och ansvara för driften av registret över .se-domäner på Internet.28
ISOC har numera också ett s k ”chapter” i Sverige, där enskilda och företag kan bli medlemmar.
29Vad övrigt är, är självreglering. Trots att Internet sammanlänkar både många kulturer i den verkliga världen och många specifika nätkulturer, så finns ändå någon sorts allmänt accepterad norm för hur man bör uppträda på nätet, den s.k. netiketten. Brott mot denna bestraffas ofta med ilskna e-postmeddelanden (flaming). Gäller det en tjänsteleverantör (serverinnehavare) som t.ex. tillhandahåller stötande material, kan följden bli mail bombing, dvs det att arga Internetanvändare skickar tusentals brev till syndaren ifråga för att slå ut hans eller hennes server. Sådan brevstorm behöver inte härröra från lika många avsändare som antalet brev. Ibland kan ett fåtal eller bara en person iscensätta sådana aktioner där tiotusentals meddelanden skickas iväg automatiskt. Många menar dock att den här typen av hämndaktioner i sig själva är ett brott mot netiketten.
Ett relativt nytt fenomen i detta sammanhang, som dessutom kan betraktas som en form av publicering, är när man vill skada en person genom att sätta ut personens namn, bild och/eller olika uppgifter om vad han eller hon anses ha gjort sig skyldig till. Detta kan förekomma som rent privata vendettor och som mera politiskt färgade kampanjer. Exempelvis kan våldtäktsmän eller förmodade pedofiler på detta sätt ”hängas ut” till beskådande vid den elektroniska skampålen. I kampen mellan rasister och anti-rasister förekommer också publicering av namnlistor över förhatliga personer från det motsatta lägret.
28 NIC-SE finns på http://www.nic-se.se/29 ISOC Swedish Chapter finns på http://www.isoc-se.a.se/
Även om det finns en hel del anstötligt bland nyhetsgrupperna på Usenet, så hejdas en del faktiskt i sin linda. Nynazister försökte under 1996 skapa en nyhetsgupp under namnet ”rec.music.white-power”, men förslaget röstades ned efter en kampanj, med siffrorna 592 för och 33 033 emot. Svårare är det att stoppa nyhetsgrupper inom den friare alt.kategorin.30
Tecken finns också på att en del organisationer för sanering av olika mindre önskvärda företeelser på nätet håller på att uppstå, en tid fanns t.ex. en sorts rådgivande ”skiljedomstol” på www med frivilliga insatser av Internetintresserade jurister som sysslade med upphovsrättsliga saker, liksom förtals- och yttrandefrihetsaspekter.
4 Olika typer av elektroniska publikationer idag
Den elektroniska publiceringen åstadkommer mer väsen i tryckta och eterberoende medier än i de egna digitala kanalerna. Uppskattningarna av andelen elektroniska publikationer av den totala mängden växlar förstås, och beror som alltid på vad man räknar som publikation, men såväl bedömningar inom EU som från olika branschorgan brukar ligga runt ett par procent, sällan dock över fem.
31Detta skall man naturligtivis inte låta sig luras av. Som redan antytts används digitala hjälpmedel sedan länge inom den mesta massmedieproduktion – före det sista presentationsstadiet. Det är rätt naturligt. Datorn är en sorts raffinaderi, som hjälper till att bereda och omforma råvaran information, vare sig det är bild, ljud eller text, men den har hittills inte varit inriktad på konsumtion på samma sätt som en besläktad bildskärmsförsedd apparat har varit – TV:n. Så det vore enkelt att hävda att mycket egentligen i någon form är elektroniskt redan i dag. Låt mig ändå göra en liten uppställning av några huvudtyper av mera renodlade elektroniska publiceringsformer:
I. Man tar del av materialet på datorskärm:
1. Materialet tillhandahålls på ett fast fysiskt medium:
30 Läs mera om kampanjen mot white power-gruppen på http://www.jcn18.com/news/cfv-fail.htm31 Riitta Alkula anför några siffror i NORDINFO-Nytt 1-2/97 i artikeln ”Elektronisk publicering” på http://www.nordinfo.helsinki.fi/nordnytt/nnytt1-2_97/alkula.htm
a) Cd-rom. Intresset för dessa har dämpats något i takt med wwwboomen, men mediet är starkt inom spelbranschen och även för olika sorters referensverk, även om många förlag överväger migration till Internet så snart problemet med säker överföring av betalningar har lösts. Dessutom används cd-rom ofta som databasservrar på Internet.
b) Andra besläktade format som CD-I, Electronic Book Format, Photo-Disc, Laserdisc, MiniDisc, DVD osv. Några av de här formaten tycks hålla på att försvinna, andra håller på att finna sin plats.
c) Disketter. Dessa blir allt ovanligare som distributionsmedium, även om enskilda designer, konstnärer m. fl. ofta sprider arbetsprover i enkel katalogform på diskett. Det förekommer också diskettvisitkort osv. Diskettdistribuerad egenpublicering av litteratur i exv. pdf-format är rätt ovanligt, sådant sprids numera oftast över Internet.
2) Materialet tillhandahålls för nedladdning och/eller läsning på Internet eller BBS
a) Nedladdning för senare läsning (i ett annat program). Det var tidigare vanligt att man laddade ned saker i komprimerat skick från BBS:er eller FTP-servrar och sedan iordningställde filerna för läsning utan att behöva vara uppkopplad. Sådana filer kunde innehålla
- rena ASCII-publikationer (zines och nyhetsblad) eller
- Postscript-filer för utskrift av typograferade sidor (egentligen en sorts primitiv print-on-demand).32 Ett fåtal datorer kan visa Postcript på skärmen, annars måste formatet skrivas ut.
- Hypercardbuntar (Macintosh)
- Pdf-filer för läsning i programmet Adobe Acrobat
- SGML-text för läsning i en speciell browser
b) Nedladdning för direkt läsning. Numera är det vanligare att dekomprimering och tolkning av olika filer sker direkt i en browser, så att man kan ta del av innehållet i det ögonblick filerna nått datorn. Filerna kan då vara
- HTML-text
- Bilder i främst JPEG- eller GIF-format
32 En tidskrift som Intertext, ett forum för s.k. creative writing, har sedan starten 1991 genomgått alla dessa faser och finns nu också direkt läsbar på webben på http://www.intertext.com/Zines/InterText/. Den tillhandahåll också i formaten pdf, Postscript och ASCII, samt för handdatorerna Newton och Pilot.
- Digital video i Quicktime- eller MPEG-format (egentligen ett gränsfall, för filerna behöver laddas ned helt men visas sedan oftast med en s. k. plug-in direkt i browserprogrammet)
- Olika former av s.k. streaming audio (ljudfiler) och streaming video som visas kontinuerligt medan de laddas ned till den egna datorn
II. Man tar del av materialet på annat medium än datorn
a) På papper. Print-on-demand, antingen fullt utvecklad med tillhörande bokbindningsmöjligheter eller en enklare form där pdf- eller Postscriptfiler kan skrivas ut på en vanlig laserskrivare.
I dag förefaller det kanske inte relevant att räkna spel som publikationer, men med största sannolikhet kommer deras verkningsmedel att användas i framtidens publikationer. Redan nu finns tidskrifter som utnyttjar simuleringar. I framtiden kommer man säkert att vara intresserad av hur detta började, så därför är spel och andra företeelser som till synes befinner sig i publicismens periferi men i teknikens frontlinje värda att bevaras – vad man kallar dem just nu är mindre viktigt.
Det talas mycket om pushteknik. Sådan skräddarydd information, t.ex. när man skapar en personifierad tidning (”The Daily Me”) etc., är praktisk men egentligen inte så uppseendeväckande, mer att likna vid ett personligt val av prenumerationer på tidningar som levereras i vår fysiska brevlåda eller vad man zappar sig fram till vid TV:n. Att pushtekniken blivit så omskriven och höjd till skyarna kan nog hänga samman med att dess verkningsmedel är lätt igenkännliga för traditionella publicister och massmediemänniskor. Det verkligt nya blir när man kan skräddarsy varje publikation för sig; språk, svårighetsgrad, utförlighet (från abstract, steglöst över till vidareläsning i all oändlighet via exempelvis successiva länkar på www).
Om vi nu bortser från vilken form utgåvorna har på datorn och ser till anknytningen till traditionella publikationsformer, kan man konstatera att det finns:
1. Enstaka publikationer
a) Fasta utgåvor. De uppdateras inte, de finns på nätet eller cd-rom eller något annat medium och förändras inte, utan är att likna vid en traditionell bok eller en affisch.
b) Flexibla enstaka publikationer. Hit kan man räkna många webbplatser som uppdateras då och då eller olika referensverk som uppslagsböcker på cd, som utkommer i flera versioner etc.
2. Periodica
a) Dagstidningar. Dessa finns nästan enbart på www, om det inte gäller fulltextdatabaser med artiklar, då dessa ofta också överförs till cd-rom. Nästan uteslutande är det fråga om webbversioner av tidningar som redan finns i tryckt form.
b) Annan periodicitet. Här finns mängder av tidskrifter både sådana som också finns i tryck, t.ex. Newsweek, Die Zeit, och sådana som bara finns på nätet, exv. Slate, The Art Bin.
Anmärkas bör att även när det gäller periodica kan den vara högst flexibel. Pushtekniken har redan nämnts. Och många redaktörer utnyttjar naturligtvis det faktum att en elektronisk text kan korrigeras även efter publikationstillfället. Det här är förstås viktigt när man diskuterar pliktleveranser, för även om man förlitar sig på utgivarens egen sändning i stället för på automatiskt insamlande från nätet, så behöver den sändning man fått direkt från utgivaren inte alls vara den slutgiltiga. Det här är ett problem som påminner om dagstidningarnas numera digitala textarkiv. Frågan är där i vilket stadium av prepressproceduren man väljer att ”tanka ned” texter till det egna arkivet. Redigerare och journalister kan göra enstaka slutkorrigeringar bara sekunder innan sidan sänds från datorn till fotosättaren. Alltså kan även där den arkiverade versionen skilja sig från den som nått läsarna.
När det gäller arkiv, kan man också konstatera att många tidningar och tidskrifter på www utnyttjar det faktum att gamla utgåvor ligger kvar på servern. Med några länköversikter eller en sökfunktion kan man således enkelt skapa ett arkiv över utgivningen. Elektronisk periodica tenderar på detta sätt att få ett slags palimpsestartat förhållande till sina tidigare nummer. Det senaste har så att säga under sig hela skikt av tidigare utgivna nummer. Det finns ett talesätt i journalistkretsar att ”inget är så gammalt som gårdagens tidning”. Så blir det nog inte längre i den digitala världen. Ingen lär komma att rulla in fisk eller blommor i gamla elektroniska tidningar.
Ytterligare en uppdelning man kunde göra av olika typer av publikationer, är efter vilka som kostar pengar och vilka som tillhandahålls gratis. På andra medier än Internet kostar det oftast, även om man ser vissa cd-rom-utgåvor som delas ut gratis som reklam. (Här finns också en sektor som ökat kraftigt under de senaste åren, cd-rom-bilagan, det att tryckta tidskrifter som lockbete bifogar en gratis cd-rom-skiva, oftast
med gratisprogram och demoversioner av spel.) På Internet är det mesta ännu gratis, främst högprestigetidningarna tar betalt – New York Times och Wall Street Journal t.ex. Annars är metoden den att man gratis tillhandahåller en del av materialet, i hopp om att läsarna ska lockas att köpa ”fulltextversionen” i tryck. Enklare, förlagsoberoende zines klarar sig i allmänhet genom att de antingen är rena hobbyprojekt, eller också tar man emot annonser, ofta från mindre annonsörer. Medan New York Times kanske har annonser för Kodak eller Levis jeans, har det lilla magasinet annonser för en systerpublikation, en bekant som frilansar som webbdesigner eller för en lokal restaurang.
Många statiska webbplatser har också en sorts periodisk utgivning, av annan art än vanlig uppdatering, som ju oftast sker p.g.a. att något nytt hänt i organisationen, när företaget lanserar en ny produkt eller liknande. Här är det istället frågan om en liten särpublikation inom ramen för en annars tämligen statisk sida. Webbplatser kan ha dagens skämt som ändras hela tiden, konstnärer kan ladda upp en ny bild på sin webbplats med jämna mellanrum. Edvard Derkert laddar t.ex. upp ”a picture a day” på sin webbplats33, och fotografen Brad Brace har sedan januari 1995 hållit liv i sitt 24-hour-jpeg-project, ett nytt svartvitt foto laddas upp varje dag.34
I detta sammanhang bör kanske nämnas en annan typ av ”partiell” publicering, när webbplatser använder sig av ramtekniken för att presentera andras texter eller bilder. Några uppmärksammade tvister förekom under 1997 kring detta, t.ex, striden kring TotalNews, en nyhetstjänst som sålde annonsutrymme på sin ram, och inne i ramen lockade besökare med innehåll från andra som man egentligen inte hade rätten till, exv från CNN.
Det typiska för den elektroniska publiceringen är ju att den oftast är betydligt billigare än motsvarande pappersbundna utgivning. Även cdrom-produktion har som nämnts blivit billigare, ändå är det främst på Internet som man ser den verkliga revolutionen. Om man har utrustningen som behövs för att läsa på Internet, så har man också utrustningen för att kunna publicera sig där. Principiellt raderas skillnaden mellan producent och konsument ut alltmer, även om kategorierna troligen aldrig kommer att sammanfalla helt. På Internet samsas också traditionella förlag och tidningsföretag med små egenpublicister, officiell och inofficiell information ligger ”vägg i vägg”. Att jämföra proportionerna mellan det ”professionella” och det ”privata” låter sig knappast göras. Ska man
33 Se http://www.dad.a.se/34 Se ftp.rdrop.com/pub/users/bbrace/12hr.jpeg
räkna antalet personliga hemsidor, så leder dessa förmodligen i antal över de etablerade publikationerna. Men hur många läser dem?
35
Www är förstås inte allt på Internet. Ännu finns publikationer som sänds per e-post eller laddas upp på någon nyhetsgrupp på Usenet eller en BBS. De e-postbaserade tidningarna lever och frodas, det finns t.o.m. en särskild webbplats om sådan publicering.36 Och även Gopherservrarna finns ju kvar, även om deras betydelse minskar hela tiden till förmån för www.
Det kan vara värt att påminna om att det finns en del hybridformer. Webbpublicerade tidskrifter som t.ex. Web-Vantage37 skickar ut sina nya nummer per e-post med bara rubrikerna och tre-fyra raders ingress samt en http-länk till själva artikeln, som man således läser på www. Webbplatser kan ha nyhetsgrupper på Usenet knutna till sig, antingen sådana som alla kan se eller som är slutna. På Online-newspapers finns en helt webbaserad nyhetsgrupp som är sluten, skapad med en särskild programvara från Lyris38.
Det finns ju också vanliga mailinglistor (distributionslistor) som kan vara antingen öppna för alla eller slutna. Det har diskuterats hur man skall betrakta sådana, bl.a. av Mediekommittén.39 Man resonerar bl.a. om huruvida utsändningen (av t.ex. e-post) är riktad till allmänheten eller inte, om utsändningen kan sättas igång av mottagaren eller inte – allt detta för att försöka inordna de nya publikationsformerna i gamla lagskrivningar som gäller radioutsändning eller tidningsutgivning etc. De här formerna går redan idag in i varandra på ett sätt som svårligen låter sig sorteras under de gamla begreppen.
Jag tror att det enda rimliga är att tills vidare betrakta allt som distribueras till många, i ungefärligen samma gestalt, som en publikation. Detta för att skilja den från enkel bilateral e-post, tillägget ”ungefärligen samma gestalt” åsyftar den typ av personligt skräddarsydda dokument man redan idag kan prenumerera på från exv. databaser. Man får nog också räkna med att allt inte går att samla in, slutna publikationer har redan tidigare fallit genom de nationalbibliotekariska fångstnätens maskor och mycket som sägs i diskussionslistor är kanske mera jämförbart med gruppsamtal per telefon, som ju inte är föremål för bevarande.
Det är vanligt att många diskussionslistor, vars medlemmar själva betraktar innehållet som värdefullt, väljer att spara inläggen på en www-
35 Jfr avsnitt 6.4 om ”flaskposteffekten”.36 Se The e-mail publishing Inc. Home Page på http://www.emailpub.com. Man ger förstås ut en e-posttidning också, The Emailian Newsletter.37 Se http://www.web-vantage.com/38 Se news://clio.lyris.net/online-newspapers39SOU 1997:49
server. Därmed är de publicerade på ett mera uttalat sätt och kommer dessutom att hamna i de automatiska nedladdningar som görs.
5 Hur ser det ut på svenska www idag?
5.1 Kulturarw3:s statistik över filer
På den svenska delen av www finns cirka 4,84 miljoner HTMLdokument fördelade på 26 000 webbplatser, enligt den räkning som Kulturarw3-projektet färdigställde i januari 1998. Dessa HTMLdokument upptar sammanlagt 24,2 Gb diskutrymme.
Totalt upptar den svenska delen av www 200 Gb, fördelade på 9,5 miljoner dokument. Antalet stillbilder, de flesta lagrade i JPEG- eller GIF-format är 3,45 miljoner och övriga filer är 1,18 miljoner, dvs andra textformat, ljud, videosekvenser, program som laddats upp i något komprimerat format exv. Bilddelen kan vara aningen missvisande, eftersom bilder nu används som en kompromissmetod att lägga in grafiska formelement som HTML-språket inte tillåter. Alla bilder är alltså inte vad man skulle kalla illustrationer i dagligt tal, utan rubriker i ett visst typsnitt eller navigeringsknappar. Ofta utnyttjas också helt osynliga (genomskinliga) bilder enbart för att skapa mellanrum mellan textstycken.
Det kan ändå vara intressant att jämföra textmängden på den svenska delen av www med textmängden i Kungl. biblioteket. En oerhört grov uppskattning, närmast en någorlunda kvalificerad gissning, ger vid handen att de 24,2 Gb text som finns på den svenska delen av www motsvarar ungefär 38 100 ”normalstora” böcker, om vi för räkneexperimentet antar att en normalbok är 635 K (275 sidor med 33 rader om 70 nedslag). Nu innehåller ju böcker ofta bilder också, och om vi antar att 75 procent av bildfilerna är verkliga bilder och att de i genomsnitt motsvarar en halvsidesbild i en bok, skulle vi få ytterligare 4 700 böcker.
Svenska www skulle alltså motsvara ungefär 42 800 sådana här tänkta normalböcker, vilket kan jämföras med Kungl. bibliotekets samlingar, där det finns ungefär 3 miljoner volymer, eller med de svenska förlagens årliga utgivning, som de senaste två åren (1996-1997) uppgått till ca 13 500 titlar.
5.2 Några typiska kategorier av svenska webbplatser
5.2.1 Det offentliga Sverige
SverigeDirekt är den offentliga sektorns gemensamma webbplats.40 I mars 1998 fanns där länkar till 255 kommuner (av tiotalt 288), 21 landsting och 215 myndigheter.
Cirka tre fjärdedelar av kommunernas sidorna uppfyller Toppledarforums krav om viss uppdatering och kontroll som bör ställas på webbplatser inom den offentliga sektorn. De flesta kommunsidor har information om näringsliv, kultur och fritid, turism, aktuellt i kommunen osv. Många har information om kommunikationer, några har kommunala protokoll utlagda och information på främmande språk. Vissa har också lediga platser förtecknade. Utbildning, bibliotek och boende har också egna avdelningar på många kommunhemsidor.
De 21 landstingssidorna består förstås rätt mycket av information om vård och trafik, men ofta också om kultur och speciella ungdomsproblem, och många går också ut lite offensivt med ”kontakta din politiker”, ”tyck till” och liknande.
De större statliga myndigheterna har oftast egna hemsidor, flera mindre har det inte (som exv Bokföringsnämnden eller Stadsmiljörådet). Här finns aktuellt om verksamheten, ofta kan blanketter laddas ned i pdfformat, ibland för man på ett lite journalistiskt sätt fram omdebatterade frågor (Luftfartsverket har t.ex. rubriker som matas fram tecken för tecken som på en gammal teleprinter), ibland förekommer särskild pressinformation och författningar som gäller myndighetens område.
Gemensamt för den offentliga informationen är nog att man det senaste året har satsat mera på design och kanske tack vare Toppledarforum ett bättre gränssnittstänkande.
5.2.2 Organisationer
När det gäller organisationer kan man naturligtvis inte finna någon gemensam nämnare, eftersom verksamheterna ju kan vara hur olika som helst. Internationellt verksamma som Röda korset och Rädda barnen har båda en lite journalistisk framtoning med nyheter och rubriker. Från många organisationer kan man förstås beställa mer material i broschyrform. Webbsidorna skiljer sig också mycket i sin utformning, beroende på om det är fråga om en intresseorganisation som försöker bilda opinion för den egna saken hos utomstående eller om det är en organisation som vill använda sin sida som en resurssamling för de egna medlemmarna.
Fackförbundem har ofta fakta om pågående förhandlingar och arbetslöshetsstatistik inom den egna sektorn. Oftast har man information
40 Se vidare http://www.sverigedirekt.riksdagen.se/
för både medlemmar och utomstående, inklusive pressen. I mars 1998 hade precis hälften av LO-förbunden egna hemsidor. Många har också avdelningar av typen ”Vad går avgiften till?” och tävlingar med priser. SEKO (tidigare Statsanställdas förbund) har ”Månadens fråga”, en direktomröstning där besökare kan svara ja eller nej. I mars 1998 var frågan ”Ska LO och TCO slås ihop?”.
5.2.3 Museer, bibliotek
Sveriges museeer har ofta rätt väldesignade webbplatser, men de är ofta snåriga att hitta i och man tycks vara lite rädd att ställa samlingarna i strålkastarljuset. Ofta tror man som besökare att det bara finns fakta om öppettider, museishopen och vilka utställningar som hållits senaste året, men längre ned i hierarkin kanske det finns intressant bildmaterial från samlingarna. Kanske finns här liknande farhågor som inom pressen, att webbplatsen ska konkurrera med museet eller tidningen i verkliga livet. Ibland tycks en känsla för systematik eller den egna organisationsstrukturens avspegling på webbsidan ta överhanden över ambitionen att väcka allmänhetens intresse.
De flesta folkbibliotek har inte egna webbplatser utan återfinns på kommunens sidor. Här finner man oftast öppettider, vad man kan låna och hur, tidskriftslistor, man kan ställa frågor till bibliotekarien, en sorts infomationsdisk online, flera har extra information om släktforskning och många erbjuder sökning i Bibliotekstjänsts databas BTJ2000. Evenemang på biblioteket anslås förstås också. Oftast är det hela ganska administrativt, direkt information om litteratur är inte så vanligt. Inte heller är det så vanligt att man vänder sig ut mot Internet, många har länkar till tidskrifter, men rätt få har länkar till de stora reservoarer av digitaliserad litteratur som finns på Internet, både i Sverige och utomlands. Skillnaderna i ambitionsnivå kan vara slående, några skriver om lokala boksamlingar och lite lokal kulturhistoria, medan andra knappt har mer än öppettiderna.
5.2.4 Marknadstorgen
Torget, Postens elektroniska marknadstorg, har 79 000 medlemmar, hur många av dessa som utnyttjar möjligheten att ha egen hemsida vet man inte. Det finns 13 tidningar och tidskrifter på Torget, fem av dessa finns på deras server, resten är länkade från egen server. Dessutom har man något som heter Sveriges Tidskrifter med information om och länkar till en del av de 328 tidskrifter som förtecknas.
Under Torgets ”paraply” finns också 73 företag. Knappt hälften av dessa ligger rent fysiskt på Torgets servrar. En stor del av Torget upptas också av det egna redaktionella materialet, under avdelningar som Verktyg & Hobby, Hälsa, Familj etc.
Passagen, Telias motsvarighet till Torget, har cirka 100 000 medlemmar av vilka 35 000 har egna hemsidor. Passagens eget material består av ett 10-tal olika webbplatser innehållande cirka 2 000 sidor (pageviews), bl.a. Passagens förstasida, länkguide, Expertis, Cafe, Svenska CNN, IT-nyheter, Sportbase (med ett tjugotal underavdelningar). Tidskrifter är Then nya Swänska Argus, Bella och Direkt. Passagen deltar ibland också i specialevenemang som Internetworld, Sime, Vattenfestivalen etc. Passagen uppger att deras Galleria innehåller ett 40-tal butiker.
Bland de tusentals privata hemsidorna finns ett svårberäknat antal amatörpublikationer, mer eller mindre långlivade skoltidningar, fanzines etc. En mera ambitiös variant, som återfinns bland Tele2:s hemsidor, är t.ex. Otto Olsson Newsletter.41 Till saken hör också att vi bland de renodlat privata hemsidorna och deras enkla presentationer av innehavaren, hans eller hennes familj, vänner och intressen etc, troligen också ser ett embryo till en ny publikationstyp. Se vidare avsnitt 6.4.
5.2.5 Företag
Multinationella företag som Volvo eller Apple har internationella webbplatser med förgreningar till de lokala. Produktinformation är förstås en självklarhet. Volvo har avdelningar för personbilar, lastbilar osv., och dessutom en historisk del med museum och tidslinje. Saab har en likartad uppdelning på bilsidan (när man väl hittat dit, man ska inte slå på www.saab.se, vilket leder till flygsektionen, utan på www.saab.com). Vissa, som Ericsson t.ex., publicerar sin årsrapport på nätet. ABB har, förutom information om alla underbolag, produkter och länkar till lokala sidor, även information om hur man söker arbete på företaget. Trygg-Hansa har en del simuleringar på sin sida, man kan beräkna hur mycket man får i pension, vad bilen kostar per år etc.
Mindre företag kan ha små webbplatser med kanske bara en sida, som då fungerar närmast som en annons i Gula sidorna. Andra, särskilt sådana som säljer reservdelar eller är underleverantörer till större företag, kan ofta ha lagerlistorna utlagda på nätet.
41 Se http://home3.swipnet.se/~w-38951/oonl9701.htm
5.2.6 Tidningar och tidskrifter samt etermedia
Kungl. Biblioteket har en förteckning på www över Svensk periodica online,42 där det i mars 1998 fanns 225 tidskrifter, 16 storstadsdagstidningar, 54 landsortsdagstidningar, 5 finlandssvenska och en svenskamerikansk tidning.
Tidskrifterna är – för att nu generalisera en aning – oftast mer specialiserade och håller sig inom sitt fackområde. Här finns artiklar, ibland ljudfiler men sällan direkta tjänster. Både tidskrifterna och tidningarna har i rätt hög grad tryckmetaforen kvar – de försöker designmässigt likna sina tryckta förebilder. Många nätpublikationer har dock påfallande lite redaktionellt material och är då snarast en elektronisk reklamfolder för den tryckta förlagan.
Råd & Rön har en intressant blandtjänst. Man kan söka i deras artikelarkiv och läsa första stycket i de artiklar man får träff på. Är man prenumerant och har registrerat sig, kan man läsa hela artiklarna. Annars får man beställa tidningarna från tidskriftens kundtjänst.
Svenska Dagbladet bjuder på några dagsfärska nyheter, samt ledarsidans huvudartikel, från kultursidan några recensioner samt understreckaren, kalendarium över Stockholmshändelser samt tabeller över aktuella sportresultat. Man bjuder också på dessa kategorier av artiklar fyra veckor bakåt. SvD har även en service, där man kan skräddarsy sina tablåer över TV-programmen.
Dagens Nyheters webbupplaga bjuder också på en del utvalda nyheter, dagens huvudledare och artikeln på DN Debatt. Från kultur- och nöjessidorna kan man läsa ett hyfsat urval, men de är uppblandade med de senaste dagarnas artiklar, så det är svårt att omedelbart se vilka som hör till just dagens nummer. DN laddar upp artiklar för kommande dags nummer redan på kvällen och man kan också se den kommande förstasidan i pdf-format.
Aftonbladet profilerar sig med en mera kontinuerlig uppladdning av senaste nytt men har också vissa kultur- och ledarartiklar. En del nyhetsartiklar, artiklar ur Aftonbladet Kvinna m.m. kan man läsa i ett korttidsarkiv, längre tillbaka är man hänvisad till betaltjänsten Mediearkivet, som även omfattar artiklar ur Göteborgs-Posten, Nerikes Allehanda, Dagens Eko, TT och Svenska Dagbladet.
Expressen för nästan uteslutande fram sport- och nöjesmaterial på bekostnad av politisk kommentar och kulturdebatt. Detta är den minst påkostade webbplatsen av de fyra Stockholmstidningarnas.
De flesta stora dagstidningarna har då och då specialevenemang för att locka läsare, av typen QuickTime VR-filer med panoraman över re-
42 Se http://www.kb.se/nbp/el-per.htm
daktionen eller någon aktuell lokal (Nya Moderna museet t.ex.) eller interaktiva spel.
Landsortstidningarna är ofta ungefär lika professionellt gjorda som storstadstidningarna. En påtaglig uppryckning har skett bland samtliga dagstidningar det senaste året. Falukuriren43 är rätt typisk för landsortstidningarna, med sidor för de olika orterna i spridningsområdet. Dessutom har man en ovanligt genomförd tidningsmetafor med en papperssida med nedvikt hörn och tidningens logotyp som följer med, oavsett vilken avdelning man befinner sig på.
Östersundsposten, som var en av de första landsortstidningarna på nätet har dragit konsekvensen av URL-adressernas avsaknad av svenska tecken och kallar sig ”OP.se”, utan prickar alltså.44
Sundsvalls Tidning har en mycket genomarbetad webbplats och tar också ut en avgift för vissa artklar. Prenumererar man på papperstidningen, kostar det 25 kronor per månad, annars 80 kr per månad. I en programförklaring säger webbredaktören Tommy Klaar:
45
– Vi är mycket snabbare än andra medier. Tommy Klaar har ett exempel från socialdemokraternas kongress där det var klar i förväg att Mona Sahlin skulle väljas. Medierna tvingades givetvis vänta på det officiella beslutet innan en publicering var möjlig. – Jag var uppkopplad med en bärbar dator och hade skrivit hela artikeln, säger Tommy Klaar. När beslutet kom räckte det med ett tryck på return-knappen. – Samtidigt var jag ute på nätet. Vi var före DN, TT och Aftonbladet, säger han. En annan fördel med den elektroniska tidningen är möjligheterna till fördjupning. Genom att länka till hemsidor med mer information kan läsaren välja om han eller hon vill läsa mer om ett visst ämne.
Av radiokanalerna har Sveriges Radios samtliga kanaler ljudande material på Internet. Det mest regelbundna är Ekosändningarna, som finns som Real Audio-filer. Många andra program i P1 och P3 finns också utlagda på nätet. P2 har dock bara månadens P 2-fågel att erbjuda. Även lokalkanalerna inom SR-koncernen har ljudfiler utlagda, t.ex. Radio Sjuhärad.46
De kommersiella musikradiostationerna har också sidor. Radio Bandit presenterar olika listor och sina diskjockeys samt sänder programmen live på nätet, med hjälp av s.k. streaming audio-teknik. Man kan då välja
43 Se http://www.falukuriren.se/44 Se http://www.op.se/45 Se http://www.stonline.se/online/IT/IT/STO/STO.htm46 Se http://www.sr.se/sjuharad/
mellan tre olika ljudkvaliteter.47 Radio City har främst en 30 i topp-lista och presentation av kanalen i de olika städer där man sänder, Stockholm, Göteborg och Malmö. Radio Rix är ett nätverk av flera kommersiella stationer med egna sidor i t.ex. Karlstad, Sundsvall och Umeå. t.ex. En central rikssida finns också.48
Sveriges Television har en del nyhetsmaterial utlagt, det mesta som text. Vissa Rapportinslag kan förekomma som digital video.49 TV 4 har skaffat sig en betydligt överskådligare webbplats nu än vad man hade för något år sedan. Man för också fram nyhetsrubriker på ett sätt som liknar tidningarnas eller de renodlade nyhetstjänsternas layoutidé. För övrigt har man information om de s.k. tvåloperorna och andra populära program på sin förstasida. TV 4 har också en chatverksamhet, dit kända och aktuella personer bjuds in.
Gemensamt för etermedierna på nätet är förstås att de publicerar sina programtablåer.
Ovanlig är nyhetstjänsten 24 timmar, en liten annonsfinansierad nyhetstjänst i Örebro utan tryckt motsvarighet.50 En annan, men förstås med helt andra resurser, är Svenska CNN.51 25 timmar heter ytterligare en annonsfinansierad nyhetstjänst, som arbetar via en skärmsläckare som laddas med kontinuerliga nyheter med hjälp av pushteknik.52 Flera sådana här tjänster är att vänta, för på nätet är säkert tidningsmetaforen en övergångsform som bara finns kvar tills läsarna har vant sig vid en mera flexibel databaspresentation av nyhetsstoff.
Den genomsnittliga europeiska nyhetstjänsten har 5 anställda, vilket beräknas öka till 9 under det kommande året, enligt en undersökning gjord av Interactive Publishing Surveys i januari 1998. Om man jämför med USA kan man konstatera att den genomsnittliga onlineredaktionen för en nyhetstjänst där består av 8 personer, och den beräknas växa till 11 det kommande året.
53En annan undersökning, gjord av Middleburg + Associates54 visar att andelen originalmaterial framställt enbart för onlinetjänster ökar. 1997 uppgav 7 procent av de tillfrågade amerikanska tidningarna att de hade
47 Se http://bandit.se48 Se http://www.rix.se/49 Se http://www.svt.se/svt24/50 Se http://www.24timmar.se/51 Se http://cnn.passagen.se/52 Se http://www.25timmar.se/53 Undersökningen omfattar 140 onlinetjänster och finns på http://www. interactivepublishing.ch/survey54 Se http://www.mediasource.com/intro.htm
mer än hälften unikt material i nätupplagan, 1998 var det 20 procent som hade mer än hälften originalmaterial.
6 Ett försök att se in i framtiden
Alla aktörer på mediemarknaden famlar sig fram i dag och försöker finna något fotfäste. För bara ett par år sedan var förlag, tidningar och även vanliga företag, organisationer, rent av kommuner, rädda att missa IT-tåget. Det gällde alltså att hoppa på medan tid var. Många felaktiga investeringar gjordes, långsiktigt tänkande anbefalldes på många håll, men få av de traditionella aktörerna på mediemarknaden har haft den uthållighet som krävts.
Runt 1991-92 förutspåddes diskettboken bli en storsäljare. Affärsresenärerna skulle förhoppningsvis ligga och läsa klassisk litteratur på sin laptop på hotellrummet i stället för att tömma minibaren. Voyager gav ut ett antal sådana här böcker och Norstedts skulle 1993 ge ut några titlar av Jonas Gardell och Jan Guillou, men man fick kalla fötter när broschyrer och omslag redan var gjorda – och böckerna kom aldrig ut.
Idag ser man sådana böcker alltmera sällan. Nu konkurrerar man mera med multimediala effekter. Min gissning är att mera renodlade textböcker ändå kommer så småningom, framför allt när skärmstandarden blivit bättre, när vi kan vika ihop skärmen och stoppa den i fickan som en tidning och när kontrast och upplösning närmar sig papperets. Dessutom krävs kanske en fokusering på innehåll, till skillnad från form, som ju tenderar att dominera när nya medier kommer. Minns någon stereoradions första stapplande steg med spatialt utspridda hörspel, där folk stod och ropade från var sitt hörn? Eller den tidiga färgtelevisionens demonstrativa blomstersymfonier?
En möjlighet är kanske talboken i nya former. Nyligen lanserades t.ex. Audible MobilePlayer,55 en liten ”walkman” som man ansluter till Internet för att ladda ned ljudfiler med tal – böcker eller radioprogram upp till två timmars längd – för senare avlyssning i bilen eller under promenaden.
6.1 Kontroll och personalisering
Datoreran, eller snarare persondatoreran, har fört med sig två delvis motstridiga tendenser. Man vill helst ensam kontrollera alltmer av arbetsprocesser som tidigare varit uppdelade på flera personer. Tydligast
55 Se http://www.audible.com/
blev det kanske inom desktop publishing, där plötsligt en person kunde skriva, fotografera, designa, bildbehandla, färgkorrigera och skriva ut tryckoriginal på någon 600-punkters laserskrivare. Samtidigt vill man gärna sätta sin personliga prägel på både innehållet och verktyget. Aldrig har väl en skrivmaskin utsmyckats så som en datorskärm med alla specialvarianter man kan installera av bakgrundsbilder, ikoner, olikfärgade menyer och specialpapperskorgar.
Samtidigt finns inom nätvärlden också ett visst experimenterande med identiteter, inte minst i s.k. MUDs och chatkanaler, olika typer av kollektivt skrivande, tillfälliga roller i såväl lek som allvar som möjligen pekar i en annan riktning. Båda fenomenen skulle dock kunna tas till intäkt för att det ligger något i vad bl.a. teoretiker som Marshall McLuhan hävdat, att datorn är en sorts förlängning av vårt nervsystem, till skillnad från mekaniska maskiner som är en förstärkning eller förfining av våra muskler och deras arbete.
6.2 Läsaren som medförfattare
När nu publiceringen flyttar in i denna nya mentalitet, kan man nog förutse just en ökad personalisering av böcker, texter och annan information. Det talas i dessa dagar mycket om text mining, när man ser texter som en sorts råvara ur vilken man kan utvinna olika typer av kunskaper och samband med hjälp av program med någon form av artificiell intelligens som logiskt kan tolka samband utifrån lingvistiska strukturer. Det diskuteras mest i samband med stora organisationers informationslogistik, men jag tror detta kommer att bli mycket betydelsefullt även på det individuella planet.
Böcker kanske kommer att levereras i ett neutralt råformat. Som läsare väljer man sedan sitt favoritverktyg för läsningen. Man kan då utnyttja någon enkel bläddrare eller något mera avancerat läsverktyg, som kanske medger översättning av texten, sammanfattningar av vissa avsnitt, eller man kanske vill att all argumentation skall analyseras och underförstådda respektive explicita presumtioner pekas ut. Det som tidigare varit en rent mental akt, den s.k. personliga läsarten, kan kanske bli något som lagras i läsinstrumentet, så att man sedan kan låna en annan persons läsart och så att säga läsa texten genom hans eller hennes glasögon.
Tänker man sig en nätverksversion av detta, ligger inte Ted Nelsons vision om ett docuverse så långt borta. Han tänkte sig att ett nätverk med mängder av sammanlänkad information – ungefär som www – också skulle kunna utökas med läsarnas marginalanteckningar, tankar och kommentarer, så att man skulle kunna dra nytta av varandras idéer på ett
helt nytt, oerhört effektivt sätt. Det ska i så fall givetvis finnas filter som gör att man kan se grundtexten oförändrad och sedan alla nivåer av auktoriserade såväl som icke-auktoriserade kommentarer.
Det där ligger en bra bit in in framtiden, om det nu alls blir så. Vad som däremot kan inträffa tidigare är att ett mera standardiserat råformat för uppslagsverk och läromedel uppstår. Man skulle då slippa vara beroende av vissa bra uppslagsverks dåliga gränssnitt. Har man köpt innehållet i detta flexibla format, kan man läsa det med det verktyg och det gränssnitt man föredrar. Författarna och förlaget kan då exv konkurrera med inte bara en högkvalitativ text, utan även med en metamärkning av texten som medger intressanta sökmöjligheter.
Och redan nu finns ju automatiserad översättning. Alta Vista har en sådan tjänst sedan i december 1997.56 Förmodligen är detta början till en verklig globalisering av Internet. Språkfilter kommer snart att bli oerhört vanliga, för e-post, för ögonblicklig dubbning eller textning av filmer, radioprogram etc. Förhoppningsvis kommer språkfilter inte att avhålla människor från att lära sig språk utan istället stimulera språkintresset, när man på detta sätt får inblickar i kulturer man kanske inte annars skulle kunnat få någon kontakt med alls.
Gränsen mellan tal och skrift kommer nog inte att upplösas i framtiden, men gränslinjen mellan dem kommer att se mycket annorlunda ut, när vi också får mera av taligenkänning (speech recognition), och vi kan gå runt med små handdatorer eller ”fickminnen”, som direkt omvandlar det vi talar in till redigerbara datafiler, alltså inte sekventiellt på ett band, utan så att man direkt med rösten kan styra in varje röstanteckning i sin fil. Text kommer att bli något som också ljuder, lika självklart som ett ljudband gör i dag, och omvänt kommer tal självklart att vara potentiella tecken – eller annat tal, på andra språk t.ex. Man kan här ana både nya former för publicering och nya konstformer.
När det gäller de här möjliga utvecklingsvägarna, förefaller det, oavsett utfall, som om två krafter står mot varandra. Får den ena råda, kommer vi alltmer att utnyttja de elektroniska mediernas flexibilitet (oformlighet och obeständighet skulle man säga om man vill accentuera den negativa sidan) till att skapa något i stil med Nelsons docuverse. Får den andra råda, uppstår alltmer en informationsprotektionism som svartsjukt bevakar alla idéer så att de inte sprids innan de skyddats för andras exploatering. Kanske går vi mot en tid när inte bara en idés praktiska uttryck i form av en viss bok eller text blir föremål för upphovsrättsligt
56 Alta Vistas översättningstjänst bygger på teknik från Systran och finns på adressen http://babelfish.altavista.digital.com/. Det finns också moduler till epostprogram som direkt översätter ens elektroniska korrespondens, t.ex. EasyTranslator för programmet Eudora och svenska TFS Gateway.
skydd. Kanske sprider sig en sorts patenttänkande även till saker som tidigare betraktats som konstnärliga eller vetenskapliga verk. Jag tror det är en i högsta grad öppen fråga vilken av de här krafterna som kommer att dominera. Man kan ju t.ex. fråga sig om frisläppandet av Netscapes källkod (se avsnitt 2.1) är ett uttryck för en skiftning i den här konflikten eller om det är ett rent affärstrick.
6.3 Förlagen
Vad kan förlagen egentligen ge för mervärde i den nya situation som håller på att uppstå? Vid ett möte med Society for Scholarly Publishing sade hydrologen James Wallis vid IBM Watson Labs:
The problem with you publishers is you think you add value. Well, you don’t. You force me to reduce the information in my scientific papers so that they will fit on a flat printed page.
57Som svar på sådan kritik startades tidskriften Earth Interactions i januari 1997.58 Man ville från början gå utanför den vanliga sidans begränsningar och använda sig av avancerad grafik, simuleringar, exekverbar programkod m.m.
Inom just den vetenskapliga publiceringen kommer nog mycket att hända. Redan nu finns ju ett missnöje, där många anser att i synnerhet statligt finansierad forskning tvingas betala sin litteratur två gånger. Därför ges förhållandevis mycket ut elektroniskt, andelen är större här än inom generell publicering.
Peer-review systemet kommer kanske att sprida sig till andra områden än rent akademiska och omfatta inte bara ”review” utan kanske rent av ”peer-authoring”, skrivandet kan komma att bli en mycket mer kollektiv affär än det varit på hundratals år.
Det diskuteras ofta när något egentligen blir offentligt. Är ett meddelande som skickats till en nyhetsgrupp en publikation som man kan referera till t.ex. i ett akademiskt arbete? Förutom problemet med när en pågående framställning ska anses genomtänkt och mogen, kan man rimligen inte hänvisa till något som är så obeständigt som nätet är, i varje fall i sig självt, ute i det vardagliga bruket. Samtidigt är det svårt att se något alternativ till hänvisningar till material på nätet, vilket inte minst denna text är ett belägg för. Om däremot de olika arkiveringsinitiativ
57 Se Journal of Electronic Publishing på http://www.press.umich.edu/jep/03-01/EI.html58 Se http://earthinteractions.org/
som är i gång (Kulturarw3, Brewster Kahles Internet Archive etc.) blir framgångsrika, har man ett institut som kan borga för en kontinuitet i själva referensinstrumentariet. Ett steg på vägen är förstås också att dels programvara tas fram som kan säkra texter på en server, dels att dokumentets identitet och revisionshistoria kan kartläggas med id-nummer och någon form av versionsnummer, ungefär som dataprogam har haft länge.
Dessutom bör en utgivare ta ansvar för sin utgivning – det som ligger på hans eller hennes server skulle vara skyddat, ett auktoriserat ”exemplar” skulle således uppstå bland alla de kopior som kan vara i omlopp på nätet. Detta är en möjlighet, kanske mindre trolig, men i så fall en tillfällig lösning för de allra närmaste åren. På längre sikt, särskilt om möjligheterna till läsarkommentarer byggs in i systemet, måste nog lösningen på denna auktoritetsproblematik byggas in i själva dokumentarkitekturen, kanske rent av i framtida versioner av ASCII eller motsvarande teckenuppsättningar, för kanske ger olika former av metamärkning, checksummor osv. inte tillräckligt skydd mot intrång.
Linköping University Press tillämpar dock ett intressant system med checksummor presenterade som PGP-strängar,59 kombinerat med att originaldokumentet lagras i flera exemplar i pappersform (tillsammans med PGP-strängen).
”One of the key requirements on the E-Press is that it shall not be possible for anyone to modify an article after it has been published. In particular, of course, it shall not be possible for the author to modify his or her work in order to 'improve' the results retroactively”, skriver man på Linköping University Press hemsida apropå dessa säkerhetsrutiner.60Men detta att kunna förbättra är ju samtidigt en av de stora fördelarna med en elektroniskt publicerad text, som absolut borde utnyttjas om det kan göras på ett överskådligt sätt, så att man vet vem som ändrat vad och vad som är ursprungstext.
Bra bibliografier och annan nyttig information om elektronisk publicering av akademiska skrifter finns hos University of Houston, på webbsidan ”Scholarly Electronic Publishing Bibliography”.61 Översikt över publikationer på just www finns på sidan ”Scholarly Journals Distributed Via the World Wide Web”.62 Ett annat vanskligt företag när det gäller elektroniska publikationer är, som redan antytts, att referera till andra elektroniska källor. På sidan ”Citing Electronic Information”
59 PGP = Pretty Good Privacy, krypteringsprogram skapat av amerikanen Phil Zimmerman.60 Se http://www.ida.liu.se/ext/cgi-bin/epa/protect.html61 Se http://info.lib.uh.edu/sepb/sepb.html62 Se http://info.lib.uh.edu/wj/webjour.html
(http://libweb.sdsu.edu/cite.html) finns upplysningar om olika försöka att bringa reda i detta.
6.4 Självpublicering i nya former
När det gäller självpublicering, så finns det ju redan i flera former, de egna dikterna och romanförsöken läggs ut på nätet utan att någon förlagsredaktör lagt sig i. Men även alla dessa hemsidor där människor berättar om sig själva, familjen, sitt arbete, sina vänner och intressen är ju en sorts självpublicering. Ofta laddar man upp även dagböcker här. Detta är otvivelaktigt en form av publicering och definitivt något nytt.
Här uppstår ett sätt att synliggöra sig i världen som skiljer sig från traditionell publicering, genom att man inte alltid förväntar sig läsare; det liknar mera flaskposten som kastas ut i havet i hopp om att någon ska finna den. Dock har man här chansen att träffa rätt läsekrets på någon avlägsen strand, för sökverktygen gör ju att vissa ord och ämnen genererar sökträffar. Detta förebådar säkerligen något nytt, där inte längre utgåvor av publikationer kommer att vara lika påtagliga, där man snarare gör sig själv till en kontinuerlig publikation, ständigt utställd och tillgänglig i ett mer eller mindre offentligt rum.
I en sådan värld skulle publicering och offentliggörande inte vara de aktiva processerna. Publicering skulle helt enkelt vara normaltillståndet, en självklar biprodukt av all normal produktion, fritid och liv, en sorts fjärrnärvaro i olika ständigt disponibla informationsmängder. Den aktiva handlingen skulle snarare bli tillbakahållandet, skapandet av hemliga, privata rum. Om detta skall anses vara en utopi eller en dystopi beror säkert på hur stor valfriheten blir mellan dessa poler av tillgänglighet.
Hybridformer mellan den personliga hemsidan, chatlinjer där man skapar sig en fiktiv identitet och ICQ-nätverk63 av vänner och bekanta, som man ständigt är i förbindelse med via portabla miniatyrdatorer, blir kanske första steget mot en sådan utveckling. Det finns redan starka tendenser i medierna till en upplösning av gränsen mellan fakta och fiktion, liksom mellan privat och offentligt. En sådan här hybrid utgör kanske en annan aspekt av detta.
Servrar kan komma att bli framtidens bankfack, där vi förvarar våra digitaliserade värdesaker, elektroniska pengar, familjealbumet som släktingar runt hela världen kan titta i osv. Allt snyggt säkerhetskopierat på ett par ställen i världen, skyddat för såväl brand som inbördeskrig. I en
63
ICQ (uutalas I Seek You): program som visar vilka av ens vänner som är uppkopplade mot nätet.
sådan miljö kommer ett begrepp som kopiering för enskilt bruk att närma sig publiceringen. Man kan ha ett litet intranät för närmaste vännerna, där man i lugn och ro helt lagligt enligt dagens definitioner skulle kunna sprida annars skyddat material.
6.5 Ny mentalitet
Upphovsrätten kommer säkert att förändras drastiskt, i varje fall på längre sikt. Med copyrightens uppkomst centrerades publikationerna på 1700-talet på ett tidigare inte skådat sätt kring personen, författaren. Kanske håller vi nu på att skapa en ny typ av inriktning mot ett mera upplöst personbegrepp, där man inte längre kan räknas som upphovsman på det gamla sättet utan som deltagare i en kollektivt självpublicerad rymd av information. Den tidigare skisserade läsarten som man tillgodogör sig med hjälp av olika program, ställer förstås också frågan om vem som blir författare i en sådan situation – och vad verkshöjd är. Gamla verk som skrivits traditionellt och som återutges på det här nya sättet kan förstås inte anta vilka former som helst. Men vad händer när författare börjar skriva speciellt med tanke på de här möjligheterna?
Det rent mentala koncipierandet av texter, de nya gestalter idéer och fakta kan få när de passerat en eller flera människohjärnor och några konstgjorda, tror jag är en mycket viktig infallsvinkel när det gäller att analysera vad framtiden innebär för publicering, distribution, upphovsrätt, hela kunskapsbegreppet, kanske rent av medvetandebegreppet. Den är minst lika viktig som att försöka räkna ut hur apparaterna kommer att se ut, om vi kommer att ha datorn inbyggd i glasögonen eller om vår sänglektyr kommer att projiceras i taket osv.
Nya möjligheter kommer givetvis att förändra tänkesättet – och tvärtom. Sambandet är oskiljaktigt. De nya möjligheterna kommer säkerligen också att lösa upp den medieidentitet som förlag, TV-bolag, radiostationer etc av tradition har haft. Istället kommer man antagligen att förmedla information – möjligen begränsad till vissa ämnen man specialiserat sig på – och efter förhållandena välja om innehållet bäst presenteras som text (då blir man temporärt ”förlag” eller ”tidning”) eller som rörliga bilder (då blir man ”TV-bolag”) eller med ljudfiler (”radiostation”) eller med en kombination. Dagens multimediala imperativ kommer förhoppningsvis att adlas till friheten att välja uttrycksmedel.
Teknisk rapport
angående förutsättningarna för robotbaserad insamling och
leverans av Internetdokument
Johan Palmkvist
johan@palmkvist.com
Maj 1998
1 Inledning
Denna rapport beskriver ur teknisk synvinkel uppdraget att samla in och arkivera svenskt material från Internet. Rapporten består av fyra delar, där den första beskriver olika aspekter av själva problemet – vad innebär uppdraget egentligen? Del två och tre beskriver lösning av problemet, vilket naturligt sönderfaller i de två delarna insamling och arkivering. Slutligen diskuteras kostnader i rapportens sista del.
2 Problembeskrivning
Detta kapitel försöker ge en beskrivning av problembilden – vad innebär det egentligen att arkivera den svenska delen av webben? Vad är egentligen en sida, och vad är svenskt i en värld som går tvärs över nationsgränser? Vad är en webbrobot? Vilka typer av material stöter den på på sin vandring över webben? Vilka är svårigheterna, och vad kan man veta eller gissa om framtiden?
2.1 Vad är en sida?
Man talar om begreppet webbsida som om det vore något mycket väldefinierat, men det visar sig snabbt att det inte finns någon självklar definition. Till att börja med kan vi säga att det man når om man följer en viss länk, en viss URL, är en sida. Men denna sida innehåller normalt en mängd länkar till andra resurser, som t ex html-dokument eller bilder. Ingår dessa i den första sidan? Kanske inte html-dokument, men bilder måste nog anses göra det, eftersom man inte kan se sidan som den var tänkt att se ut utan dess bilder. Så långt inga större problem. Men arkiveringsprojektet måste också ta hänsyn till när sidor ändras, eftersom det bara är ändrade sidor man behöver arkivera på nytt. En sida som i sig inte har ändrats, men som pekar ut en bild som är ändrad, ska den anses vara ändrad? Detta är inte så stort problem för själva insamlandet, eftersom man kommer att arkivera en ny version av bilden men inte av sidan som länkar till den, men det ställer krav på strukturen hos själva arkivet. En och samma sida måste kunna visas tillsammans med olika versioner av en bild.
2.2 Vad är svenskt material?
För projektet Kulturarw³ har en viktig del i arbetet varit att definiera vad som ska anses vara svenskt material på webben, och som därmed ska arkiveras. Relativt självklart är att alla domäner inom toppdomänen ’.se’ kan betraktas som svenska och följaktligen allt material på desamma som svenskt. Network Information Centre Sweden (NIC-SE)1, som administrerar alla underdomäner till ’.se’-domänen, ställer dock relativt hårda formella krav för att få registrera en domän under ’.se’. Detta gör att många söker sig till andra toppdomäner som tex de icke nationsspecifika toppdomänerna ’org’, ’.com’ och ’.net’ vilka har betydligt mildare krav för registrering av underdomäner. Oftast är det ”först till kvarn” som gäller, och man kan registrera vilket namn som helst.
Här kan noteras att en annan anledning för företag och organisationer att välja toppdomänerna ovan är att dessa på sätt och vis fungerar som internationell ”telefonkatalog” över webben eftersom de inte är nationsbundna. Den som till exempel känner till namnet på ett företag, eller företagets huvudprodukt, men inte vilket land företaget ligger i, kan ofta hitta den sökta webbplatsen genom att i sin webbläsare pröva http://www.<företagsnamn eller produktnamn>.com. Med en fungerande ”telefonkatalog” för webben skulle denna landsflykt därför kanske minska.
Det förekommer också att svenskar väljer andra nationers toppdomäner som ger mer eller mindre fyndiga URL:er på svenska, exempelvis ’.tm’ och ’.nu’ (t ex http://www.krylbo.nu). Man kan därför tänka sig flera definitioner av vad som är svenskt på webben:
- Allt material som nås via URL:er under toppdomänen ’.se’.
- Allt material på webbservrar som rent fysiskt befinner sig i Sverige.
- Allt material inom domäner registrerade med svensk postadress eller svenskt telefonnummer.
- Allt material som riktar sig till, eller är intressant för, svenskar.
Att kriterierna ovan i viss mån är överlappande är uppenbart. I vissa fall är de till och med motsägande, exempelvis kan domäner under toppdomänen ’.se’ mycket väl ligga på webbservrar placerade utanför Sverige, men bör nog ändå anses svenska. Början till en rimlig definition fås om man i listan ovan använder kriterierna i den ordning de står, dvs svenskt material är alla URL:er under toppdomänen ’.se’, dessutom allt
1 [http://www.nic-se.se]
material utanför ’.se’-domänen som ligger på webbservrar i Sverige, osv.
Tyvärr slutar inte svårigheterna där. En sida inom ’.se’ har ansetts som svensk enligt ovan. Men en sådan sida kan ju mycket väl innehålla länkar till sidor utanför denna toppdomän. Ska då även dessa länkade sidor arkiveras? Man har inom Kulturarw³ valt att generellt sett inte följa dessa länkar, då de ju uppenbart ligger utanför Sverige, och den hämtade sidan kan anses fullständig i sig själv, även utan möjlighet att klicka sig vidare från den. I vissa fall innehåller dock svenska sidor bilder som inte ligger inom svensk domän. En sådan sida kan knappast anses komplett i arkivet om man inte kan se bilden, så i dessa fall har även den inlänkade bilden hämtats.
2.3 Hur fungerar en webbrobot?
En webbrobot är programvara som arbetar sig igenom webben genom att ta sig från webbplats till webbplats, från webbsida till webbsida, och bearbeta den information den finner på sidorna på något sätt. De flesta webbrobotar är så kallade indexeringsrobotar knutna till någon söktjänst på nätet. En sådan robot samlar information om vad som finns på webbsidorna i syfte att presentera länkar till sidor som innehåller de sökord en användare har angivit. Ett exempel på en sådan robot är Scooter från Digital, som samlar sidor till söktjänsten AltaVista. En arkiveringsrobot hämtar istället hem hela innehållet på varje sida den finner, även bilder och ljud, och skickar det vidare till ett arkiv. Oavsett syftet med vandringen över nätet arbetar olika robotar efter ungefär samma principer.
Från en webbsida kan man i allmänhet ta sig till många andra webbsidor via klickbara länkar. Det betyder att när en robot har hittat en viss sida, har den på samma gång också hittat länkar till en mängd andra sidor. På så sätt bygger roboten parallellt med insamlandet av själva sidorna också upp en lista med URL:er att arbeta sig igenom. För varje länk den hittar söker den i denna lista för att se om URL:en redan finns där, och om inte adderas den till listan. Roboten kan även spara en lista med URL:er till varje webbplats startsida inför nästa stickprov. När roboten ska börja det nya stickprovet över webben finns då en lista medURL:er att starta med.
En viktig fråga är i vilken ordning webbsidorna ska besökas av roboten. När en viss URL hämtats från listan av URL:er, och motsvarande sida hämtats från nätet, finns ju en mängd länkar på denna sida. Ska roboten då följa dessa länkar direkt, och så arbeta sig vidare ”på djupet” innan den går vidare till nästa URL i listan, eller ska den bara lagra de
nya URL:erna i listan och återkomma till dem när den har kommit så långt i listan? I det första fallet får man sidor som är sammankopplade med länkar någorlunda samtidigt, det vill säga risken att informationen på sidorna inte hänger ihop är liten. Nackdelen är dock att servern dessa sidor ligger på blir hårt belastad medan man ”dammsuger” den på all information. Den senare metoden ger en jämnare last på webbservrar, men samtidigt en sämre ögonblicksbild av informationen.
En robot bör vara så flexibelt konfigurerbar som möjligt för att underlätta ändrade förutsättningar. Exempelvis bör definitionen av var gränsen för robotens vandring ska gå (dvs i vårt fall definitionen av vad som ska anses vara svenskt, enligt ovan) vara parameterstyrd i robotens konfiguration.
2.4 Olika typer av webbprotokoll
Kommunikationen mellan webbläsare och webbservrar sker enligt väldefinierade protokoll, lämpliga för olika typer av material och ändamål.
- HyperText Transfer Protocol (HTTP) är det protokoll som oftast används för publicering av information på webben, varför detta dokument huvudsakligen fokuserar på HTTP.2
- File Transfer Protocol (FTP) används mest av så kallade filarkiv för distribution av programvara och har därför inte ansetts ha högsta prio-ritet ur bevarandesynpunkt.3
- Network News Transfer Protocol (NNTP) används för överföring av Usenet News där (oftast) publika diskussioner förs. Protokollet kan där-för vara intressant att samla in.4
- Simple Mail Transfer Protocol (SMTP) används för att distribuera elektronisk post, e-post, över Internet. Även om ambitionen inte är att bevara all vanlig e-post, kan det ändå vara intressant att bevara epostlistor (alias/listserv), där diskussioner liknande dem på Usenet News förs. Exempelvis publicerar många av våra riksdagspartier regel-bundet nyhetsbrev på detta sätt.5
2 Hypertext Transfer Protocol -- HTTP/1.0 [ftp://ftp.internic.net/rfc/rfc1945.txt] och Hypertext Transfer Protocol -- HTTP/1.1 [ftp://ftp.internic.net/rfc/rfc2068.txt]3 File Transfer Protocol [ftp://ftp.internic.net/rfc/rfc959.txt] och FTP Security Extensions [ftp://ftp.internic.net/rfc/rfc2228.txt]4 Network News Transfer Protocol [ftp://ftp.internic.net/rfc/rfc977.txt]5 Simple Mail Transfer Protocol [ftp://ftp.internic.net/rfc/rfc821.txt]
- Gopher kan i viss mån ses som HTTP/HTML:s föregångare och det finns inte alls så mycket publicerat på gopher. Dock kan det material som finns kvar vara intressant att bevara.6
- Så kallade streamade protokoll, som används till exempel för radioeller TV-sändning, är på stark frammarsch. Utmärkande för streamade protokoll är att inte all information behöver ha skickats färdigt innan den kan börja konsumeras. De flesta av dem är dock leverantörsspecifika standarder som inte är offentligt dokumenterade och därför svåra att samla in och bevara.
2.5 Olika typer av material
Beroende på bl a typ av information är webbsidor definierade på olika sätt, med hjälp av olika språk som webbläsare kan tolka. En arkiveringsrobot måste också kunna hantera dessa olika typer av material.
HTML
HyperText Markup Language (HTML) är egentligen ett språk för att definiera strukturen hos dokument, men det används i praktiken mest för att definiera utseendet hos dokument. Idag är de flesta sidorna på webben definierade m h a HTML. För närvarande används oftast följande två versioner av HTML på webben:
- HTML 2.07
- HTML 3.28
Vidare har nästa version, HTML 4.0, just tagits fram9.
Här följer ett exempel på hur ett HTML-dokument är uppbyggt, tillsammans med hur det ser ut när en sökrobot arbetar sig igenom den:
6 The Internet Gopher Protocol [ftp://ftp.internic.net/rfc/rfc1436.txt]7 http://www.w3.org/MarkUp/html-spec/8 http://www.w3.org/TR/REC-html32.html9 http://www.w3.org/TR/REC-html40/
Ett HTML-dokument skall enligt specifikationen för HTML 3.2 ha följande struktur:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN"> <HTML> <HEAD> <TITLE>Nisses Vulk</TITLE> ... other head elements </HEAD> <BODY> ... document body </BODY> </HTML>
I HTML-dokumentets ”BODY” finns en del element som är av speciellt intresse för en webbrobot. Det är de element som pekar ut andra länkade resurser såsom tex HTML-dokument eller bilder:
- A – Anchor elements, används för att definiera länkar:
<A href="http://www.nisses-vulk.se/prislista.html">
- IMG – Inline images, används för att inkludera bilder:
<IMG SRC="turbofalg.gif" ALT="Turbo fälg">
- APPLET – inkludera Java Applets (i HTML 4.0 ersatt av OBJECT):
<applet code="falgar.class" width=500 height=500> Java applet som visar rullande Turbo fälgar. </applet>
- MAP – Client-side maps:
<img src="navbar.gif" border=0 usemap="#map1"> <map name="map1"> <area href=prislista.html alt="Prislistan" shape=rect coords="0,0,100,20"> <area href=falgar.html alt="Fälgar" shape=rect c oords="100,0,200,20"> <area href=info.html alt="Information" shape=rect coords="200,0,300,20"> </map>
Nu vet vi lite om HTML-dokumentets uppbyggnad och kan följa webbroboten i några steg. I steg 1 hämtar roboten sidan http://www.kb.se. Då hittar den bland annat dessa länkade resurser i dokumentet:
<A HREF="eng/kbstart.htm"> <A HREF="eng/preserv.htm"> <A HREF="f1700/start.htm"> <IMG SRC="98mini.JPG" BORDER=0 HEIGHT=45 WIDTH=45 ALIGN=TEXTTOP> <IMG SRC="england.gif" BORDER=0 HEIGHT=20 WIDTH=32>
Roboten indexerar sedan sidan om den är en indexeringsrobot, och är den en arkiveringsrobot arkiverar den sidan.
Om roboten sedan hämtar den länkade resursen http://www.kb.se/eng/kbstart.htm kommer den i steg 2 bland annat att hitta:
<A HREF="/kbstart.htm"> <A HREF="eng/baltprog.htm"> <A HREF="eng/kbinfo.htm"> <IMG SRC="/BILDER/new.gif" BORDER=0 HEIGHT=18 WIDTH=30> <IMG SRC="eng/Sweden.gif" BORDER=0 HEIGHT=15 WIDTH=25>
Roboten upprepar detta förfarande för varje länkad resurs tills den hämtat hem alla länkade resurser inom den domän eller domäner som skall arkiveras, exempelvis den svenska toppdomänen ’.se’.
Style Sheets
Utseendet på webbsidor kan definieras med hjälp av s k style sheets, vilket är dokument med formatmallar som kan ligga separat från själva webbsidorna. Idag finns några olika standarder för hur style sheets kan skrivas:
- CSS1, Cascading Style Sheets level 1
10
- CSS2, Cascading Style Sheets level 2
11
- XSL, eXtensible Style Language
12 Skript, programvaror och plug-ins
Somliga webbsidor är delvis definierade m h a programkod, eller dataformat som använder så kallade plug-ins (insticksprogram), som exekveras när sidan visas upp. Det finns ett antal skript- och programspråk att använda för detta, exempelvis:
- EcmaScript, en standardiserad variant av språket JavaScript13
- Java Applet, ett sätt att paketera småprogram skrivna i Java14
- ShockWave, används för multimedia på webbsidor
15
- RealPlayer, för streamad överföring av ljud och bild
16
10 http://www.w3.org/TR/REC-CCS111 http://www.w3.org/TR/REC-CCS2/12 http://www.w3.org/Style/XSL13 http://developer.netscape.com/docs/manuals/javascript.html14 http://java.sun.com15 http://www.macromedia.com16 http://www.real.com
Denna typ av sidor ställer speciella krav på ett webbarkiv, eftersom programkoden måste kunna exekveras även om skript- eller programspråket den är skriven i inte längre används.
2.6 Svårigheter
Uppgiften att arkivera svenska webbsidor kan verka rättfram när man väl definierat vad som ska anses vara svenskt. Man stöter dock på en mängd problem, varav en del beror på att Internet fortfarande är ett relativt nytt medium som användarna ännu inte helt behärskar, samt att allt ännu inte är enhetligt standardiserat.
Svenskt material utanför ’.se’-domänen
Som nämnts ovan finns ofta domäner med svenskt material registrerade under andra toppdomäner än ’.se’. Hur hittar man dessa ”svenska” domäner?
Ett sätt är att söka i olika sökmotorer såsom AltaVista och HotBot efter svenska ord. Detta är dock ganska tidsödande och kräver en hel del manuellt arbete för att gå igenom de kandidater till svenska domäner som vaskats fram. En annan nackdel med metoden är att den utesluter svenska domäner med andra språk än svenska.
Ett annat sätt är att försöka få tillgång till registren över toppdomänerna och söka efter domänägare med svensk postadress (postnummer med SE- eller S-prefix, eller land SWEDEN) eller svenskt telefonnummer (+46). Inom ramen för Kulturarw³ hittade jag på detta sätt ca 9000 svenska domäner med totalt ca 5000 webbplatser i toppdomänerna ’.org’, ’.com’ och ’.net’.
Det finns också webbsidor som kan betraktas som svenska eller är intressanta ur svenskt perspektiv, som inte ligger på svenska webbservrar eller i svenska domäner. Enda sättet att på ett någorlunda automatiserat sätt hitta sådana sidor är att söka i sökmotorer efter svenska ord enligt ovan, med samma för- och nackdelar.
Slutligen ska nämnas att mycket material utanför ’.se’-domänen troligen kommer att hittas ryktesvägen.
Sannolikt bör man föra ett manuellt register över svenska domäner, svenska webbservrar och svenska webbsidor som roboten kan använda för att avgöra vad den skall samla in.
Databaser
När roboten stöter på en databas kan den ibland få svårigheter beroende på hur databasens gränssnitt ser ut. Har databasen URL-gränsnitt, dvs parametrarna till databasfrågan ingår i URL:en, kommer roboten att uppfatta sidan som en vanlig webbsida och kan arkivera den på vanligt sätt utan problem. Om databasen istället har ett frågegränssnitt, där parametrarna inte ingår i URL:en utan anges av användaren, uppstår däremot problem eftersom det är omöjligt för roboten att gissa frågor för att komma åt innehållet i databasen.
Här tangerar man frågan om vad som egentligen ska anses vara publicerat på webben. En definition vad gäller databaser kan vara att om databasen har URL-gränssnitt kan den anses vara publicerad, och kan samlas in med ordinarie robotteknik, medan databaser med frågegränsnitt inte är publicerade i egentlig mening, utan bara ”tillgängliggjorda”. Frågegränssnittet kan då ses som webbens kikhål in i databasen, vilken i sig inte ligger på webben. Dessa databaser torde dock trots detta vara lika intressanta att bevara som de med URL-gränssnitt. Ett sätt att lösa problemet är att ålägga den som publicerar en sådan databas att regelbundet tillhandahålla databasen i form av dokumenterade flata binärfiler enligt specifikation från KB.
Spärrade sidor
Vissa webbsidor är svåra eller omöjliga för en robot att komma åt, beroende på att de är spärrade för läsning på något sätt. Några varianter är vanliga:
En webbsida kan vara skyddad för obehörig access på flera sätt. Exempelvis kan sidan vara lösenordsskyddad. Roboten måste med andra ord känna till användarnamn och lösenord för att komma åt sidan och alla de sidor som ligger under densamma.
Det går också att konfigurera en webbserver så att den inte släpper in robotar till vissa sidor. Detta trots att den kanske lämnar ut sidan till alla andra på webben.
Vidare har många webbplatser en fil ’robots.txt’ innehållande de förhållningsregler besökande robotar förväntas följa för att anses ”väluppfostrade” (well-behaved). En typisk sådan förhållningsregel är att robotar inte får titta på vissa sidor på webbplatsen. Notera dock att detta är ett mjukare sätt att neka robotar tillträde; roboten kan välja att ignorera denna fil, och på så sätt ändå komma åt alla sidor på webbservern i fråga.
I samtliga dessa fall kan en lösning vara att uppmana till specialbehandling av just KB:s arkiveringsrobot, genom att i första fallet lämna ut användarnamn och lösenord och i de följande fallen tillåta just arkiveringsroboten att komma åt samtliga sidor genom omkonfigurering av servern respektive ändring i ’robots.txt’-filen.
Olika versioner för olika webbläsare
Olika webbläsare har egna implementationer av de standarder som finns på webben. De har ofta inte heller implementerat hela standarden. Nya versioner av standarder finns av förklarliga skäl inte i äldre versioner av webbläsarna. Detta sammantaget gör att samma sida ibland kan ha olika utseende och beteende i olika webbläsare. För att uppnå samma utseende och beteende görs ibland samma sida i olika versioner för olika webbläsare och deras olika versioner.
Vilken version skall roboten arkivera? En lösning är att konfigurera roboten så att den arkiverar den eller de versioner av sidan som motsvarar de webbläsare och de versioner av dessa webbläsare som är vanligast ibland de svenska användarna.
Imagemaps
Klickbara bilder på webben brukas kallas imagemaps. De finns i två skepnader: client side maps och server side maps.
Client side maps beskrevs ovan i avsnittet om HTML i kapitel 2.5 Olika typer av material. Där kan man se att länken, dvs URL:en, står med på sidan. Med andra ord bereder det inga problem för roboten att arkivera sidan och att följa länkarna för att sedan arkivera dessa också.
Server side maps däremot är svårare för roboten att få ut något vettigt av. Den klickbara bilden har i detta fall inte information omURL:en/URL:arna, utan koordinaterna för musklicket skickas till webbservern som utifrån dessa koordinater avgör vilken sida den skall skicka tillbaka till webbläsaren/roboten. Detta är dock relativt resurskrävande för webbservern, varför server side maps torde bli mer och mer ovanligt. En möjlighet för roboten vore den tidsödande metoden att ”klicka” sig igenom sådana bilder, låt säga var 5:e pixel, och se vad den får tillbaka för varje klickning. Lyckligtvis återfinner man dock oftast länkar till de sidor som döljer sig bakom den klickbara bilden på annan plats på sidan.
Dubletter
Ett problem är att samma material kan råka samlas in flera gånger på grund av att en och samma webbserver kan uppträda under flera namn. Detta problem kan inte lösas helt automatiskt, men roboten kan fås att göra intelligenta gissningar om i vilka fall flera servernamn gäller samma server och presentera dessa förslag för driftspersonalen.
Dubletter kan också uppstå orsakat av att vissa webbservrar inte skiljer mellan versaler och gemena i pathen i URL:en, medan andra gör det. Roboten utgår från att exempelvis ’nisse’, ’Nisse’ och ’NISSE’, som den hittat i pathen i olika URL:er pekande på samma fil, är namn på olika filer och således samlar in samma fil tre gånger. En möjlig lösning på detta problem vore att beräkna md5-checksumma på innehållet på sidor vars namn skiljer sig endast i fråga om versaler/gemena (md5 är en algoritm för beräkning av checksummor av informationsmängder, där risken att två olika informationsmängder skulle få samma checksumma är så gott som obefintlig).
Notera att problem med dubletter inte uppstår för indexeringsrobotar på samma sätt som för arkiveringsrobotar. I det förra fallet är ju det primära att kunna förse användare med länkar till viss information, varvid roboten kan nöja sig när den hittat en viss sida en gång. Ur arkiveringssynpunkt kan det däremot vara av intresse att veta om exakt samma information finns på flera webbplatser eller i flera filer på samma webbplats, varför den kan råka arkivera samma webbsida flera gånger.
Övriga problem
Utöver ovan nämnda större problem stöter arkiveringsroboten på ett otal andra problem. Som exempel är webbservrar ibland felkonfigurerade så att de lämnar felaktiga statuskoder etc. Ett annat stort problem är när URL:er innehåller tecken som inte är tillåtna enligt specifikationen, t.ex. ’\’ i pathdelen.
2.7 Framtid
Troligen kommer i stort sett alla svenska företag, myndigheter och organisationer att skaffa egen domän och webbserver på samma sätt som de idag har telefon och fax. Volymen, antalet sidor, på varje webbserver kommer troligen också att öka med tiden då det är ett effektivt sätt att sköta sin marknadskommunikation. Broschyrer, kataloger, prislistor och manualer är exempel på företeelser som lämpar sig för webben även om inte företagets verksamhet i sig har med Internet att göra.
Idag, 1998-05-03, finns det hos svenska NIC-SE17 10 557 registrerade domäner under den svenska toppdomänen ’.se’. Sannolikt finns det en eller flera webbservrar per registrerad domän.
Nya toppdomäner
Det finns idag ett antal icke-nationsbundna toppdomäner, exempelvis ’.com’ för företag och ’.org’ för organisationer. Skälet till att dessa finns är historiskt; det fanns tidigare ingen toppdomän för USA. Numera är det inte bara amerikanska företag som är registrerade under dessa domäner; av flera skäl väljer även andra att registrera underdomän till dessa (se ovan). Dessa icke-nationsbundna toppdomäner börjar nu bli väldigt stora. Ett skäl är att det hittills har ställts mycket små krav på den som önskat registrera en underdomän till dessa toppdomäner. Ett annat skäl är att de är mycket generella; inom ’.com’ ryms ju naturligt alla företag, helt oberoende av typ. För att råda bot på detta kommer man att definiera ett antal nya toppdomäner, med mer specifik inriktning. Dessa nya toppdomäner beskrivs av Generic Top Level Domain Memorandum of Understanding (gTLD-MoU)18 såsom följer:
.
firm for businesses, or firms
.shop for businesses offering goods to purchase .web for entities emphasizing activities related to the World Wide Web .arts for entities emphasizing cultural and entertainment activ ities .rec for entities emphasizing recreation/entertainment activities .info for entities providing information services .nom for those wishing individual or personal nomenclature, i.e., a personal nom de plume
För det svenska arkiveringsprojektet innebär detta att man får fler toppdomäner att söka svenska underdomäner/webbsidor under, enligt ovan.
Nya och kommande standarder
17 ftp://sunic.sunet.se/dbase/domreg.txt18 http://www.gtld-mou.org
Det sker en hel del utveckling av de tekniska grunderna för webben. En av de organisationer som är mest aktiva är World Wide Web Consortium (W3C)19.Bland W3C:s aktiviteter kan nämnas definition av:
- Resource Description Framework (RDF) utvecklas för att tillhandahålla en infrastruktur som stödjer metadata.
20
- Document Object Model (DOM) är ett plattforms- och språkneutralt gränssnitt som tillåter program och skript att dynamiskt komma åt och uppdatera innehåll, struktur och utseende på dokument.
21
- Mathematical Markup Language (MathML) används för strukturering av matematiska uttryck och ekvationer.
22
- Platform for Internet Content Selection (PICS), möjliggör att knyta s.k. labels eller metadata till innehåll på webben. Designades från början till att hjälpa lärare och föräldrar att kontrollera barnens åtkomst till webbsidor på Internet.
23
- The eXtensible Markup Lanugage (XML) är ett dataformat för utbyte av strukturerade dokument på webben.
243 Insamling
När det gäller insamlande av data för arkivering finns ett antal olika modeller för hur man ska kunna arkivera en rättvisande bild av det material som finns publicerat på webben. Nedan finns några sådana beskrivna. De val som gjordes inom projektet Kulturarw³ är presenterade liksom en diskussion kring lämpliga val inför framtiden. Generellt gäller här att välja flexibla lösningar, eftersom det enda man med säkerhet kan veta om webbens framtid är att den kommer att förändras och, inte minst, växa, så att förutsättningarna för arkivering ändras. Det gäller såväl mjuk- som hårdvarulösningar.
3.1 Modeller för lösning
19 http://www.w3.org/20 http://www.w3.org/RDF/21 http://www.w3.org/MarkUp/DOM/22 http://www.w3.org/MarkUp/Math/23 http://www.w3.org/PICS/24 http://www.w3.org/XML/
Det finns flera olika metoder för insamling av material från webben, lämpliga för olika typer av material. Viktiga särskiljande kriteria här är, bland annat, ändringsfrekvens hos webbsidorna och vem det är som publicerar dem.
Stickprov
En metod är att med lämplig periodicitet ta ”snapshots” av den svenska delen av webben, på liknande sätt som ALB (Arkivet för Ljud och Bild), som sparar alla närradiosändningar under en vecka fyra gånger per år. Insamlingstillfällena kan förläggas till tillfällen som man bedömer med stor sannolikhet är historiskt intressanta, såsom exempelvis inför/efter ett riksdagsval eller en folkomröstning. På så sätt skulle man kunna göra exempelvis fyra stickprov av webben under ett år. När det gäller ALBs sparande av närradio har det ingen betydelse hur dessa insamlingstillfällen ligger i tiden i förhållande till varandra. Två stickprovtagningar av webben bör dock inte göras för tätt inpå varandra; detta för att att man skall kunna fånga upp så många ändringar på webben som möjligt.
För att ett stickprov verkligen ska bli en sammanhängande ögonblicksbild är det viktigt att insamlandet inte tar för lång tid. Inom projektet Kulturarw³ har man haft som mål att ett stickprov får ta maximalt en vecka.
Stickprovsmetoden är bra för att samla in data med låg ändringsfrekvens från webben.
Sidor med hög ändringsfrekvens
Data som har hög ändringsfrekvens, till exempel dagstidningar och annan periodica, kommer till största delen att missas med stickprovsmetoden, då dessa ändras kontinuerligt under varje dygn. Om man tex samlar in webben fyra gånger per år kommer man bara att få cirka 1 % (4/365= 0,01) av informationen från dessa webbplatser. Riktigt så illa är det dock inte, då många tidningar låter gamla dagars nyheter/sidor ligga kvar ”vid sidan om” de aktuella nyheterna/sidorna, men klart är att en mycket stor del av materialet ändå missas med stickprovsmet oden.
En lösning för att komma åt data med hög ändringsfrekvens är att identifiera de webbplatser eller sidor som har hög ändringsfrekvens och låta roboten besöka dem med samma eller högre frekvens än ändrings-
frekvensen. Tex skulle man kunna låta roboten besöka/samla in från Dagens Nyheter25 en eller flera gånger per dygn.
En stor nackdel med denna metod är att det sannolikt är en mycket liten del av det totala antalet sidor som har ändrats medan roboten inte har någon möjlighet a priori att veta vilka. Roboten måste hämta alla sidor för att kunna kontrollera vilka sidor som ändrats, vilket tar resurser av roboten liksom av webbservern i fråga, och bandbredd på Internet.
Ett sätt att minska denna nackdel är ha en distribuerad robot som sitter ute vid eller på webbservern. På detta sätt förbrukar man mindre bandbredd på Internet eftersom den distribuerade roboten då kan avgöra vad som ändrats, och skicka bara dessa ändrade sidor ”bakåt” till den centrala roboten.
Ytterligare en variant vore att låta roboten känna av ändringsfrekvensen hos en hämtad sida genom att utgå från tidsintervallen mellan de senaste hämtningarna, och huruvida sidan ifråga hade ändrats sedan föregående gång. Denna beräkning görs varje gång sidan hämtats, och ligger till grund för hur lång tid roboten ska vänta till nästa besök. Här slipper man identitetskontrollen, men nackdelen är att man inte kan garantera att samtliga versioner av sidan kommer med i arkivet. Roboten måste också förses med en databas för lagring av tidsintervall och resultat av hämtningar.
Leverans av information/data
En tredje modell för att samla sidor, lämplig framför allt för sidor med hög ändringsfrekvens, är leverans av ändringsinformation, dvs att KB notifieras om nya och ändrade sidor. Med periodicitet som bestäms av ändringsfrekvensen hos publicisten skickas då en lista med de URL:er som tillkommit eller ändrats. Varje post i listan kan exempelvis innehållaURL, md5-checksumma på innehållet och datum+klockslag för skapande/ändring av sidan. Datum och klockslag bör kunna anges ofullständigt. KB kan med ledning av denna information hämta de sidor som ändrats.
Detta är ett exempel på hur det skulle kunna se ut när tex Svenska Dagbladet skickar en lista med de URL:er som tillkommit eller ändrats:
http://www.svd.se/svd/ettan/dagens/index.html 8168be35b6a6005c8a4b975977869166
1998-05-10
http://www-b.svd.se/svd/naringsliv/index.html 9b2a9c2ed3f35108410840b6d6225d54
1998-05
http://www-b.svd.se/svd/sport/index.html d4f1849ee30ed89a75605b4a63ad64c5
1998-05-10:12
En variant på leveransmodellen är att nya och ändrade sidor skickas direkt till KB av publicisten. Så snart man tillåter leverans av sidor som
25 http://www.dn.se
ska arkiveras bör man dock införa identitetskontroll av den som levererar sidorna, så att man verkligen arkiverar rätt material. Detta kan man klara sig utan då endast information om vad som ska hämtas levereras till KB.
Leveransmodellen är kanske inte lämplig för gemene man som publicerar sig på nätet, oavsett ändringsfrekvens; leverans kan troligen inte begäras av andra än professionella publicister. Leverans av information och/eller data på detta sätt kan kombineras med stickprovsmodellen.
3.2 Kulturarw³:s val
Projektet Kulturarw³ syftade till att undersöka möjligheterna och förutsättningarna för arkivering av svenska webbsidor. De första arkiveringsvarven runt webben ska därför ses som pilotverksamhet ämnad att ge viktig kunskap om webbens struktur och ändringsfrekvens etc.
Modell
Den modell som Kulturarw³ valde initialt var stickprovsmetoden, dels för att den ansågs vara viktigast och dels för att personalresurserna var begränsade. Ytterligare en faktor i valet av modell var att Kulturarw³ hade tillgång till den robotprogramvara som användes i NWI-projektet (Nordic Web Index)26 och hade utvecklats av NetLab i Lund. Den roboten var skriven för att samla sidor till NWI:s indexeringstjänst. Genom att sprida ut hämtningen över alla de sidor som roboten för tillfället kände till, försökte roboten belasta de inblandade webbplatserna så lite som möjligt.
NWI-roboten skrevs om en del för att bättre passa för Kulturarw³s arkiveringssyften. Exempel på saker som gjordes var: spara fulltext, hämta och spara bilder och ljud, göra konfigurerbart vilka domäner som skall avsökas och sparas och inte som ursprungligen bara en enda domän.
För dagen, under det att det tredje stickprovet håller på att samlas in, testas några idéer kring hur en robot som samlar sidor med hög ändringsfrekvens skulle kunna vara konstruerad.
Implementering
26 http://nwi.ub2.lu.se
Den av Kulturarw³ modifierade roboten kördes igång för en försiktig test på Kulturarw³:s utvecklings- och testmaskin. Testen gick bra och övergick i det första stickprovet av svenska webben. Under insamlingen flyttades roboten över till en nyanskaffad driftsmaskin med snabbare cpu:er, mer internminne och snabbare, flera och större diskar. De insamlade sidorna sparades temporärt på disk för att sedan arkiveras på band i två kopior. Även denna kopia på band är temporär tills det riktiga webbarkivet kommer på plats.
Utvärdering
En stor nackdel med hur NWI-roboten fungerade var att den försökte sprida belastningen över alla webbplatser som den skulle hämta sidor ifrån genom att maximera tiden mellan hämtningen av två sidor ifrån samma webbplats. Målet var med andra ord att tiden från att den hämtade första sidan från webbplatsen till att den hämtade den allra sista sidan från samma webbplats skulle bli maximalt lång. Den ögonblicksbild av webbplatsen som man är intressad av i bevarandesyfte blir då väldigt utsträckt i tiden och risken för att den då insamlade kopian inte överensstämmer med webbplatsen närmar sig raskt 100%. Att samla alla sidor från en viss webbplats så koncentrerat i tiden som möjligt är en viktig förutsättning för att få en så korrekt avbild av webbplatsen som möjligt.
Ett stickprov taget med NWI-roboten tog mer än en månad (effektiv tid något kortare; roboten måste ibland stå stilla i väntan på att disken tömdes genom att det insamlade materialet fördes över på band). Det torde dock vara möjligt att komma ned till målet på en veckas insamlingstid med en bättre och effektivare robot, specialdesignad för arkivering, och färdig arkiveringslösning.
3.3 Framtida möjliga val
En mycket stor del av de svenskar som idag surfar på webben har möjlighet eller kan lätt skaffa sig möjlighet att publicera sina sidor för föra ut sina åsikter eller vad han/hon vill göra offentligt åt en större publik. Denna lätthet att publicera sig bör störas så lite som möjligt. Dessa sidor ändras förmodligen inte heller med så stor frekvens. Stickprovsmetoden möjliggör att spara dessa sidor utan publicisternas medverkan.
De publicister som publicerar mera professionellt har i allmänhet högre ändringfrekvens på sina sidor och där kommer stickprovsmetoden till korta på grund av framför allt just denna höga ändringsfrekvens. Ett alternativ skulle kunna vara att införa en slags leveransplikt för detta
material. Den bör i så fall utformas så att publicisterna skall informera KB om alla uppdaterade eller nya sidor. Då är det även viktigt att sidorna finns tillgängliga oförändrade under en viss given tid, tex en timme, så att KB ges möjlighet att hinna samla dessa sidor innan de förändras, flyttas eller tas bort. Man kan också tänka sig att filerna levereras över Internet i stället för att hämtas.
Idag kan således webbmaterialet indelas i två stora grupper beroende på ändringsfrekvens och om det är en professionell publicist som står bakom eller inte. Eftersom insamlingsmetodiken enligt ovan skiljer sig avsevärt mellan de båda typerna av material, är det lämpligt att arkiveringstekniskt skilja dem åt såtillvida att man har såväl olika robotar som olika hårdvara att köra dem på, där en samlar material stickprovsvis och den andra tar hand om leveranser. Detta underlättar framtida ändringar, inte minst som man kan räkna med att man i framtiden kommer att se ännu fler typer av material på webben, vilket i sin tur kan medföra behov av ytterligare insamlingsmetoder. Robotarna kommer naturligtvis ändå att i viss mån samarbeta, exempelvis genom att utbyta URL:er.
4 Arkivering
Det insamlade materialet lagras i ett arkiv, som ska kunna tillhandahålla data till användare. När det gäller lagring och framtida åtkomst av det arkiverade materialet är det viktigt även här att välja lösningar som lätt kan ändras eller bytas ut, med tanke på hur fort tekniken utvecklas.
4.1 Lagring och åtkomst
På grund av den stora datavolym som dessa samlade sidor med största sannolikhet kommer att utgöra är det idag för dyrt att lagra dem permanent på hårddisk. Ett billigare lagringssätt är magnetband, där magnetband av typen DLT7000 för närvande är föredra på grund av bland annat hög läs- och skrivhastighet, litet mekaniskt slitage på det fysiska bandet och självkorrigerande skrivsätt på bandet. Dessutom ingår ickeförstörande komprimering av data i bandspelaren.
För att få en rationell och automatisk hantering av den stora mängd DLT-band som det totalt kommer att bli, stoppas dessa band i ett bandbibliotek med en bandrobot som hanterar läsning och skrivning på banden. Bandbibliotek brukar vanligen kunna förses med en eller flera DLTbandstationer. Flera bandstationer ökar driftsäkerheten om en bandstation fallerar och ökar samtidigt prestanda om man låter bandroboten läsa och skriva samtidigt på flera bandstationer.
En viktig fördel av att tekniken kring lagringsmedia utvecklas så snabbt är att man kan bortse från frågeställningar kring åldersbeständighet hos dessa media. Arkivet betraktas således inte som en samling band, utan som bitar och bytes som kan flyttas vidare till nya bandtyper, nya mer kostnadseffektiva lagringsmedia eller media med snabbare åtkomsttider.
Hierarchical Storage Management (HSM) är en programvara som erbjuder möjlighet att kunna betrakta hela eller delar av bandbiblioteket tillsammans med lokala diskar som ett enda gigantiskt filsystem på många TB. Det är oftast antalet band eller bandbibliotekets storlek i termer av antal bandslots som sätter begränsningen på filsystemets storlek.
Dock brukar det oftast finnas några praktiska begränsningar på HSM-filsystemet. Exempel på en sådan är antalet filer i HSMfilsystemet. Ett sätt att lösa detta problem och samtidigt korta åtkomsttiderna (se nedan) är att lagra en grupp av sidor tillsammans i en så kallad tar-fil. (’tar’ är ett UNIX-kommando som lagrar flera filer och filkataloger i en och samma fil, med bibehållen struktur och information om ursprungsfilerna.) En sådan tar-fil skulle t ex kunna bestå av alla sidor från en webbplats under ett stickprov. Eftersom man kan anta att den som söker i arkivet tittar på flera sidor från samma webbplats vid samma tillfälle kortas söktiderna genom att dessa sidor finns i samma fil.
Åtkomsttiderna i ett arkiv uppbyggt med HSM, bandbibliotek och cachedisk kan bli ett problem om det är många samtidiga användare, då de filer som en enskild användare efterfrågar kan ligga fördelade på flera olika band. Den totala åtkomstiden för en fil på band är laddtiden, dvs tiden att ladda ett band ifrån slot till en bandstation i bandbiblioteket, 5 sekunder, plus medelsöktiden på bandet, 60 sekunder, således 65 sekunder inalles. I de fall flera filer finns på samma band bortfaller laddtiden utom för första filen. Om det är flera band som efterfrågas är den totala åtkomsttiden lika med åtkomstiden för varje band multiplicerat med antalet efterfrågade band. Flera bandstationer i bandbiblioteket liksom lagrandet av hela webbplatser tillsammans i tar-filer minskar visserligen problemet med åtkomsttiderna (se ovan), men förhoppningsvis går det i framtiden att lagra hela eller stora delar av arkivet på framtida lagringsmedia som är mer online, på motsvarande sätt som disk fungerar idag.
En viktig fråga kring åtkomst av arkivets innehåll rör säkerhetsaspekterna. För att säkerställa att innehållet inte ändras obehörigt skulle man kunna införa kryptering. Tyvärr är inget krypto helt säkert, utan garanterar bara med hög sannolikhet att ingen kan knäcka det under en viss given tid. Dessutom utvecklas tekniken att knäcka krypton hela tiden. Sammantaget blir slutsatsen att man måste kryptera om allt krypterat material i arkivet med jämna mellanrum. Operationer på hela det ar-
kiverade materialet är dock oerhört tidsödande med tanke på den enorma datamängden, varför man i det längsta bör undvika detta. Ett smidigare alternativ för att behålla säkerheten kan därför vara att ha mycket hårda behörighetskontroller för tillgång till arkivet.
4.2 Presentation och migrering
Den arkiverade datamängden måste kunna kommas åt på flera olika sätt, via olika nycklar, sökvägar och sökmetoder. Det är lämpligt att skjuta upp lösningen av presentationen till dess att det ska göras tillgängligt, eftersom man kan räkna med att det då finns mer effektiva metoder för detta än idag.
Byte av dataformat kräver presentation av gamla format på nytt sätt. Detta kan lösas genom migrering av allt arkiverat material till det nya formatet. Materialet måste dock ändå sparas i det gamla formatet också p g a risken för fel vid migreringen. Eftersom formatstandarder kan förväntas skifta relativt ofta får man många upplagor av all data. Dessutom är, som redan konstaterats, denna typ av bearbetning av allt det samlade materialet enormt tidsödande. Ett bättre alternativ är därför att låta migreringen ligga i gränssnittet till databasen, dvs allt material lagras alltid i sitt ursprungliga format och migreras först när det ska visas. På så sätt minimeras också problemen med mindre lyckade migreringsalgoritmer, eftersom de kan ändras utan att det påverkar det arkiverade materialet.
5 Kostnader
Detta kapitel redogör för de kostnader som uppstår vid insamlande och arkivering av svenskt material publicerat på webben, uppdelat i kostnader för inköp av färdiga produkter såsom hårdvara, kostnader för utveckling och underhåll av robotar etc, samt kostnader för drift.
När det gäller hårdvara har jag angivit tänkbara lösningar som täcker dagens, och förhoppningsvis morgondagens, behov, men kanske inte övermorgondagens behov då dessa är svåra att överblicka. De föreslagna lösningarna täcker (åtminstone) behoven för insamling av material publicerat med HTTP, vilket utgör den absoluta lejonparten av materialet.
För att underlätta drift, utveckling och framtida uppgradering har jag designat systemlösningar med ett robotprogram per dator och disklösning. Det är då enklare att byta ut en programvara eller dator utan att störa de övrigas robotarnas funktioner och drift.
Vidare tror jag att man bör försöka ha flera små robotprogram istället för ett stort, således exempelvis en robot per typ av data eller protokoll. Skälet till detta är att svårigheterna och därmed lösningarna i stor utsträckning kommer att vara olika för olika typer av material. Det är då bättre att få små enheter som kan ha olika utvecklingscykler, men där man naturligtvis ändå kan dra nytta av de likheter som finns, än att ha en stor koloss som aldrig når ett stabilt utvecklingsläge.
Notera att alla kostnader för utveckling, underhåll och drift för enhetlighets skull är räknade i form av månadslöner. Det kan kanske vara lämpligt att anlita konsult när det gäller utveckling, och möjligen underhåll, men knappast drift, som bör hanteras av anställd personal. Beroende på hur man väljer att lösa personalfrågan kommer således kostnaderna angivna nedan att variera. Vidare kan man anta att månadslöner i praktiken varierar beroende på uppgift; exempelvis torde drift kosta mindre än underhåll. De angivna tiderna för utveckling och underhåll, och i viss mån även drift, ska betraktas som mycket grova uppskattningar.
Nedan följer specifikation av de olika delarna i detalj.
5.1 Nuvarande lösning
Här har antagits att en ny lösning tas fram så snart som möjligt, medräknat är endast underhåll och drift fram till dess att den nya lösningen kan ersätta den gamla.
Underhåll:
Tid: 1 halvt manår per år = 6 månader per år Månadslön: 32000 SEK LKP: 44% Kostnad: 6 × 32000 × 1,44 = 280 kSEK per år
Drift:
Drift: 1 manår per år = 12 månader per år Månadslön: 32000 SEK LKP: 44% Kostnad: 12 × 32000 × 1,44 = 560 kSEK per år
5.2 Framtida lösning
Notera att kostnader för underhåll och drift uppstår först när respektive del tagits i drift. Prisuppgifterna är angivna exklusive moms och i förekommande fall med gällande rabatt enligt Statskontorsavtalet.
Hårdvara för insamling
Dator och disk för insamling enligt stickprovsmetoden:
Dator: Sun Enterprise 3500 med 4 × 336 MHz cpu:er och 4 GB minne. Disk: Sun StorEdge innehållande 2 × A5000 monterat i rack. Totalt 2 × 14 × 9.1 GB = 254.8 GB disk. Kostnad: 1,6 MSEK
Dator och disk för insamling efter leverans av information om ändrade sidor:
Dator: Sun Enterprise 3500 med 4 × 336 MHz cpu:er och 4 GB minne. Disk: Sun StorEdge innehållande 2 × A5000 monterat i rack. Totalt 2 × 14 × 9.1 GB = 254.8 GB disk. Kostnad: 1,6 MSEK
Dator och disk för test och utveckling av robotprogramvara:
Dator: Sun Enterprise 450 med 2 × 300 MHz cpu:er och 2 GB minne. Disk: Interna diskar. Totalt 20 × 9.1 GB = 182 GB disk. Kostnad: 550 kSEK
Hårdvara för arkiv
Dator och disk:
Dator: Sun Enterprise E4500 med 4 × 336 MHz cpu:er och 4 GB minne. Disk: Sun StorEdge innehållande 2 × A5000 monterat i rack. Totalt 2 × 14 × 9.1 GB = 254.8 GB disk. Kostnad: 1,8 MSEK
Program för HSM och backup:
NetBackup: 300 kSEK
Bandbibliotek:
Bandrobot: StorTek 9740 innehållande 2 × DLT7000 Band: 300 st DLT-band. Kostnad: 1,2 MSEK
Robotprogram
Sticksprovsrobot:
Utvecklingstid: 2 manår = 2 × 12 = 24 månader Månadslön: 32000 SEK LKP: 44% Kostnad: 24 × 32000 × 1,44 = 1,12 MSEK
Underhåll: 1 halvt manår per år = 6 månader per år Månadslön: 32000 SEK LKP: 44% Kostnad: 6 × 32000 × 1,44 = 280 kSEK per år
Leveransrobot:
Utvecklingstid: 1 manår = 12 månader Månadslön: 32000 SEK LKP: 44% Kostnad: 12 × 32000 × 1,44 = 560 kSEK
Underhåll: 1 halvt manår per år = 6 månader per år Månadslön: 32000 SEK LKP: 44% Kostnad: 6 × 32000 × 1,44 = 280 kSEK per år
Program för arkiv och migrering
Arkiv:
Utvecklingstid: 1 manår = 12 månader Månadslön: 32000 SEK LKP: 44% Kostnad: 12 × 32000 × 1,44 = 560 kSEK
Underhåll: 1 halvt manår per år = 6 månader per år Månadslön: 32000 SEK LKP: 44% Kostnad: 6 × 32000 × 1,44 = 280 kSEK per år Migrering (ingår i presentation):
Utvecklingstid: 1 halvt manår = 6 månader Månadslön: 32000 SEK LKP: 44% Kostnad: 6 × 32000 × 1,44 = 280 kSEK
Underhåll: 1 halvt manår per år = 6 månader per år Månadslön: 32000 SEK LKP: 44% Kostnad: 6 × 32000 × 1,44 = 280 kSEK per år
Drift
Drift: 1 manår per år = 12 månader per år Månadslön: 32000 SEK LKP: 44% Kostnad: 12 × 32000 × 1,44 = 560 kSEK
5.3 Totala kostnader
Nuvarande lösning
Underhåll: 0,28 MSEK per år Drift: 0,56 MSEK per år
Framtida lösning
(Notera att kostnader för underhåll och drift uppstår först när de olika delarna tagits i drift.)
Totalsumma inköpta
produkter: 7,05 MSEK
Totalsumma utveckling: 2,52 MSEK Totalsumma underhåll: 1,12 MSEK per år Totalsumma drift: 0,56 MSEK per år Totalt: 9,57 MSEK investering, därefter 1,68 MSEK per år.