Skip to content
Stafræn sagnfræði: Stefnir í „Íslandiseringu“ rannsókna?

„Ein mesta hætta sem yfir vofir er „íslandísering“ stafrænnar sagnfræði.“ Með þessum orðum vakti hollenski sagnfræðingurinn Ralf Futselaar mikla athygli á ráðstefnu Tensions of Europe-samtakanna í Lúxemborg sumarið 2019. Ráðstefnan bar yfirskriftina „Decoding Europe. Technological Pasts in the Digital Age“ og var tileinkuð umræðum um sagnfræðirannsóknir á stafrænni öld auk hefðbundinna tæknisögulegra rannsóknarefna sem þessi samtök hafa helgað sig undanfarin ár.1 Ráðstefnan hófst með pallborðsumræðum þar sem fimm fræðimenn ræddu stöðu stafrænnar sagnfræði. Margt af því sem rætt var um hafði heyrst áður: að sagnfræðirannsóknir þyrftu að styðjast við stafrænar aðferðir til að vera í takt við tímann, að flutningur sögulegra heimilda á stafrænt form — eða „dígítalísering“ — krefjist beinlínis nýrra aðferða og að í því felist mikil tækifæri en um leið áskoranir og ýmsir erfiðleikar í notkun stafrænna aðferða. En eitt hafði ekki heyrst áður: að mesta hættan væri „íslandísering“ rannsókna.2

Það sem Ralf Futselaar átti við er að iðkendur stafrænnar sagnfræði (e. digital history), sem og fræðimenn sem vinna með söguleg efni á sviði stafrænna hugvísinda (e. digital humanities), sæki almennt á þau mið þar sem besta afla er að vænta. Söguleg gögn sem hægt er að vinna úr með stafrænum aðferðum séu að langmestu leyti frá litlum, auðugum og auðvitað hvítum Evrópuþjóðum eins og Íslandi. Því sé hætt við að fræðimenn einblíni á þessar þjóðir og að niðurstöður þeirra verði mjög einsleitar. Þetta ætti til dæmis við um viðfangsefni eins og nýlendustefnu þar sem heimildir endurspegli þá aðeins sjónarmið og orðræðu nýlenduherranna.

Um þessi ummæli Futselaars sköpuðust líflegar umræður strax eftir framsögu hans og meðan á ráðstefnunni stóð. Sumir bentu á það að hættan á „íslandíseringu“ rannsókna væri í raun og veru ekkert nýtt, sagnfræðingar hefðu lengi vel flykkst að þeim rannsóknarefnum sem flestar og aðgengilegastar heimildir eru um, til dæmis vel flokkuð og aðgengileg skjalasöfn, og því mætti spyrja hvort þessi „íslandísering“ hefðbundinna sagnfræðirannsókna væri jafn hættuleg? Aðrir bentu á það að þessi áhætta væri í raun sú sama og ætti við um Evrópumiðaðar (e. Eurocentric) söguskoðanir sem deilt hefur verið um í áratugi og menn hefðu lært að lifa með, með því að sporna gegn þeim og með því að vera gagnrýnir og meðvitaðir um þennan vanda.

Þar sem ég var eini Íslendingurinn á ráðstefnunni kom það í minn hlut að benda á að það væri einum of sterkt til orða tekið að vara við „íslandíseringu“ sagnfræðirannsókna. Íslenskt hugvísindafólk — málfræðingar, þjóðfræðingar, bókmenntafræðingar og fleiri

— hefur að vísu verið mjög virkt á sviði stafrænna hugvísinda og vakið verðskuldaða athygli fyrir rannsóknir sínar á sögulegum efnum.3 Þó er raunin sú að fáir íslenskir sagnfræðingar stunda fræðilegar rannsóknir með stafrænum aðferðum öðrum en að styðjast við stafræn afrit af prentuðum heimildum á vefsvæðum eins og Tímarit.is í hefðbundinni heimildaúrvinnslu sinni. Því er of langt gengið og beinlínis mótsagnakennt að draga upp svo dramatískar myndir af yfirvofandi „íslandíseringu“ á meðan stafrænar aðferðir gegna jaðarhlutverki í íslenskum sagnfræðirannsóknum.

Almennt séð bjóða Ísland og íslenskan ekki endilega upp á kjöraðstæður fyrir stafrænar rannsóknir. Hér eru að vísu til ýmsir góðir og heildstæðir sögulegir gagnagrunnar og heimildavefir á borð við Íslendingabók, Heimildir.is, Tímarit.is og stafrænar útgáfur Íslendingasagna. Þó vantar upp á að þessar heimildir séu nothæfar til stafrænna rannsókna á sama hátt og mögulegt er víða erlendis. Fyrir vefinn Tímarit.is hefur til dæmis verið notuð svokölluð OCR-tækni til að ljóslesa letrið í gömlum dagblöðum sem síðan leggja grunn að textasarpi fyrir leitarvélina. Þótt almennt takist furðu vel til munu margir kannast við það að tæknin hefur átt erfitt með að bera kennsl á suma stafi og þyrfti helst að lesa yfir hverja einustu blaðsíðu til að leiðrétta villur forritsins. Slíkt krefst mikils mannafla og hefur aðeins verið gert með einstök tímarit eins og Fjölni þar sem villur forritsins hafa verið lagfærðar handvirkt til þess að greiða fyrir frekari textagreiningu.4 Þótt aðrar þjóðarbókhlöður kunni að öfunda þá íslensku af því að hafa þegar skannað svo mörg tímarit hafa önnur söfn unnið markvisst að því að fækka villum með prófarkalestri og fínstillingu OCR-forrita sem þýðir að leitarvélin og textaskjölin bjóða upp á töluvert nákvæmari og heildstæðari heimildaleit og úrvinnslu.5 Hér á landi eru því takmarkaðir möguleikar til að gera heildstæða úttekt á notkun ákveðinna hugtaka eða greina heildstæðan textagrunn með textanámi (e. text mining) þar sem forrit er látið plægja í gegnum mikið magn af texta til að svara rannsóknarspurningum um áherslur í orðræðu um efni eins og stríðsglæpi svo dæmi sé nefnt.6 Þar að auki er íslenska tungumál sem fáir tala og því ekki sjálfgefið að forrit fyrir stafræna sagnfræði verði þróuð fyrir íslenskt mál en á undanförnum árum hefur mikið verið rætt um þann möguleika að íslenskan verði fyrir „stafrænum tungumáladauða“ með síaukinni tæknivæðingu málnotkunar sem þá hefði hugsanlega líka áhrif á stafrænar sagnfræðirannsóknir.7

Gagnrýni minni svaraði Ralf Futselaar á þann hátt að hann hefði með ummælum sínum langað til að ögra fólki og vekja það til umhugsunar. Að hans mati séu Íslendingar áberandi á sviði stafrænna hugvísinda í Evrópu og yfirleitt mjög stoltir af sínum rannsóknum og gagnagrunnum. Vandinn að flestir flykkist þangað sem bestu gagnagrunnarnir eru fyrir hendi sé ekki bundinn við Ísland. Það mætti allt eins kalla þetta „finnlandíseringu“ eða „hollandíseringu“ en hann hefði kosið „íslandíseringu“ því að það hljómaði betur og væri fullkomið dæmi um auðuga og tæknivædda smáþjóð í Evrópu. Allt var þetta sett fram með góðum húmor en Ralf sagðist þurfa að hafa nóg af honum til að komast gegnum daginn í vinnu sinni hjá hinu hollenska War and Genocide Research Center þar sem hann starfar við að rannsaka hrylling á borð við stríð og þjóðarmorð á hverjum einasta degi.

Það gerist ekki oft að Ísland lendi í brennidepli erlendra umræðna um sagnfræði. Þótt umræðan um „íslandíseringu“ stafrænnar sagnfræði fjalli ekki beint um íslenska sagnfræði — Ísland er aðeins notað táknrænt til að benda á þá áhættu að stafræn sagnfræði einblíni á viðfangsefni sem aðgengilegar heimildir eru til um — þá veitir hún kærkomið tilefni til að velta fyrir okkur nokkrum grundvallarspurningum um stöðu og framtíð íslenskrar sagnfræði á stafrænni öld.

Í fyrsta lagi verðum við að kanna hvernig við náum sem mestu úr þeim sögulegu heimildum sem þegar liggja fyrir á stafrænu formi, hvaða öðrum heimildum koma mætti á stafrænt form og hvernig við getum nýtt þessa heimildagrunna með stafrænum aðferðum. Íslenskir sagnfræðingar — ólíkt öðru hugvísindafólki — eru skammt á veg komnir með að prófa algengar stafrænar aðferðir og rannsóknartól eins og til dæmis sögulega netgreiningu (e. historical network analysis) þar sem tengsl fjölda rannsóknareininga eins og einstaklinga eða hópa eru skráð í gagnagrunn til að greina tengslanet á milli þeirra, sem gætu vafalaust varpað nýju ljósi á Íslandssöguna.

Í öðru lagi verðum við að velta fyrir okkur framtíðarhlutverki sagnfræðingsins á stafrænni öld og hvernig við ætlum til dæmis að ráða við gífurlegt magn nýrra stafrænna heimilda. Íslensk skjalasöfn hafa nú þegar safnað miklu magni stafrænna gagna sem munu verða aðgengileg sagnfræðingum og almenningi innan tíðar. Hvernig munu sagnfræðingar vinna úr þessum heimildum? Við getum tæplega flett í gegnum tólf terabæti af tölvupóstum eins og við gerum með gömul bréfasöfn. Varla dugir heldur það eitt að gera orðaleit að atriðisorðum og notast við hefðbundna innihaldsgreiningu á heimildatextum. Flestir munu hafa frétt af risavöxnum erlendum rannsóknarverkefnum á mannkynssögunni, svokölluðum „Big Data Projects”, sem stundum eru talin vera framtíð sagnfræðinnar. Þar er tækninni að ýmsu leyti ætlað að koma í staðinn fyrir hefðbundna heimildavinnu sagnfræðingsins með forritum og hugbúnaði sem geta ljóslesið og unnið upp úr prentuðum og handskrifuðum skjölum mun hraðar og skilvirkar en nokkur maður.8 Ekki er ástæða til að óttast að tæknin taki algerlega yfir hlutverk sagnfræðingsins í náinni framtíð en þó getur hún aðstoðað okkur á margan hátt við að koma heimildum á stafrænt form og vinna úr þeim með stafrænum aðferðum. Í því að kanna nýjar stafrænar leiðir felst mikið sóknarfæri fyrir íslenska sagnfræði, ekki síst í ljósi þess að við erum þegar komin með öflugan stafrænan heimildagrunn.

  1. Um Tensions of Europe, sjá: https://www.tensionsofeurope.eu.
  2. Á ensku hefur hugtakið Icelandification áður verið notað í þeirri merkingu að snara einhverju yfir á íslensku eða til að þess segja að annarra landa biðu sömu efnahagslegu örlög og Íslands haustið 2008 (t.d. „the Icelandification of Greece“).
  3. T.d. á ráðstefnum norrænu samtakanna um stafræn hugvísindi, sjá vef þeirra: http://dig-hum-nord.eu/projects/country/iceland.
  4. Vef. Jón Friðrik Daðason, Kristín Bjarnadóttir og Kristján Rúnarsson, „The Journal Fjölnir for Everyone: The Post-Processing of Historical OCR Texts“, erindi flutt á ráðstefnunni LREC í Reykjavík, 26. maí 2014. Aðgengilegt á: http://www.lexis.hi.is/kristinb/LRT4HDA-Fjolnir-grein.pdf.
  5. Tímaritsvefur Austurrísku Þjóðarbókhlöðunnar (ÖNB) inniheldur t.d. aðeins tímarit til ársins 1949 en textaskjölin sem fylgja myndunum hafa þó verið unnin með það að takmarki að byggja upp heildstæðan textagagnagrunn: Bettina Kann og Michael Hintersonnleitner, „Volltextsuche in historischen Texten. Erfahrungen aus den Projekten der Österreichischen Nationalbibliothek“, BIBLIOTHEK — Forschung und Praxis 39:1 (2015), bls. 73–79. Sjá einnig vefinn á http://anno.onb.ac.at/index.htm.
  6. Sjá t.d. textanám Ralfs Futselaar og kollega: Milan M. van Lange og Ralf D. Futselaar, „Debating Evil: Using Word Embeddings to Analyze Parliamentary Debates on War Criminals in The Netherlands“, Contributions to Contemporary History 59:1 (2019), bls. 147–153.
  7. Sjá t.d.: Eiríkur Rögnvaldsson, „Um utanaðkomandi aðstæður íslenskrar málþróunar“, Skírnir 190 (vor 2016), bls. 17–31.
  8. Eitt þekktasta dæmi um slíkt stórverkefni er „European Time Machine“, sjá: https://www.timemachine.eu.

Deila:

Annað efni