Archief voor oktober 2012

Genlias tot 1 januari 2013 in de lucht

In samenwerking en overleg met het CBG, exploitant van WieWasWie, is besloten dat Genlias in de lucht blijft tot 1 januari aanstaande. Dit besluit is genomen als reactie op bezorgdheid over het stoppen van Genlias voordat de opvolger WieWasWie minstens een gelijkwaardig alternatief biedt.

De twee belangrijkste punten waar WieWasWie momenteel nog aan werkt, zijn het versterken van de zoekfunctionaliteit (o.a. het zoeken op twee personen tegelijk), en het verbeteren van de hoeveelheid en de kwaliteit van de beschikbare data in WieWasWie.

Het eerste punt zal naar verwachting eind oktober gerealiseerd zijn. Dit kan niet gegarandeerd worden voor het tweede punt. De software waarmee de data van Genlias overgebracht wordt naar WieWasWie blijkt de grote hoeveelheid records niet op tijd te kunnen verwerken.

Hoewel ook op dit terrein de planning nog steeds is gericht op 1 november a.s., zijn er bij het verwerken van de Genlias-data vele partijen betrokken en is het volume daarvan zodanig groot, dat het zinvol lijkt om Genlias nog een extra periode in de lucht te houden.

Bron:
Nieuwsbericht Centraal Bureau voor Genealogie
Nieuwsbericht nieuwsblog WieWasWie 

Duizenden gekaapte brieven toegankelijk

In 1980 werden ze bij toeval ontdekt in het nationale archief in Londen: duizenden handgeschreven brieven, afkomstig van Nederlandse schepen die in de zeventiende en achttiende eeuw waren buitgemaakt door de Engelsen. Uniek onderzoeksmateriaal voor zowel historici als taalkundigen, aangezien er uit deze periode weinig persoonlijke documenten zijn overgeleverd. Vanaf vandaag zijn ze voor iedereen online te raadplegen op de website www.gekaaptebrieven.nl

Tot nu toe was slechts een klein deel van deze brieven door onderzoekers gepubliceerd, bijvoorbeeld in de Brieven van de maand bij het Leidse project Brieven als buit. Daar komt nu verandering in: dankzij het werk van een groot aantal vrijwilligers komen volgende week alvast 3000 getranscribeerde brieven voor iedereen beschikbaar op internet. Voor het eind van het jaar komen daar nog eens even zoveel bij. Dat is niet alleen goed nieuws voor onderzoekers, ook geïnteresseerde leken kunnen op de website terecht om bijvoorbeeld meer te weten te komen over hun familiegeschiedenis.

Verkortingen
110 vrijwilligers werken sinds 1 december 2011 aan het transcriberen (nauwkeurig overtikken) van de brieven. Daarin worden ze begeleid door Nicoline van der Sijs, onderzoeker op het Meertens Instituut: “De meeste vrijwilligers hadden wel enige ervaring opgedaan of een geschiedenis waardoor ze de moeilijk leesbare handschriften konden lezen. Een klein groepje van tien mensen met veel expertise heeft de correctie gedaan: zij hebben enorm veel werk verricht.” 

Met een op het Meertens Instituut ontwikkelde ‘editor’ konden veel mensen tegelijk aan de brieven werken. Een dergelijke grootschalige vorm van ‘crowdsourcing’ , waarbij het publiek betrokken wordt bij het onderzoek en taken verricht waarvoor onderzoekers binnen hun werktijd geen mogelijkheden hebben, is voor Nederland relatief nieuw. 

Wat de documenten zo moeilijk leesbaar maakt, is niet alleen de slordigheid (of onervarenheid) van de handschriften en de slechte staat ervan (veel brieven zijn opgerold geweest, incidenteel zitten er gaten in), legt de onderzoekster uit, maar ook het grote aantal verkortingen in de teksten: “De vrijwilligers hebben enorm hun best gedaan om uit te zoeken waar die verkortingen voor staan. In de transcripties zijn de vertalingen altijd tussen haakjes geplaatst, zodat je kan zien dat het een interpretatie is. Zo wordt DGG vaak gebruikt voor de vaste formule D(ie) G(od) G(eleide), en gebruikt men m. voor zowel de oude vochtmaat muts als de landmaat morgen, maar ook voormerk en maakt: “Het kan soms een heel gepuzzel zijn om uit te vinden wat er is bedoeld.”

Metadata 
De vrijwilligers hebben niet alleen de brieven vertaald, maar ook zogenaamde metadata toegevoegd. Dat zijn gegevens als jaartal, tekstsoort, afzender en geadresseerde. Die metadata vergemakkelijken het doorzoeken van de brievendatabank, zodat iedereen zijn eigen vragen op het materiaal kan loslaten. Van der Sijs: “Je kunt zeggen: geef mij alle brieven en zet ze in chronologische volgorde of: geef mij alle brieven van een bepaald schip, van een bepaalde afzender of naar een bepaalde kapitein gestuurd.” 

Er zijn wel eerder brieven getranscribeerd en toegankelijk gemaakt voor het grote publiek, maar nooit in deze orde van grootte.

Bovendien gaat het vaak om fragmenten uit de brieven, waarbij vooral veel achtergrondinformatie wordt gegeven. Van der Sijs: “Ons doel was om de totale hoeveelheid beschikbare scans te ontsluiten, zowel aan de hand van een transcriptie als metadata, zodat leken en onderzoekers geen moeilijke handschriften meer hoeven te lezen en snel door de gegevens kunnen zoeken.” 

Taalgebruik 
Op het Meertens Instituut zal dit corpus in ieder geval geïntegreerd worden in Nederlab: een database waarin alle gedigitaliseerde teksten die van belang zijn voor de geschiedenis van de Nederlandse taal en cultuur bij elkaar worden gebracht. Daarmee kan een taalwetenschapper straks bijvoorbeeld onderzoeken in hoeverre het taalgebruik van deze handgeschreven egodocumenten uit de 17e en 18e eeuw verschilt van gedrukte teksten uit diezelfde periode. 

Van der Sijs:

Nu we zo’n groot tekstbestand hebben, kunnen we het taalgebruik daarvan ook vergelijken met dagboeken of egodocumenten die zijn geschreven door Nederlanders die zich op andere continenten hebben gevestigd.

In het vroegere Nieuw-Amsterdam (New York) zijn bijvoorbeeld veel documenten bewaard gebleven. Is het taalgebruik van Nederlanders in de VS veranderd, en zo ja: in welke opzichten en hoe snel is dat gegaan? Tegenwoordig bestaan er computerprogramma’s die de verschillen en overeenkomsten in teksten kunnen vinden, mits de tekstbestanden maar groot genoeg zijn. Ik ben heel erg benieuwd wat dit soort tekstvergelijkend onderzoek in de toekomst aan nieuwe inzichten gaat opleveren.


Zakelijke post
Het beschikbaar gekomen (onderzoeks)materiaal is heel gevarieerd van aard. Zo is ongeveer de helft van de brieven zakelijke post, weet de onderzoekster: “Denk aan vrachtbrieven en financiële overzichten, die bijvoorbeeld voor economisch historici relevant zijn. Er zijn ook hele plantagelijsten uit Suriname met informatie over kasboeken, hoeveel negers er waren, hoeveel ze daarmee verdienden. Het is niet zo dat we daar nu helemaal niets over weten, maar dit is wel een heel mooie aanvullende bron.”

Ook zijn de brieven geschreven door mensen uit alle lagen van de bevolking.

Het corpus bevat behalve brieven van en naar bemanningsleden van het schip, ook correspondentie daarbuiten, legt Van der Sijs uit: “Denk bijvoorbeeld aan iemand die een plantage had in de Oost en daar tijdelijk woonde. Wanneer hij een brief wilde sturen aan zijn familieleden gaf hij die mee aan de kapitein van het schip: ‘U vaart nu terug naar Enkhuizen? Neem dan deze brief voor mijn vrouw mee’.”

Andere talen
Overigens ligt er nog een schat aan materiaal in de archieven in Kew (Londen). Er zijn nu 9000 scans in Nederland (waarvan er zo’n 6000 worden ontsloten; op de rest staat geen tekst), maar de overige brieven zijn nooit gefotografeerd. Om hoeveel brieven het gaat is niet precies bekend, aldus Van der Sijs: “Er worden altijd getallen genoemd van 38.000, maar dat is een schatting. Die schatting komt van Roelof van Gelder, die destijds een inventarisatie heeft gemaakt. Hij heeft dat heel serieus gedaan, maar hij heeft bijvoorbeeld geen dozen opengemaakt waarop staat dat ze afkomstig zijn van Deense of Franse schepen. We weten dat in die dozen vaak ook Nederlandse teksten zitten.”

De brieven die wij nu hier hebben zijn ook voor een deel Duitstalig, Franstalig, Spaanstalig, Italiaanstalig. Die komen niet allemaal onmiddellijk op de website: het corrigeren daarvan is wat lastiger omdat we minder vrijwilligers hebben die die handschriften kunnen lezen. Maar begin volgend jaar hopen we toch zeker al het materiaal beschikbaar te hebben gemaakt.

 Klik hier om naar de gekaapte brieven te gaan.

 

Bron: ‘Duizenden gekaapte brieven toegankelijk voor iedereen’ door Mathilde Jansen in de nieuwsbrief van het Meertens Instituut, oktober 2012