dinsdag 13 april 2010

Synoniemen : bestanden met gekoppelde voor- en achternamen beschikbaar


Het is gelukt! Meldden we in ons vorige blogbericht dat het ons niet lukte om het bestand met de gekoppelde schrijfwijzen van voor- en achternamen uit de database van Zeeuwen Gezocht te halen en te publiceren. Mede dankzij de reactie van Bob Coret, van genealogie-online, stamboomforum enz., is het gelukt om een afzonderlijk bestand met de door ons gekoppelde voornamen en gekoppelde achternamen te genereren. De twee bestanden zijn als spread-sheet beschikbaar in Google-docs. Het bestand met voornamen telt 326 koppelingen, het bestand met achternamen ruim 2.800. Met behulp van deze bestanden kunt u zien welke namen aan elkaar gekoppeld zijn. Bij een zoekopdracht naar een naam met een bepaalde schrijfwijze krijgt u dan ook de varianten. Als u de mogelijkheid van zoeken met naamsvarianten wilt uitschakelen, dan zet u de naam waarmee u zoekt tussen enkele aanhalingstekens (quote's): 'naam'.
Uiteraard willen wij graag uw reacties horen en vooral willen wij suggesties ontvangen voor het koppelen van voor- en achternamen die feitelijk dezelfde persoon of familie betreffen. U kunt een mail sturen naar isis.reactie of u kunt ook uw reactie hieronder plaatsen. Als u geen Google-account heeft kunt u kiezen bij de optie Reageren als: met OpenID (laatste keuze).
Link naar de spreadsheet met gekoppelde voornamen (stand per update 20 = januari 2010)
Link naar de spreadsheet met gekoppelde achternamen (stand per update 20 = januari 2010)

Leo Hollestelle, beheerder Zeeuwen Gezocht

2 opmerkingen:

  1. Leo,

    Bedankt voor het beschikbaar stellen van de synoniemenlijst, een mooi voorbeeld van open data!

    Ik heb er gelijk maar gebruik van gemaakt. Ik heb de achternaam synoniemen ingelezen en opgeslagen in de Genealogie Online database. Ik gebruik deze data nu bij de zoekfunctie van Genealogie Online om een zoeksuggestie te geven. Zie bijvoorbeeld http://www.genealogieonline.nl/zoeken/?q=Corving of http://www.genealogieonline.nl/zoeken/?q=Andriesen

    Ik heb het inlezen van de data geautomatiseerd. Hierbij voer ik ook een kwaliteitscontrole uit op de namen. Hierbij enkele van mijn bevindingen:

    - bij HOLLESTELLE komt als synoniem "HOLLESTELLE, JACOBA" voor, dit lijkt meer op een achternaam, voornaam combinatie;

    - "HOUTENHOOFT, T" komt voor, moet waarschijnlijk "HOUTENHOOFT, 'T" zijn (met apostrophe)

    - "KEIJMOLEN, VAM" moet waarschijnlijk "KEIJMOLEN, VAN"

    - "NOORDEN, AN" moet waarschijnlijk "NOORDEN, VAN" zijn

    - "SIKKELERUS, VA" moet waarschijnlijk "SIKKELERUS, VAN" zijn

    - "SWAAL, VAV" en "SWAAL, VAM" moet waarschijnlijk "SWAAL, VAN" zijn

    - in de namen komt 7 keer een 0 (nul) voor waar een hoofdletter O zou moeten staan.

    mvg,
    Bob Coret

    BeantwoordenVerwijderen
  2. Bob,

    In een aantal gevallen zijn fout ingevoerde namen gekoppeld aan de juiste schrijfwijze, zoals bij: Keijmolen, vam. In sommige gevallen is ook een 0 (nul) ingevoerd i.p.v. de letter O. Door deze verkeerd ingetypte namen te koppelen aan juiste schrijfwijze zijn ze wel zichtbaar.

    BeantwoordenVerwijderen