Aufgabe Anreicherung mit lobid-gnd

Man öffnet OpenRefine und somit auch das bis jetzt bearbeiteten Projekt in OpenRefine. Anhand der allgemeine Anleitung im Blog von lobid-gnd wurden die Autoren Namen mit der GND abgestummen (reconcialiate). Dies mit folgende Schritte:

  • Spalte Autoren auswählen
  • Dann auf “Reconcialiate” und > “Start Reconciliation”
  • Man muss den Service hinzufügen, dafür klickt man auf “Add Standard Service…”
  • und gibt https://lobid.org/hnd/reconcile als URL ein.

Sobald den Service hinzugefügt wurde, folgte ich diese Schritte:

  • Man klickt links auf den GND-Service und wählt Individualisierte Person (DifferentiatedPerson) aus

Nicht alle Zellen haben gematched, aber ich fahre weiter mit den Zellen die gepasst haben:

  • Pfeil der Kolumne “Autor” auswählen
  • dann auf “Edit column” und “Add column from reconciled values…” anklicken.
  • Im Fenster wählen wir “GND-Nummer” und “Geburstagdatum”
  • OK drücken

Somit kommen zwei neuen Kolumnen rechts von der Kolumne “Autor”, dies aber nur wo die Namen von Autoren wirklich gematched haben.

Jetzt wird exportiert!

Hier nutze ich die Vorlage, welche wir gemeinsam am 7. November erschafft haben: Wir wählen Export > Templating … Und fügen die Ausgangsbasis und den Row Template. Wenn das gemacht worden ist, einfach auf “Export” drücken und lokal speichern.

Die Ausgangslage:

  • Prefix:
      <collection xmlns="http://www.loc.gov/MARC21/slim">
    
  • Row Separator: (Zeilenumbruch)
  • Suffix:
      </collection>
    
  • Und den Row Template:
      <record>
      <leader>     nab a22     uu 4500</leader>
      <controlfield tag="001"></controlfield>
      <datafield tag="022" ind1=" " ind2=" ">
          <subfield code="a"></subfield>
      </datafield>
      <datafield tag="041" ind1=" " ind2=" ">
          <subfield code="a"></subfield>
      </datafield>
      <datafield tag="100" ind1="0" ind2=" ">
          <subfield code="a"></subfield>
      </datafield>
      <datafield tag="260" ind1=" " ind2=" ">
          <subfield code="b"></subfield>
      </datafield>
      <datafield tag="264" ind1=" " ind2=" ">
          <subfield code="b"></subfield>
      </datafield>
      </record>
    

Kommentar zu dieser Anreicherung

  • Die leere Zellen, also wo keine GND-Nummer und keine Geburtsdatum steht, brauchen ein Platzhalter. Dies ist nötig damit die Autoren wieder zusammengeführt werden können und damit im Export keine “null” Zellen (wo eben keine Daten verfügrbar sind) mitkommen.
  • Auch habe ich die Zellen nicht zusammengeführt.
  • Um dies nachzuvollziehen, kann dieser Lösungsweg angeschaut werden.