ARCHIV

ARCHIVE

Für verschiedene Anwen­dun­gen (z.B. fraktion­ierte Zählmeth­o­d­en auf Basis von Insti­tu­tio­nen) ist eine Insti­tu­tio­nenkodierung notwendig. Die existierende Insti­tu­tio­nenkodierung beschränkt sich auf deutsche Adressen/Institutionen und es beste­ht inner­halb des Kompe­tenzzen­trums Bibliome­trie (KB) ein Bedarf nach einer Ausweitung auf weitere Länder. Allerd­ings skaliert die für Deutsch­land angewandte Methode der Adress-Disam­bigu­ierung nicht auf größerem Maßstab. Daher ist es Ziel dieses Projek­tes, die Durch­führbarkeit einer Insti­tu­tio­nenkodierung für weitere Länder mit unter­schiedlichen Metho­d­en zu testen.

Insti­tu­tion­al disam­bigua­tion for further countries – an explo­ration with exten­sive use of wikida­ta (project report)

Ziel des Projek­tes ist die Bereit­stel­lung bereinigter und angere­ichert­er Verlagsin­for­ma­tio­nen für die Bibliome­trie-Daten­banken. Ähnlich wie bei Adressen zu Insti­tu­tio­nen liegen auch im Fall von Verlags­beze­ich­nun­gen unter­schiedliche Schreib­weisen vor, es beste­hen (Hierarchie-)beziehungen zwischen Verla­gen und Struk­turverän­derun­gen über die Zeit.

Publish­er. Disam­bigu­ierung und Historisierung. Projektbericht

In dem Projekt wird eine Zuord­nung von Adressen zu NUTS-Codes erstellt.

NUTS Geocod­ing – project report

Anwen­dung der automa­tis­chen Research Level-Klassi­fika­tion (Boyack et al. (2014), Journal of Infor­met­rics, 8, 1–12) auf die Datenbestände des KB sowie Validierung der Zuord­nun­gen anhand ausgewählter extern­er Daten­sätze. Diese Klassi­fika­tion ordnet einzelne Publika­tio­nen anhand der Begriffe im Titel und Abstract in vier Klassen nach ihrer Anwen­dungs- bzw. Grund­lagenori­en­tierung. Ergeb­nis der Projek­tes ist eine zusät­zliche Daten­bank­ta­belle mit Research Level-Angaben für die KB-Infra­struk­tur und ein intern­er Bericht zur Einschätzung der Valid­ität der Verfahrens.

Bericht: Research Level-Daten für die Bibliometriedatenbanken

Im Rahmen einer Machbarkeitsstudie werden mögliche Verfahren zur weltweit­en Insti­tu­tion­skodierung entwick­elt und getestet. Dabei soll das Verfahren soweit möglich automa­tisiert ablaufen. Es wird ein Bottom-Up-Verfahren auf Basis der zu kodieren­den Daten entwick­elt, wobei die beste­hen­den distink­ten Organ­i­sa­tio­nen zunächst wie einzelne Organ­i­sa­tion­sin­stanzen behan­delt werden, welche dann weiter zusam­men gruppiert werden, um eine Unter­schei­dung in eindeutige Organ­i­sa­tion­sob­jek­te zu erzie­len. Es wird zunächst eine Zuord­nung auf Basis von identis­chen bzw. ähnlichen Namensvari­anten der Organ­i­sa­tio­nen getestet. Zur Evaluierung der Methode wurde zuerst ein Goldstan­dard-Daten­satz entwick­elt, auf dessen Basis die Ergeb­nisse unser­er Methode schlussendlich analysiert werden sollen.

Abschluss­bericht: Kodierung inter­na­tionaler Insti­tu­tio­nen – eine Machbarkeitsstudie anhand von ausgewählten Ländern