FORSCHUNG

INTERNE ENTWICKLUNGSPROJEKTE

Für die Weiter­ent­wick­lung der Daten­bank­in­fra­struk­tur werden durch das Kompe­tenz­netz­werk Biblio­me­trie verschie­de­ne Entwick­lungs­pro­jek­te durch­ge­führt. Berich­te zu beende­ten Projek­te sind in unserem Archiv abrufbar.

Kompa­ra­ti­ve Analy­se und Kuratie­rung Deutscher Metada­ten in Offenen Biblio­me­trie­da­ten (OPENBIB)

Projekt­lauf­zeit: Mai 2023Dezem­ber 2025

Ziel des Entwick­lungs­pro­jek­tes ist der Aufbau einer offenen Biblio­me­trie­da­ten­bank inner­halb des Kompe­tenz­netz­werks Biblio­me­trie. Dadurch wird die Möglich­keit für die Wissen­schafts- und Hochschul­for­schung geschaf­fen, zur Förde­rung des Open-Science-Gedan­kens innova­ti­ve und offene Daten­quel­len als Alter­na­ti­ve zu den proprie­tä­ren Biblio­me­trie­da­ten­ban­ken zu nutzen. Gleich­zei­tig verspricht der Aufbau einer frei zugäng­li­chen Biblio­me­trie­da­ten­bank ein eigen­stän­di­ges Analy­se­po­ten­ti­al im Hinblick auf solche Publi­ka­ti­ons­or­te und ‑weisen, die in den proprie­tä­ren Daten nicht abgedeckt sind.

Konkret wird inner­halb des Kompe­tenz­netz­werks Biblio­me­trie eine offene Biblio­me­trie­da­ten­bank auf der Basis von OpenAl­ex koope­ra­tiv aufge­baut. Dabei verfolgt das Verbund­pro­jekt der KB-Partner SUB Göttin­gen, Univer­si­tät Biele­feld, FZ Jülich, GESIS und DZHW in Zusam­men­ar­beit mit dem KB-Hosting Partner FIZ Karls­ru­he und unter Einbe­zug weite­rer KB-Partnern folgen­de aufein­an­der abgestimm­te Teilziele:

  1. Daten­bank­be­reit­stel­lung: Bereit­stel­lung einer freien und maschi­nen­les­ba­ren Entwick­ler-Instanz der Biblio­me­trie­da­ten­bank OpenAl­ex als Grund­la­ge für die Kuratie­rung deutscher Publi­ka­ti­ons­da­ten unter Nutzung einer offenen Lizenz.
  2. Daten­bank­ver­gleich: Verglei­chen­de Analy­se der Abdeckung und Quali­tät der offenen Biblio­me­trie­da­ten­bank OpenAl­ex gegen­über den proprie­tä­ren Datenbanken.
  3. Daten­ku­ra­tie­rung: Entwick­lung und Anwen­dung techni­scher Verfah­ren zur Kuratie­rung der Metada­ten von Publi­ka­tio­nen, die unter Betei­li­gung von Autor*innen deutscher Forschungs­ein­rich­tun­gen entstan­den sind.
  4. Vernet­zung und Verwer­tung: Identi­fi­zie­rung von natio­na­len und inter­na­tio­na­len Nachnutzungsmöglichkeiten.

Ansprech­per­son: Najko Jahn (SUB Göttin­gen)

Weite­re Infor­ma­tio­nen können im Blog des Projekts gefun­den werden.

Daten­in­fra­struk­tur

Das Kompe­tenz­netz­werk Biblio­me­trie betreibt eine quali­täts­ge­si­cher­te Daten­in­fra­struk­tur. Diese wird am FIZ Karls­ru­he gehos­tet. Der Kern der Daten­ba­sis sind die biblio­gra­fi­schen Daten­ban­ken Scopus (Elsevier) und relevan­te Bestän­de des Web of Science (Clari­va­te Analy­tics). Die Daten­be­stän­de von OpenAl­ex werden im Laufe des Jahres 2025 gleich­be­rech­tigt zu den beiden anderen Daten­ban­ken in die Infra­struk­tur integriert werden.

Die Daten­be­stän­de werden über eine Reihe von automa­ti­schen und semiau­to­ma­ti­schen Proze­du­ren während der Ladepro­zes­se überprüft und Fehler entspre­chend bekann­ter Muster korri­giert. Es werden Verein­heit­li­chun­gen und Standar­di­sie­run­gen, z.B. von Zeitschrif­ten­na­men und Länder­an­ga­ben, vorgenommen.

Die Struk­tur­sche­ma­ta der Daten­ban­ken sind in Hinblick auf die Benut­zung für biblio­me­tri­sche Unter­su­chun­gen konzi­piert und optimiert, d.h. in Ergän­zung der von den Daten­bank­her­stel­lern gelie­fer­ten Rohda­ten enthal­ten die Biblio­me­trie­da­ten­ban­ken zusätz­li­che Infor­ma­tio­nen und bereits vorbe­rech­ne­te Indikatoren.

Ein beson­de­rer Mehrwert der vom Kompe­tenz­netz­werk Biblio­me­trie betrie­be­nen Daten­in­fra­struk­tur ist die imple­men­tier­te Insti­tu­tio­nen­ko­die­rung, d.h. die vielfäl­ti­gen Schreib­wei­sen deutscher Insti­tu­tio­nen, die in den Adress­fel­dern der Daten­ban­ken enthal­ten sind, werden berei­nigt und zusam­men­ge­führt, sodass eine eindeu­ti­ge Zuord­nung der Publi­ka­tio­nen zu den Insti­tu­tio­nen möglich wird. Die Insti­tu­tio­nen­co­die­rung wird von I²SoS, Univer­si­tät Biele­feld, vorgenommen.

Mit dem Ziel, die Repro­du­zier­bar­keit biblio­me­tri­scher Analy­sen sicher­zu­stel­len, werden die viertel­jähr­lich aktua­li­sier­ten, quali­täts­ge­prüf­ten Biblio­me­trie­da­ten­ban­ken zu einem definier­ten Zeitpunkt festge­schrie­ben und einge­fro­ren. Die alten Versio­nen der Daten­ban­ken werden archiviert.

Ein Artikel, der konzep­tu­el­le Überle­gun­gen zur techni­schen Infra­struk­tur und diese selbst beschreibt, das Daten­bank­sche­ma und Lade- sowie Prozes­se zur Daten­ku­ra­tie­rung und Quali­täts­si­che­rung dokumen­tiert, wurde 2024 erarbei­tet und als Preprint auf Zenodo veröffentlicht. 

Das DDL-Script zur Erstel­lung der Tabel­len ist ebenfalls auf Zenodo abgelegt. 

Weite­re Details werden in den zugehö­ri­gen Arbeits­be­rich­ten aufbereitet.

PUBLIKATIONEN UND VORTRÄGE

Folgen­de Publi­ka­tio­nen und Vorträ­ge sind unter Verwen­dung der Infra­struk­tur des Kompe­tenz­netz­werks Biblio­me­trie entstanden:

NETZWERKPARTNER

Das Kompe­tenz­netz­werk Biblio­me­trie ist ein insti­tu­tio­nen­über­grei­fen­der Verbund, mit dessen Zusam­men­ar­beit ein Beitrag zur Fortent­wick­lung und Anwend­bar­keit der Biblio­me­trie geleis­tet wird, der auf der zur Verfü­gung stehen­den Daten­in­fra­struk­tur basiert.