FORSCHUNG

INTERNE ENTWICKLUNGSPROJEKTE

Für die Weiter­ent­wick­lung der Daten­bank­in­fra­struk­tur werden durch das Kompe­tenz­netz­werk Biblio­me­trie verschie­de­ne Entwick­lungs­pro­jek­te durch­ge­führt. Berich­te zu beende­ten Projek­te sind in unserem Archiv abrufbar.

Kompa­ra­ti­ve Analy­se und Kuratie­rung Deutscher Metada­ten in Offenen Biblio­me­trie­da­ten (OPENBIB)

Projekt­lauf­zeit: Mai 2023Dezem­ber 2025

Ziel des Entwick­lungs­pro­jek­tes ist der Aufbau einer offenen Biblio­me­trie­da­ten­bank inner­halb des Kompe­tenz­netz­werks Biblio­me­trie. Dadurch wird für die Wissen­schafts- und Hochschul­for­schung die Möglich­keit geschaf­fen, zur Förde­rung des Open-Science-Gedan­kens offene Daten­quel­len als Alter­na­ti­ve zu den proprie­tä­ren Biblio­me­trie­da­ten­ban­ken zu nutzen. Gleich­zei­tig verspricht der Aufbau einer frei zugäng­li­chen Biblio­me­trie­da­ten­bank ein eigen­stän­di­ges Analy­se­po­ten­ti­al im Hinblick auf solche Publi­ka­ti­ons­or­te und ‑weisen, die in den proprie­tä­ren Daten nicht abgedeckt sind.

Konkret wird inner­halb des Kompe­tenz­netz­werks Biblio­me­trie eine offene Biblio­me­trie­da­ten­bank auf der Basis von OpenAl­ex koope­ra­tiv aufge­baut. Dabei verfolgt das Verbund­pro­jekt der KB-Partner SUB Göttin­gen, Univer­si­tät Biele­feld, FZ Jülich, GESIS und DZHW in Zusam­men­ar­beit mit dem KB-Hosting Partner FIZ Karls­ru­he und unter Einbe­zug weite­rer KB-Partner folgen­de aufein­an­der abgestimm­te Teilziele:

  1. Daten­bank­be­reit­stel­lung: Bereit­stel­lung einer freien und maschi­nen­les­ba­ren Entwick­ler-Instanz der Biblio­me­trie­da­ten­bank OpenAl­ex als Grund­la­ge für die Kuratie­rung deutscher Publi­ka­ti­ons­da­ten unter Nutzung einer offenen Lizenz.
  2. Daten­bank­ver­gleich: Verglei­chen­de Analy­se der Abdeckung und Quali­tät der offenen Biblio­me­trie­da­ten­bank OpenAl­ex gegen­über den proprie­tä­ren Datenbanken.
  3. Daten­ku­ra­tie­rung: Entwick­lung und Anwen­dung techni­scher Verfah­ren zur Kuratie­rung der Metada­ten von Publi­ka­tio­nen, die unter Betei­li­gung deutscher Forschungs­ein­rich­tun­gen entstan­den sind.
  4. Vernet­zung und Verwer­tung: Identi­fi­zie­rung von natio­na­len und inter­na­tio­na­len Nachnutzungsmöglichkeiten.

Ansprech­per­son: Najko Jahn (SUB Göttin­gen)

Weite­re Infor­ma­tio­nen können im Blog des Projekts gefun­den werden.

Daten­in­fra­struk­tur

Das Kompe­tenz­netz­werk Biblio­me­trie betreibt eine quali­täts­ge­si­cher­te Daten­in­fra­struk­tur. Diese wird am FIZ Karls­ru­he gehos­tet. Im Zentrum der Daten­in­fra­struk­tur stehen die biblio­gra­fi­schen Daten­ban­ken Scopus (Elsevier) und der Kernbe­stand des Web of Science (Clari­va­te Analy­tics). Die Daten­be­stän­de von OpenAl­ex werden im Laufe des Jahres 2025 gleich­be­rech­tigt zu den beiden anderen Daten­ban­ken in die Infra­struk­tur integriert.

Die Daten­be­stän­de werden über eine Reihe von automa­ti­schen und semiau­to­ma­ti­schen Proze­du­ren während der Ladepro­zes­se überprüft und eventu­el­le Fehler beim Laden und Mapping korri­giert sowie Irregu­la­ri­tä­ten an die Betrei­ber Elsevier und Clari­va­te gemel­det. Es werden einige Standar­di­sie­run­gen, insb. im Fall von Identi­fi­ern und Länder­an­ga­ben, vorge­nom­men. Jede Daten­bank­ver­si­on wird von einem intern veröf­fent­lich­ten Quali­täts­si­che­rungs-Report beglei­tet und einmal jährlich werden aggre­gier­te Daten und Indika­to­ren mit dem Stand des Vorjah­res vergli­chen und in einem frei zugäng­li­chen Bericht veröf­fent­licht.

Die Schema­ta der Biblio­me­trie­da­ten­ban­ken sind für die Benut­zung für biblio­me­tri­sche Analy­sen konzi­piert und optimiert, sie enthal­ten zudem auch Daten­an­rei­che­run­gen und vorbe­rech­ne­te Indikatoren.

Ein beson­de­rer Mehrwert der vom Kompe­tenz­netz­werk Biblio­me­trie betrie­be­nen Daten­in­fra­struk­tur ist die imple­men­tier­te Insti­tu­tio­nen­ko­die­rung, die variie­ren­de Schreib­wei­sen, die in den Adress­fel­dern der gelie­fer­ten Rohda­ten enthal­ten sind, zusam­men­führt. Die Insti­tu­tio­nen­ko­die­rung greift dafür zunächst auf Adress-Infor­ma­tio­nen in den Rohda­ten von WoS, Scopus und OAL zu und liefert eine eindeu­ti­ge Zuord­nung der Publi­ka­tio­nen zu Forschungs­ein­rich­tun­gen, wobei struk­tu­rel­le Verän­de­run­gen der Insti­tu­tio­nen­land­schaft über die Zeit hinweg mittels zweier alter­na­ti­ver Mappings darge­stellt wird. Die Insti­tu­tio­nen­ko­die­rung wird für alle Publi­ka­tio­nen aus Deutsch­land prozes­siert, so dass biblio­me­tri­sche Evalua­tio­nen deutschen Forschungs­ein­rich­tun­gen durch eine Daten­ba­sis mit verbes­ser­ter Validi­tät unter­stützt werden. Die Insti­tu­tio­nen­co­die­rung wird von I²SoS, Univer­si­tät Biele­feld, in Zusam­men­ar­beit mit FIZ Karls­ru­he entwi­ckelt und betrieben.

Schrit­te zu einer offenen, repro­du­zier­ba­ren Infrastruktur

Um die Repro­du­zier­bar­keit biblio­me­tri­scher Analy­sen zu unter­stüt­zen werden die viertel­jähr­lich aktua­li­sier­ten, quali­täts­ge­prüf­ten Biblio­me­trie­da­ten­ban­ken zu einem definier­ten Zeitpunkt festge­schrie­ben und einge­fro­ren. Die alten Versio­nen der Daten­ban­ken werden archi­viert. Ebenfalls zur Unter­stüt­zung von Repro­du­zier­bar­keit und Trans­pa­renz der Daten­in­fra­struk­tur wurde 2024 ein Artikel geschrie­ben, der konzep­tu­el­le Überle­gun­gen zur techni­schen Infra­struk­tur und diese selbst beschreibt, das Daten­bank­sche­ma und Lade- sowie Prozes­se zur Daten­ku­ra­tie­rung und Quali­täts­si­che­rung dokumen­tiert. Er wurde als Preprint auf Zenodo veröf­fent­licht sowie in QSS einge­reicht. Das DDL-Script zur Erstel­lung der Tabel­len ist ebenfalls auf Zenodo abgelegt.

Weite­re Details werden in den zugehö­ri­gen Arbeits­be­rich­ten aufbereitet.

Eine Veröf­fent­li­chung von ausge­wähl­ten, kuratier­ten Daten­seg­men­ten aus dem OPENBIB-Projekt ist über Github sowie ebenfalls über Zenodo erhältlich.

Anwen­dung

Das Kompe­tenz­netz­werk Biblio­me­trie wird vom BMBF darin geför­dert, diese Daten­in­fra­struk­tur bereit zu stellen; dagegen werden Forschungs­pro­jek­te i.d.R. nicht im Rahmen des KB geför­dert. Die Partner­ein­rich­tun­gen des KB nutzen ihre Grund­för­de­rung oder ander­wei­tig einge­wor­be­ne Dritt­mit­tel, um auf Basis der durch das KB bereit­ge­stell­ten Daten zu forschen. In den vergan­ge­nen Jahren sind viele Publi­ka­tio­nen und Vorträ­ge entstan­den, die sich sowohl mit metho­do­lo­gi­schen Frage­stel­lun­gen der Biblio­me­trie beschäf­ti­gen als auch biblio­me­tri­sche Daten für z.B. wissen­schafts­so­zio­lo­gi­sche oder innova­ti­ons­öko­no­mi­sche Fragen benutzen.

PUBLIKATIONEN UND VORTRÄGE

Folgen­de Publi­ka­tio­nen und Vorträ­ge sind unter Verwen­dung der Infra­struk­tur des Kompe­tenz­netz­werks Biblio­me­trie entstanden: