ARCHIV

ARCHIV DER
INTERNEN ENTWICKLUNGSPROJEKTE

An dieser Stelle finden Sie die Berich­te zu beende­ten Projekten.

2021


The focus of the project is the detec­tion and quanti­ta­ti­ve analy­sis of acknow­led­ged entities, i.e., named entity recogni­ti­on (NER) task in a larger corpus of WoS artic­les which include acknow­led­ge­ments. The analy­sis of acknow­ledgments is parti­cu­lar­ly interes­t­ing as acknow­ledgments may give an insight on such aspects of scien­ti­fic socie­ty as reward systems, colla­bo­ra­ti­on struc­tures, and hidden research trends. The FLAIR NLP Frame­work will be used to perform the acknow­led­ged entity recogni­ti­on task.

Project Report: Mining Acknow­led­ge­ment Texts in Web of Science (MinAck)

2020


In diesem Projekt wird die Anwend­bar­keit der bestehen­den Insti­tu­tio­nen-Kodie­rung auf die Daten von Dimen­si­ons geprüft. Dies umfasst die Anwen­dung der Disam­bi­gu­ie­rungs­rou­ti­nen auf die Dimen­si­ons-Daten und den Vergleich der von Dimen­si­ons angebo­te­nen GRID-Daten.

Download Machbar­keits­stu­die „Insti­tu­tio­nen-Kodie­rung Dimensions“

Im Projekt wird das Zitati­ons­netz­werk von Dimen­si­ons mit denen von WoS und Scopus vergli­chen, um einen mögli­chen Mehrwert der Daten­quel­le für zitati­ons­ana­ly­ti­sche Studi­en zu identi­fi­zie­ren. Es werden getrennt Teilmen­gen von Publi­ka­tio­nen betrach­tet, die in allen Quellen enthal­ten sind, nur in zwei Quellen enthal­ten sind und solchen, die nur in einer Quelle enthal­ten sind. Unter­sucht wird auch, inwie­fern die gleichen Veröf­fent­li­chun­gen in den verschie­de­nen Quellen hinsicht­lich ihres Zitati­onsim­pact unter­schied­li­che Ergeb­nis­se aufweisen.

Download Erkun­dung des Dimen­si­ons Zitati­ons­netz­werks als Daten­quel­le für das Kompe­tenz­zen­trum Bibliometrie

Download Scalable Disam­bi­gua­ti­on of Insti­tu­ti­ons for Web of Science

Die Studie unter­sucht die Inhal­te von Dimen­si­ons im Vergleich zu den beiden bislang im KB verwen­de­ten Quell­da­ten­ban­ken. Dies umfasst die statis­ti­sche Erfas­sung der Inhal­te und Überprü­fung auf mögli­che Abdeckungs­lü­cken, die Prüfung der vorhan­de­nen Daten­fel­der hinsicht­lich Eignung für biblio­me­tri­sche Studi­en, und Evalu­ie­rung der Datenkonsistenz.

Download Dimen­si­ons – Evalu­ie­rung der Inhal­te und biblio­me­tri­schen Datenbasis

Basie­rend auf den drei Projek­ten haben das DZHW, FZ Jülich und Univer­si­tät Biele­feld eine Zusam­men­fas­sung der wichtigs­ten Ergeb­nis­se und daraus resul­tie­ren­den Empfeh­lun­gen für das KB erstellt.

2019


Die Verän­de­rung von Zeitschrif­ten­ti­teln wie zum Beispiel Gründung, Einstel­lung, Zusam­men­schluss, Aufspal­tung und die Abände­rung des Titels wird in der derzei­ti­gen KB Daten­bank­struk­tur nicht abgebil­det. Des Weite­ren wird zwar Auskunft über die derzei­ti­ge Zugehö­rig­keit von Zeitschrif­ten zu Verla­gen, nicht aber über die Verän­de­rung der Besitz­ver­hält­nis­se im Zeitver­lauf gegeben. Je nach Projekt­kon­text und Erkennt­nis­in­ter­es­se kann es von Bedeu­tung sein, die Identi­fi­zie­rung und Zuord­nung von Journalen­ti­tä­ten und deren Zugehö­rig­keit zu Verla­gen im histo­ri­schen Verlauf zu berück­sich­ti­gen, so dass die Ergän­zung dieser Infor­ma­tio­nen eine Aufwer­tung der KB-Daten­ban­ken darstellt. Ziel des Klein­pro­jekts ist es, eine Daten­grund­la­ge zu schaf­fen, die eine Analy­se der Zugehö­rig­keit von Zeitschrif­ten­ti­teln zu Verla­gen im Zeitver­lauf erlaubt.

Download Journal-Histo­ri­sie­rung und Zugehö­rig­keit. Endbericht

Ambigui­ty level of insti­tu­ti­on names is diffe­rent in various data aggre­ga­tors based on metada­ta provi­ded. The Web of Science (WoS) supports basic struc­tures such as univer­si­ty, street address, city, ZIP code and country name. Nevert­hel­ess diffe­rent styles of filling the fields by authors are not avoida­ble. Often, it is not obvious whether two diffe­rent referen­ces to insti­tu­ti­ons are variants of just one name or actual­ly consti­tu­te diffe­rent insti­tu­ti­ons. Authors enter their affilia­ti­on in diffe­rent ways over various publi­ca­ti­ons or intro­du­ce spelling errors. The aim of this study is to intro­du­ce a method to disam­bi­gua­te the insti­tu­ti­on names in WoS, as a large scale biblio­me­tric databa­se. For this purpo­se, multi­ple variants of insti­tu­ti­ons name are grouped together. To evalua­te the method, we will use the insti­tu­ti­on coding imple­men­ted by Biele­feld University.

Download Scalable Disam­bi­gua­ti­on of Insti­tu­ti­ons for Web of Science

2018


As the h-index becomes the gold standard for measu­ring scholar­ly impact, the risk for gaming the system grows. This has spurred the propo­sal for report­ing a self-citati­on index (s‑index), which aims to add much needed context to calcu­la­ted h scores. It also is expec­ted to promo­te good citati­on habits. A neces­sa­ry step towards using the metric is valida­ti­on. Here we propo­se to use the s-index to measu­re how self-citati­on patterns vary accor­ding to diffe­rent fields, acade­mic ages, count­ries, and institutions.

Report: Track­ing self-citati­ons in acade­mic publishing

The restric­ted access to published, peer-review­ed documents is enforced via a legal frame­work, which is predo­mi­na­te­ly based upon copyright laws. In the publi­ca­ti­on process authors trans­fer the copyright (or solely the exclu­si­ve repro­duc­tion rights) to a publisher and the publisher uses these rights as a legal instru­ment to restrict access to an audience which is willing to pay for obtai­ning the right to access the content. Given this perspec­ti­ve any identi­fi­ca­ti­on of OA publi­ca­ti­ons must there­fo­re also be based upon legal infor­ma­ti­on, which defines the access charac­ter of the publi­ca­ti­on as imposed by the copyright holder, i.e. the publisher.

Inspi­red by the Hybrid OA Dashboard (Jahn, 2017) we there­fo­re propo­se to apply licen­sing infor­ma­ti­on suppli­ed by publishers to the publisher associa­ti­on Cross­ref to identi­fy OA publi­ca­ti­on. In detail, we propo­se to obtain the respec­ti­ve licen­ses of Web of Science (or Scopus) indexed publi­ca­ti­ons and compa­re them with a white­list of estab­lished OA licen­ses and annota­te the thereby defined OA status of the publi­ca­ti­ons in the KB infrastructure.

Report: Apply­ing Cross­ref and Unpay­wall infor­ma­ti­on to identi­fy gold, hidden gold, hybrid and delay­ed Open Access publi­ca­ti­ons in the KB publi­ca­ti­on corpus

Im Projekt „Effizi­en­tes Retrie­val auf Web of Science-Daten mit Elastic­se­arch“ ist geplant, die umfang­rei­chen XML-Daten des Web of Science (WoS), die aktuell in einer SQL-Daten­bank vorlie­gen, in einen perfor­man­ten Elastic­se­arch Index3 zu überfüh­ren. Dadurch werden diese Daten effizi­en­ter recher­chier­bar und leich­ter zugänglich.

Abschluss­be­richt: Effzi­en­tes Retrie­val auf Web of Science-Daten mit Elasticsearch

2017


Für verschie­de­ne Anwen­dun­gen (z.B. fraktio­nier­te Zählme­tho­den auf Basis von Insti­tu­tio­nen) ist eine Insti­tu­tio­nen­ko­die­rung notwen­dig. Die existie­ren­de Insti­tu­tio­nen­ko­die­rung beschränkt sich auf deutsche Adressen/Institutionen und es besteht inner­halb des Kompe­tenz­zen­trums Biblio­me­trie (KB) ein Bedarf nach einer Auswei­tung auf weite­re Länder. Aller­dings skaliert die für Deutsch­land angewand­te Metho­de der Adress-Disam­bi­gu­ie­rung nicht auf größe­rem Maßstab. Daher ist es Ziel dieses Projek­tes, die Durch­führ­bar­keit einer Insti­tu­tio­nen­ko­die­rung für weite­re Länder mit unter­schied­li­chen Metho­den zu testen.

Insti­tu­tio­nal disam­bi­gua­ti­on for further count­ries – an explo­ra­ti­on with exten­si­ve use of wikida­ta (project report)

Ziel des Projek­tes ist die Bereit­stel­lung berei­nig­ter und angerei­cher­ter Verlags­in­for­ma­tio­nen für die Biblio­me­trie-Daten­ban­ken. Ähnlich wie bei Adres­sen zu Insti­tu­tio­nen liegen auch im Fall von Verlags­be­zeich­nun­gen unter­schied­li­che Schreib­wei­sen vor, es bestehen (Hierarchie-)beziehungen zwischen Verla­gen und Struk­tur­ver­än­de­run­gen über die Zeit.

Publisher. Disam­bi­gu­ie­rung und Histo­ri­sie­rung. Projektbericht

Anwen­dung der automa­ti­schen Research Level-Klassi­fi­ka­ti­on (Boyack et al. (2014), Journal of Infor­me­trics, 8, 1–12) auf die Daten­be­stän­de des KB sowie Validie­rung der Zuord­nun­gen anhand ausge­wähl­ter exter­ner Daten­sät­ze. Diese Klassi­fi­ka­ti­on ordnet einzel­ne Publi­ka­tio­nen anhand der Begrif­fe im Titel und Abstract in vier Klassen nach ihrer Anwen­dungs- bzw. Grund­la­gen­ori­en­tie­rung. Ergeb­nis der Projek­tes ist eine zusätz­li­che Daten­bank­ta­bel­le mit Research Level-Angaben für die KB-Infra­struk­tur und ein inter­ner Bericht zur Einschät­zung der Validi­tät der Verfahrens.

Bericht: Research Level-Daten für die Bibliometriedatenbanken

Im Rahmen einer Machbar­keits­stu­die werden mögli­che Verfah­ren zur weltwei­ten Insti­tu­ti­ons­ko­die­rung entwi­ckelt und getes­tet. Dabei soll das Verfah­ren soweit möglich automa­ti­siert ablau­fen. Es wird ein Bottom-Up-Verfah­ren auf Basis der zu kodie­ren­den Daten entwi­ckelt, wobei die bestehen­den distink­ten Organi­sa­tio­nen zunächst wie einzel­ne Organi­sa­ti­ons­in­stan­zen behan­delt werden, welche dann weiter zusam­men gruppiert werden, um eine Unter­schei­dung in eindeu­ti­ge Organi­sa­ti­ons­ob­jek­te zu erzie­len. Es wird zunächst eine Zuord­nung auf Basis von identi­schen bzw. ähnli­chen Namens­va­ri­an­ten der Organi­sa­tio­nen getes­tet. Zur Evalu­ie­rung der Metho­de wurde zuerst ein Goldstan­dard-Daten­satz entwi­ckelt, auf dessen Basis die Ergeb­nis­se unserer Metho­de schluss­end­lich analy­siert werden sollen.

Abschluss­be­richt: Kodie­rung inter­na­tio­na­ler Insti­tu­tio­nen – eine Machbar­keits­stu­die anhand von ausge­wähl­ten Ländern

2016


Die Frage nach der Verschrän­kung von Wissen­schaft und Wirtschaft, insbe­son­de­re in inter­na­tio­nal verglei­chen­der Perspek­ti­ve, aber auch für einzel­ne Länder über die Zeit, ist eine wissen­schafts­po­li­tisch zuneh­mend wichti­ge Kenngrö­ße. Derzeit erlaubt die Daten­in­fra­struk­tur des Kompe­tenz­zen­trums Biblio­me­trie eine Zuschrei­bung der Katego­rie „Wirtschaft“ für Insti­tu­tio­nen mit deutschem Sitz. Diese insti­tu­tio­nel­le Disam­bi­gu­ie­rung erlaubt es annähe­rungs­wei­se die Integra­ti­on von Wissen­schaft und Wirtschafts­ak­teu­ren über Ko-Publi­ka­tio­nen zu analy­sie­ren. Jedoch nur für solche Fälle, in denen beide Akteu­re ihren Sitz in Deutsch­land haben. Es wird daher vorge­schla­gen, Ansät­ze aus der Harmo­ni­sie­rung von Daten­be­stän­den zu nutzen und deren Übertrag­bar­keit auf Publi­ka­ti­ons­da­ten zu prüfen.

Bericht: There is no easy way around disam­bi­gua­ti­on to construct valid publi­ca­ti­on­ba­sed indica­tors for science-indus­try linkage

Die Identi­fi­ka­ti­on und Disam­bi­gu­ie­rung von Autoren­na­men ermög­licht es, über Perso­nen­na­men die Suche von Publi­ka­tio­nen im Daten­be­stand vorzu­neh­men, um präzi­se Auskünf­te zu Verfas­sern und deren Veröf­fent­li­chun­gen zu erhal­ten. Diese Disam­bi­gu­ie­rung wird im KB u. a. für Fallstu­di­en und Länder­ana­ly­sen dringend benötigt. Im Vorläu­fer­pro­jekt wurde ein Verfah­ren auf Basis von Co-Autoren-Analy­sen entwi­ckelt, um Autoren­na­men in DBLP und WoS-Daten­sät­zen zu disam­bi­gu­ie­ren. Die Effek­ti­vi­tät des Verfah­rens wurde anhand von einem eigens dafür erstell­ten Goldda­ten­satz jeweils für DBLP und WoS unter­sucht. Die Präzi­si­on für Autoren-Homony­me im Fall von DBLP und WoS liegt in der proto­ty­pi­schen Imple­men­ta­ti­on in einem erfreu­lich guten Niveau. Projekt­ge­gen­stand von Teil 2 des Projekts ist die Weiter­ent­wick­lung und Optimie­rung des proto­ty­pi­schen Verfah­rens zur Autorendisambiguierung.

Download Project Report: Author Identi­fiers Part II

Die Unter­su­chung wird zum einen eine statis­ti­sche Auswer­tung zu Art und Vollstän­dig­keit der in den Adress­da­ten­sät­zen von Web of Science und Scopus enthal­te­nen Geoin­for­ma­tio­nen liefern (Verfüg­bar­keit von Ortsna­men, PLZ, Straßen­an­ga­ben; fehlen­de City- und Country-Angaben bei Scopus etc.). Zum anderen wird eine Übersicht über verfüg­ba­re und geeig­ne­te Ressour­cen zur Geoko­die­rung erstellt, einschließ­lich exempla­ri­scher Tests zu deren Leistungs­fä­hig­keit (und Proble­men). Darüber hinaus werden Grund­zü­ge eines Verfah­rens zur Geoko­die­rung entwi­ckelt und ein Vorschlag für die Struk­tur der Tabel­len zur Integra­ti­on der Ergeb­nis­se in die KB-Daten­ban­ken vorgestellt.

Geoko­die­rung von Autoren­adres­sen in Publi­ka­ti­ons­da­ten­ban­ken. Abschluss­be­richt einer Unter­su­chung für das Kompe­tenz­zen­trum Bibliometrie

In diesem Projekt soll ein Schritt in Richtung der Harmo­ni­sie­rung der Arbeit der Mitglieds­ein­rich­tun­gen mit den gemein­sam genutz­ten Daten getan werden. Dazu sollen für gängi­ge biblio­me­tri­sche Indika­to­ren auf der insti­tu­tio­nel­len Ebene, der Ebene von Ländern und der Ebene von belie­big zusam­men­ge­stell­ten Mengen an Publi­ka­tio­nen standar­di­sier­te Abfra­gen als gespei­cher­te Proze­du­ren direkt in der Biblio­me­trie­da­ten­bank bereit gestellt werden. Die Proze­du­ren sind dann sowohl zur Ausfüh­rung als auch zur Ansicht der Berech­nung, d.h. des Quell­codes den Benut­zern der KB-Oracle-Daten­bank freigegeben.

Dokumen­ta­ti­on Biblio­me­tri­sche Indika­to­ren als gespei­cher­te Prozeduren

vor 2016


Problem­stel­lung und Ziel
Eine Identi­fi­ka­ti­on und Disam­bi­gu­ie­rung von Autoren­na­men ermög­licht es, über Perso­nen­na­men die Suche von Publi­ka­tio­nen im Daten­be­stand vorzu­neh­men, um präzi­se Auskünf­te zu Verfas­sern und deren Veröf­fent­li­chun­gen zu erhal­ten. Ziel des Projek­tes ist es zunächst seitens GESIS, einen Goldstan­dard-Daten­satz für Autoren-Publi­ka­tio­nen-Relatio­nen zu erstel­len. GESIS und ISI entwi­ckeln unabhän­gig vonein­an­der unter­schied­li­che Merging-Verfah­ren und Ähnlich­keits­rech­nun­gen, die anschlie­ßend mit dem Goldstan­dard evalu­iert werden.

Antrag­stel­ler
Fraun­ho­fer ISI und GESIS

Download Project Report: Author Identifiers

Download Endbe­richt: Verga­be von eindeu­ti­gen Autoren-IDs in WoS

Problem­stel­lung und Ziel
Die in Web of Science (WoS) und Scopus verfüg­ba­ren Journal­klas­si­fi­ka­tio­nen sind nicht geeig­net, inter­dis­zi­pli­nä­re oder dynami­sche Forschungs­ge­bie­te abzugren­zen, da die Klassen einen unter­schied­li­chen Spezia­li­sie­rungs­grad aufwei­sen. Hierfür ist eine Artikel­klas­si­fi­zie­rung erfor­der­lich. Zur Klassi­fi­zie­rung werden Co-Occur­ren­ces von Referen­zen verwendet.

Hierar­chi­sche Artikel­klas­si­fi­ka­ti­on. Bericht für das Kompe­tenz­zen­trum Bibliometrie

Antrag­stel­ler
GESIS

Problem­stel­lung und Ziel
Für die Feldnor­ma­li­sie­rung von Zitati­ons­in­di­ka­to­ren ist die innere Homoge­ni­tät von Subject Catego­ries (SC) in der Daten­bank Web of Science (WoS) bezüg­lich der unter­lie­gen­den Publi­ka­ti­ons- und Zitati­ons­kul­tu­ren eine basale Voraus­set­zung, die jedoch nicht immer gegeben zu sein scheint. In diesem Projekt wird eine Metho­de entwi­ckelt, mit der Hetero­ge­ni­tät inner­halb von Subject Catego­ries quanti­fi­zier­bar gemacht und in der Form eines Fehler­in­ter­valls in die Norma­li­sie­rung integriert werden kann. Damit sollen insbe­son­de­re Klassen mit asymme­tri­schen Zitati­ons­struk­tu­ren (bspw. zwischen Grund­la­gen­for­schung und anwen­dungs­ori­en­tier­ter Forschung zum gleichen Gegen­stand) identi­fi­ziert werden.

Antrag­stel­ler
DZHW

Download: Measu­ring and analy­sing the inter­nal, topical coherence of Web of Science Subject Categories

Problem­stel­lung und Ziel
Ziel der Studie ist die Quanti­fi­zie­rung des Ausma­ßes und der Bandbrei­te der Verän­de­run­gen von typischen biblio­me­tri­schen Indika­to­ren durch die Disam­bi­gu­ie­rung deutscher Insti­tu­ti­ons­adres­sen der Uni Biele­feld. Zu diesem Zweck sollen inter­na­tio­nal als Standard anerkann­te und aussa­ge­kräf­ti­ge Kennzah­len des Publi­ka­ti­ons­out­puts, der natio­na­len und inter­na­tio­na­len Koope­ra­ti­on sowie des Impacts von deutschen wissen­schaft­li­chen Einrich­tun­gen berech­net werden – einmal unter Berück­sich­ti­gung der berei­nig­ten und zusam­men­ge­führ­ten Adress­da­ten und, als Kontrast, über die typische in der Daten­bank benutz­te Institutionskennung.
Zusätz­lich sollen auch Beispiel­rech­nun­gen zum Effekt auf biblio­me­tri­sche Maße von Einrich­tun­gen durch­ge­führt werden, die eine Verän­de­rung in der Organi­sa­ti­ons­struk­tur durch­lau­fen haben (z.B. Fusion, Einglie­de­rung) unter Nutzung der Histo­ri­sie­rungs­kom­po­nen­te der Adresscodierung.

Antrag­stel­ler
Univer­si­tät Biele­feld I²SOS und DZHW

Download: Compa­ring insti­tu­tio­nal-level biblio­me­tric research perfor­mance indica­tor values based on diffe­rent affilia­ti­on disam­bi­gua­ti­on systems

Problem­stel­lung und Ziel
Die Zuord­nung des Forschungs­out­puts zu den jewei­li­gen fördern­den Organi­sa­tio­nen ist nach wie vor aufwen­dig. Im Rahmen des Vorha­bens sollen Metho­den der Zuord­nung von Publi­ka­tio­nen zu Forschungs­för­de­rern vergli­chen werden. Ziel ist es insbe­son­de­re, zu einer Bewer­tung der Relia­bi­li­tät und Validi­tät der im Web of Science verfüg­ba­ren Angaben zu Funding Acknow­led­ge­ments und Aussa­gen zu deren Nutzbar­keit in biblio­me­tri­schen Analy­sen zu kommen.

Projekt­be­schrei­bung
Im Rahmen des Projek­tes soll am Beispiel der DFG und der BMBF Forschungs­för­de­rung die Relia­bi­li­tät und Validi­tät der Angaben „Funding Acknow­led­ge­ments“ unter­sucht werden. Dazu werden die im Web of Science erfass­ten Funding Acknow­led­ge­ments mit den Angaben zu Publi­ka­tio­nen in den Abschluss­be­rich­ten zu von der DFG und dem BMBF geför­der­ten Projek­ten abgegli­chen. Zusätz­lich werden die Ergeb­nis­se des Vergleichs im Rahmen von Kurzin­ter­views validiert. Dadurch sollen Rückschlüs­se auf die Motiva­ti­on für die Nennung der Förder­or­ga­ni­sa­ti­on, auf die Nennung von Förder­or­ga­ni­sa­tio­nen bei Mehrfach­för­de­rung und auf mögli­che Verzer­run­gen, die sich aus dem von Thomson Reuters einge­setz­ten Erhebungs­ver­fah­ren ergeben, gezogen werden. Basie­rend auf den Ergeb­nis­sen wird eine Einschät­zung der Vollstän­dig­keit und der Richtig­keit der Angaben zu Funding Acknow­led­ge­ments im Web of Science gegeben.

Butler, L. / Biglia, B. / Bourke, P., 1998: Austra­li­an Biome­di­cal Research: Funding Acknow­ledgments and Perfor­mance. Canber­ra: NHMRC.
Gilles, C. / Councill, I., 2004: Who gets acknow­led­ged: Measu­ring scien­ti­fic contri­bu­ti­ons through automa­tic acknow­ledgment index­ing. PNAS 101 (51), 17599–17604.

Antrag­stel­ler
Insti­tut für Forschungs­in­for­ma­ti­on und Quali­täts­si­che­rung (iFQ)

Download: Bericht Funding Acknow­led­ge­ment-Daten­be­rei­ni­gung Web of Science

Problem­stel­lung und Ziel
Die Infor­ma­ti­on über die Abgren­zung verschie­de­ner Themen­ge­bie­te, den Wandel dieser Themen­ge­bie­te über die Zeit und die Entste­hung neuer Themen­ge­bie­te kann sowohl für Wissen­schaft­ler, Veran­stal­ter von Konfe­ren­zen u.ä. als auch für Förde­rer von Forschungs­pro­gram­men, ‑projek­ten und ‑einrich­tun­gen von großer Wichtig­keit sein. Eine manuel­le Identi­fi­ka­ti­on von bestehen­den und neu entstan­de­nen Themen­ge­bie­ten ist jedoch aufgrund der Menge an Publi­ka­tio­nen und der fehlen­den Übersicht über diese kaum reali­sier­bar. In diesem Projekt soll deshalb ein automa­ti­sches Verfah­ren zur Erstel­lung von Sammlun­gen solcher Publi­ka­tio­nen zu einem Themen­ge­biet, sogenann­te Cluster, am aktuel­len Rand erstellt werden. Dieses Verfah­ren nutzt die Kennt­nis­se über bereits bestehen­de Themen­ge­bie­te und die Eigen­schaf­ten entstan­de­ner Themen­ge­bie­te, um neue Themen­ge­bie­te zu erken­nen und als neue Cluster von den bestehen­den abzugren­zen. Zusätz­lich zur Erstel­lung dieser Cluster sollen diese von einem automa­ti­schen Verfah­ren benannt werden, das hierzu textu­el­le Infor­ma­tio­nen aus den Publi­ka­tio­nen benutzt und aus diesen solche auswählt, die dieses Themen­ge­biet spezi­fi­zie­ren und von den anderen hinrei­chend abgrenzt.

Projekt­be­schrei­bung
Am Anfang des Projekts werden die Attri­bu­te bestimmt, mit denen die Gebie­te in biblio­me­tri­schen Daten­sät­zen automa­tisch vonein­an­der abgegrenzt werden können. Diese werden auf einem eigens dafür erstell­ten berei­nig­ten Teilda­ten­satz (aus der Oberklas­se „Compu­ter Science“) mit einem Machi­ne Learning Ansatz auf ihre Eignung getes­tet. Auf diese Weise soll ein automa­ti­sches Verfah­ren zur Erstel­lung der Themen­clus­ter generiert werden. Darauf aufbau­end wird ein zweites Verfah­ren zur Benen­nung dieser Cluster entwi­ckelt. Hierdurch wird es möglich, die Entste­hung und Entwick­lung von Themen­clus­tern über die Zeit genau­er zu analy­sie­ren und das Verfah­ren zur Früherken­nung von aufkom­men­den Gebie­ten zu verfeinern.

Antrag­stel­ler
Fraun­ho­fer Insti­tut für System- und Innova­ti­ons­for­schung (Fraun­ho­fer ISI), Karlsruhe

Download: Emerging Topics in Science

Problem­stel­lung und Ziel
Der Brain Drain wissen­schaft­li­cher Forscher ist offen­sicht­lich ein erheb­li­cher Verlust der besten Köpfe für die deutsche Forschung, es erweist sich jedoch als schwie­rig, das Ausmaß dieses Problems quanti­ta­tiv zu fassen. Es gibt Statis­ti­ken zu Auslands­auf­ent­hal­ten von Studie­ren­den vor und während ihrer Promo­ti­on; andere Daten beschrei­ben die Emigra­ti­on hoch quali­fi­zier­ter Fachkräf­te, sie unter­schei­den jedoch nicht nach Berufs­grup­pen. Für wissen­schafts­po­li­ti­sche Maßnah­men zur Begren­zung des Brain Drains wäre es wichtig, genaue­re Zahlen über dessen Umfang zu erhal­ten, insbe­son­de­re auch Angaben zu einzel­nen Fächern und zu aufneh­men­den Hochschu­len, um geeig­ne­te Gegen­maß­nah­men konzi­pie­ren zu können.

Projekt­be­schrei­bung
Es soll der Brain Drain aus Deutsch­land in die Verei­nig­ten Staaten vertieft analy­siert werden. Hierzu sollen für ein spezi­fi­sches Publi­ka­ti­ons­jahr alle Namen deutscher Autoren unter­sucht und für die Folge­jah­re geprüft werden, ob sie erneut als Autoren deutscher Einrich­tun­gen in Erschei­nung treten. Diese Unter­su­chung wird als Referenz verwen­det, um das Niveau der Publi­ka­ti­ons­ak­ti­vi­tä­ten der Basis­stich­pro­be in den nachfol­gen­den Jahren zu bestim­men. Dann wird geprüft, in welchem Ausmaß deutsche Autoren aus dem Basis­jahr als Autoren ameri­ka­ni­scher Einrich­tun­gen in Erschei­nung treten. Da es in den Publi­ka­ti­ons­da­ten­ban­ken keine direk­ten Hinwei­se auf die Natio­na­li­tät der Autoren gibt, sondern nur Adres­sen von Einrich­tun­gen, werden zur eindeu­ti­gen Identi­fi­ka­ti­on der in den Verei­nig­ten Staaten arbei­ten­den deutschen Autoren neben dem vollen Namen weite­re Krite­ri­en benötigt, insbe­son­de­re das Fachge­biet. Die Analy­se wird mit Hilfe der Daten­bank Scopus reali­siert werden. Im weite­ren Zeitver­lauf wird verfolgt, wie lange deutsche Autoren an ameri­ka­ni­schen Einrich­tun­gen weiter publi­zie­ren und nach welcher Zeitdau­er sie wieder nach Deutsch­land zurück­keh­ren oder ob sie dauer­haft in den Verei­nig­ten Staaten verblei­ben. Eine analo­ge Analy­se wird für Südafri­ka in Bezug auf Großbri­tan­ni­en durch­ge­führt, um den Vergleich mit den dorti­gen Erhebungs­zah­len zu ermöglichen.

Antrag­stel­ler
Fraun­ho­fer Insti­tut für System- und Innova­ti­ons­for­schung (Fraun­ho­fer ISI), Karlsruhe

Download: Scien­ti­fic mobili­ty. An analy­sis of Germa­ny, Austria, France and Great Britain

Problem­stel­lung und Ziel
In den beiden inter­dis­zi­pli­nä­ren Litera­tur­da­ten­ban­ken Web of Science (WoS) und Scopus sind pro Publi­ka­ti­on zwar die insti­tu­tio­nel­len Adres­sen der Autoren erfasst, soweit diese im Origi­nal der jewei­li­gen Arbeit aufge­führt sind. Die Erfas­sung dieser Adres­sen lässt aber hinsicht­lich Genau­ig­keit und Vollstän­dig­keit sehr zu wünschen übrig. Dahin­ter verber­gen sich verschie­de­ne Proble­me. Am bekann­tes­ten ist das Problem der unter­schied­li­chen Schreib­wei­sen von Adres­sen. Ein nicht zu unter­schät­zen­des Problem stellen außer­dem die Extrem­fäl­le von Publi­ka­tio­nen dar, an denen Autoren von einer sehr großen Zahl von Insti­tu­tio­nen betei­ligt sind. Hinzu kommt, dass im Zeitver­lauf die Insti­tu­tio­nen­land­schaft nicht stabil, sondern im Wandel ist. Vor diesem Hinter­grund wäre es unzuläs­sig, valide biblio­me­tri­sche Indika­to­ren insti­tu­ti­ons­be­zo­gen auf der Basis der unberei­nig­ten, in WoS oder Scopus vorge­fun­de­nen Adress­da­ten­sät­ze generie­ren zu wollen. Das hier vorge­schla­ge­ne Teilpro­jekt zielt demge­gen­über auf die Schaf­fung einer seriö­sen Basis für die bestmög­li­che Zuord­nung der in WoS und Scopus erfass­ten Publi­ka­tio­nen aller deutschen Institutionen.

Projekt­be­schrei­bung
Zunächst sollen die Adress­da­ten­sät­ze eines aktuel­len Daten­bank­jahr­gangs (2008) des WoS soweit wie möglich mit automa­ti­schen Proze­du­ren kodiert werden. Im nächs­ten Schritt sollen die gewon­ne­nen Erfah­run­gen auf den Paral­lel­jahr­gang von Scopus übertra­gen werden. Die nach Durch­füh­rung der automa­ti­schen Kodie­rung verblei­ben­de Restmen­ge von Problem­adres­sen, die nicht ohne weite­res als zu einer deutschen Haupt­in­sti­tu­ti­on gehörig zu identi­fi­zie­ren sind, werden einer manuel­len Sichtung und Bearbei­tung unter­zo­gen. In einem weite­ren Schritt werden jenseits einer bloßen Kodie­rung von Adres­sen nunmehr defini­tiv Publi­ka­tio­nen zu (deutschen) Insti­tu­tio­nen zugeord­net. Auf der Basis der gewon­ne­nen Erfah­run­gen werden dann die Proze­du­ren zur automa­ti­schen Kodie­rung auf möglichst alle verfüg­ba­ren Jahrgän­ge von WoS und Scopus ausge­dehnt. Im letzten Schritt schließ­lich soll ein Verfah­ren entwi­ckelt werden, um die von den Daten­bank­her­stel­lern eintref­fen­den Liefe­run­gen neuer Daten konti­nu­ier­lich kodie­ren zu können.

Antrag­stel­ler
Univer­si­tät Bielefeld

Download: Disam­bi­gua­ti­on of author addres­ses in biblio­me­tric databa­ses – techni­cal report

Problem­stel­lung und Ziel
In der empiri­schen Sozial­for­schung übliche Metho­den­stan­dards und Fehler­leh­ren sowie darauf aufbau­en­de Gütema­ße sind in der Biblio­me­trie kaum entwi­ckelt. Das ist nicht nur ein theore­ti­sches Defizit, sondern zieht auch einen völlig unkri­ti­schen Umgang mit biblio­me­tri­schen Indika­to­ren, die nicht selten als „objek­ti­ve Reali­täts­be­schrei­bun­gen“ betrach­tet werden, nach sich. Dieses Teilpro­jekt soll daher zunächst die in der Litera­tur bereits disku­tier­ten und aus vorhan­de­nen biblio­me­tri­schen Studi­en und Publi­ka­ti­ons­er­he­bun­gen bekann­ten Fehler- und Biasquel­len aufar­bei­ten, sodann ansatz­wei­se eine theore­tisch begrün­de­te Fehler­leh­re formu­lie­ren und zugehö­ri­ge Gütema­ße bereitstellen.

Projekt­be­schrei­bung
Ausgangs­punkt dieses Projek­tes ist eine syste­ma­ti­sche Litera­tur­ana­ly­se, auf deren Basis eine Übersicht über die poten­zi­ell auftre­ten­den Fehler und Inter­pre­ta­ti­ons­pro­ble­me sowie deren Ausmaß und Auswir­kun­gen entwi­ckelt wird und Ansät­ze für Korrek­tu­ren und Gütema­ße syste­ma­ti­siert werden. Die im Rahmen von Modulen entwi­ckel­ten Gütema­ße werden als Algorith­men in die biblio­me­tri­sche Daten­bank imple­men­tiert. Diese werden im Weite­ren genutzt, um Indika­to­ren adäquat zu berech­nen und deren Quali­tät und Aussa­ge­fä­hig­keit bewer­ten zu können. Paral­lel dazu sollen Algorith­men erstellt, geprüft und imple­men­tiert werden, mit deren Hilfe bei der Konstruk­ti­on der biblio­me­tri­schen Indika­to­ren die identi­fi­zier­ten Fehler und ihr Ausmaß adäquat berück­sich­tigt werden können.

Antrag­stel­ler
Insti­tut für Forschungs­in­for­ma­ti­on und Quali­täts­si­che­rung (iFQ)

Download: Measu­re­ment varia­ti­on in biblio­me­tric impact indicators

Problem­stel­lung und Ziel
Im Rahmen eines Pilot­pro­jekts entwi­ckeln iFQ und IWT für das BMBF die Grund­la­gen für ein Monito­ring-Instru­ment zur Identi­fi­zie­rung poten­ti­ell inter­es­san­ter inter­na­tio­na­ler Koope­ra­ti­ons­part­ner. Das Instru­ment soll fachun­ab­hän­gig einsetz­bar sein. Im beglei­ten­den KB-Forschungs­pro­jekt werden grund­sätz­li­che metho­di­sche Fragen behan­delt. Insbe­son­de­re geht es um die Entwick­lung und Erpro­bung von Verfah­ren und Metho­den, mit denen sich komple­xe oder emergen­te Themen­ge­bie­te biblio­gra­phisch abgren­zen lassen und um die Identi­fi­zie­rung geeig­ne­ter biblio­me­tri­scher Charak­te­ris­ti­ka, durch die sich entspre­chen­de inter­na­tio­na­le Koope­ra­ti­ons­part­ner auf verschie­de­nen Ebenen – Land, Insti­tu­ti­on und Person – auszeich­nen, d.h. es geht darum, Indika­to­ren zur Identi­fi­zie­rung inter­es­san­ter Koope­ra­ti­ons­part­ner zu entwi­ckeln und zu testen.

Projekt­be­schrei­bung
Mit Hilfe des vom ISN entwi­ckel­ten Verfah­rens wird versucht, Publi­ka­tio­nen eines definier­ten Fachge­biets automa­ti­siert aus einem großen Dokumen­ten­be­stand (WoS/Scopus) zu identi­fi­zie­ren und zu extra­hie­ren. Der Algorith­mus wird unter Nutzung der Abstracts einer zielge­rech­ten Publi­ka­ti­ons­men­ge trainiert. Auf dieser Basis wird ein sogenann­ter Finger­ab­druck berech­net. Dieser lässt sich im Ideal­fall deutlich im Gesamt­da­ten­be­stand wieder finden und zur Feldab­gren­zung verwen­den. Für die Identi­fi­zie­rung von poten­ti­el­len Koope­ra­ti­ons­part­nern sollen Indika­to­ren entwi­ckelt werden, die auf der Analy­se von Koope­ra­ti­ons- und Zitati­ons­netz­wer­ken beruhen und die eine Bewer­tung der zeitli­chen Stabi­li­tät der Indika­to­ren ermög­li­chen. Insbe­son­de­re geht es auch darum, skalen­un­ab­hän­gi­ge Indika­to­ren zu entwi­ckeln und zu erproben.

Antrag­stel­ler
Insti­tut für Forschungs­in­for­ma­ti­on und Quali­täts­si­che­rung (iFQ)

Koope­ra­ti­on
Insti­tu­te for Science Networ­king Olden­burg GmbH (ISN), Oldenburg

Download: Feldab­gren­zung und inter­na­tio­na­le Kolla­bo­ra­tio­nen: Prakti­sche Begleit­for­schung zum „Pilot­vor­ha­ben zur Identi­fi­zie­rung inter­na­tio­na­ler Koope­ra­ti­ons­mög­lich­kei­ten“ des BMBF – Abschlussbericht

Problem­stel­lung und Ziel
Im Rahmen eines Projekts, welches organi­sa­to­risch von der HIS betreut wird, entwi­ckeln mehre­re Univer­si­tä­ten derzeit gemein­sam ein Kennzah­len­set für ein inter­nes Univer­si­täts­bench­mar­king. Von den Univer­si­tä­ten werden Daten zur Inter­na­tio­na­li­tät, Leistungs­fä­hig­keit der Lehre und Forschung sowie Gleich­stel­lung erhoben. Ebenfalls im Bench­mar­king erfasst werden soll die Perfor­manz in der Forschung. Hierzu wird das iFQ im Rahmen eines Pilot­pro­jek­tes eine biblio­me­tri­sche Analy­se für zwei Fächer durch­füh­ren. Basie­rend auf Publi­ka­ti­ons- und Zitati­ons­da­ten werden Indika­to­ren bereit­ge­stellt, die Aussa­gen zur Forschungs­per­for­manz gestat­ten. Die Arbei­ten des iFQ-Projekt­teams werden durch eine Arbeits­grup­pe mit Vertre­tern und Vertre­te­rin­nen der Univer­si­tä­ten (u.a. den Kanzle­rIn­nen und Wissen­schaft­le­rIn­nen) beglei­tet. Dieses Pilot­pro­jekt wird ergänzt durch ein KB-Projekt, in dem grund­sätz­li­che metho­di­sche Fragen zur Eignung von biblio­me­tri­schen Indika­to­ren für das Bench­mar­king von Univer­si­tä­ten adres­siert und bearbei­tet werden, wie z.B. der Umgang mit Verzer­run­gen beim Vergleich der Einrich­tun­gen, die Abgren­zung von fachli­chen und organi­sa­to­ri­schen Einhei­ten und die Norma­li­sie­rung mit Perso­nal­struk­tur­da­ten. Im Rahmen der Arbeits­grup­pe und gegebe­nen­falls durch Inter­views soll analy­siert werden, ob und wie indika­tor­ba­sier­te Aussa­gen mit den Einschät­zun­gen der Wissen­schaft­le­rIn­nen korre­spon­die­ren. Ziel ist es, zu klären, unter welchen Voraus­set­zun­gen ein natio­na­les Bench­mar­king möglich ist.

Projekt­be­schrei­bung
Publi­ka­ti­ons­da­ten für die Fächer Physik und Chemie werden für den Zeitraum 2005–2010 für drei Univer­si­tä­ten erhoben. Abgegrenzt werden die Daten­sets auf der Grund­la­ge der Insti­tu­tio­nen­adres­sen und Perso­nen­na­men im Web of Science. Dieser Daten­kor­pus wird den Fachbe­rei­chen der Univer­si­tä­ten rückge­kop­pelt und von diesen verifi­ziert. Ergän­zun­gen der Publi­ka­ti­ons­da­ten werden mit dem Web of Science abgegli­chen und Publi­ka­ti­ons­in­di­ka­to­ren für den gesam­ten Zeitraum sowie Zitati­ons­in­di­ka­to­ren für den Zeitraum 2005–2007 ermit­telt. Diese Analy­se wird gegebe­nen­falls auf Non-Source-Items (Daten­sät­ze, die im Web of Science nur als Referen­zen vorhan­den sind) ausgeweitet.

Antrag­stel­ler
Insti­tut für Forschungs­in­for­ma­ti­on und Quali­täts­si­che­rung (iFQ)

Biblio­me­tri­sche Indika­to­ren im Univer­si­täts­bench­mar­king – Modifi­zier­ter übergrei­fen­der Bericht

Problem­stel­lung und Ziel
Der Wissens- und Techno­lo­gie­trans­fer aus Hochschu­len ist in den letzten Jahren als ein wesent­li­cher Ansatz­punkt zur Moder­ni­sie­rung der Wirtschafts­struk­tu­ren und zur Förde­rung der wirtschaft­li­chen Dynamik gesehen worden. Zur Analy­se der daraus resul­tie­ren­den Verän­de­run­gen ist es wichtig, die Patent­an­mel­dun­gen aus Hochschu­len vollstän­dig erfas­sen zu können. Zur Verbes­se­rung der Ermitt­lung von Erfin­dun­gen aus Hochschu­len wird ein Ansatz vorge­schla­gen, bei dem bei den Namen von Erfin­dern geprüft wird, ob es gleiche Namen von Autoren in Publi­ka­ti­ons­da­ten­ban­ken gibt, um so die insti­tu­tio­nel­le Zuord­nung von Erfin­dern zu Univer­si­tä­ten feststel­len zu können. Ziel ist eine breite Erfas­sung der Patent­an­mel­dun­gen aus Univer­si­tä­ten in allen Fachge­bie­ten mit einer möglichst hohen Präzi­si­on der Zuord­nung von Erfin­dern zu Autoren und damit zu deren Institutionen.

Projekt­be­schrei­bung
In dem Projekt geht es darum, für spezi­fi­sche Jahrgän­ge von Patent­an­mel­dun­gen, etwa ab Mitte der 1990er Jahre, sämtli­che Erfin­der am Deutschen Patent­amt herun­ter zu laden und mit Autoren in den Daten­ban­ken WoS und SCOPUS zu verglei­chen. Im Falle von Überein­stim­mun­gen sollen dann die zu den Autoren gehören­den wissen­schaft­li­chen Einrich­tun­gen festge­stellt, und insbe­son­de­re Univer­si­tä­ten identi­fi­ziert werden. In aktuel­len Jahrgän­gen der Daten­bank SCOPUS sind zu allen Autoren auch die zugehö­ri­gen wissen­schaft­li­chen Einrich­tun­gen angege­ben, was bei einer positi­ven Identi­fi­ka­ti­on einen direk­ten Rückschluss auf die Herkunft einer Erfin­dung zulässt. Ein wichti­ger Vorteil von SCOPUS ist schließ­lich die breite­re Abdeckung ingenieur­wis­sen­schaft­li­cher Diszi­pli­nen, wobei jedoch zu klären ist, ab welchem Jahrgang die Erfas­sung besser als im WoS ist. Die Analy­sen sollen am Beispiel der Patent­an­mel­dun­gen von Erfin­dern aus Deutsch­land und der Schweiz in den letzten zehn Jahren durch­ge­führt werden.

Antrag­stel­ler
Fraun­ho­fer Insti­tut für System- und Innova­ti­ons­for­schung (Fraun­ho­fer ISI), Karlsruhe

Download: Vollstän­di­ge Erfas­sung von Patent­an­mel­dun­gen aus Universitäten

Problem­stel­lung und Ziel
Zitatra­ten werden bei biblio­me­tri­schen Analy­sen benutzt, um den Impact (Einfluss) von Publi­ka­tio­nen zu bestim­men. Annah­me ist dabei, dass sehr häufig zitier­te Publi­ka­tio­nen einen höheren Impact als weniger häufig zitier­te haben. In der Regel geht es dabei nicht um den Impact einer einzel­nen Publi­ka­ti­on, sondern den durch­schnitt­li­chen Impact einer Teilmen­ge von Publi­ka­tio­nen. Faktisch wird Impact vielfach mit Quali­tät gleich­ge­setzt. Ein grund­sätz­li­ches Problem besteht darin, dass die Zitatra­ten sehr unter­schied­lich sein können. Wichtigs­te Einfluss­fak­to­ren sind dabei Fachge­biet, Zeitschrift, Natio­na­le Herkunft der Autoren und zeitli­che Verän­de­run­gen. Aus diesen Überle­gun­gen ergibt sich der Bedarf für eine Standar­di­sie­rung der Zitatraten.

Projekt­be­schrei­bung
Aus einer Defini­ti­on von Zeitschrif­ten können in einem ersten Überblick erste Tests zu erwar­te­ten Zitatra­ten reali­siert werden. Im nächs­ten Schritt wird es notwen­dig sein, erste Felder zu definie­ren, für die erwar­te­te Zitatra­ten ermit­telt werden können. Diese Felder sind durch Sätze von Zeitschrif­ten definiert. Schließ­lich werden durch Ko-Zitati­ons­ana­ly­sen inhalt­li­che Ähnlich­kei­ten zwischen klassi­fi­zier­ten und nicht-klassi­fi­zier­ten Zeitschrif­ten ermit­telt und auf dieser Basis Entschei­dun­gen für die Klassi­fi­ka­ti­on einzel­ner Zeitschrif­ten getrof­fen. Weiter­hin soll in diesem Teilpro­jekt eine Übersicht erstellt werden, welche diszi­pli­nä­ren und thema­ti­schen Klassi­fi­ka­tio­nen für die Wissen­schaft natio­nal und inter­na­tio­nal verwen­det werden. Dieser letzte Schritt ist Vorbe­rei­tung für ein weite­res großes Arbeits­pa­ket, bei dem alle Zeitschrif­ten nach diesem neuen Schema im Sinne einer Grobklas­si­fi­ka­ti­on zugeord­net werden. Daran anschlie­ßend soll jeder einzel­ne Artikel klassi­fi­ziert werden, wobei dann eine deutlich feine­re Klassi­fi­ka­ti­on einge­setzt werden soll.

Antrag­stel­ler
Fraun­ho­fer Insti­tut für System- und Innova­ti­ons­for­schung (Fraun­ho­fer ISI), Karlsruhe

Download: Erwar­te­te Zitatra­ten und Klassifikationen