RLPC: Record Linkage Pre-Cleaning – Technical Documentation of Routines
Übergeordnetes Ziel des Record-Linkage ist die Zusammenführung verschiedener Datensätze anhand eines eindeutigen Identifizierungsmerkmals. In den uns vorliegenden Fällen handelt es sich primär um Unternehmensdatensätze aus Datenbanken mit Unternehmensmerkmalen (z. B. BvD Amadeus/Dafne), Patentdatensätze (z. B. Patstat oder DPMA) sowie Förderdatensätze (z. B. BMBF Förderkatalog). Diese Datensätze sollen über den Namen der Unternehmen verknüpft werden. Da in der Praxis Unternehmensnamen in verschiedenen Datenbasen uneinheitlich geschrieben werden – beispielsweise die Unternehmensform – ist eine Harmonisierung und Standardisierung notwendig.