top of page

Bioökonomiepatente

Der Übergang zu einer biobasierten Wirtschaft erfordert die Entwicklung und Diffusion von (technologischen) Innovationen. Die Erfassung von Innovationen in der Bioökonomie ist aufgrund ihrer multidimensionalen und sektorübergreifenden Natur eine Herausforderung. Um dieses Problem zu adressieren, haben wir mit Hilfe von künstlicher Intelligenz einen umfassenden Datensatz von Patenten mit Bezug zur Bioökonomie entwickelt. Patente sind ein gängiger Indikator für Wissensentwicklung und Innovation. Herkömmliche Methoden zur Identifizierung von Patenten mit Bezug zur Bioökonomie weisen erhebliche Einschränkungen auf. Statische Technologieklassifizierungen und Schlagwortsuchen in Patentzusammenfassungen sind zwar weit verbreitet, aber anfällig für Ungenauigkeiten. So können beispielsweise biobasierte Innovationen unter nicht verwandten Kategorien falsch klassifiziert oder aufgrund der unterschiedlichen Terminologie in verschiedenen Sprachen und Disziplinen völlig übersehen werden. Diese Unzulänglichkeiten herkömmlicher Methoden machen deutlich, dass ein anpassungsfähigerer und dynamischerer Ansatz erforderlich ist, um die sich entwickelnde Natur der Bioökonomie genau widerzuspiegeln. 

 

Um diesen Herausforderungen zu begegnen, haben wir ein vortrainiertes großes Sprachmodell (LLM) mit manuell annotierten Patentzusammenfassungen trainiert. Dieses Modell wurde entwickelt, um biobasierte Produkte, Dienstleistungen und Prozesse mit hoher Genauigkeit zu identifizieren. Auf Basis des Modells haben wir einen Datensatz mit 67 Millionen Patenten analysiert und konnten über 5,6 Millionen bioökonomiebezogene Patente identifizieren. Dieser Ansatz übertrifft herkömmliche Methoden, indem er sprachliche und kontextuelle Variationen in Patentbeschreibungen berücksichtigt, um bioökonomienahe Patente zu identifizieren. 

 

Um die Ergebnisse unserer Forschung zu visualisieren, haben wir ein Topic Modeling angewandt, eine Technik, die Textdaten in thematische Cluster gruppiert. Diese Themen wurden durch eine detaillierte Karte visualisiert, in der die thematischen Cluster und ihre Verbindungen dargestellt sind. Diese Visualisierung ermöglicht es Forschenden sowie der Politik und Praxis, Erfindungen in der Bioökonomie zu untersuchen. 

 

Weitere Details zur Datenverarbeitung sind in der entsprechenden Publikation ausführlich beschrieben. Dort steht auch der Datensatz zum Download zur Verfügung. Wir hoffen, dass Interessierte diese Daten nutzen werden, um unterschiedliche offene Forschungsfragen zu Innovationen in der Bioökonomie zu beantworten. Wir bitten darum, das Paper zu zitieren, wenn die Daten verwendet werden. 

 

Kriesch, L., & Losacker, S. (2024). A global patent dataset of bioeconomy-related inventions. Scientific Data, 11(1), 1308. http://dx.doi.org/10.1038/s41597-024-04163-6

 

Der untenstehende Datenexplorer (in Desktopansicht verfügbar) ermöglicht es, den Datensatz interaktiv zu erkunden. Die Bezeichnung der Topics wird automatisiert über ein Sprachmodell auf Basis der Patentzusammenfassungen erstellt und beinhaltet daher unter Umständen technologische Ungenauigkeiten. Der Datenexplorer ist zudem auf GitHub im Vollbildmodus zu erreichen.

bottom of page