Das spannende Projekt „DeKIS – Dezentrale KI-gestützte Suche und semantische Webindizierung“, das am 1. Oktober 2025 seinen Startschuss gegeben hat, nimmt neue Dimensionen in der Welt der Webtechnologien an. Initiiert von der Universität Passau und gefördert vom Bayerischen Staatsministerium für Wirtschaft, Landesentwicklung und Energie, will DeKIS herausfinden, ob der innovative Open Web Index (OWI) eine solide Grundlage für eine europäische, KI-gestützte Suchmaschine darstellen kann. Diese Initiative ist eines von vier bayernweit geförderten Projekten, die durch die Initiative „Bayern Innovativ“ unterstützt werden – eine erfreuliche Entwicklung für die Innovationslandschaft in Deutschland.[uni-passau.de]

Der Open Web Index soll als öffentliche Ressource zur Verfügung stehen, was ihn von den bekannten, geschlossenen Indizes wie Google oder Bing unterscheidet. Unternehmen, Entwickler und Forschende erhalten dadurch Zugang zu strukturierten Daten, die sie für eigene Anwendungen oder Analysen nutzen können. Im Fokus des Projekts steht die Validierung von Algorithmen, die eine skalierbare, semantische Web-Indizierung und dezentrale KI-gestützte Suche ermöglichen. Zudem wird dabei die Verwendung von Vektoreinbettungen angestrebt, um große Datenmengen effizient zu komprimieren und den benötigten Rechenaufwand zu reduzieren. Über potenzielle Anwendungsszenarien, wie die Verbesserung von Suchanfragen, die Bekämpfung von Desinformation oder optimierte Kartenfunktionen auf Smartphones, könnte DeKIS neue Maßstäbe setzen.

Ein offener Index für alle

Doch was genau ist der Open Web Index? Einfach gesagt handelt es sich um eine Datenstruktur, die schnellen, inhaltsbasierten Zugriff sowie die Sortierung und Filterung großer Webdokumente erlaubt. Eine umgekehrte Indexstruktur bildet die Grundlage, bei der Inhalte wie Wörter und Metadaten auf eine Liste von Webdokumenten verweisen, die diese enthalten. Da die Qualität eines Webindex maßgeblich von den indizierten Dokumenten abhängt, ist es wichtig, zusätzliche Signale wie Nutzungsinformationen und Metadaten einzubeziehen, um die Suchergebnisse optimal an die Bedürfnisse der Nutzer anzupassen.[openwebsearch.eu]

Ein zentraler Aspekt des Projekts ist die Schaffung einer offenen Infrastruktur für den OWI. Auf diese Weise wird der Index als offene Datenquelle bereitgestellt, die von Drittanbietern zur Entwicklung eigener Suchmaschinen genutzt werden kann. Diese Ambition ist Teil eines größeren Trends, der bereits 2018 mit der Open Web Search Initiative durch die Open Search Foundation angestoßen wurde. Mittlerweile haben 13 Organisationen aus Forschung und Wirtschaft in sieben europäischen Ländern an der Entwicklung des OWI mitgewirkt, der nun in einer Pilotphase präsentiert wird. Ein wahrer Meilenstein für die digitale Souveränität Europas und die Entwicklungen im Bereich Künstliche Intelligenz![opensearchfoundation.org]

Kommende Schritte und Möglichkeiten

Ab Juni 2023 wird es möglich sein, auf fast ein Petabyte an offenen Webdaten zuzugreifen – sowohl für kommerzielle als auch für wissenschaftliche Zwecke. Diese Daten stehen unter einer allgemeinen Forschungslizenz oder auf Anfrage auch kommerziell zur Verfügung. In einer ersten Phase ruft das Team Early Adopters auf, innovative Projekte in Bereichen wie vertikaler Websuche und Anwendungen mit großen Sprachmodellen (LLMs) zu entwickeln.

Werbung
Hier könnte Ihr Advertorial stehen
Ein Advertorial bietet Unternehmen die Möglichkeit, ihre Botschaft direkt im redaktionellen Umfeld zu platzieren

Um das Feedback und die Marktanforderungen besser zu verstehen, ist die Pilotphase entscheidend. Die offizielle Kick-off-Veranstaltung zur Einführung wird am 6. Juni 2023 über Zoom stattfinden. Interessierte können sich über einen bereitgestellten Link anmelden, um Teil dieses zukunftsorientierten Projekts zu werden.

Mit Dr. Jelena Mitrovic als Projektleiterin und angesiedelt am Lehrstuhl für Data Science von Prof. Dr. Michael Granitzer spricht DeKIS nicht nur akademisch auf höchstem Niveau, sondern könnte auch langfristig nachhaltige Innovationen im Bereich der Webtechnologie vorantreiben.