Europas führende KI-Unternehmen und Forschungseinrichtungen bündeln ihre Kräfte und ihr Fachwissen, um in einer beispiellosen Zusammenarbeit die nächste Generation von Open-Source-Sprachmodellen mit stark verbessertem logischen Denken zu entwickeln: das OpenEuroLLM-Projekt.
Ein Konsortium aus 20 führenden europäischen Forschungseinrichtungen, Unternehmen und EuroHPC Hochleistungs-Rechenzentren wird eine Familie leistungsstarker, mehrsprachiger großer Sprachmodelle für kommerzielle, industrielle, wissenschaftliche und öffentliche Anwendungen entwickeln. Diese transparenten und regelkonformen Open-Source-Modelle demokratisieren - zusammen mit offenen Datensätzen für deren Erstellung - den Zugang zu hochwertigen KI-Technologien. Sie stärken sowohl die Wettbewerbsfähigkeit europäischer Unternehmen auf dem globalen Markt als auch die Fähigkeit öffentlicher Organisationen, wirkungsvolle öffentliche Dienstleistungen bereitzustellen.
Während es schon viele derartige Projekte gab, die allesamt nicht mit der Konkurrenz aus den USA (OpenAI, Meta & Co.) oder China (DeepSeek, Alibabas Qwen & Co.) mithalten konnten, ist diesmal neu, dass die besten Köpfe aus Wissenschaft, Startups, und der Open-Source Szene zusammenkommen. Einzigartig ist auch die Anbindung von großen EuroHPC Zentren – JSC, BSC, CINECA, CSC – die sowohl die größten Supercomputer Europas mit der entsprechenden Infrastruktur besitzen als auch die nötige Expertise, diese zu betreiben.
Das OpenEuroLLM-Projekt steht im Einklang mit der dringenden Notwendigkeit, Europas Wettbewerbsfähigkeit, Forschungskompetenz und digitale Souveränität zu stärken. Es ist ein herausragendes Beispiel für die technologische Infrastruktur, die erforderlich ist, um die Einstiegshürden für die Entwicklung und Optimierung europäischer KI-Produkte zu senken. Dabei setzt das Projekt auf Transparenz, Offenheit und Gemeinschaftsbeteiligung – Werte, die im europäischen Technologie-Ökosystem breit anerkannt sind. Die Modelle werden innerhalb des robusten europäischen Regulierungsrahmens entwickelt, um höchste technologische Exzellenz mit europäischen Werten zu vereinen.
In Zusammenarbeit mit Open-Source- und Open-Science-Communities wie LAION, Open-sci und OpenML sowie weiteren weltweit anerkannten Expert:innen im Open Strategic Partnership Board wie Thomas Wolf (HuggingFace), Ce Zhang (Together AI), Colin Raffel (EleutherAI, Vector Institute), Alice Oh (KAIST) und Melanie Mitchell (Santa Fe Institute) stellt OpenEuroLLM sicher, dass die Modelle, Software, Daten und Evaluierung vollständig offen zugänglich sind und auf spezifische Branchen und öffentliche Anwendungsfälle zugeschnitten werden können. Diese leistungsstarken, mehrsprachigen Modelle bewahren sowohl sprachliche als auch kulturelle Vielfalt und ermöglichen es europäischen Unternehmen, im KI-Zeitalter qualitativ hochwertige Produkte und Dienstleistungen zu entwickeln.
Das Projekt, das mit dem STEP-Siegel der EU (Strategic Technologies for Europe Platform) ausgezeichnet wurde, baut auf früheren europäischen Projekten sowie der Erfahrung und dem Knowhow der Partner auf – darunter sind große Repositorien hochwertiger Daten und bereits entwickelte Pilot-LLMs. Das Konsortium nimmt seine Arbeit am 1. Februar 2025 auf und wird von der Europäischen Kommission im Rahmen des Digital Europe Programms mit gut 20 Millionen Euro gefördert.
In Deutschland nehmen an dem Projekt das ELLIS Institut Tübingen, das Forschungszentrum Jülich, das Tübingen AI Center (Universität Tübingen), Aleph Alpha, das Startup ellamind sowie das Fraunhofer IAIS teil.
Das gesamte Konsortium umfasst:
Universitäten und Forschungseinrichtungen:
Charles University (Institute of Formal and Applied Linguistics), Czechia (coordinator)
Alliance for Language Technologies EDIC (ALT-EDIC), France
Eindhoven University of Technology, the Netherlands
ELLIS Institute Tübingen, Germany
Fraunhofer IAIS, Germany
Lindholmen Science Park (AI Sweden), Sweden
University of Helsinki, Finland
University of Oslo, Norway
University of Turku, Finland
University of Tübingen (Tübingen AI Center), Germany
Research Center Juelich (FZJ), Germany
Firmen:
Silo GenAI (AMD Silo AI), Finland (co-lead)
Aleph Alpha Research, Germany
ellamind, Germany
LightOn, France
Prompsit Language Engineering, Spain
EuroHPC Zentren:
Barcelona Supercomputing Center, Spain
Cineca Interuniversity Consortium, Italy
CSC - IT Center for Science, Finland
Juelich Supercomputing Center (JSC), Germany
SURF, the Netherlands
Kontakt: Jan Hajič, Charles University, hajic@ufal.mff.cuni.cz, +420 607 209 212
Nationaler Kontakt: Jenia Jitsev, j.jitsev@fz-juelich.de, +49 2461619727
Über das ELLIS Institut Tübingen
Das ELLIS Institut Tübingen strebt an, die kreativsten Köpfe zu versammeln, um hervorragende Grundlagenforschung auf dem Gebiet der künstlichen Intelligenz durchzuführen. So entwickelt sich das weltweit erste ELLIS Institut zu einem anerkannten Zentrum für Experten und Forschung, das hochmoderne Arbeitsplätze und sehr gute Bedingungen für die Durchführung von Forschungsarbeiten bieten kann. Das Institut entstand aus dem ELLIS Netzwerk, dem Europäischen Labor für Lernen und Intelligente Systeme (ELLIS), das ein europaweites Netzwerk für die Forschung im Bereich des maschinellen Lernens aufbaut.
Über das Forschungszentrum Juelich / Juelich Supercomputing Center
Das Forschungszentrum Jülich (FZJ) ist eines der größten interdisziplinären Forschungszentren Europas und Gründungsmitglied der Helmholtz-Gemeinschaft. Es beherbergt Jülich Supercomputing Center (JSC), eines der größten Hochleistungsrechenzentren in Europa. JUPITER, der erste Exascale Supercomputer, wird am JSC im Betrieb genommen und ist eins der zentralen Infrastrukturbestandteile für die grossen Rechenzeitanforderungen, die openEuroLLM Modelle bringen. LAION - die non-profit Forschungsorganisation, die bereits mit großem Erfolg open foundation models und Datensätze erforscht und herstellt - hat am JSC und FZJ eins der wichtigsten community hubs, womit die Expertise und Vernetzung mit starker weltweiter community fuer foundation model Forschung gesichert wird. FZJ und LAION arbeiten eng zusammen mit ELLIS Institute Tuebingen, Tuebingen AI center, und ellamind und bilden so einen wichtigen Kern des Vorhabens - die Herstellung der starken, wiederverwendbaren, offenen Basismodelle, der Datensaetze für das Training und der Methoden der Evaluierung.
Über das Tübingen AI Center
Das Tübingen AI Center ist eine Forschungseinrichtung der Universität Tübingen in Kooperation mit dem Max-Planck-Institut für Intelligente Systeme (MPI-IS). Ziel der Forschenden ist es, robuste lernende Systeme zum Nutzen von Gesellschaft und Wirtschaft voranzutreiben. Das Tübingen AI Center fasst 250 Wissenschaftlerinnen und Wissenschaftler in 20 Forschungsgruppen zusammen. Sie leisten, gemeinsam mit anderen Forschenden in Europa, einen Beitrag zu gesellschaftlich wertvollen Technologien als "KI made in Europe". Das Tübingen AI Center arbeitet eng mit dem ELLIS-Institut Tübingen und dem Cyber Valley zusammen. Es wird vom Forschungsministerium Baden-Württemberg und vom Bundesministerium für Bildung und Forschung gefördert.
Über ellamind
Die ellamind GmbH ist ein KI-Startup mit Standort in Bremen, das sich auf die Entwicklung modernster KI-Modelle und -Anwendungen spezialisiert hat. ellamind entwickelt derzeit eine innovative KI-Evaluations- und Optimierungsplattform, die speziell für B2B-Anwendungen konzipiert ist. Zu den Kunden des Unternehmens zählen z.B. ein DAX-Konzern, eine der größten deutschen Krankenkassen und die Bundesverwaltung. ellamind´s Ursprünge liegen in der Open-Source-KI-Community und seine Gründer und Mitarbeiter haben u.a. einige der populärsten offenen KI-Modelle für deutschsprachige Anwendungen entwickelt und veröffentlicht.
Über Fraunhofer IAIS
Als Teil der größten Organisation für anwendungsorientierte Forschung in Europa ist das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS mit Sitz in Sankt Augustin/Bonn und einem Standort in Dresden eines der führenden Wissenschaftsinstitute auf den Gebieten Künstliche Intelligenz (KI), Maschinelles Lernen und Big Data in Deutschland und Europa. Rund 380 Mitarbeitende unterstützen Unternehmen bei der Optimierung von Produkten, Dienstleistungen und Prozessen sowie bei der Entwicklung neuer digitaler Geschäftsmodelle.