JSC-Forscher erhalten einen Outstanding Paper Award auf der NeurIPS 2022
Der Helmholtz Forschungsbereich Information gratuliert: Mehdi Cherti und Jenia Jitsev vom JSC erhielten auf der NeurIPS 2022, einer der führenden internationalen Konferenzen für maschinelles Lernen und künstliche Intelligenz, einen Outstanding Paper Award für ihre Veröffentlichung mit dem Titel „LAION-5B: An open large-scale dataset for training next generation image-text models“ (Quelle: Jülich Supercomputing Centre (JSC – Kurznachrichten)
Aktuelle Spracherkennungsmodelle haben sich von traditionellen Ansätzen abgesetzt und zahlreiche Einschränkungen überwunden. Dies ist vor allem den Trainingsmethoden zu verdanken, die auf großen Datensätzen aus Online-Quellen basieren. Leider wird die Forschung hauptsächlich von Industrielabors durchgeführt, und die Datensätze blieben bisher privat – bis jetzt. Diese preisgekrönte Arbeit stellt offene Datensätze aus öffentlichen Internetressourcen zur Verfügung, die zum Trainieren von Spracherkennungsmodellen auf dem neuesten Stand der Technik verwendet werden können und für alle Forschungslabors auf der ganzen Welt zugänglich sind.
Die Arbeit wurde von JSC und LAION e.V. durchgeführt, einer gemeinnützigen Organisation mit Sitz in Hamburg, die sich stark für Open Source und Open Science einsetzt und von Jitsev und Cherti mitbegründet wurde. Toolsets für die Zusammenstellung von Datensätzen und vortrainierte openCLIP-Modelle werden als Ergebnis dieser Arbeit ebenfalls als Open Source zur Verfügung gestellt.
Die Original-Pressemitteilung finden Sie unter:
JSC-Forscher erhalten einen Outstanding Paper Award auf der NeurIPS 2022
Weiterführende Artikel:
Die Originalpublikation finden Sie unter:
Christoph Schuhmann, Romain Beaumont, Richard Vencu, Cade W Gordon, Ross Wightman, Mehdi Cherti, Theo Coombes, Aarush Katta, Clayton Mullis, Mitchell Wortsman, Patrick Schramowski, Srivatsa R Kundurthy, Katherine Crowson, Ludwig Schmidt, Robert Kaczmarczyk, Jenia Jitsev: LAION-5B: An open large-scale dataset for training next generation image-text models. 36th Conference on Neural Information Processing Systems (NeurIPS 2022). Link
Verortung im Helmholtz-Forschungsbereich Information:
Helmholtz-Forschungsbereich Information, Programm 1: Engineering Digital Futures, Topic 1: Enabling Computational- & Data-intensive Science and Engineering
Kontakt:
Dr. Jenia Jitsev
Institute for Advanced Simulation (IAS)
Jülich Supercomputing Centre (JSC)
Forschungszentrum Jülich
Tel.: +49 2461/61-9727
E-Mail: j.jitsev@fz-juelich.de



