Das nächsten Treffen der Data Science @ Regensburg – Meetupgruppe wird einen Bereich behandeln der Natural Language Processing und Suche vereint – automatisiertes Question-Answering. In den letzten Jahren wurden in diesem Bereich besonders im Englischen zahlreiche Fortschritt gemacht, doch vor kurzem wurde nun auch ein Datensatz zu deutschen Frage-Antwortpaaren veröffentlicht.
Dieser stammt von der deepset GmbH aus Berlin. Beim Meetup werden Branden Chan, NLP Entwickler bei deepset, und Timo Möller, Mitgründer und Leiter des Machine Learning Bereichs bei deepset, ihren neuen Datensatz vorstellen.
Abstract:
Suchen ist allgegenwärtig. Es wird erwartet, dass nahezu jedes Programm, das mit Text arbeitet, eine Suchfunktion enthält. Mit den Durchbrüchen beim maschinellen Lernen (ML) und der Verarbeitung natürlicher Sprache (NLP) hat die Suchtechnologie einen großen Sprung nach vorne gemacht, und wir bei deepset sind fest entschlossen, den neuesten Trends zu folgen. Unser Open-Source-Framework Haystack ist eine Sammlung von NLP-Pipelines, mit denen Millionen von Dokumenten durchsucht, Fragen, die in vollständigen Sätzen gestellt wurden, beantwortet und Dokumente zusammengefasst werden können. Mit der Veröffentlichung unseres neuen deutschen Question Answering- und Passage Retrieval-Datensatzes (https://deepset.ai/germanquad), ist Neural Search nun auch für die deutsche Sprache verfügbar. In diesem Vortrag werden wir diskutieren, was heute im Bereich der Neural Search möglich ist, und aus erster Hand Ratschläge geben, wie dies für Ihre Sprache und Ihre Domäne funktioniert.
Mittwoch, 09.06.2021, 19:00 – 21:00 Uhr, Online-Event
Mehr Details & Anmeldung unter: https://www.meetup.com/de-DE/Data-Science-Regensburg/events/278094204/.
Dies ist ein Event der Data Science @ Regensburg – Meetupgruppe.