das Kultur und Nachrichtenmagazin

Künstliche Intelligenz für den Datenjournalismus

TH KölnTH Köln und Science Media Center Germany entwickeln Lösung für die Informationsextraktion

Datenjournalisten sammeln und analysieren öffentlich zugängliche Daten und bereiten die darin verborgenen Informationen für ihre Medien auf. Dafür müssen sie häufig mit Daten arbeiten, die nur in unstrukturierter Form vorliegen. Dies macht eine automatisierte Auswertung schwierig. Im Forschungsprojekt „Journalistic Information Extraction“ (JoIE) möchten die TH Köln und das Science Media Center Germany daher ein Tool entwickeln, das mit solchen Datenquellen umgehen und diese journalistisch nutzbar machen kann.

„Die Daten, in denen Journalisten nach Informationen suchen, können ungemein vielfältig sein: Es handelt sich um Texte, Tabellen oder Grafiken, Dokumente unterschiedlichen Typs wie Word, PDF oder E-Mail oder um Webseiten, die zudem noch höchst unterschiedlich formatiert sein können. All das macht es sehr schwierig, zuverlässige und konsistente Regeln zu definieren, nach denen eine automatisierte Auswertung erfolgen könnte“, erläutert Prof. Dr. Philipp Schaer vom Institut für Informationswissenschaft der TH Köln die Problemstellung.

Auf Grundlage der beiden Open-Source-Werkzeuge Workbench und Fonduer soll eine Lösung entstehen, die unstrukturierte Daten in eine strukturierte und damit auswertbare Form bringt. Workbench erlaubt unter anderem die Extraktion von Webdaten. Fonduer verwendet künstliche Intelligenz, um automatisch Extraktionsmuster zum Beispiel zur Erkennung von Tabellen zu lernen.

„Kernidee unseres Projektes ist die Synthese der Nutzerfreundlichkeit von Workbench mit der hervorragenden Extraktionsleistung von Fonduer. Dabei geht es auch darum, komplexe Eingabehilfen zu entwickeln, mit denen Regeln für die Datenbearbeitung ohne Programmierkenntnisse erstellt und entwickelt werden können“, sagt Björn Engelmann, der im Rahmen von JoIE seine Doktorarbeit verfassen wird.

Um die spezifischen Anforderungen von Redaktionen und Datenjournalisten zu erfahren, sind Experteninterviews und gegebenenfalls Umfragen geplant. „Mit unserem Tool möchten wir den State of the Art der Datenverarbeitung für Redakteurinnen und Redakteure verfügbar machen, damit sie Informationen aus der Wildnis des Internets schnell und zuverlässig beschaffen können. Da diese oftmals mit begrenzten Ressourcen arbeiten müssen, wird unsere Lösung kostenlos und als Open-Source-Software verfügbar sein“, sagt Dr. Meik Bittkowski, Leiter Forschung und Entwicklung beim Science Media Center Germany.

Das Forschungsprojekt „Journalistic Information Extraction“ (JoIE) wird über drei Jahre von der Klaus Tschira Stiftung gGmbH gefördert. In dieser Zeit soll das Grundgerüst der Anwendung entstehen. Die Überführung in ein für Externe nutzbares System ist für eine optionale Projektverlängerung von zwölf Monaten angedacht.

Quelle: www.th-koeln.de

Diesen Beitrag teilen, das Unterstützt uns, DANKE !

FacebookVZJappyDeliciousMister WongXingTwitterLinkedInPinterestDiggGoogle Plus

weitere Beiträge

Gesundheit und Bildung

Schüleraustausch nach England in Corona-Zeiten: Gute Chancen für das Auslandsjahr 2021 / 2022

schüleraustausch englandJunge Leute wollen für das Auslandsjahr vor allem in englischsprachige Länder. 8 Punkte zu den Aussichten für den Start im September 2021 nach England

1 Das Auslandsjahr in England ist bei jungen Leuten traditionell begehrt. England gehört interna...


weiterlesen...

Hannover Messe: Gastland Indonesien gefährdet Rechte von Arbeitnehmerinnen und Arbeitnehmern

amnesty logoIndonesien, diesjähriges Gastland der Hannover Messe, gefährdet mit einem 2020 verabschiedeten Gesetz wichtige soziale und arbeitsrechtliche Standards. Dies kritisiert Amnesty International anlässlich der Eröffnung der digitalen Industrieausstellu...


weiterlesen...

Die JunX mit SCHAU NACH OBEN 2021

Die JunX CoverDas kulturelle Leben und die Unterhaltungsbranche stehen seit vielen Monaten still - doch viele Künstler wollen nicht ungehört bleiben, sich nicht dem Schicksal der Tatenlosigkeit ergeben. Und so bereiten sich auch die beiden Hamburger Musiker Chr...


weiterlesen...

TH Köln – Themen und Termine vom 12. bis 18. April 2021

TH KölnDienstag, 13. April 2021
„Kulturtechnik der Verflachung und Digitalität.“

TH Köln, Online-Vortrag, 17.30 bis 18.30 Uhr

Prof. em. Dr. Sybille Krämer, emeritierte Professorin für Philosophie von der FU Berlin / Leuphana Universität Lüneburg, hält a...


weiterlesen...

Bildband "Fotografie im Lockdown" von Klaus Wohlmann Der Stadt in die Seele blicken

fotografie im Lockdown klaus WohlmannKöln, 9. April 2021. Geredet wurde sehr viel über die Pandemie und ihre Folgen. Aber wie sieht eine Stadt in dieser außergewöhnlichen Zeit aus? Welche Auswirkungen hat Corona auf alltägliche Orte wie Straßen und Plätze? Der Kölner Fotograf Klaus W...


weiterlesen...

weitere Informationen

Soziales und Leben in Köln

13. Firmenlauf Köln am 23.9.2021 am Fühlinger See Run ohne Risiko

firmenlauf KölnKönigswinter/Köln, 12. April 2021. Im vergangenen Jahr musste er ausfallen, 2021 soll er wieder als Highlight in den Kalendern der Unternehmen markiert sein: der Firmenlauf Köln! Und wie immer verspricht das Motto „Loof wie de bess" auch in der 13...


weiterlesen...

"Silver Surfer" am Ebertplatz - Sechstes Rolltreppenkunstwerk eröffnet

stadt Koeln LogoIm Rahmen der Zwischennutzung des Ebertplatzes wurde das neue Rolltreppenkunstwerk "Silver Surfer" des Berliner Kreativ-Netzwerkes ON/OFF eröffnet. Es handelt sich hierbei um eine spiegelnde Rutsche, die vom Eigelstein in die Ebertplatzpassage füh...


weiterlesen...

Generalsanierung der Mülheimer Brücke - Umplanungen zur Sanierung der Strombrücke

copyright Tatjana ZieschangDie Verwaltung legt dem Verkehrsausschuss in seiner Sitzung am Dienstag, 20. April 2021, eine Mitteilung über die Umplanungen zur Sanierung der Strombrücke im Rahmen der Generalsanierung der Mülheimer Brücke vor. (https://ratsinformation.stadt-koe...


weiterlesen...

Corona-Virus: Inzidenzzahl liegt bei 149,9

stadt Koeln Logo2.969 Kölner*innen sind aktuell mit dem Corona-Virus infiziert

Mit Stand heute, Montag, 12. April 2021, gibt es auf dem Gebiet der Stadt Köln den insgesamt 41.747. (Vortag: 41.365) bestätigten Corona-Virus-Fall. Die Inzidenzzahl liegt in Köln aktu...


weiterlesen...
csm_AW_Skull_Website_650ab21697.jpg
Dienstag, 20.Apr 00:00 Uhr
Andy Warhol - Now

POPUP GALLERY Beziehungsweise.jpg
Dienstag, 20.Apr 00:00 Uhr
Ausstellung BEZIEHUNG(S)WEISE

wrm_2020-teaser-signac-03.jpg
Dienstag, 20.Apr 00:00 Uhr
BON VOYAGE, SIGNAC! EINE IMPRESSIONISTISCHE REISE DURCH DIE EIGENE SAMMLUNG

galerie_biesenbach_bram_braam_01.jpg
Dienstag, 20.Apr 00:00 Uhr
Group Show Sculptural.Painting - Galerie Biesenbach Köln

Gesinde Grundmann o.T. 2015.jpg
Dienstag, 20.Apr 00:00 Uhr
NEU AUFGESTELLT-Ausstellung Kunstmuseum Villa Zanders

Alexander20Meyen20Portraitneu.jpg
Dienstag, 20.Apr 10:00 - 11:30 Uhr
Yoga Kurs I - Level 1 – 2

Alexander20Meyen20Portraitneu.jpg
Dienstag, 20.Apr 18:30 - 20:00 Uhr
Yoga Kurs I. - Level 2 – 3

Alexander20Meyen20Portraitneu.jpg
Dienstag, 20.Apr 20:15 - 21:45 Uhr
Yoga Kurs I. - Level 1 – 2

Alexander20Meyen20Portraitneu.jpg
Mittwoch, 21.Apr 10:00 - 11:30 Uhr
Yoga Kurs I - Level 1 – 2

Alexander20Meyen20Portraitneu.jpg
Mittwoch, 21.Apr 18:30 - 20:00 Uhr
Yoga Kurs I. - Level 2 – 3

lebeART Video

VIDEO - Live-Musik, Literatur, Verkaufsstände im Rautenstrauch-Joest-Museum - Thementag Orient informiertVideo Kunst und Kultur
Videobeitrag

Mit orientalischen Händlerinnen und Händlern, einem bunten Bühnenprogramm und morgenländischen Kö...


weiterlesen

Werbung

lebeART Kalender

Letzter Monat April 2021 Nächster Monat
Mo Di Mi Do Fr Sa So
week 13 1 2 3 4
week 14 5 6 7 8 9 10 11
week 15 12 13 14 15 16 17 18
week 16 19 20 21 22 23 24 25
week 17 26 27 28 29 30

Wir nutzen Cookies auf unserer Website. Einige von ihnen sind essenziell für den Betrieb der Seite, während andere uns helfen, diese Website und die Nutzererfahrung zu verbessern (Tracking Cookies). Sie können selbst entscheiden, ob Sie die Cookies zulassen möchten. Bitte beachten Sie, dass bei einer Ablehnung womöglich nicht mehr alle Funktionalitäten der Seite zur Verfügung stehen.