Wie wir die Daten analysieren.

Unstrukturiertes strukturieren. Die DATAlovers eben.

Die digitale Revolution ist da und schreitet ungebremst voran. Wissen wir natürlich. Und sie geht einher mit einem Wachstum von 50 Prozent an unstrukturierten Textdaten pro Jahr. Das ist nicht wenig. Somit ist der erste und wichtigste Schritt die Extraktion von strukturierten Informationen aus dem unstrukturierten Content. Information Extraction ist der Sektor im Textmining, mit dem in Texten automatisch Personen, Impressumsangaben oder Schlagworte erkannt werden. Die zentralen Informationen, die den gesamten Inhalt eines Texten wiedergeben, sind fundamental für jeden weiteren Verarbeitungsschritt – sei es die Gruppierung von Texten nach ähnlichem Inhalt oder die Selektierbarkeit nach Eigenschaften in einem grafischem Interface. So machen wir die versteckten Inhalte in den Texten sichtbar und verwendbar.