Data acquisition - Woher wir die Daten bekommen.

Unterschiedlichste Quellen. „Best of Breed“. Unlimited eben.

„Best of Breed“. Mit diesem Ansatz arbeiten wir. Für Sie und für uns. Damit erheben wir hoch-volumige Datenströme aus Online- und Offline-Medien, aus Webseiten, Blogs und Social Networks. Wir entwickeln ein eigenes „Large-scale Crawling Framework“, welches auf gängigen Big Data-Technologien wie Map Reduce und Hadoop aufsetzt. Und so können wir jede Größenordnung von Webdaten akquirieren. Wirklich jede! Und im nächsten Schritt stürzen wir uns begeistert in Analyse und Auswertung.

Die DATAlovers-Crawling-Technologie basiert auf dem Apache Top Level-Projekt Nutch. Klingt kompliziert. Ist es aber nicht. Zumindest nicht für uns. Auf Basis der verteilten Map-Reduce-Architektur ist es einfach, jegliche Größenordnungen von Webseiten zu crawlen. Dabei werden zuerst die Daten akquiriert, die wir in die Analyse einschließen wollen. Dann folgt der Rest. Typische Anwendungen sind das Crawling von Webseiten über die Abfrage von APIs (Facebook, Twitter, YouTube, etc.) und Scraping von Preisen auf Shop-Portalen. Die Duplicate Detection entfernt Datensätze, die einander sehr ähnlich sind, sogenannte Near-Duplicates. Damit nichts, aber auch gar nichts, unsere Ergebnisse verfälschen kann.

Data analytics - Wie wir die Daten analysieren.

Unstrukturiertes strukturieren. Die DATAlovers eben.

Die digitale Revolution ist da und schreitet ungebremst voran. Wissen wir natürlich. Und sie geht einher mit einem Wachstum von 50 Prozent an unstrukturierten Textdaten pro Jahr. Das ist nicht wenig. Somit ist der erste und wichtigste Schritt die Extraktion von strukturierten Informationen aus dem unstrukturierten Content. Information Extraction ist der Sektor im Textmining, mit dem in Texten automatisch Personen, Impressumsangaben oder Schlagworte erkannt werden. Die zentralen Informationen, die den gesamten Inhalt eines Texten wiedergeben, sind fundamental für jeden weiteren Verarbeitungsschritt – sei es die Gruppierung von Texten nach ähnlichem Inhalt oder die Selektierbarkeit nach Eigenschaften in einem grafischem Interface. So machen wir die versteckten Inhalte in den Texten sichtbar und verwendbar.

Data utilization - Wie wir die Daten nutzen.

Verstecktes entdecken. Einblicke erlangen. Tiefe erschließen. Alles unlimited.

Zu guter Letzt müssen die Daten und die erhobenen Informationen natürlich möglichst effizient und intuitiv aufbereitet werden. Nur so können wir jede gestellte Aufgabe lösen. Einerseits sollen die Daten so verdichtet werden, dass sie sich mit wenigen Blicken erfassen lassen.  Andererseits muss der Anwender natürlich jederzeit so tief eintauchen können, dass er Ursachen oder Zusammenhänge erkennt. Das erreichen wir nur durch eine konsequente Kombination unserer einzelnen Ansätze.

Unsere Lead Prediction-Technologie verwendet moderne Deep Learning-Algorithmen, um die besten zukünftigen Kunden sicher vorherzusagen. Auf Basis von erfolgreichen Kundenbeziehungen wird eine generische Kunden-DNA erlernt, die mit dem gesamten Unternehmensuniversum abgeglichen wird. Damit können wir neue potenzielle Kunden mit einer hohen Conversion Rate sicher vorschlagen. Fast wie wahrsagen. Aber nur fast.

Trend Detection auf Twitter-, Nachrichten- oder Marktforschungsdaten basieren auf den zeitlichen Veränderungen im Datenstrom. Dabei fragen wir uns: Hat sich etwas verändert? Gibt es ein neues Thema, einen „Burst“, über den ich informiert sein sollte? Wir adaptieren Indikatoren aus dem Stock Market-Umfeld, um Trendveränderungen in den Zeitreihen zu erkennen.

Und was machen wir mit den vielen Analysen? Wir visualisieren übersichtlich in Plots und Grafiken, segmentieren die Suchergebnisse effektiver und erschließen Stück um Stück die wirkliche Datentiefe. Und schon ist es da, das Wissen aus den Daten, welches Sie für Ihre täglichen Arbeitsabläufe brauchen.

NEW DATA. NEW BUSINESS. UNLIMITED