Textmining

Während quantitative Daten leicht mit statistischen Methoden auszuwerten sind, stellt sich die automatisierte Auswertung freier Texte als wesentlich schwieriger dar. So können mit ganz unterschiedlichen Woren gleiche Sachverhalte beschrieben werden oder kleinste Abweichungen können große Bedeutungsunterschiede nach sich ziehen.

Hier setzt Textmining an. Unter dem Begriff versteht man die Gewinnung qualitativ hochwertiger Informationen aus freiem Text. Verwendet werden dabei verschiedene algorithmus-basierte Analyseverfahren, um die Inhalte im Text zu identifizieren und weiter zu verarbeiten.

Typische Informationsquellen sind dabei das Internet, aber auch unstrukturierte CRM-Daten oder umfangreiche Textsammlungen, Berichte o.ä..

Mittels Textmining lassen sich große Mengen freier Texte automatisiert verarbeiten. Texte können anhand ihrer Inhalte kategorisiert werden. Es können auch mittels Cluster-Analyse ähnliche Texte identifiziert und in Gruppen eingeteilt werden. Bestehende Informationen können mit weiteren Informationen vernetzt werden. Auch ist es möglich, nach bestimmten Inhalten suchen, ohne deren  genauen Wortlaut zu kennen. Die Liste der Anwendungen ließe sich beliebig fortsetzen.

Entscheidend ist, zunächst klare Fragestellungen und geeignete Informationsquellen zu definieren. Diese werden dann verwendet, um mittels Textmining die relevanten Informationen zu gewinnen.

Emergent Actio führt für Sie Textmining-Projekte durch und berät Sie bei der Implementierung in Ihren Anwendungen.