Text mining
Text mining (eksploracja tekstu) – ogólna nazwa metod eksploracji danych służących do wydobywania danych z tekstu i ich późniejszej obróbki.
Metody text mining stosowane są np. do statystycznego przetwarzania:
- artykułów prasowych
- wiadomości poczty elektronicznej
- otwartych odpowiedzi na pytania ankietowe
- opisów dolegliwości, podawanych przez pacjentów
- komentarzy do sesji giełdowych i zdarzeń dotyczące spółek
- życiorysów zawodowych i listów motywacyjnych
- tekstów reklamacji konsumenckich
Text mining może polegać na znalezieniu kluczowych fraz, zdań, które zostają następnie zakodowane pod postacią zmiennych numerycznych. Później stosuje się metody statystyki i eksploracji danych w celu odkrycia zależności pomiędzy zmiennymi. Ze względu na to, że powstające zmienne są zwykle nominalne, szczególnie użyteczna jest analiza koszykowa.
Zobacz też
- przetwarzanie języka naturalnego
- drzewa klasyfikacyjne