TF-IDF oznacza „Term Frequency”— “Inverse Document Frequency”. Jest to technika kwantyfikacji słów w zestawie dokumentów.
Zazwyczaj obliczamy punktację dla każdego słowa, aby wskazać jego znaczenie w dokumencie i korpusie.
Ta metoda jest szeroko stosowaną techniką w wyszukiwaniu informacji i eksploracji tekstu.