Teksten bestaan uit woorden (en leestekens, maar die laten we in deze opgave buiten beschouwing). Deze woorden zijn niet allemaal verschillend. Dat wil zeggen dat ze niet allemaal uniek zijn. Hoe meer unieke woorden je naar verhouding tegenkomt, hoe moeilijker de tekst is.
In deze opgave kijken we naar het percentage unieke woorden in een tekst. Dit percentage wordt bepaald aan de hand van twee grootheden:
$U: het aantal unieke woorden in een stuk tekst;
$T: het totaal aantal woorden in dat stuk tekst.
We bekijken de eerste twee zinnen van deze opgave:
Teksten bestaan uit woorden (en leestekens, maar die laten we in deze opgave buiten beschouwing). Deze woorden zijn niet allemaal verschillend.

