WikiWoordenboek:Gangbaarheid: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
Geen bewerkingssamenvatting
Labels: Ongedaan gemaakt Bewerking via mobiel Bewerking via mobiele website
Versie 4612736 van 2001:1C05:2F91:E000:ED54:4711:8CE7:3DBB (overleg) ongedaan gemaakt
Label: Ongedaan maken
Regel 6:
== Woordfrequentie ==
Sinds er computers zijn is het mogelijk om grote aantallen teksten op te splitsen in losse woorden en dan te tellen hoe vaak elk woord voorkomt. Het blijkt dat een beperkt aantal woorden een heel groot deel van alle teksten uitmaakt en dat er aan de andere kant enorme aantallen woorden zijn die weinig voorkomen. Dit verschijnsel heet naar een van de ontdekkers de [[w:Wet van Zipf|wet van Zipf]]. Het aantal keren dat een woord voorkomt zegt alleen iets over de gangbaarheid als het op de een of andere manier wordt vergeleken met het totale aantal woorden in de teksten.
Dhzz az ha=== Frequentie ===
Het aantal keren dat een bepaald woord voorkomt gedeeld door het totale aantal woorden in alle teksten geeft per definitie de frequentie van het woord. Het nadeel van deze maatstaf is dat het grotendeels om kleine getallen gaat, breuken met eerst wat nullen achter de komma, die niet zo gemakkelijk te gebruiken zijn.