NB! Denne side er underopbygning og derfor er ikke alt indholdet ikke på plads.
Gennemsnitlig ordlængde
Funktionen skal returner den gennemsnitlige længde af alle ordene i teksten i form af et kommatal.
Funktionen bliver givet en liste af alle ord i teksten kaldet words.
def avg_word_length(words):
Diversitet af ord
Funktionen skal returner forholdet imellem antallet af ord i teksten og antallet forskellige ord brugt i teksten i form af et kommatal.
Forholder givet ved at antallet af forskellige ord divideret med det totale antal ord i teksten.
Derfor hvis funktionen returnere et tal tæt på 1 er der stor diversitet i ordene brugt af forfatteren, mens hvis den er tæt på 0 bruger forfatteren de samme ord mange gange.
Funktionen bliver givet en liste af alle ord i teksten kaldet words.
def type_token_ratio(words):
Hapax legomenon forholdet
Funktionen skal returner Hapax legomenon forholdet for teksten i form af et kommatal.
Hapax legomenon forholdet er antallet af ord der kun optræder en gang i teksten divideret med det totale antal af ord.
Funktionen bliver givet en liste af alle ord i teksten kaldet words.
def hapax_legomenon_ratio(words):
Gennemsnitlig sætningslængde
Funktionen skal returner den gennemsnitlige sætningslængde i form af et kommatal, dvs. antallet af ord i teksten divideret med antallet af sætninger.
Funktionen bliver givet en liste af alle sætninger i teksten kaldet sentences.
Hint: Man kan bruge funktionen extract_words_from_string(str) til at få en liste af ord i en sætning.
def avg_sentence_length(sentences):
Gennemsnitlig sætningskompleksitet
Funktionen skal returner den gennemsnitlige sætningskompleksitet i form af et kommatal, dvs. antallet af delsætninger divideret med antallet af sætninger.
Funktionen bliver givet en liste af alle sætninger i teksten kaldet sentences.
Hint: Man kan bruge funktionen split_on_separator(str, separators) til at få en liste af delsætninger i en sætning.
def avg_sentence_complexity(sentences):
LIX
Funktionen skal returner LIX (læsbarhedsindekset) for teksten i form af et kommatal.
LIX er udtrykket ved antallet af ord divideret med antallet af sætninger plus antallet af lange ord (længere end 6 bogstaver) gange 100 divideret med antallet af ord.
Funktionen bliver givet både en liste af ord kaldet words og en liste af sætninger kaldet sentences.
def lix(sentences, words):