Sprogteknologi

From CCT - Vidensdeling
Jump to navigation Jump to search

Klæd eleverne på til at forstå den sprogteknologi, der omfavner dem på nettet helt uden, de bemærker det. I forløbet videreudvikler eleverne selv simple systemer til strengmanipulation for så og diskutere, hvordan man bedst/"rigtigst" præsenterer brugerne for de manipulationer, valg og fravalg der er taget i filtrer på Facebookgrupper, Bots på twitter og Opslag i Ordbøger og Google Translate.

Flg. ordfilter lavet på Khanacademy er et worked example fra forløbet: https://www.khanacademy.org/computer-programming/udvidet-ordfilter/6121835899977728

Status & Planer

Forløbet er udviklet dette efterår og afprøvet på informatik c i en stx-klasse med Mediefag B og Engelsk A.

Introduktion

Forløbet er udviklet til sproglige studieretninger der har informatik c som fællesfag. Det giver en introduktion til grundlæggende teknikker og strategier i sprogteknologimed et overordnede formål, at eleverne skal blive bedre til at forstå og bruge sprogteknologier.

Læreplansmål

  • C+B: Påvirkning af brugeres adfærd - Usability: hvorfor foretrækker brugerne Google Translate fremfor ordbøger?
  • C+B: Datarepræsentation og manipulation: Strenghåndtering, Tabeller...
  • C+B: Programmering: Javascript & HTML - variable, betingelser, funktioner, arrays.
  • (Interaktionsdesign?)

Forudsætninger

Skabeloner til programmer ligger på Khan Academy. Lærer og elever kan oprette en bruger gratis og videreudvikles herfra og lærer kan lave et klasserum og tilgå og kommentere elevers produkter her. Det er også muligt at bruge eksemplerne i et andet HTML & JavaScript baseret udviklingsmiljø.

Didaktiske designprincipper

  • Consumer to Producer: fra brug af digital ordfiltre/oversætter/ordbog til produktion af små scripts.
  • Application Oriented: simpel maskinoversætter/ordbog.
  • Use-Modify-Create: brug simpelt filter, maskinoversætter... og udvid. Lav hybrid ordbog/oversætter.
  • Stepwise Improvement: fra ordbog til guidet ordbog.
  • Worked Example: hybrid ordbog/oversætter.

Lektionsplan

Bemærk! Dette er en drejebog henvendt til underviseren og tidsangivelser er vejledende.

Ord-filtre i facebook grupper

40 min: Diskussion af automatisk censur på facebook

  • 15 min: Præsentation af filtre - primitiv ordbog - og censur af opslag med bestemte ord på facebook: https://www.facebook.com/help/131671940241729
  • 05 min: Afstemning & diskussion (Socrative/Håndoprækning): Man må censure på egen side / Man må censure på både sider og grupper / Man må censure på egen side, hvis det fremgår / Man må censure på både sider og grupper, hvis det fremgår / Man bør sende besked, så administrator kan kommentere / Man må aldrig censurere
  • 10 min: Case: censur af "Fadøl" på Lars Løkkes side:
  • 05 min: Afstemning & diskussion (Socrative/Håndoprækning): Censuren er i orden / Censuren er ok, men bruger skal vide det / Censuren er ikke rimelig fordi Lars Løkke er politiker / Censur er aldrig rimelig
  • 05 min: Afstemning & diskussion (Socrative/Håndoprækning): Censurede opslag skjules som nu / Censurede opslag skjules og der sendes besked til bruger / Kun censurede ord fjernes / Censurede ord erstattes med xxx

60 min: Udvikling af simpelt ordfilter i javascript

  • 05 min: Elever afprøver simpelt filter: https://www.khanacademy.org/computer-programming/ordfilter/6652642502705152
  • 40 min: Opgave: Klik på spinoff/kopier kode og lav program, der censurerer enhver tænkelig brug af fad, øl, fadøl, fadbamse... - Obs! Pas på rækkefølge - filtreres fad før fadøl, finder den ikke fadøl!
  • 10 min: Afprøvning af filtre - bytter 2 og 2 >> fælles afprøvning af udvalgte filtre i klassen.
  • 05 min: Opsamling: Ryger forkerte ord med (f.eks - et fad, fadæse...)? Hvordan kan filter omgås?

60 min: Forbedring af ordfilter i javascript

  • 10 min: Elever afprøver filter der opdeler ord i array med bogstaver og gennemgår det med løkke: https://www.khanacademy.org/computer-programming/udvidet-ordfilter/6121835899977728
  • 40 min: Videreudvikling af filter, så fadæse, fadder m.fl. ikke ryger, men fadnæse, fadmand, fadnisse o.lign gør!
  • 10 min: Afprøvning af filtre - bytter 2 og 2 >> fælles afprøvning af udvalgte filtre i klassen.
  • 05 min: Diskussion - kan man lave et effektivt filter?

Maskinoversættelse

45 min: OrdFight: Translate vs. Ordbog

  • 30 min: Opgave - Del eleverne op i par og bed dem oversætte tekst fra et fremmedsprog de har ordbog til (ikke engelsk men eks. fransk eller spansk) til korrekt dansk, hvor den ene bruger digital ordbog og den anden bruger Google Translate. Vælg eks. uddrag af oversat hc. andersen eventyr fra http://www.andersenstories.com/
  • 10 min: Opsamling, hvor eleverne i par sammenligner deres bud med den oprindelige danske tekst og laver en liste med fordele og ulemper ved digital ordbog og ved Google Translate.
  • 05 min: Bud på fordele og ulemper samles på tavle/i fælles dokument.

120 min: Simpel regelbaseret maskinoversætter

  • 10 min: Elever afprøver dum oversætter, hvor sætning konverteres til ordtabel og gennemgås med løkke: https://www.khanacademy.org/computer-programming/maskinoverstter/6242950320291840
  • 90 min: Opgave: Elever skal lave maskinbeoversætter der ord for ord kan oversætte sætninger med få, får, men og fåresyge rigtigt til engelsk, så den håndterer sætningerne: "Får få får fåresyge?" "Få får får fåresyge, men du kan få men af fåresyge"
  • 20 min: Opsamling på produkter - hvad er svært? hvilke strategier har eleverne brugt?

40 min: Statistiske vs. regelbaserede maskinoversættere

  • 20 min. Sammenligning af elevers oversættere med Google Translate:
    • Afstemning - hvor mange tror, at deres oversætter er bedre end Google Translate?
    • Vis Google translates oversættelse af: "Får få får fåresyge? Få får får fåresyge, men du kan få men af fåresyge"
    • Bed eleverne komme med bud på, hvorfor Google Translate er på Glatis!
    • min: Video: Inside Google Translate: https://www.youtube.com/watch?v=_GdSC1Z1Kzs
    • Fælles afdækning af, hvilke strategier der gør at Google Translate får problemer
  • 20 min: Forskellen på regelbaserede og statistisk baserede oversætter?

Udvikling af guidet Digital Ordbog

60 min: Usability evaluering af ordbog Brug socrative eller andet afstemningssystem

  • 15 min: Opgave - Brug ordbogen til at oversætte: "Jeg får spat af ordbøger". Tips - bed elever og indsende bud i "fritekst" på eks. Socrative, så alle får lavet opgaven.
  • 10 min: Afstemning
    • Vælg den beskrivelse der bedst beskriver din oplevelse af opslaget: Jeg fandt hurtigt et svar i ordbogen / Det tog lang tid at finde et svar fordi ordbogen er rodet / Det tog lang tid at finde et svar fordi jeg ikke kender ordbogen / Jeg fandt ikke et svar og troede ikke der var noget.
    • Hvad gør du typisk, når du i første omgang ikke finder svar i ordbogen?: Prøver Google Translate / Laver krydsopslag med de ord jeg finder / Prøver en anden ordbog / Googler på nettet / Prøver andre ord af
    • Er det rimeligt, hvis lærere bliver sure over elevers brug af oversættelsesmaskiner?: Ja / Nej
    • Hvorfor bliver lærere sure over at elever bruger Google Translate?: (Fritekst)
    • Hvorfor bruger elever oversættelsesmaskiner?: (fritekst)
  • 05 min: Vis hvordan man finder rigtigt svar.
  • 20 min: Opsamling på undersøgelse med fokus på, at det er brugervenligheden ved ordbog den er galt med.
  • 10 min: Video - Why computers suck at translations: https://www.youtube.com/watch?v=GAgp7nXdkLUWh.

60 min: Tænke Højt Test:

  • 15 min: Introduktion til Tænke Højt Test.- Brug eks denne præsentation - kommentar fra KM (27/2-2017): Brug denne henvisning istedet Introduktion til Tænk Højt Testen
  • 30 min: Tænke Højt Test af ordbog. - Vælg elev der har svært ved at bruge ordbog - pointer, at det ikke er eleven, men ordbogen der er problemet. Lærer guider seance og elever observerer og noterer. Eleven skal prøve at finde en oversættelse af sætning fra dansk til engelsk: "Han tog den væk".
  • 15 min: opsamling - hvad så vi og lærte vi?

120 min: Udvikling af Guidet Ordbog

Ekstra: byg din egen Bot

Ekstra: forfattergenkendelse

  • Genkendelse af forfatter ud fra tekstlængde, lixtal, kendetegnende stavefejl...

Refleksioner over designet af forløbet

Forløbet er designet til klasser der har sprog som interesse og ikke nødvendiges den større kendskab eller interesse for informatik.

Det tager udgangspunkt i elevernes brug af sprogteknologier og de indledende øvelser med at bruge, teste og diskutere er centrale for både elevernes motivation og forståelse og af de efterfølgende øvelser i at programmere og udvikle sprogteknologier.

Kode for at lære at sekvensere, abstrahere og strukturere.