Talegjenkjenning

Fra IKT Hjelpemidler
Hopp til navigering Hopp til søk

Oppdatert artikkel finner du på Wikipedia. - gammel side med masse info

Oversikt over talegjenkjenning- og dikteringssystemer per dags dato

  • Apples iPhone og iPad har norsk diktering tilgjengelig i tastaturet. iPhone har i tillegg Siri kommandostyring på norsk som gjør det mulig å betjene mange funksjoner håndsfritt med talen. oppskrift på Youtube
  • Smarttelefoner med Android operativsystemet har norsk diktering tilgjengelig i tastaturet. Bruk tastaturet "Gboard", og velg norsk - hvis du har valgt flere språk, kan det føre til forvekslingen. Best gjenkjenning får du derfor hvis du velger kun norsk) Oppskrift på Android diktering
  • Max Manus as leverer norsk talegjenkjenning (Tuva), med diktering og styring av PC på Windows. Systemet er personavhengig, og må trenes opp. Foreløpig finnes det kun bokmål versjon, og ikke nynorsk. Web-side til Max Manus as
  • Cloud Speech-to-Text -

Andre systemer på engelsk samt andre språk

  • Beste systemet på verdensmarkedet for Windows: Dragon NaturallySpeaking på engelsk, tysk, spansk, … (ikke norsk). Aktuell Windows finnes nå i versjon 15. Hvis Dragon skal kunne tilpasses til andre applikasjoner enn Office produktene burde man anskaffe den profesjonelle versjonen (Kommandoer for å starte programmer, trykke hurtigtaster etc.) . -> hjelpemiddeldatabasen.no
  • Dragon Dictate for Mac på engelsk, tysk, spansk, … (ikke norsk)
  • Windows 7, 8 og 10 har innebygd talegjenkjenning (Windows Speech Recognition (WSR)) på engelsk og andre språk, men ikke norsk. Oppskrift på hvordan du installerer det.
    • Hvis du får denne feilmeldingen: "Speech Recognition could not start. Please change the recognizer language in the speech recognition control panel under advanced options" -> go to settings (not control panel) > Time & Language > Region & Language > under Languages click on English (US) (or other supported speech language that you have as defualt). Click the Options button and then click install speech.
    • Oversikt over talegjenkjenningskommandoer i Windows 7 og 10
  • Windows 10 Cortana er et talestyrt spørsmål/svar-system liknende som Siri i iOS. [2] - Systemet finnes ikke på norsk ennå. (per sept 2018)
  • Sammenlikning mellom Tuva og Dragon NaturallySpeaking

Tuva sammen med engelsk talegjenkjenning i Windows 10:

Hvis man har bruk for både norsk og engelsk diktering, så kan man velge engelsk som visningsspråk i Windows 10. Windows 10 (også tidligere versjoner av Windows) har innebygd talegjenkjenning for engelsk (se egen artikkel om Windows speech recognition), men ikke norsk. Tuva kan derimot brukes i engelsk Windows og Office programmene som Word. Du kan fortsatt bruke norsk tastatur. Vær obs på at Tuva panel også forandrer seg til engelsk, men talekommandoene er fortsatt på norsk!

Det å bruke «klikk» sammen med navn av en knapp vil ikke uten videre fungere i Tuva med engelsk Windows og Word! Derimot fungerer «vis tall» uten videre.

Husk å skru av Tuvas talegjenkjenning før du bruker engelsk og motsatt!

Norsk talegjenkjenning til å transkribere innspilt lyd av et møte

Jeg får ofte spørsmål om dette tema. Følgende avsnitt er min personlige vurdering - Jeg oppfordrer til en diskusjon!

Spørsmål:

Hei, jeg så veldig kort på artikkelen om "tale til tekst" nettopp. Interessant! jeg lurer også på om det fins tale-til-tekst man kan kjøre på opptak, la oss si vi tar opp et kort foredrag, og bruker tale-til-tekst for å få mesteparten av det som blir sagt i en tekstfil, retter den opp, og laster den opp som tekstfil til opptak vi legger ut. Hadde det gått an?

Svar:

Det er generelt dårligere gjenkjenning av innspilt tale, da man vanligvis snakker «muntlig språk» og ikke «skriftlig språk». Muntlig språk har mindre struktur, man mangler setningstegn som komma og punktum og de fleste nordmenn slår over til sin dialekt. Når man dikterer med hensikt til å få det omgjort til skriftlig språk, snakker man mye mer strukturert, bruker tegnsetting og mer artikulert tale.

Dette kan du prøve selv:

1.      Gå til Word 365 lokalt på din NAV PC

2.      klikk på mikrofonknapp øverst venstre hjørnet under hjem-menyen

3.      les inn enn setning fra en tekst du har på papir, og si alle setningstegn som komma, punktum og ev. «ny linje»

4.      les flytende som når du leser tekst for en annen person – omtrent som en nyhetsoppleser – ikke bruk dialektord, men kun bokmål som du pleier å skrive!

Nytt forsøk:

·        denne gangen setter du på mikrofonen, og snakker til en annen person uten å tenke på setningsstruktur eller tegnsetting

·        snakk så naturlig og raskt som i en vanlig samtale

Se på forskjellene i de to forsøkene!


Stortinget har et prosjekt på gang (begynnelse 2020) for å få denne typen transkripsjon på alt som blir sagt i Stortinget. Stortingsrepresentantene er vanligvis stolt av sin lokale dialekt, og dette er en del av den norske språkfriheten. Lykke til med dagens teknologi!


Ellers har jeg tro på talegjenkjenning til teksttolking hvis man ikke får tak i en teksttolk. Det er ofte en god løsning.


NRK har begynt å bruke transkripsjon til å tagge filmmateriell. Dette må ikke forveksles med teksting på TV. De bruker det kun til å legge den transkriberte teksten sammen med filmsnuttene i en database for å letter kunne finne tilbake til ting som blir sagt på et gitt tidspunkt.


Jeg håper at dette er en liten oppklaring. Alle har i dag tilgang til gratis dikteringssystemer på PC, Mac og smarttelefoner, og det blir stadig bedre.

  1. Norsk talegjenkjenning er per dags dato avhengig av at brukeren snakker på en skriftspråklig måte på bokmål. I et møte snakker vi på en muntlig måte, med dialektord som ikke ville være egnet til et referat. Utenlandske aksenter kommer i tillegg, samt utfordringer med dårlig artikulasjon. Vi ville ikke få en setningsstruktur med setningstegn heller. Korrekturlesingen samt retting ville muligens ta lenger tid enn å skrive et vanlig nedkortet referat.
  2. Et referat skal bare plukke ut hovedpoengene, men nesten aldri være ordrett (bortsett fra Stortingets krav som jeg nevnte for deg).
  3. Derimot ville det kanskje være et alternativ til teksting av møter til hørselshemmede, siden alternativene ville være en teksttolk eller tegnspråktolk hvis brukeren kan det. Dette vurderes også for tiden.
  4. Systemet med å transkribere lydinnspillingen ville også kreve høy lydkvalitet samt en møtedisiplin hvor kun én person snakker om gangen, og hvor personen som snakker må si navnet sitt for hvert innlegg.
  5. Jeg vet at tilsvarende systemer på engelsk har allerede kommet så langt. Du kan se eksempler på Youtube, hvor du kan få opp automatisert tekst på alle filmene som ikke er tekstet i utgangspunktet.

Rapporter og mediaomtale

Forprosjektet norsk talegjenkjenning

Et forprosjekt i samarbeid mellom InfoShare Solutions, brukere av systemet og NAV Kompetansesenter for tilrettelegging og deltakelse har vist at det nå er teknisk mulig å utvikle talegjenkjenning på norsk ved å benytte datamaterialet som er tilgjengelig i den norske Språkbanken.