A Century of Elvis
I used to think my dad was Elvis,
but I haven't told him that yet.
I haven't told my dad either
- Belle & Sebastian, A century of Elvis
Random thoughts put into writing
I used to think my dad was Elvis,
but I haven't told him that yet.
I haven't told my dad either
- Belle & Sebastian, A century of Elvis
Skrivet av AI kl 12:28 0 kommentarer
Kategorier: Allmänna inlägg
Ytterligare kartläggning och frågeställningar under lektionen ger mig följande tankar:
Forskning sker vid:
Universitet
- LiU - IDA
- Carnegie-Mellon University (CMU)
- MIT
- Umeå
- mfl.
Företag
- IBM
- Microsoft
- mfl.
Forskning bör också ske bland folk som använder färdiga taligenkänningsprogram för att forska kring taligenkänning, alternativt bland folk som använder open-source taligenkännaren Sphinx för att utveckla egna varianter av den.
Viktigt att skilja på forskning för att utveckla taligenkänning och forskning för att använda taligenkänning.
Marknadsledande taligenkänningsprogram är bland andra:
- IBM
- Nuance
- Microsoft - Speech Server
- Inbyggt i i Win XP / Office
- DragonSpeech?
- dessa företag/produkter bör ha egna forum/nyhetsbrev/usenet-grupper om sina produkter
Open-Source
- CMU Sphinx (finns i tre versioner)
- Stort community att utforska för information
Statistik
- Det finns säkert intressant 'statistik' kring hur bra de olika taligenkännarna är, prestanda, vilka som använder dem, hur de används, etc. Detta hittas nog lättast på produkternas egna sidor och i forum kopplade till dem eller kopplade till taligenkänning i allmänhet.
Regulatorer
- Finns det några offentliga regulatorer på området?
- Finns det patent som påverkar området? Knappast inom Europa, då mjukvarupatent (gudskelov) är förbjudna. USA däremot borde ha en hel bunt patent kring taligenkänning. Hur hitta dem? Amerikanska patentverket heter?
Publikationer
- Finns det några tidsskrifter som tar upp taligenkänning regelbundet?
- Datavetenskapliga tidsskrifter
- Forskningsrapporter/Doktorsavhandlingar/Exjobb finns det massvis av
Skrivet av AI kl 08:21 0 kommentarer
Kategorier: Allmänna inlägg
På svenska wikipedia.org hittar man inget om ämnet taligenkänning. Det finns en mening om talsyntes, dvs. när man försöker skapa tal med hjälp av datorn, men inget om taligenkänning. Söker även på "röstigenkänning", "igenkänning", mfl.
På engelska Wikipedia hittar man en lååång text om speech recognition, tillsammans med länkar till angränsande ämnen, keywords etc. Här ser jag skillnader mellan olika typer av speech recognition, som exv. "grammar constrained recognition", "natural language recognition", etc. Jag hittar också termer som "Hidden Markov Models". Sidan innehåller också länkar till alla, eller åtminstone de flesta, av de ledande taligenkänningsföretagen.
Skrivet av AI kl 15:05 0 kommentarer
Kategorier: Allmänna inlägg
Enkel sökning på microsoft.com ger lite information om deras produkter:
- www.microsoft.com/speech/
- Microsoft Speech Application Software Development Kit 1.1 - låter utvecklare göra egna taligenkänningsapplikationer genom .NET
- Microsoft Speech Server
Man hittar även massor i MSDN genom att söka på "speech recognition", bland annat en katalog/kategori med tekniska artiklar kring utveckling av taligenkänningsapplikationer.
Det finns även ett antal FAQ:er och tutorials för hur man får igång taligenkänning på sin Windows XP dator och i Office med mera. Detta verkar intressant och ska testas strax.
Skrivet av AI kl 09:48 0 kommentarer
Kategorier: Allmänna inlägg
Snabb kartläggning av taligenkänningsområdet utifrån vad jag redan vet:
Skrivet av AI kl 09:10 0 kommentarer
Kategorier: Allmänna inlägg
Som ett första steg i kursen Online Research and Communication och för att det verkade vara en trevlig idé har jag nu skapat mig en blogg. Bloggen kommer troligtvis användas genom veckorna, månaderna och kanske till och med åren för att publicera tankar, idéer och annat jag samlar på mig under tiden.
Skrivet av AI kl 21:37 0 kommentarer
Kategorier: Allmänna inlägg