Bör intelligenta assistenter tala naturligt? En undersökning om betydelsen av intelligenta assistenters tal för användarupplevelsen
Is natural speech desirable in intelligent assistants? A study of the relevance of intelligent assistants' speech for the user experience
Abstract
Intelligenta personliga assistenters tal är idag begripligt. Trots detta låter det fortfarande
konstgjort och talets prosodi tycks vara en av de stora svårigheterna. Både företag och
forskare inom ämnet strävar efter en naturlighet i syntetiskt tal, men om detta är något
som är eftersträvansvärt har dock varken motbevisats eller bekräftats. Syftet med denna
studie var att undersöka betydelsen av intelligenta personliga assistenters tal för
användarupplevelsen. Apples intelligenta personliga assistent Siri valdes för att utföra ett
experiment med inomgruppsdesign bestående av tre nivåer: Siris tal, naturligt tal som
efterliknar Siris prosodi samt naturligt tal. Resultatet visade att ingen statistiskt
signifikant skillnad förelåg mellan de tre nivåerna och därvid kunde ingen skillnad
påvisas mellan naturligt tal och Siris tal gällande användarupplevelsen. Inte heller
huruvida prosodin har en inverkan på användarupplevelsen kunde påvisas. Ytterligare
statistisk analys konstaterade att en statistiskt signifikant skillnad förelåg mellan de
naturliga talen och Siris tal angående hur enkla de var att förstå, där Siris tal var
signifikant svårare att förstå. Att en statistiskt signifikant skillnad går att påvisa vad
gäller förståelsen av intelligenta assistenters tal men inte för användarupplevelsen i sin
helhet kan vara en intressant upptäckt, men kräver vidare undersökning.
Degree
Kandidatuppsats
Bachelor thesis
Other description
Modern intelligent personal assistants are comprehensible. Despite this, their speech still
sounds artificial, where the prosody of the speech seems to be one of the major
difficulties. Both companies and researchers in the subject strive for naturalness in
synthetic speech, but if this is something that is desirable has neither been demented nor
confirmed. The purpose of this study was to investigate the importance of intelligent
personal assistants' speech for the user experience and if it increases with more
naturalness. The intelligent personal assistant Siri was chosen to perform an experiment
with repeated measures design consisting of three levels: Siri's speech, natural speech
mimicking Siri's prosody and natural speech. The results revealed no statistically
significant difference between the three levels. Hence, no difference was found between
natural speech and Siri's speech regarding the user experience. The study was also not
able to confirm whether prosody has an impact on the user experience. Further statistical
analysis found that there was a statistically significant difference between the natural
speeches and Siri's speech as to how easy they were to understand, where Siri's speech
was significantly more difficult to understand. That a statistically significant difference
can be found in terms of understanding the intelligent assistants but not for the user
experience could be an interesting discovery, but requires further investigation.
Date
2017-10-02Author
LORIN, PAULINE
THORSAGER, LINN
Keywords
Intelligent personlig assistent
användarupplevelse
talsyntes
Siri
prosodi
människa-datorinteraktion
konkateneringssyntes
Intelligent personal assistant
user experience
speech synthesis
prosody
human-computer interaction
concatenative speech synthesis
Series/Report no.
2017:125
Language
swe