Susan Bennett enthüllt mehr über den Prozess, die Stimme von Siri zu werden

Tiffany Garrett

Susan Bennett hat die Geschichte schon einmal erzählt, wie sie zur Stimme von Siri wurde, ohne es zu merken - zu der Zeit dachte sie, sie würde die Aufnahmen für ein automatisiertes Vermittlungssystem machen. Tatsächlich fand sie nicht einmal heraus, dass sie Siri geworden war, bis eine Freundin mit einem iPhone spielte und ihre Stimme erkannte.

Aber in einem neuen Interview mit Typform hat sie mehr darüber enthüllt, wie der Prozess funktioniert hat, einschließlich des Sprechens von Unsinnssätzen…



Sie habe den Auftritt erst bekommen, als der Schauspieler, der für die Rolle vorsprechen sollte, nicht gezeigt werden konnte. Es sei eine ironische Rolle für einen Nicht-Techniker gewesen.

wie man Reshade-Presets verwendet

Meine Generation ist nicht mit Computern aufgewachsen. Ich denke, es gibt einen Teil von uns, der immer noch ein wenig von ihnen entfernt bleiben möchte. Ich finde, dass ich ihnen nicht wirklich vertraue. (Lacht)

Anstatt jedes einzelne Wort, das Siri jemals sagen musste, aufzeichnen zu lassen, ließ das Team ihre Stimme eine ganze Reihe von Phrasen - einige echte Wörter, andere nicht -, die sie später zu neuen Wörtern und Phrasen kombinieren konnten.

Wir haben Hunderte von Phrasen und Sätzen aufgenommen, die erstellt wurden, um alle Klangkombinationen in englischer Sprache zu erhalten. Jetzt hat die englische Sprache über eine Million Wörter, sodass Sie sich vorstellen können, wie lange dies gedauert hat. Die ersten Aufnahmen dauerten 2005 einen Monat [bevor es das iPhone überhaupt gab], vier Stunden am Tag, fünf Tage die Woche, dann habe ich 2011/12 vier Monate lang Updates durchgeführt.

Bennett gab ein Beispiel für die Art von Dingen, die sie aufzeichnete.

Malitia oi halluzinieren, Buckry Ockra Schlamm. Cathexis fefatelly sexuelle Leichtigkeit Stumpf. Sagen Sie das Shrodding noch einmal, sagen Sie das Shrodding noch einmal, sagen Sie das Scroding noch einmal, sagen Sie das Shriding noch einmal, sagen Sie das Shrading noch einmal, sagen Sie das Shrumping noch einmal.

Da alles in genau demselben Ton, derselben Tonhöhe und demselben Tempo geäußert werden musste, war dies die unglaublich mühsame Arbeit, sagte sie.

Bennett sagt, dies bedeutet, dass sie die Stimme, die Humanisierung der Erfahrung, würdigen kann, aber nicht Siris berühmt freche Antworten.

Vor Siri klangen verkettete Stimmen sehr roboterhaft… nicht die Art von Stimme, mit der jeder interagieren möchte. Ich denke, deshalb war sie so beliebt. Es ist wie: 'Oh mein Wort, das klingt wie eine Person in meinem Telefon.' [Aber] die Sprachtalente hatten nichts mit dem zu tun, was Siri sagt. Alles hat mit den Programmierern zu tun.

Als sie herausfand, dass sie die Stimme von Siri war, hatte Bennett ambivalente Gefühle.

Zuallererst war ich wirklich, wirklich geschmeichelt, ausgewählt worden zu sein [aber] das Negative und Problematische daran ist, diejenigen von uns, die alle Arten von Sprachjobs erledigt haben, wenn wir Dinge wie Telefon-Messaging, Informationssachen, GPS-Systeme, solche Dinge, die Leute bemerken die Stimme nicht wirklich, weil sie auf die Informationen hören, die sie brauchen […]

Jackbox Party Pack 4 Rezension

Aber wenn Sie plötzlich diese anonyme Stimme nehmen und es zu einer Person wie Siri wird, mit der Menschen interagieren und im Grunde genommen als Person denken, dann sind Sie plötzlich diese Person. Und wir Menschen lieben es wirklich, Menschen zu stereotypisieren. Wenn Sie also als die Stimme von Siri identifiziert sind, ist es wie 'Sie ist Siri, sie kann nichts anderes tun.'

Aber am Ende hat es gut geklappt, da es neue Möglichkeiten eröffnet hat, wie zum Beispiel eine Karriere als Redner.

Ich mache viele Auftritte bei Konferenzen und Meetings und so, und das hat viel Spaß gemacht.

Das gesamte 24-minütige Interview ist auf der zu hören Typform Blog .

Über TNW . Foto: Vox .


FTC: Wir verwenden einkommensverdienende Auto-Affiliate-Links. Mehr.