Hör den sjungande AI:n

Genom att matas med en MIDI-fil och sångtexten till en låt kan en AI utvecklad i Spanien sjunga på ett naturtroget sätt med sin talsyntesröst.

Ett par forskare vid Universitat Pompeu Fabra (UPF) i Barcelona har tagit fram en sjungande AI som låter riktigt naturtrogen. De har använt sig en kombination av DeepMinds WaveNet och en vocoder. En vocoder är en slags synteffekt som läggs på en vanlig röst och användes flitigt av artister under 80-talet. Ett känt exempel är låten ”The Robots” av Kraftwerk där robotrösterna skapades med hjälp av en vocoder. Fortsätt läsa ”Hör den sjungande AI:n”

Google Assistant får naturtrogen talsyntes – med hjälp av AI

Diagram som på en skala 1-5 visar hur naturtroget WaveNet-talsynteserna låter. Grafik: DeepMind

Med hjälp av artificiell intelligens har Google Assistant nu fått en talsyntes som låter läskigt naturtrogen.

För ett drygt år sedan presenterades WaveNet av Googleägda DeepMind. Det är ett djupt neuralt nätverk (DNN) som från grunden kan skapa mänskligt tal som låter betydligt mer naturtroget än dagens bästa talsynteser. Redan då lät det mycket bra, trots att det handlade om en forskningsprototyp. Den stora beräkningskraft som krävdes gjorde dock att WaveNet inte lämpade sig särskilt bra för att användas i konsumentprodukter såsom smartphones och smarthögtalare som Google Home. De senaste 12 månaderna har dock DeepMinds ingenjörer optimerat WaveNet rejält. Fortsätt läsa ”Google Assistant får naturtrogen talsyntes – med hjälp av AI”