talsyntes | Robotnyheter

Hör Google-AI:n Duplex ringa och boka klipptid helt på egen hand

Under utvecklarkonferensen Google I/O tidigare i veckan demonstrerade Google sitt nya AI-system som helt på egen hand kan ringa upp företag och till exempel boka bord på en restaurang.

Google Duplex, som AI:n heter, bygger på ett RNN (Recurrent Neural Network) och kombinerar naturlig språkigenkänning, djupinlärning och talsyntes (text till tal). I dagsläget är Duplex inriktad på att kunna utföra specifika uppgifter som att boka tider och liknande, snarare än att hålla generella konversationer om allt mellan himmel och jord. Fortsätt läsa ”Hör Google-AI:n Duplex ringa och boka klipptid helt på egen hand”

Hör den sjungande AI:n

Genom att matas med en MIDI-fil och sångtexten till en låt kan en AI utvecklad i Spanien sjunga på ett naturtroget sätt med sin talsyntesröst.

Ett par forskare vid Universitat Pompeu Fabra (UPF) i Barcelona har tagit fram en sjungande AI som låter riktigt naturtrogen. De har använt sig en kombination av DeepMinds WaveNet och en vocoder. En vocoder är en slags synteffekt som läggs på en vanlig röst och användes flitigt av artister under 80-talet. Ett känt exempel är låten ”The Robots” av Kraftwerk där robotrösterna skapades med hjälp av en vocoder. Fortsätt läsa ”Hör den sjungande AI:n”

Google Assistant får naturtrogen talsyntes – med hjälp av AI

Diagram som på en skala 1-5 visar hur naturtroget WaveNet-talsynteserna låter. Grafik: DeepMind

Med hjälp av artificiell intelligens har Google Assistant nu fått en talsyntes som låter läskigt naturtrogen.

För ett drygt år sedan presenterades WaveNet av Googleägda DeepMind. Det är ett djupt neuralt nätverk (DNN) som från grunden kan skapa mänskligt tal som låter betydligt mer naturtroget än dagens bästa talsynteser. Redan då lät det mycket bra, trots att det handlade om en forskningsprototyp. Den stora beräkningskraft som krävdes gjorde dock att WaveNet inte lämpade sig särskilt bra för att användas i konsumentprodukter såsom smartphones och smarthögtalare som Google Home. De senaste 12 månaderna har dock DeepMinds ingenjörer optimerat WaveNet rejält. Fortsätt läsa ”Google Assistant får naturtrogen talsyntes – med hjälp av AI”

Nvidias AI skapar naturtrogna ansiktsanimationer utifrån tal

Nvidias AI-baserade ansiktsanimationsteknik här kombinerad med Remedys spelmotor Northlight.

Den snabba utvecklingen inom AI gör att det snart kommer finnas helt digitala skådespelare där både ansiktsanimationer och röster har skapats i en dator. Ett av de första tillämpningsområdena för denna teknik blir förmodligen i dialogdrivna datorspel.

Nvidia har i samarbete med spelutvecklaren Remedy, som ligger bakom spel som Max Payne, Alan Wake och Quantum Break, utvecklat en AI som via ett DNN (Deep Neural Network) i realtid kan skapa naturtrogna ansiktsanimationer i 3D utifrån inspelat tal. DNN-nätverket tränas först upp via endast 3-5 minuters högkvalitativa videoinspelningar, via nio HD-kameror, av en talande människas ansikte. AI:n kan utifrån denna data generalisera för att lista ut ansiktsanimationerna för ytterligare ord. Tekniken visade sig fungera inte bara för den aktuella skådespelaren som videofilmades utan gav, enligt Nvidia, rimliga resultat även när röster från personer med olika kön, accent eller språk användes. Fortsätt läsa ”Nvidias AI skapar naturtrogna ansiktsanimationer utifrån tal”

Veckans videor: RoboCup 2017, Robo-One och volleybollrobot

RoboCup firar 20 år i år och återvänder till staden där allt började. Foto: Skärmdump från YouTube

Robo-One är en populär robottävling som startade i Japan 2002. Där tävlar små bipedala robotar mot varandra i en slags boxningsring där det gäller att slå omkull motståndaren. Hittills har dock robotarna fjärrstyrts av människor men nu har man anordnat det första Robo-One med helt autonoma robotar. De måste därmed helt förlita sig på sina ombordsensorer (takkameror är ej tillåtna) för att kunna känna av var motståndaren är. Fortsätt läsa ”Veckans videor: RoboCup 2017, Robo-One och volleybollrobot”