WaveNet | Robotnyheter

Hör Facebooks AI förvandla Metallica till Beethoven

Hur skulle egentligen Metallicas musik låta om den hade spelats av Beethoven? En ny AI från Facebook kan konvertera låtar mellan olika musikstilar.

Så kallad style transfer har blivit ett populärt tillämpningsområde för AI. Det vill säga att man kan ta ett fotografi eller annan bild och få den att se ut som om den till exempel är en målning av Vincent van Gogh eller någon annan känd konstnär. Nu har Facebook utvecklat en AI som kan göra samma sak fast med musik. Fortsätt läsa ”Hör Facebooks AI förvandla Metallica till Beethoven”

Hör Google-AI:n Duplex ringa och boka klipptid helt på egen hand

Under utvecklarkonferensen Google I/O tidigare i veckan demonstrerade Google sitt nya AI-system som helt på egen hand kan ringa upp företag och till exempel boka bord på en restaurang.

Google Duplex, som AI:n heter, bygger på ett RNN (Recurrent Neural Network) och kombinerar naturlig språkigenkänning, djupinlärning och talsyntes (text till tal). I dagsläget är Duplex inriktad på att kunna utföra specifika uppgifter som att boka tider och liknande, snarare än att hålla generella konversationer om allt mellan himmel och jord. Fortsätt läsa ”Hör Google-AI:n Duplex ringa och boka klipptid helt på egen hand”

Hör den sjungande AI:n

Genom att matas med en MIDI-fil och sångtexten till en låt kan en AI utvecklad i Spanien sjunga på ett naturtroget sätt med sin talsyntesröst.

Ett par forskare vid Universitat Pompeu Fabra (UPF) i Barcelona har tagit fram en sjungande AI som låter riktigt naturtrogen. De har använt sig en kombination av DeepMinds WaveNet och en vocoder. En vocoder är en slags synteffekt som läggs på en vanlig röst och användes flitigt av artister under 80-talet. Ett känt exempel är låten ”The Robots” av Kraftwerk där robotrösterna skapades med hjälp av en vocoder. Fortsätt läsa ”Hör den sjungande AI:n”

Hör Googles nya talsyntes Tacotron 2 – kan du skilja den från mänsklig röst?

Snart är robotaktiga talsynteser som betonar orden fel ett minne blott. Googles senaste AI-drivna talsyntes låter väldigt naturtroget.

Robotnyheter har tidigare skrivit om WaveNet från DeepMind som numera används för talsyntesen i Google Assistant. WaveNet genererar syntetiskt men ändå naturtroget tal från grunden, istället för att som tidigare talsynteser klippa och klistra ihop meningar utifrån korta samplingar inlästa av röstskådespelare. Googles senaste text-till-tal-motor heter Tacotron 2 och bygger vidare på deras tidigare talsyntes Tacotron i kombination med WaveNet. De drivs båda av djupa neurala nätverk (DNN), en form av artificiell intelligens kort och gott. Fortsätt läsa ”Hör Googles nya talsyntes Tacotron 2 – kan du skilja den från mänsklig röst?”

Google Assistant får naturtrogen talsyntes – med hjälp av AI

Diagram som på en skala 1-5 visar hur naturtroget WaveNet-talsynteserna låter. Grafik: DeepMind

Med hjälp av artificiell intelligens har Google Assistant nu fått en talsyntes som låter läskigt naturtrogen.

För ett drygt år sedan presenterades WaveNet av Googleägda DeepMind. Det är ett djupt neuralt nätverk (DNN) som från grunden kan skapa mänskligt tal som låter betydligt mer naturtroget än dagens bästa talsynteser. Redan då lät det mycket bra, trots att det handlade om en forskningsprototyp. Den stora beräkningskraft som krävdes gjorde dock att WaveNet inte lämpade sig särskilt bra för att användas i konsumentprodukter såsom smartphones och smarthögtalare som Google Home. De senaste 12 månaderna har dock DeepMinds ingenjörer optimerat WaveNet rejält. Fortsätt läsa ”Google Assistant får naturtrogen talsyntes – med hjälp av AI”