Hör den sjungande AI:n

Genom att matas med en MIDI-fil och sångtexten till en låt kan en AI utvecklad i Spanien sjunga på ett naturtroget sätt med sin talsyntesröst.

Ett par forskare vid Universitat Pompeu Fabra (UPF) i Barcelona har tagit fram en sjungande AI som låter riktigt naturtrogen. De har använt sig en kombination av DeepMinds WaveNet och en vocoder. En vocoder är en slags synteffekt som läggs på en vanlig röst och användes flitigt av artister under 80-talet. Ett känt exempel är låten ”The Robots” av Kraftwerk där robotrösterna skapades med hjälp av en vocoder. Fortsätt läsa ”Hör den sjungande AI:n”

Veckans videor: Robotsvanar, DroNet, våfflor och Alfapet

Robotfistbump.

MegaBots har under några månaders tid utvecklat en bättre arm till sin jätterobot Eagle Prime. Den nya armen kan slå betydligt snabbare och man har dessutom byggt in hydraulikslangarna inuti armen eftersom de tidigare exponerade slangarna var en tydlig akilleshäl under fajterna. De verkar även ha fått spons av bland annat AutoDesk då hela videon känns lite som en reklamfilm för AutoDesk Fusion 360. Men vem sa att det var billigt att bygga jätterobotar? Fortsätt läsa ”Veckans videor: Robotsvanar, DroNet, våfflor och Alfapet”

Hör Googles nya talsyntes Tacotron 2 – kan du skilja den från mänsklig röst?

Grafik: Google

Snart är robotaktiga talsynteser som betonar orden fel ett minne blott. Googles senaste AI-drivna talsyntes låter väldigt naturtroget.

Robotnyheter har tidigare skrivit om WaveNet från DeepMind som numera används för talsyntesen i Google Assistant. WaveNet genererar syntetiskt men ändå naturtroget tal från grunden, istället för att som tidigare talsynteser klippa och klistra ihop meningar utifrån korta samplingar inlästa av röstskådespelare. Googles senaste text-till-tal-motor heter Tacotron 2 och bygger vidare på deras tidigare talsyntes Tacotron i kombination med WaveNet. De drivs båda av djupa neurala nätverk (DNN), en form av artificiell intelligens kort och gott. Fortsätt läsa ”Hör Googles nya talsyntes Tacotron 2 – kan du skilja den från mänsklig röst?”

Veckans videor: Nvidia Drive PX Pegasus, AlphaGo Zero, Nasas AI-racingdrönare och Lola

Foto: Nvidia

Under Googles Pixel-event förra månaden visades bland annat de nya trådlösa hörlurarna Pixel Buds upp. Dessa kan i realtid översätta mellan 40 olika språk, via Google Translate, och på scenen demonstrerades detta genom att de översatte mellan svenska och engelska. Haken är dock att det krävs att man har en Pixel 2-smartphone från Google för att det ska fungera. Det finns dock andra företag som utvecklar liknande tekniska lösningar för realtidsöversättning och Engadget har tagit sig en titt på dessa konkurrenter i sin serie Future IRL. Fortsätt läsa ”Veckans videor: Nvidia Drive PX Pegasus, AlphaGo Zero, Nasas AI-racingdrönare och Lola”

Google Assistant får naturtrogen talsyntes – med hjälp av AI

Diagram som på en skala 1-5 visar hur naturtroget WaveNet-talsynteserna låter. Grafik: DeepMind

Med hjälp av artificiell intelligens har Google Assistant nu fått en talsyntes som låter läskigt naturtrogen.

För ett drygt år sedan presenterades WaveNet av Googleägda DeepMind. Det är ett djupt neuralt nätverk (DNN) som från grunden kan skapa mänskligt tal som låter betydligt mer naturtroget än dagens bästa talsynteser. Redan då lät det mycket bra, trots att det handlade om en forskningsprototyp. Den stora beräkningskraft som krävdes gjorde dock att WaveNet inte lämpade sig särskilt bra för att användas i konsumentprodukter såsom smartphones och smarthögtalare som Google Home. De senaste 12 månaderna har dock DeepMinds ingenjörer optimerat WaveNet rejält. Fortsätt läsa ”Google Assistant får naturtrogen talsyntes – med hjälp av AI”