Lyrebird: maak elke stem na met maar één minuut aan bronmateriaal

Adobe liet vorig jaar al een demo horen van VoCo, software die het mogelijk maakte om iemands stem na te bootsen op basis van 20 minuten aan audio-opnames en een hoop rekenkracht. Of dat stukje software op de markt komt weten we niet, maar Lyrebird, vergelijkbare software van een startup uit Canada, komt er in elk geval wel aan.

Supersnel

Lyrebird belooft nog meer dan VoCo doet, want het zou al aan één minuut stemgeluid genoeg hebben om iemand woorden in de mond te kunnen leggen. Je kunt ook zelf stemmen ontwerpen en volgens de site van de software kunnen de ‘GPU clusters’ 1000 zinnen in minder dan een halve seconde genereren. Stress, sympathie of welke emotie dan ook kan als we ze moeten geloven ook toegevoegd worden aan de gegenereerde stem, zoals je in de demo’s kunt horen.

https://w.soundcloud.com/player/?url=https%3A//api.soundcloud.com/tracks/319146798&auto_play=fal

Dat zei ik niet

Als je het bovenstaande stukje ‘Trump’ hebt geluisterd hoor je wel dat het een gedigitaliseerde stem is, maar geef het nog even en laat iemand dit door een telefoon horen met een stem die ze niet dagelijks horen en dan wordt het een heel ander verhaal.

De ontwikkelaars beseffen dit ook en zeggen zelfs op hun eigen pagina dat ze expres de technologie beschikbaar maken voor iedereen:

Allemaal prima, maar als dit echt is kunnen we net zoals foto’s en sommige video’s ook geluidsopnamen afschrijven als stellig bewijs dat iets gebeurd is. Let wel: de technologie is voor nu niets meer dan een belofte en wat Soundcloud-bestanden die op allerlei manieren tot stand kunnen zijn gekomen.

We zullen zien of deze software (of service, dat wordt niet helemaal duidelijk) in de komende maanden echt boven water gaat komen gaan we er zeker meer van horen, al is het vanwege een nieuwe sloot aan nep(audio)nieuws.

Lyrebird: maak elke stem na met maar één minuut aan bronmateriaal

Supersnel

Dat zei ik niet

Share this post