Voice cloning: Ang voice-as-a-service ba ang bagong kumikitang modelo ng negosyo?

CREDIT NG LARAWAN:
Image credit
iStock

Voice cloning: Ang voice-as-a-service ba ang bagong kumikitang modelo ng negosyo?

TINYO PARA SA FUTURIST BUKAS

Ang Quantumrun Trends Platform ay magbibigay sa iyo ng mga insight, tool, at komunidad upang galugarin at umunlad mula sa mga trend sa hinaharap.

Espesyal na Alok

$5 BAWAT BUWAN

Voice cloning: Ang voice-as-a-service ba ang bagong kumikitang modelo ng negosyo?

Teksto ng subheading
Ang software ay maaari na ngayong muling lumikha ng mga boses ng tao, na lumilikha ng mga bagong pagkakataon para sa mga tech na kumpanya.
    • May-akda:
    • pangalan Author
      Quantumrun Foresight
    • Septiyembre 8, 2022

    Buod ng pananaw

    Ang teknolohiya ng synthetic na boses ay umunlad mula sa pagsasama-sama ng na-record na audio hanggang sa paggamit ng AI upang lumikha ng mga nakakumbinsi na voice clone. Ang teknolohiyang ito, na nagbibigay-daan sa sinuman na mag-clone ng mga boses gamit ang mga simpleng tool, ay nakakakuha ng traksyon sa entertainment ngunit nagpapataas ng mga alalahanin sa etika at seguridad. Ang malawakang aplikasyon nito, mula sa personal na paggamit hanggang sa pagrenta ng boses ng celebrity, ay kaakibat ng mga panganib tulad ng pagnanakaw ng pagkakakilanlan at maling paggamit, na nagbibigay-diin sa pangangailangan para sa mga regulasyon at pagsulong sa cybersecurity.

    Konteksto ng pag-clone ng boses

    Ang mga sintetikong boses ay minsang ginawa sa pamamagitan ng pagre-record ng mga boses ng tao, paghahati-hati sa mga ito sa maliliit na bahagi ng audio, at pagsasama-sama ng mga ito. Pagsapit ng 2022, ginawang posible ng artificial intelligence at machine learning (AI/ML) na i-clone ang mga boses nang tumpak at nakakumbinsi. Bagama't ang tagumpay na ito ay may mga pakinabang para sa industriya ng entertainment, mayroon din itong mga etikal na implikasyon.

    Ang pag-clone ng boses ay maaaring mukhang nakakatakot, ngunit ang kailangan lang ay isang mikropono, isang script, at 30 minuto. Maaaring ipadala ng taong gustong i-clone ang kanyang boses ang kanyang mga na-record na audio file para maproseso, at sa ilang oras, available na ang kanyang boses para ma-download. Pagkatapos, gamit ang isang chatbox, maaari silang mag-type ng anuman sa anumang wika, at uulitin ito ng kanilang AI replica. Ang voice cloning ay maaaring magbigay ng nakakumbinsi na audio na kahit na ang mga kaibigan at pamilya ay paniniwalaan. 

    Ang buong proseso sa itaas ay ginawang posible sa pamamagitan ng pag-aaral ng makina na lubhang nagpasulong sa larangan ng speech synthesis. At pagsapit ng 2025, maaaring karaniwan na para sa mga celebrity na ibenta o irenta ang kanilang mga naka-clone na boses para sa iba't ibang serbisyo. Ang Veritone ay isa sa mga unang kumpanyang nagbigay ng ganitong serbisyo noong 2021, na nagpapahintulot sa mga influencer, atleta, at aktor na lisensyahan ang kanilang mga boses na naka-clone ng AI para sa mga pag-endorso nang hindi na kailangang pumunta sa isang studio.

    Nakakagambalang epekto

    Pampublikong debate tungkol sa mga sopistikadong teknolohiya ng digital cloning tulad ng mga video na binuo ng AI na ginamit upang tumuon sa pag-usbong ng mga mahirap na matukoy na deepfake na may simulate na audio at ang kanilang potensyal na magpakalat ng maling impormasyon at paghahati sa pulitika. Gayunpaman, ang teknolohiya ng voice cloning ay may bahagi ng mga panganib at kontrobersya. 

    Isa sa mga pinaka-high-profile na application ay ang paggamit ng boses ng namatay na chef na si Anthony Bourdain para sa 2021 documentary na Roadrunner. Nagulat ang mga manonood, una sa paggamit ng 'pekeng' audio, pagkatapos ay sa tila pagtatanggal ng direktor sa mga etikal na alalahanin. Ang mga manonood ay nagpahayag ng kanilang galit online. Sinabi ni Sam Gregory, ang direktor ng programa sa Witness (isang nonprofit na nagtatrabaho sa paggamit ng teknolohiya ng video para sa mga karapatang pantao), na ang mga hindi komportableng reaksyon sa voice cloning na si Anthony Bourdain ay sumasalamin sa mga inaasahan ng mga tao tungkol sa pagsisiwalat at pagpayag. Nabanggit ni Gregory na ang pagkuha ng pahintulot at pagsisiwalat ng teknolohiya sa likod ng voice cloning sa madla ay mahalaga sa pasulong. 

    Mayroon ding mga alalahanin tungkol sa mga potensyal na panganib ng teknolohiya ng voice cloning. Noong 2019, iniulat ng Wall Street Journal ang isang kasong kriminal na kinasasangkutan ng voice cloning. Nalinlang ang isang business manager sa paglilipat ng $260,000 USD sa mga kriminal na gumamit ng clone copy ng boses ng kanyang amo. 

    Mga implikasyon ng voice cloning

    Maaaring kabilang sa mas malawak na implikasyon ng voice cloning ang: 

    • Ang pagtaas ng voice cloning app na mada-download at magamit ng sinuman.
    • Ang mga kilalang tao ay nagrerenta ng kanilang mga boses para sa iba't ibang content tulad ng mga podcast, audiobook, at meditation app.
    • Ang pagtaas ng pamumuhunan sa mga teknolohiya ng voice cloning para sa mga layunin ng entertainment tulad ng mga video game at movie dubbing.
    • Hina-hack ng mga cybercriminal ang mga online storage system ng mga naka-clone na voice recording. 
    • Ang mga kumpanya ng cybersecurity ay gumagawa ng mga espesyal na solusyon para sa mga nagbibigay ng serbisyo ng voice cloning.
    • Mga pamahalaan na lumilikha ng mga patakaran at regulasyon upang protektahan ang mga tao at ang kanilang mga boses laban sa mga ilegal na aktibidad.

    Mga katanungang dapat isaalang-alang

    • Anong mga potensyal na krimen ang maiisip mo kung ang isang boses ay na-clone nang walang pahintulot?
    • Paano pa maaaring maapektuhan ng voice cloning ang mga industriya ng entertainment at negosyo?

    Mga sanggunian ng insight

    Ang mga sumusunod na sikat at institusyonal na link ay isinangguni para sa pananaw na ito: