Tworzenie Muzyki Z Użyciem Sztucznej Inteligencji (wersja tekstowa)

Pobierz napisy w formacie SRT
Pobierz napisy w formacie VTT
Fundacja Instytut Rozwoju Regionalnego prezentuje Tyflo Podcast.
Dzień dobry, dzień dobry. Muzyka była i dzisiaj też będzie o muzyce.
O serwisach do tworzenia muzyki, można powiedzieć,
czy generowaniach, które generują muzykę na życzenie użytkownika.
Ze mną jest Patryk Chojnacki, ja jestem Tomek Bilecki,
A nad tym, żeby to wszystko było słychać, czuł wam Michał Dziwisz przy konsolecie?
Jestem, jestem. Dobry wieczór, dzień dobry w sumie jeszcze.
I Michał pewnie będzie też odbierał wasze różne wiadomości, rozmowy, no…
Wszystko, co tam będziecie do nas chcieli powiedzieć.
Jesteśmy… Wszędzie jesteśmy, tak?
Na YouTubie, na Facebooku…
Zgadza się.
I na Tyfloradiu.
Tak jest.
Whatsapp, telefon, wszystko działa.
Tak jest. No i świetnie.
Dobra, to co, zacznijmy sobie od Suno, bo to jest taki, mam wrażenie,
serwis, który jest dużo bardziej popularny od Uno.
Znaczy, ja myślę, że najpierw taki krótki wstęp, o co chodzi.
Generalnie chodzi o to, że swego czasu, troszeczkę tak, myślę,
pod koniec dwudziestego trzeciego roku, zaczął robić taki poważny boom
na sztuczną inteligencję. Co to nie potrafi?
Że możemy w sobie zrobić wszystko. I powstał sobie czat GPT.
Wtedy jeszcze bardzo taki okrojony ze wszystkiego, że tak to nazwę, który po prostu był i ludzie byli zafascynowani tym.
No ale wiadomo, że wszystko musi iść z duchem czasu.
No to wszystko się rozwinęło i pomyśleli sobie ludzie, ej, a co wy na to, żeby może zrobić nawet muzykę w ten sposób?
Użytkownik wrzuca nam tekst, piosenki, wrzuca na przykład tam gatunek preferowany, jakieś tam tragi.
Tego typu serwisy to już działały wcześniej, znaczy takie były algorytmy.
Mało tego, nawet dostępne dla wszystkich, tyle że trzeba to było uruchamiać na własnym sprzęcie, to po pierwsze.
Po drugie, działało to strasznie długo. A po trzecie, było to złe.
OpenAI nawet stworzyło coś takiego, co nazywało się Jukebox.
I to, no właśnie było czymś takim, to znaczy można było po pierwsze promptem określić, co miało się stworzyć, jaką muzykę.
Po drugie, można było mu załadować jakiś fragment muzyki i on mógł tę muzykę przedłużyć.
I swego czasu też na YouTubie pojawiało się ileś różnych przedłużeń takich standardowych dźwięków.
Jakieś intro z konsol, intro z systemów operacyjnych poprzedłużonych i tak dalej, i tak dalej.
No tylko, że to było 16 kHz, to było mono i to jeszcze było dość takie…
Kulawe po prostu.
Kulawe z kilku różnych… To mi przypomniało, to mi przypominało, słuchajcie, coś takiego…
Czasami w snach się słyszy muzykę, to trochę to tak mi brzmiało.
Ja powiem tak, tak samo jak wiadomo chatboty, powiedzmy, istniały kiedyś, no na przykład w pewnym prymitywnym, bardzo prymitywnym i może znanym pośród nas było coś, co zwało się Snickers i to w teorii też było coś w stylu chatbota, który miał odpowiednie nasze pytania.
No tak, tylko że on miał swoje wypowiedzi, to było dużo prostsze.
Oczywiście. Mi chodzi o to, że teraz to po prostu ewoluowało w dość szybkim tempie, gdzie faktycznie generatywnych modeli językowych, tak zwanych, czyli LLM, można używać nawet do tworzenia muzyki, wideo, obrazów.
W ogóle dźwięku i w sumie chyba prawie wszystkiego tak naprawdę.
No…
No a dzisiaj będziemy właśnie opowiadali o tym, co tworzy muzykę.
Są dwa takie serwisy, czyli tak jak Tomek powiedział, sunno, czyli raczej to, o czym mogliście już słyszeć.
Pierwszy, który w ogóle zaczął dość ciekawie, bo pierwsza beta polegała na tym, że był sobie serwer na Discordzie.
I na tym Discordzie wpisywało się odpowiedni prompt, czy odpowiednie zapytanie, odpowiednie tam tagi, było wszystko podane.
No i po prostu mam publiczny kanał, to się wtedy jeszcze chyba Chirp nazywało nawet.
Tak, dlatego że to była firma, która zrobiła kilka swoich różnych modeli.
Był Chirp od tworzenia muzyki i był, nie pamiętam jaki, od tworzenia
był jeszcze ich model TTS.
Tak, po prostu można było wpisać, no i on tam trochę sobie pomielił, pomielił i nam
dawał jakiś tam efekt na ten czat publiczny, więc sobie to każdy mógł chyba ten plik
I to się utrzymuje do dzisiaj. Co ciekawe, też w drugim serwisie zawsze otrzymujemy jakby dwa wyniki naszego promptu.
Nie wiem w sumie dlaczego tak, ale okej.
Widocznie jakaś taka praktyka się przyjęła, ale rzeczywiście wtedy było coś takiego, że faktycznie wpisywało się coś, że chcemy pop jakiś, załóżmy.
I on generował dwie, dwa warianty tego wszystkiego i można było wybrać czy ten, czy tamten jest lepszy.
No i używać sobie tam coś z tym zrobić.
Tak to się jakoś przyjęło, rzeczywiście dwa na raz się takie rzeczy tworzą i można sobie wybrać, który jest lepszy.
Obecnie Sunoo ma już swój model 4.5.
Pozwala na kowerowanie, chociaż to jest trochę szara strefa bym powiedział.
kowerowanie istniejących, zapodanych mu materiałów audio,
wywdłużanie ich, tak jak tu właśnie Tomek przedtem wspomniał,
czy tworzenie muzyki i edycję tejże później w specjalnym edytorku.
No i oczywiście wiadomo, że nie ma róży bez kolców.
Mamy wersję Free, mamy wersję Premium,
chociaż wersja Free nie jest aż taka zła,
bo nam oferuje model 3.5, który i tak nie jest jakiś zły.
Tak, bo w zasadzie od modelu 2, w wersji drugiej,
to to jest bardziej ewolucja niż rewolucja.
Rzeczywiście model 2 w stosunku do 1, no to to bardzo dużo zmienił, dlatego że wtedy pojawiło się stereo i to po prostu zaczęło, naprawdę to zaczęło działać.
Oczywiście nie we wszystkich gatunkach muzyki. Im bardziej taki skomplikowany, czyli na przykład klasyka, jazz, no to on się na tym wykładał, aż żal było patrzeć czy słuchać.
Natomiast w tym momencie jest lepiej.
Jest lepiej, to jest dość zauważalna różnica.
Mało tego, na przykład zauważyłem ostatnio, co to było dość zabawne, bo dość
popularnym ostatnim gatunkiem muzyki był handzap, czyli rodzaj techno, muzyki klubowej,
którego Sunoo w ogóle nie potrafiło.
Dawao się wpisał w handzap, on potrafił hardstyle, wyrzucić jakieś w ogóle
alternatywki i wszystko, tylko nie to.
Ostatnio, co ciekawe, faktycznie zaczął go umieć robić, więc widać, że sprawa się
rozwija. Co do tych planów, o których mówiłem.
Możemy płacić niecałe 38 z groszami złotych miesięcznie, za co dostajemy tak zwane 2500 kredytków, czyli no powiedzmy, że jest to waluta…
Takie punkty, za które można wymieniać na piosenki, które dostajemy odsunąć, czy utwory.
Tak, dostajemy właśnie miesięcznie 2500, możemy też dokupować jakby w trakcie, jak nam zabraknie.
Mamy dostęp do najnowszych modeli, mamy priorytet w generowaniu, możemy maksymalnie dziesięć zadań otworzyć naraz,
bo oczywiście to nie jest tak, że ja na przykład chciałbym mieć cztery wersje, mogę kliknąć dwa razy, ten przycisk generuj,
i zrobimy wtedy cztery wersje i to w podobnym czasie.
Model Free wbrew pozorom nie jest aż taki zły, ponieważ pozwala nam, dostajemy pięćdziesiąt kredytów dziennie,
więc jest to chyba pięć utworów, tak jak liczę dobrze, chyba pięć utworków.
Możemy używać modelu 3, 5 i 4 z ograniczeniem HD10,
czy do 5 zapytań na miesiąc, czy na dziennie.
Dokładnie jakoś tak tak wyglądało.
Generalnie nie mamy możliwości tego edytora zaawansowanego,
nie mamy chyba remasteringu.
A właśnie, bo możemy też jakby remasterować
nawet istniejące rzeczy na to, co Suno by nam zrobiło.
Nie wiem jak to wytłumaczyć, postaram się to pokazać po prostu.
Możemy oczywiście też kupić, są też droższe plany, pozwalające na 5 tys. kredytów miesięcznie, 10 tys. 15 i tak dalej, w zależności oczywiście od potrzeb.
To są też większe ceny, oczywiście możemy też kupić od razu na cały rok i w pewnym sensie zaoszczędzić, ale to zależy jakby do czego chcemy to używać.
Z UDIO myślę, że ty troszkę więcej wiesz, ale tam chyba troszkę inaczej to wygląda.
Tam są trzy plany. Głównie jest darmowy, jest taki podstawowy płatny standard i nie pamiętam jak się nazywa ten najwyższy, a potem tam zajrzę i powiem.
I też troszkę podobne są ograniczenia, to znaczy w standardowym jakby tam jedna piosenka kosztuje dwa lub cztery, no te kredyty powiedzmy.
Różnica polega na tym, że jest możliwość stworzenia takiego kawałka albo 30 sekund, albo dwie minuty.
I te 30 sekund kosztuje dwa kredyty, dwie minuty kosztuje cztery kredyty.
Suno nie ma czegoś takiego.
Suno robi tyle, ile chce po prostu.
Tak, Suno robi tyle, ile chce.
Chociaż kiedyś był limit chyba do dwóch minut, on strasznie brzydko urywał te końcówki.
On nie potrafił jakby wyczuć, gdzie ma końcówkę i strasznie brzydko potrafił sobie trwać utwory,
a nagle… nie ma.
To jest jedna rzecz, bo z modelu na model ten limit się wydłuża i model 4,5, nie wiem czy wiesz,
że ma chyba to 8 minut zdaje się ten…
Tak, no ale on też potrafi naprawdę, jeżeli wie, że może zrobić to wcześniej, kończyć,
to jest nie zawsze, ale jakby potrafi wcześniej skończyć i zrobić to ładnie, a nie tak brzydko
Oczywiście dalej mu się zdarzy raz na jakiś czas polecieć po całości do końca limitu i urwać brzydko w połowie, albo no, halucynacje i tak zwane, tak?
Różne rzeczy mogą się zdarzyć.
To prawda.
Audio też oczywiście pozwala na coverowanie, na jakby przedłużanie istniejącego materiału, ale nie ma chyba takiego edytorka. Ja szczerze jestem bardziej przesuną, w sensie dłużej z niego korzystam.
To znaczy oni w ogóle ostatnio stworzyli taki edytor, który nazywa się Sessions.
Nie wiem, czy ten interfejs jest jakoś sensownie dostępny.
Dzisiaj go próbowałem ogarnąć i nie bardzo mi się to udawało.
Natomiast zwłaszcza dla widzących, no to tam można robić dużo.
Zaznaczasz fragment muzyki i można ten konkretny fragment przerobić jakoś w
No czyli podobnie jak na Suno to jest zrobione.
Troszkę tak, tylko to jest jakoś tam też wizualnie jakoś, że coś na coś, początek, koniec, coś tam, jakieś tam takie rzeczy.
Tak. Co ciekawe, to jest dla mnie osobliwe, nie też przeszkadza, ale jest osobliwe, choć Suno bardzo dobrze po polsku tworzy.
Polskiego interfejsu do dziś dnia nie ma. Przypominam, mamy rok dwudziesty piąty, mamy lipiec, więc już to z dwa lata na rynku jest.
Co jest dla mnie dość nietypowe po prostu, w sensie no mi to jakby jako mi nie przeszkadza, ale może to być bariera.
Audio też nie ma polskiego interfejsu.
Co jest dość ciekawe.
Myślę, że możemy powoli przejść do… do suno.
Do suno, tak. Może pokażmy w ogóle jak tam się… jak to zrobić, żeby nam stworzyć muzykę, bo ileś osób mówi, że to jest niedostępne.
To jest dostępne i nawet w jakimś sensie niezbyt trudne.
Jest to dość intuicyjne, jak się to pozna.
Co do rejestracji, kilka tylko słów.
Możemy zalogować się Googlem, Discordem,
sobie stworzyć konto. Ja polecam
logować się Googlem, jest najprościej.
Tak, też mam konto google’owe.
Jeżeli chcemy kupić
plan, jest to wszystko realizowane przez
Stripe, czyli raczej znany standard
płatności, taki powiedzmy konkurent dla Paypala
troszkę.
Więc wszystko jest raczej
bezpieczne. Jeżeli mam już podpięty
do maila, no to mam podpięty do maila, podajemy
będą dane karty płatniczej i tam co miesiąc dać nam odciągawkę.
Ale to nawet, tak, możemy podać kartę płatniczą, ale nie wiem czy on to nawet
jeszcze jakiś, jakichś innych metod nie obsługuje.
Nie wiem czy w subskrypcji, ale ja nawet gdzieś widziałem, że Strajpem można płacić
i przelewy 24 i różnymi…
Chyba nie, wiesz, ja pamiętam, że we Wrocławiu jest tylko ten, jest tylko ten Strajp.
Nie no, ale jakby w Strajpie można.
Nie no, w Stripe’ie masz…
Nie, bo mówię, że Stripe jest…
Stripe sam w sobie ma blika…
Boże, przepraszam. Nie, nie, pomyliłem się z czymś innym.
Stripe? Nie, zaraz, Stripe z tego centrum ma tylko kartę płatniczą.
Okej.
Mam…
Mozilla Firefox.
Piszemy sobie adres suno.com albo suno.ai.
To w ogóle nie ma znaczenia.
Właśnie.
Jesteśmy na stronie głównej, po której możemy poruszać się strzałkami, taberatorem, albo jak kto woli, literkami, np. dronka po linkach.
W pewnym oczywiście obszarze, ponieważ nie do końca. A dlaczego do tego, co jest za chwilę? Najpierw zobaczmy, co jest na ekranie głównym.
Odwiedziony link…
Do dzisiaj nie wiem, co to jest Severe Modern.
Jest to jakby zawsze jako twórca tej muzyki wpisywane w odtwarzaczach,
ale do dzisiaj nie wiem, czy to jest jakby jakaś nazwa własna, czy jest to jakiś algorytm,
czy w tym to tak właściwie jest.
Create, tutaj zaczynamy tworzenie naszego utworu.
Library, tutaj mamy wszystkie nasze już dotychczasowe kreacje.
Explore, czyli możemy przeglądać, no bo oczywiście możemy udostępniać publicznie nasze dzieła,
nie tylko w formie plików audio czy im podobnych, ale także po prostu na stronie.
Możemy dostać na przykład komuś link do naszego dzieła lub do publicznej bazy,
w której właśnie tutaj mamy dostęp do tych wszystkich materiałów, które są publiczne.
Oznaczała tagiem publick.
Link search.
Wyszukaj.
Link notifications.
Upowiadomienia.
Odwiedzony link 2684.
Aha, jeszcze jedna…
Dla niektórych może być to dość ważna sprawa.
Jeżeli publikujemy coś, znaczy w ogóle tworzymy coś na koncie darmowym,
to prawa autorskie do tego utworu ma suno.
Jeżeli tworzymy coś, mając wykupione konto płatne,
to do utworu mam prawo, ma prawo twórca.
Dokładnie tak.
Przy czym nie da się zrobić czegoś takiego, że stworzymy sobie piętnaście utworów na
za darmo, potem kupię sobie,
kupię sobie premium, no to wtedy te utwory, które zostały
stworzone na licencji darmowej, one nie zmieniają właściciela.
Tylko to, co stworzymy mając płatny plan, jest naszą własnością.
Dokładnie tak.
Tutaj mam liczbę kredytów. Po której kliknięciu otwiera się panel subskrypcji.
Odwiedzony link upgrade.
No właśnie, gdyby ktoś chciał. Ja obecnie mam to premium, więc dlatego mam tyle kredytów.
Limit na darmowym koncie to jest chyba 700 w tym momencie.
W sensie tyle możemy nastackować, nazbierać.
Tak, bo jeżeli nam coś zostanie z płatnego, to to sobie zostanie.
Tak, ale mam na myśli to, że jeżeli na przykład nie płacimy i nie wchodzimy przez jakiś czas albo mało tego używamy,
no to możemy sobie stackować, czyli zbierać te kredyty, ale do 700 max.
Czyli nie przekroczymy tej liczby po prostu, bo będą przepadać.
Możemy zaprosić znajomych, co oczywiście daje nam nam i im benefity.
No, co jest nowego, czyli takie najnowsze.
Przycisk zwinięte otwiera okno dialogowe More from Suno.
Tu mam różne rzeczy od tej firmy.
Link Sunomusic.
Sunomusic.
Link Sunomusic. Link Sunomusic. Link Sunomusic. Link Suno.
Create your own song. Pole edycji wielow…
Dobra. Także przejdziemy teraz może do tego panelu tworzenia.
Suno Home. Create.
Suno Alert. Suno i Music.
Ok. Mamy.
Przy. Odw. Odw. Glisse. Odw. Odw. Odw. Links.
I ja to robię specjalnie teraz jakby… jest prostszy sposób.
A ja specjalnie teraz strzałką idę, żeby wszystko tutaj pokazać.
Okej, i teraz zaczyna się zabawa.
Ponieważ możemy na przykład zrobić taki meg, że wpisujemy mu po angielsku…
Mamy już tu utwór o jedzeniu chipsów. I wtedy on za pomocą modelu GPT najprawdopodobniej…
Tworzy sobie napisy, czyli pośredek z piosenki.
Tworzy sobie i nazwę, i styl chyba my mu dajemy.
Czy tak, czy tak? Tak, dajemy mu styl.
Znaczy, co z tym promptem, w którym…
Wszystko się wpisuje, tak?
Wpisuje wszystko.
Napisz żywą piosenkę popową o jedzeniu chipsów.
Tak, i wtedy…
Tak, i on tam zacznie…
Oczywiście po angielsku.
Tak, i to też ciekawe albo ważne.
Wtedy zapłacimy tylko pięć kredytów za to.
Za dwa pliki, oczywiście.
Dziesięć jakby za własność, w sensie własny tekst.
Więc ja polecam zawsze kliknąć ten custom i wtedy mamy dostęp do wszystkich opcji, które nas interesują.
Tu możemy wybrać model. No oczywiście ja będę pokazywać ten w teorii najlepszy.
Ten przycisk pozwala nam na albo wrzucenie gotowego już pliku, który może być podstawą utworu,
albo coveru, albo przedłużki.
Albo możemy też nagrać własne tutaj audio w czasie rzeczywistym praktycznie.
I tu znowu kolejne ograniczenie. Wersja darmowa pozwala na wrzucenie plików do minuty,
a wersja płatna do dwóch minut, z czego też bardzo fajne jest to, kiedyś tego nie było.
Plik może być automatycznie przycięty. Nie musimy go ręcznie przycinać.
Jeżeli jest za długi, to po prostu zostanie on obcięty.
To też jest bardzo w sumie dobre. Minimalny limit zaś to chyba jest 5 albo 6 sekund.
Tak, tak. Jest minimum.
W audio też zdaje się minimum.
Persony.
Tutaj można by zrobić w sumie trochę oddzielną audycję.
Będziemy musieli tworzyć w teorii…
w teorii, bo w praktyce to tak działa trochę średnio.
Nazwijmy to głosy.
To znaczy możemy, bo kiedy on jakby generuje nam utwór,
to on generuje sobie instrumental i wokal niezależnie.
Skutek jest taki, że no jest szansa, że spotkamy dwa razy ten sam wokal, ale jest to bardzo mała szansa.
Bersony, których chyba nawet nie ma w wersji wermowej, pozwalają nam jakby zapisywać sobie próbki wokalistyczne i tych wokali używać np. jakbyśmy chcieli płytę wydać całą przykładowo, to możemy zrobić to zmieniając tylko i wyłącznie instrumentale i tekst, ale zostawiając tego samego zmiotu artysty, śpiewającego.
Lyrics. Przycisk auto.
Możemy też mieć zapisane napisy. Przepraszam, może napisy.
Lyric zawsze jako napisy po prostu. Tak, tekst.
Przycisk auto. Przycisk wlite Lyrics.
No tu mamy właśnie to, co mówię.
Addeurowne Lyrics. Herepole edycji wielowierszowe.
Tutaj możemy wpisać tekst.
Koniec pole edycji. Klikalne instrumental.
Wciśnięcie tego spowoduje instrumental, czyli piosenka będzie bez tekstu.
Co ciekawe, nie zawsze działa. Nieraz sobie odpowie, ale mnie to nie obchodzi, że ty chcesz instrumental.
Ja ci zrobię vocal, bo mam dobry dzień na śpiewanie i chcę tak, chcę pośpiewać.
A czasami na odwrót. Ja mu daję tekst, a on sobie powie, ale wiesz co, ja dzisiaj się źle czuję,
ale ja chcę zrobić sam instrumental, tak będzie mi wygodniej. No i cóż…
I Udio, z tego co wiem, ma niestety to samo.
Instrument, przycisk full song, przycisk byline.
Tutaj mamy…
Klikalne style description.
O właśnie.
Przycisk niedostępne. Enter style description, pole edycji wielogierszowe.
Czyli możemy pisać proste rzeczy typu pop, rap, ale możemy też bardziej rozbudować styl, na przykład nie wiem, rap z lat 90,
albo na przykład głęboki, soczysty heavy metal. Oczywiście wszystko musi być po angielsku.
No i to jak wpiszemy decyduje o tym, co dostaniemy.
A jeżeli nie wpiszemy nic, to suno nam sobie zrobi, co chce.
Koniec pole edycji, przycisk. Przycisk kliku i tfunk.
Mam jakby style proponowane, jeszcze tak tylko dodam.
Ciekawostka numer dwa w tym temacie.
Jeżeli mamy jakiś plik już dodany, który jest odpowiednio długi,
czasami nie przekonamy go nawet siłą, żeby ten nie ustylił.
Jeżeli ten plik jest fragmentem utworu i chcemy zrobić nawet jego extend, czyli przedłużenie,
No to przekonanie, słynność, żeby zmienić to na inny styl jest praktycznie niemożliwe.
Bo on to zrobi w tym oryginalnym.
Tu mam po prostu… często bawiłem się w jakieś propagowane style.
Ja to po prostu pomijam w tym momencie.
Możemy je oczywiście mieszać, jak chcemy poprowadzić, mieszać style, możemy to zrobić.
To są jeszcze opcje zaawansowane.
Czyli wyklucz style. Nie pozwól, żeby jakiś styl się tutaj zdarzył w naszym utworze.
Czyli powiedzmy chcę utwór, który będzie hip-hopowy, ale nie może być trapem.
No to możemy tu pisać trap i wtedy w teorii ten trap nie powinien nam powstać.
Czyli jakby… Na ile ma być to takie…
Kreatywne?
No coś tego typu, no bo jedno jest to zdziwaczenie tak w zasadzie tłumaczeniem,
ale wiadomo, że raczej nie o to chodzi. Bardziej chodzi o głębokość tego.
Ile ma się trzymać takich kanonów stylu, czy kanonów takiego czegoś?
Ja to w ogóle ostatnio daję często na zero, żeby zobaczyć w ogóle,
bo ja bardzo lubię się tym bawić trochę na zasadzie,
czy on w ogóle zna różne style, tak?
Tak, no i spróbuję też to pokazać tym jakoś, wiesz?
Koniec grupa pięćdziesiąt. Style influence.
Style influence, czyli jakby…
Klikalne. Style i klika. Suwak pięćdziesiąt.
Głębokość tego stylu.
Tak, jak ma się trzymać tego stylu, który wpisaliśmy.
Na ile sobie może pozwolić na ewentualne odstępstwa.
Tak, dokładnie.
Koniec grupa pięćdziesiąt. Klikalne more options.
Song title. Enter song title.
Pole edycji z auto uzupełnianiem.
Który na przykład w przypadku, kiedy robimy jakieś covery, też jest w sumie tytułem oryginału plus remix.
Workspace. Przycisk.
Przycisk niedostępne, SAVE PROMPT.
Możemy zapisać sobie ten prompt jako…
No zapisać po prostu jako taki szablon.
Przycisk CLEARALL.
Przycisk ZWINIĘTE.
Przycisk NIEDOSTĘPNE CREATE.
Przycisk BACK.
No i BACK do powrotu.
Może jakieś konkretne pomysły, czy robimy coś typowo testowego?
Ja proponuję, żeby zanim przejdziemy dalej,
to żebyśmy posłuchali
pytań, które mamy
od naszego słuchacza, od Mateusza.
Witajcie.
Mam dwa pytanki odnośnie Suno.
Przede wszystkim, czy można wygenerować sobie taki projekt do pliku midi,
który będzie może np. wrzucić sobie do jakiegoś Logica, Reapera, etc.
i potem go jakoś edytować po swojemu.
I zauważyłem, że jest dostępna aplikacja Suno.ai w App Store.
Czy za jej pomocą można sobie w normalnej walucie wykupywać te kredytki?
Z góry dzięki za odpowiedź i pozdrawiam.
Więc tak, co do pierwszego, wydaje mi się, że nie, nie jest to…
Chociaż tak szczerze, nie wiesz, ten zaawansowany edytor na to nie pozwala, tylko no tego nie powiem, nie pokażę i nie… aha, okej.
O ile wiem, to nie. To jest… no psu no po prostu generuje muzykę i tyle.
Teoretycznie można tam, w pewnym momencie, przy zapisywaniu pliku na zysk, można wybierać sobie, żeby on zapisał tak zwane stems,
czyli oddzielnie bębny, oddzielnie bas, oddzielnie wokal i oddzielnie
Wszystko inne, tylko że wydaje mi się, że teraz to działa tak jak wcześniej,
a wcześniej to działało tak, że on po prostu wykorzystywał kolejną sztuczną inteligencję
typu Demux albo inne coś takiego, żeby sobie to sztucznie podzielić.
Inna sztuczna inteligencja wykryła mu, co jest wokalem, co jest z bębnami
i to wyeksportowała, żeby zagrzec do pliku.
Więc nie dzieje się to bez jakichś artefaktów, niestety.
Także to trochę jest tak, jakbym sobie sam to wrzucił właśnie do tego serwisu, który
wywołała takie rzeczy.
Że akurat takie rzeczy nawet lokalnie można odwołać na wielosą przestrzeń.
Podobno w swoim roadmapie ma coś takiego, żeby on jakby, żeby algorytm tworzył
niezależnie bębny, niezależnie bas,
niezależnie w okale i żeby dało się to potem normalnie wyciągać,
żeby on jakby tworzył ścieżki osobno i żeby do tych ścieżek był potem dostęp
i można je było pobierać. Na razie, o ile mi wiadomo, tak nie ma.
Co do pytania drugiego, aplikacja na Androida jest taka sebie, a nie wiem jak na
iPhone’a, bo szczerze mówiąc już iPhone’a nie mam.
Ja mam iPhone’a, ale jeszcze nie sprawdziłem, jak dostępność o tej aplikacji.
Ale istotnie na Androida jest OI.
Wpiszmy cokolwiek po prostu, żeby…
To wpiszmy sobie na przykład…
To…
Nie, dziś…
dziś jest test…
A właśnie, bo możemy wykorzystać specjalne tagi, które nam upraszczają bardziej nie nam, tylko słynno zrozumienie, co jest czym.
On czasem potrafi domyślić się, co chce robić.
Czyli zwrotka, refren, jakieś takie rzeczy.
Działa to tak, że robimy nawias kwadratowy.
Lewy kwadratowy.
Wpisujemy sobie np. intro, vers, chorus itd.
Wpiszemy teraz wersę 1.
Zamykam nawiasy Enter i teraz piszemy sobie.
Dziś jest test. Wielki test. Zobaczymy, co to jest.
Dziś jest dzień. Wielki dzień.
Testuj z nami, nie bądź leń.
No dobrze, niech będzie taki krótki na razie tekścik.
Nie chcemy instrumentala oczywiście.
Co do tego stylu, co by tu wpisać?
Może na przykład spróbujemy na początek disco.
Nie będziemy wykluczali i na przykład
A, u, i, c, a.
Audycja.
Przycisawecleralprzycicrateprzycisk.
Przyskam to.
I teraz, jakby, utwory pojawiają się w dwóch, na dwa sposoby.
Najpierw pokażę ten taki bardziej logiczny, potem ten, który wydaje się na początku bardzo nielogiczny,
ale wydaje się, jak już go poznamy, dlaczego inni tak nie mogą.
Przynajmniej ja miałem takie wrażenia.
Jeżeli chcemy po prostu odtworzyć nasz utwór, możemy iść na górę strony literą K.
A już się tworzy.
Tak, już się tworzy, bo…
A ja sobie wchodzę, ja sobie szukam tabeli akurat.
Tak, tak, ale właśnie to jest drugi sposób, o którym chcę powiedzieć troszkę później.
Okej.
Tak, tak, tak, tak, oczywiście.
Jeszcze chyba nie mogę.
Tu mamy tak zwany playbar, który… o, zobaczcie.
Nie, jeszcze nie.
A to mam wrażenie, że w tabeli to szybciej jest.
Sprawdzimy, to wciskamy teraz T.
Wciskam Enter.
To faktycznie już jest. I teraz tak.
Poruszamy się po tabeli.
Góra, dół.
Natomiast, żeby wejść jakby w interakcję z czymś, trochę jak w Macu,
No i to jest disco lat 70-tych rzeczywiście.
Dziś jest test, wielki test. Zobaczymy, co to jest.
Dziś jest dzień, wielki dzień. Testuj z nami, nie bądź lęk.
Dziś jest dzień, wielki test. Zobaczymy, co to jest.
No jest troszkę podobnie w sumie, no takie…
I tak dalej. Natomiast coś, co ważne, to jest generowane na żywo.
To znaczy, plik może wcale nie być gotowy w pełni, ale my to już możemy odtworzyć
jakby z tego, co się tworzy powoli. Tak.
Czyli takie dodatki mamy w czacie GPT tak naprawdę na podgląd na żywo, co on tam nam tworzy.
Nie mamy tak, że musimy czekać do końca, aż on stworzy całość.
I teraz druga wersja.
Jak widać, to jest troszkę inaczej w ogóle spodziewane.
Ale to też jest takie disco klasyczne z lat 70.
Tak, tak.
O, i nie wiem, czy Instrumentalab się z tym nie stworzył, ale zobaczymy.
I czyżby teraz miał się wokal pojawić?
A to mi Bonnie M przypomina, jak za coś po polsku, która chciała coś zrobić, ale coś jej trochę za poszło, nie wiem czemu.
I sobie takie coś jest.
Okej. Coś teraz zrobić z plikami, do tego przejdziemy zaraz. Najpierw jeszcze zobaczmy sobie nasze suwaczki.
Wejdnę z grupa, wejdnę z suwak pięćdziesiąt.
No wykorzystamy sobie to na zero.
Zero.
I…
I zaraz po prostu zrobimy ten…
Ten prompt.
Czyli znowu jakby nam się tworzy nowe utwory w tym momencie.
Tak, on sobie tworzy.
I w międzyczasie tu widzę, że się jakieś pytanie chyba kolejne pojawiło,
więc może od razu idąc za ciosem odtworzymy tę wiadomość.
O, to będzie wiadomość od Grzegorza.
A, a to Grzegorz nam nie przysłał muzyczki, a właśnie nie przysłał nam wiadomości, tylko…
No, no, no, to jest troszeczkę niekoniecznie.
Jakby Grzegorzu… hamuj, hamuj, hamuj.
Ale był to przykład…
Można i tak.
Dokładnie, to jak widać jest dużo spodob…
Ale zobaczmy teraz jak to z tym suwaczkiem poszło.
To takie jeszcze bardziej disco-disco.
Tak.
Wielki test! Zobaczymy, co to jest.
Dziś jest dzień! Wielki dzień!
Testuj z nami, nie bądź lęk.
Dziś jest test!
A drugi nasz utworek.
Wielki test! Zobaczymy, co to jest.
To jest cała bardzo ciekawa rzecz, bo pomimo wpisania niby jednogłosowego, no to mamy na parę głosów.
Przewstawki, oczywiście tak, to trochę zgadza.
I tak dalej, i tak dalej. Teraz, co się stanie, kiedy ten słówak będzie przesunięty na granicę górną, czyli w drugą stronę?
Ale czy się mogą zacząć dziać?
No, ciekawe rzeczy.
I to nawet bardzo ciekawe rzeczy mogło to wyczytać.
Powinienem Ci trochę popuścić wodę fantazji.
Jeśli ma jakąkolwiek fantazję.
A ma, uwierzcie mi, że ma fantazję.
Oj, tak.
Po tym, co mi dzisiaj pokazał z hardstyle’em, jestem w stanie uwierzyć, że potrafię zrobić wszystko.
I wydaje mi się, że co istotnie dziwne, to będzie.
Tak, tak.
Może jakieś NintendoCore?
No, uwaga.
Co jest?
Tak, dokładnie tak.
Disko eksperymentalne.
Trochę brzmiące jak eksperyment pewnego człowieka,
który był po efekcie niektórych substancji,
jeszcze chyba na niego działających.
No to wystarczy, że chciałbym jeszcze drugi słówek.
Próbujmy sobie na…
Może takie…
Długość.
Przesuwało. Naprawdę się działy ciekawe rzeczy.
Tak, zdecydowanie się działy dziwne rzeczy.
Ja bym może spróbował ten Weirdness dać na powiedzmy 90, bo rzeczywiście 100 to już on leci
i w dość podobny sposób leci.
On rzeczywiście jakoś rozkawałkowuje to sobie.
A być może jak się to da na jakieś 90, to wtedy być może zrobi
coś co nie będzie aż tak eksperymentalne.
Zobacz najpierw to.
Dziś jest test, wielki test, zobaczymy co to jest.
Dziś jest dzień, wielki dzień, testuj z nami, nie bądź lęk!
Dziś jest test, wielki test…
Fajny komentarz.
… co to jest!
Dziś jest dzień, wielki dzień, testuj z nami, nie bądź lęk!
Dziś jest test, wielki test, zobaczymy co to jest.
Dziś jest dzień, wielki dzień.
Tez stój z nami, nie bądź leń.
A z paszy tłum z dziorni.
O, język AI, proszę bardzo.
Ale głupi dziec.
Twoje służysz mi, chcę ściać.
Dziś w zetwik dziećmi naladam.
To jest język AI, który tylko jest, tak?
Tak, i w tym króluje audio.
A druga wersja?
Polskie Disco Polo, wersja Prez Kolei, moi drodzy.
Wielki dzień, wezwój z nami.
Dziś nie oddechaj, mam szeczki na męża.
Siedzimy same, w lachach, jak na mocze.
Ale zauważcie, że naprawdę teraz zrobiła to dość klasycznie.
Druga sprawa…
Znaczy to nie jest… to trudno nazwać już disco jako takie.
To jest już coś trochę naokoło.
Trochę disco, trochę polo.
Tak.
Ale bardzo takie klasycznie brzmiące…
Nie wiem, albo mam wrażenie, albo zrobiło się w nie artefaktów, albo mam tylko takie wrażenie.
To być może jakoś…
To znaczy, ja zauważyłem, że jeżeli mu się robi ten style influence na zero,
to generalnie się dużo mniej trzyma tego, co wpisaliśmy
i to się staje takie bardzo często jakieś ogólne.
Rzeczywiście tego stylu, który wpisujemy, jest trochę mniej.
Czyli powiedzmy, jak wpiszemy metal, toż to nie będzie taki ciężki metal.
To może być już przez niektórych odebrany jako rock, może pop rock, może coś.
Po prostu styl jest jakby bazą, ale jest tylko inspiracją.
Troszeczkę, no.
Co nie wychodzi źle, po prostu wychodzi coś innego, coś ciekawego dalej.
To jest suwak, który ustawiony na zero, to jest na ludzi, którzy nie chcą, nie wiem,
typowego jakiegoś stylu, tylko właśnie inspiracji jakimś stylem.
A myślę, że jeżeli ustawimy sobie ten weirdness na 90 w dodatku,
to to będzie coś takiego, słuchaj, zrób mi coś, zaskocz mnie, tylko tak zaskocz,
Inspirując się właśnie na przykład disco, ale zaskocznie.
Spróbuję to zrobić, zobaczmy, co się stanie.
Zobaczymy, co się stanie.
Bo to może być dosyć ciekawe.
Dopóki się to robi, to ja często w ogóle każę mu robić rzeczy,
które ciężko w ogóle zrobić.
To znaczy wpisuje mu w prompt na przykład disco, metal, fuga, akordeon, tuba, na przykład
i każe jeszcze, musi się trzymać stylu. I wtedy on potrafi pojechać i zrobić coś naprawdę…
Dziwnego.
Wyjątkowego, znaczy dziwnego. Właśnie on jakoś próbuje z tego wybrnąć, różnie mu się to udaje,
Ale czasami też to jest pomysł na to, jak stworzyć jakiś styl, którego nie jest znaczny.
Czyli na przykład…
Zauważam, że on średnio wie, czym jest polski folk.
Można się zastanowić, jaki ten folk jest.
Mamy tu z reguły akordeon, jakieś…
Skrzypce, powiedzmy, i coś tam. To jest z reguły skoczne, żywe, to jest często, powiedzmy, na przykład w tonacji durowej.
Więc teoretycznie można by stworzyć…
Naprowadzić go po prostu.
Naprowadzić go, jakby opisując ten konkretny styl, jaki chcemy zrobić.
Możemy spróbować zaraz zrobić coś takiego dziwnego, natomiast jestem ciekawy tego efektu, który powstał teraz.
Właśnie z tego, co mówiłaś.
Dziś jest wielki test. Zobaczymy co to jest.
Ale skoczne i wesołutkie.
Dziewczyn…
testuj na oprynie.
Eee, eee, eee…
Bibi, Bibi, Bibi, Bibi, Bibi, Bibi, Bibi, Bibi, Bibi.
Bibi, Bibi, Bibi, Bibi, Bibi, Bibi, Bibi, Bibi, Bibi, Bibi, Bibi.
Dżezopolo?
W sumie…
Może takie być.
Dziś jest test. Wielki test. Zobaczymy, co to jest.
Dziś jest dzień. Wielki dzień. Testuj z nami niepodle.
Dziś jest test. Wielki test.
No jest to dosyć ciekawe w sumie.
Ja mam wrażenie, że te 90 to jest jeszcze trochę za dużo, tak pewnie z 85 do 80 to już by było coś.
Ale to jest kwestia w zasadzie no już… gustu.
Dobra, myślę, że tak szybko pokażę te słowaki.
Wiesz co, bo mamy kolejną wiadomość od Mateusza, więc sprawdźmy, jakie ma tym razem pytanie nasz słuchacz.
Witajcie jeszcze raz Mateusz z tej strony. Czy można mieć w jakiś sposób wpływ na akordy, które on generuje?
W sensie jedynie to można go próbować naprowadzać, a tak to raczej już nie.
To znaczy inaczej. I można, i nie można.
To znaczy, można mu wysłać w formie audio zagrane na szukat na fortepianie czy na czymś,
melodie, melodie z akordami, czy coś takiego.
Ja mogę pokazać, jak swego czasu bawiłem się dość popularną melodią,
którą właśnie próbowałem coś zrobić.
A, teraz będzie lepiej.
Myślę, że wszyscy znają tę melodię.
Albo większość.
Coś mi to mówi, ale jak mam być szczery, to bym tak…
To jest dokładnie tak ciężko stwierdzić, nie?
Nie odgaduj, ośliczna pani. To ma też jakiś angielski tekst.
Więc w każdym razie ja dałem tutaj melodię, zagrano na fortepianie po prostu i kazałem mu z tego zrobić właśnie, nie pamiętam czy jakiś smooth jazz, czy coś takiego.
No i jak widać zrobił to.
Mam gdzieś jeszcze wersję z tekstem.
Ale teraz jej nie mogę znaleźć, to znaczy wpisałem po prostu mu tekst
odpowiedni w pole właśnie tam, gdzie ma być tekst i on rzeczywiście to zrobił.
Czyli można mu rzeczywiście robić powiedzmy jakieś covery,
no powiedzmy piosenek czy czegoś, czegoś takiego co jest w jakiś sposób
No, czego on się nie przyczepi, tak?
To mogą być w związku z tym właśnie jakieś piosenki, które wszyscy znają.
Nie wiem, Wlaskotek, tak? Na przykład.
Znaczy nie powinien mieć do tego żadnych problemów.
Nie powinien, tak. Takie piosenki, które po prostu…
Znajdęś ludzi, trochę nie wiadomo kto to stworzył, to się po prostu…
No jest, tak?
Tak, to po prostu jest.
No i prawdopodobnie z piosenki, których próżno szukać w serwisach streamingowych,
no to też podejrzewam, że…
Przepuści.
Tak, może jakoś przepuścić. Różnie to bywa.
W każdym razie można się bawić.
Tak. Więc dobra.
Style Enterson, przyci. Sawe prompt.
Styl Weird Exclude, style Spoledy.
Weird Ex, przyci. Weirdness, grupa.
Sto, dziewięć, oś, sześć, pięć.
Style Influence, grupa.
Style Influence, suwak, zero.
Sto, koniad, en, eksclu, przy, sacle, se, arch, pole, li, bat, sre, ate.
Takie po prostu balans, tak?
Tak, ale że te słowaki jak są ustawione na pięćdziesiąt, to one mimo wszystko, jakby pięćdziesiąt już jest dużo.
To znaczy mało dziwne i dużo się trzyma jednak oryginału.
Po prostu takie zwyczajne, tak?
Tak. Choć na przykład gdybym, tak jak mówiłem, kiedyś spróbowałem zrobić coś takiego jak chyba właśnie metal.
Metal, folk, tuba, akordeon i chyba jakiś klasykal i fuga, jakieś pomieszanie dziwne rzeczy.
To na przykład bym zrobił coś takiego.
To chce być jazzem, czy coś tego typu?
Nie wiem.
Ale ciekawe.
Trochę jak z filmu?
Może? Nie.
Z filmu to ja wam potem pokażę jeszcze, co zrobił.
To ja też mam takie ciekawe różne…
No i tak do końca utworu to trwa tam prawie 4 minuty w sumie.
No, ale jest to dosyć ciekawe.
Dobra, co my tu mamy?
Ok, a drugi?
Zasubskrybujesz kanał, by być na bieżąco.
Zobaczymy, co to jest.
Dziś jest dzień, wielki dzień.
Testuj z nami, nie bądź ślej.
Dziś jest dzień, wielki dzień.
Z czego widać, że faktycznie próbuje się trzymać.
I to tak dosyć ciekawie.
Co mu na pewno nie najlepiej wychodzi, to jest klasyka.
Brzmienie fortepianu. Fortepian to jest coś, z czym ma wielki problem.
Tak samo jakieś problemy na przykład z pianinem, który był często przesterowany.
Tak, ono jest sztuczne.
Im bardziej jest coś takiego akustycznego, ale może nie to, że gitary, bo gitary to jeszcze jakoś ogarniamy.
Gitary jeszcze bardzo całkiem przyjemnie.
Ale jeżeli to ma być utwór taki a la klasyczny, no to wychodzi mu to różnie.
No chyba, że jest to jakaś klasyka, no bo klasyka, no to jest troszeczkę też co innego.
Znaczy filmówka, przepraszam.
Jeżeli to jest muzyka taka typowo filmowa, to to się jeszcze jakoś, jakoś trzyma.
Natomiast w takiej klasyce, klasyce, to…
to tak nie bardzo mu to wychodzi.
Myślę, tak jak powiedziałem, wychylania skrajne,
a potem zobaczymy jakiś taki faktycznie, jak bym mówił, mix.
Zero, style zero.
A zero zero to chyba mieliśmy już.
Nie, mieliśmy zero sto, gdzie było dziwne tam na dziewięćdziesiąt, a to było na zero.
On na zero to zawsze jakoś mieli to i to jest właśnie takie przedziwne.
I mam wrażenie, że pięćdziesiąt i pięćdziesiąt.
Aha, dobra, już wiem. Dobra, 0-0, dobra, we’re in the zone, 0-1.
3-3-3, proszę. Zaznał. Koniec minut. Zazn…
I ten klawisz. Zaznał.
Dziś jest test. Wielki test. Zobaczymy, co to jest.
Dziś jest dzień. Wielki dzień. Testuj z nami, nie bądź leń.
Ok, i drugi.
Od razu rozpocznę, abyście wszystko…
Świetnie. Wielki dzień.
A mi nie bądź lęk.
A.
A.
A.
A.
A.
A.
A.
W ramach eksperymentu.
O, chyba jeszcze nie…
Nie stworzyło go.
Czy to jest takie dziwne?
No właśnie, bo akurat…
Znaczy jest trochę nietypowe, ale nie jest jakieś dziwne.
Być może tu właśnie chodzi o te… mieszane prompy też.
A może…
Mówię, teraz spróbuję pewien bardzo dziwny eksperyment zrobić i zobaczymy, co będzie w takich bezskrajnych, już nie w każdym razie, ale…
Przyatki adverse 1, G kontra 1. Spasje na 10.
Testuj znawki, nie bądź leli. Enter styletki, więc co?
Extrude styles przy…
W ogóle instrumental zrobił to ciekawe. No dobra. Tak.
Chodźmy do drugi.
Coś takiego jakoś się nazywa, tylko nie wiem jak to się nazywa.
Ale taki styl faktycznie istnieje, który jest w rzeczywistości tego typu.
Czy to jest dziwne? No nie wiem, chyba nie.
Te dźwięki w tyle są dziwne, ale tak to to…
Strasznie dziwny jest clap tutaj.
To się akurat takie zdarzało.
Chociaż przyjemny, mięsisty w miarę.
Dobra, no to by jeszcze mnie rozkręcało długo, więc to nie jest jakieś mega dziwne.
Dobra, to co teraz? Spróbujemy zrobić…
No to czy sobie tak…
Chiptune…
Chiptuned…
Hands up.
With metal sections.
A czy ja jestem w stanie wymyślić, panie kochany?
Zostałbym na 50-50 na razie, może?
Tak, ten sam. Będzie też ten sam tytuł.
Tak, po prostu żeby to…
Dla porównania, na przykład model 3,5 rok temu próbowaliśmy zrobić jakąś muzykę taką do reklamy.
Więc tam był jakiś soft rock, energetic, coś tam, coś tego typu.
I rzeczywiście… Wyszło!
I tu po prostu na tym tekście miało być, znaczy na tej pustyni miał być jakiś tekst, który tam… coś tam.
I to jest model w wersji 3.5.
Czyli tej, która jest jakby darmowa, nazwijmy to.
Tak. A to jest też druga wersja.
No więc, jak najbardziej do jakichś reklam, do czegoś, co się absolutnie nadaje.
Tak, jakieś dżingle na przykład.
Troszkę słychać taką ziarnistość, takie coś.
Z dżinglami to mam wrażenie, że jest nieco większy problem, żeby dżingla na tym zrobić.
Króciutkie coś, co ma swoją melodię i zmusić suno do tego.
To znaczy, z tego co wiem, to ludzie robią to tak, że każą mu tworzyć jakieś dłuższe rzeczy,
a potem to po prostu tną, wycinają jakieś poszczególne fragmenty.
No tak.
I słyszałem na kilku grupach właśnie radiowych na Facebooku efekty tego.
I to nawet całkiem nieźle się udało.
Ale jakby od samego początku do samego końca suno nam niestety dżingla jako takiego niezrobki.
Niezrobki.
To jest problem. Chyba, że ma dobry dzień jeszcze.
Chyba, że ma dobry dzień. Bo jak ma dobry dzień, mówi jeszcze zrobić wiele.
Ale dobra, zobaczmy nasz eksperyment.
Okej.
Okej, nie mam pytań.
Ale jest to ciekawe.
Tu się chyba najbardziej metal wybił, mam wrażenie.
Tak.
Okej, zobaczmy to drugą wersję.
Ale jest bardziej tytunowe, patrz.
Jesteś wielki dzień. Zobaczymy, co to jest.
Jesteś wielki dzień. Zastój z nami, nie bądź lej.
Okej, a jak polecasz teraz ustawić suwaki, żeby to wyszło jakoś tak, wiesz…
Można.
W jaki sposób by to zrobić?
Przycisk.
Styl raczej, żeby się trzymał, żeby się nie trzymał i tą dziwność.
A to jak to byś polecał?
Ja bym zrobił, żeby się stylu nie bardzo trzymał i dziwność na jakieś 80%.
To może być dość reaktywne.
Zobaczymy.
Ciekawe, jak by się utrzymać stylu. Czy wtedy by odwalił Wanianę, czy by się obraził?
Nie, on rzeczywiście próbuje, zwłaszcza, że akurat chiptune z różnymi gatunkami jest często spotykany.
Tak, ale jeszcze bez wieszczu.
Takie są w cloudach, czasami w Spotifyach, więc to są takie rzeczy, które on wie jak zrobić.
I mamy kolejną wiadomość od Mateusza, więc posłuchajmy.
Witajcie, to jeszcze raz ja. Myślę, że już ostatni raz.
Czy jeśli na przykład będę chciał opublikować coś stworzonego przy pomocy właśnie Suno,
czy na YouTube’a, czy na Facebook’a jako filmik, piosenka autorską,
to czy muszę oznaczać, że stworzono przy pomocy Suno?
Chciałbym go, szczerze mówiąc, spróbować wykorzystać,
bo mam trochę spastyka w rękach i nie jestem w stanie wszystkiego zrobić sam.
Wiadomo, niby ma się tam kilku znajomych, którzy teoretycznie mogliby pomóc,
ale nie zawsze mają czas, żeby pomóc, a myślę, że fajnie,
by było jakoś tam tą AI się wspomóc przy produkcji.
Ja bym zalecał. Po pierwsze, żeby nikt się nie szczepił, ale po drugie…
To znaczy inaczej. Moment. Jeżeli robisz to na wersji płatnej, to ty masz prawa do tej piosenki.
Co z tym zrobisz, to tam wszystko jedno. Jeżeli tworzysz to na wersji darmowej, to mają prawo do tego oni
i raczej musisz to zrobić, według prawa przynajmniej. Dobrze by było.
Myślę, że jeżeli to nie jest komercyjne, to raczej nikt się nie szczepi, ale…
Natomiast z tego co wiem, w ogóle Suno ma być również taką komercyjną platformą
do właśnie różnych film, które robią jakieś reklamy, jakieś takie rzeczy.
Więc podejrzewam, że przynajmniej tworząc to, mając wykupioną wersję darmową,
to z tego co wiem, możesz to udostępniać pod własnym imieniem i nazwiskiem nawet.
Tak, tak, tak, tak.
Ma się na to prawo wyłączności, więc jakby wtedy to…
Ok, to nam wyjdzie z naszego…
No dobra, a drugi?
Tu prawie w ogóle nie ma tych…
Czekaj, zatrzymam, bo teraz muszę…
Tu prawie w ogóle nie ma tych chiptunesów.
To jest w ogóle bardziej punk niż metalina sprawa.
Tymczasem mamy telefon. Grzegorz jest z nami tym razem. Witamy. Słuchamy.
Cześć wam. Tak myślę, że za niedługo będziemy słuchać muzyki tylko właśnie.
Z Suną albo z innych takich podobnych.
No, tą piosenkę, co wysłałem, to właśnie zrobiłem ją na wersji pro,
ale powiem, że się męczyłem z tym całą noc, bo zawsze ta pierwsza wersja nie pasowała.
Potem, żeby tam tekst, no właśnie tekst, żeby zmienić, dodać, to jak się męczyłem.
W zasadzie to mam takie pytanie, właśnie, czy jakby wstawić, no bo jest tam
przyszli audio w tym, w tym sunu i właśnie, czy można byłoby także,
można by było wygenerować piosenkę ze swoim wokalem?
No tak, tak, bo możesz normalnie mu zaśpiewać, masz taki przycisk nagrań
I możesz mu zaśpiewać, albo zagrać samemu, na jakimś instrumencie, podkład coś zaśpiewać.
No i on próbuje coś z tym zrobić.
Ciekawe są wbrew pozorom efekty czegoś takiego, kiedyś próbowałem z kolegą w Krakowie, swoją drogą w internacie.
Nagrałem, ktoś z kimś tam rozmawiał przez telefon przez chwilę i… no cóż, wyszło to dziwnie.
Aha. Czyli tak zasadniczo można na przykład, żeby w piosence był mój głos.
No i tam tekst…
W teorii tak, a w praktyce no to różnie z tym jest.
Aha, to różnie wygląda.
Tak, znaczy bardziej audio się tego trzyma. Rzeczywiście audio potrafi dużo bardziej,
jakby jest dużo lepszy w analizę, że tak powiem, głosu i taką próbę oddania właśnie głosu.
Udio ma swoje problemy.
Co do udio, to właśnie nawet w tym płatnym planie to chyba nie można stworzyć dłuższej niż 4-5 minut.
To znaczy 2 minuty za jednym razem można przedłużać piosenkę.
Aha, to tak.
No to tak trochę, no bo w Suno można jakby za jednym razem można tam właśnie jakby…
Tak, w Udy jeszcze nie.
No jak widać, no po prostu trochę inne podejście, UDS jest młodsze, tak? Pierwsze było Suno Audio, później się pojawiło jakby.
To jest jedna rzecz, poza tym Suno chyba lepiej umie w marketing i więcej, tak mi się wydaje, że więcej ma użytkowników.
Że to Suno to się zrobiło mimo wszystko bardziej…
Jakby Renault Mesa jakoś się zbudowało też.
Tak.
No to jak co od GPT na przykład to już jest takie synonim pewnie jak…
Tak. No tak. Wiadomo, że Gemina gdzieś tam się w tle przewija i tak dalej,
ale te Cloudy, to wszystko, ale…
ale ten GPT jednak gdzieś tam zawsze na szczytach, nie?
Nawet dużo osób używa tych modeli, czy BMI, czy Microsoft.
Tak, i to wszystko jest na GPT, że…
I cztery, a dwa otwarte. Cztery oczy, cztery zwykłe, to zależy od produkcji.
Aha. No i jeszcze jak mam na przykład, no mam ileś tam set podkładów, albo swój podkład, jakiś instrumental stworzę do suno, to pewnie też by mi tam tekst napiszę w tym suno i pewnie ten…
Wygeneruje to po prostu…
No to znaczy, będzie się trzymało tego podkładu, co ja wrzuciłem, no i tam…
tekst wygeneruje…
Powinno.
Aha.
Warto spróbować na pewno.
Aha, o, no to spoko.
A jeszcze jest taka…
A właśnie tam o aplikacjach, wy się gadali.
W Udio nie ma aplikacji żadnej, nie?
Teraz ja wiem, że nie ma.
Chyba nie ma, nie? Nie ma.
Nie ma.
Wydaje mi się, że nie ma.
Pewnie kiedyś zrobią, przynieść z Korby te aplikacje.
Pewnie też kiedyś do tego dojdziemy, ale to…
No bo co to są, no to są te aplikacje.
I…
No tak powiem…
Tak, stworzyć się da.
Jakby…
Czy tekst napisać, czy jakby tam…
Można tam do tej, do Exploruj, czyli tam, to Exploruj to zasadniczo, tam można wyszukać, tam można jak się wejdzie w jakiś utwór, to można normalnie jak w TikToku do następnego utworu przewijać, tam można podłączyć to wszystko.
Tak, właśnie, bo też w sumie nie powiedziałem, jeżeli ktoś ma przyciski multimedialne na klawiaturze albo na słuchawkach, tak jak ja teraz robiłem w większości,
Możemy używać przycisków pauza, play, poprzedni, następny i to działa.
Tak, tak, no bo to działa jak otwarzasz.
Tylko jest właśnie na iOS-ie pewnie też, choć nie spojrzałem,
ale na Androidzie jest właśnie…
po niewidomemu nie dostaniemy się do swojej biblioteki
ani do ustawień konta.
Trzeba po prostu wyłączyć Talkbacka i na czuja obok przycisku Music, bo tam jest taki przycisk,
po lewej stronie po prostu stuknąć i wtedy do własnej biblioteki się można dostać.
No i jest to po prostu nierozumiałe. No i są problemy po prostu, tak? No niestety.
Tak, właśnie, no…
Ale tak, no to tak…
A, właśnie ten edytor właśnie, bo…
Ja w ogóle to próbowałem zrobić z przeglądarki przez telefon,
ale to się chyba za bardzo w ogóle nie da.
Czy to na komputerze ten zaawansowany edytor wsunął to jakoś w działa, czy też…
No tak jak powiedziałem, raczej jest niedostępny i to jest ten sam problem co w audio, pewnie jest dużo graficznych tam wysyłaczków, znaczków i dlatego niestety raczej jest niedostępny.
Ale jest ustawa o dostępności już weszła, to myślę, że można tam do nich pewnie…
Skoro to działa już na terenie Unii Europejskiej, no to jakieś tam, myślę, standardy dostępności powinno to już spełniać,
Więc myślę, że powinno się jakoś tym zająć, po prostu, no bo no…
No fajne to jest, ale…
No oby, oby.
No.
Zobaczymy, co będzie. Na razie mamy, co mamy.
A i tak jest już… No dobrze, tak? Możemy dużo zrobić.
Przynajmniej przez stronę. Jeszcze żeby się tak dało przez apkę, to by było fajnie.
Znaczy to przez apkę da się też wygenerować, da się.
Tylko macie problemy z dostaniem się do tego, co się wygenerowało.
To jest właśnie problem.
Tak, no to tyle.
To pozdrawiamy w takim razie.
Dzięki Grzegorzu za telefon. Cześć.
I mamy jeszcze jedną wiadomość na Whatsappie tym razem.
Kornelia się nagrała.
Generalnie Sunoo ma bardzo dobrą aplikację na iPhona.
Generalnie jest dostępna, myślę, że tak w większości.
Audio to jest najsłabszy.
I jeszcze jest, on jest dość nowy, Refusion się nazywa.
I on jest tylko przez stronę się wchodzi, nie ma aplikacji, ale na iPhone’ie też sobie można przez stronę.
I on jest też bardzo dobry, bym nawet powiedziała, że chyba…
I on jest darmowy w darmowej wersji, w sensie ma też płatne, ale w darmowej wersji też robi…
W sensie jeśli chodzi o darmowe, to on jest lepszy od sunu darmowego,
a najlepszy, jeśli najlepszy ze wszystkich, to chyba płatny sun jednak.
A widzisz…
Trochę słyszałem, nie słyszałem.
Znaczy ja słyszałem i testowałem, ale jakoś zupełnie mnie nie zachwycił ten Refusion.
Wolałem tam kilka rzeczy zrobić i wyszło jakieś takie zupełnie absolutnie bez szału.
Ale no nie wiem, może miałem pecha.
Może coś się zmieniło.
Okej, myślę teraz przejdziemy do tych akcji na plikach, które możemy robić.
Pokażę nam już całe menu, które można…
Nie, znaczy, najpierw sobie jakiś plik wrzucimy tutaj.
Czyli robimy audio.
I teraz mamy dwa przyciski.
Możemy Record lub Upload.
Wciskam Upload.
I wrzucimy, tak jak powiedzieliśmy wcześniej, coś, co każdy zna, więc raczej nikt się do tego nie będzie miał powodu wczepiać.
To jest folder.
To jest folder.
Gdzieś to było.
Inaczej zrobię, słuchajcie. Ja mam już pewien…
Ja już byłem wrzucony na piosenkę, ja wam po prostu pokażę, jak się wrzuca.
Na przykład wrzucimy sobie…
Na przykład weźmy sobie jakiś dźwięk, wrzucimy.
Mam ci takiego, po prostu spróbuję to wrzucić i tyle.
Wtedy musimy kliknąć Save.
I teraz czekamy, czy będzie problem, czy nie. Nie powinno go być.
No dobra, no i teraz możemy wybrać… możemy od razu przejść do tego, ale możemy też wybrać akcję.
Czyli wydłużyć lub skowerować.
No później.
Ponieważ ja wam pokażę na podstawie znanej raczej wszystkim piosenki Czerwonej Bóry,
czyli bardzo popularnego disco-poro, dlatego że to mam wrzucone.
Tak jak mówię, to jest coś, co raczej nie będzie pomocą, żeby ktoś miał się do tego przyczepiać.
Wpiszę w bibliotece.
Oj, czyżby nie…
Jeden zaznaczony element.
Playsong metalowa.
Jeden zaznaczony element.
Jeden zaznaczony element.
Jeden zaznaczony element.
Jeden zaznaczony element.
Jeden zaznaczony element.
Jeden zaznaczony element.
Jeden zaznaczony element.
Poczekaj, pokażę akcję na…
O, jest.
Dobra, mamy sobie piosenkę. I teraz, co mogę z tym zrobić?
Remix edit, czyli…
Otwór edytorowy, o którym mówiliśmy.
Cover, czyli no, coveruj, czyli to, co chcemy, że zrobimy też.
Extend, czyli wydłuż. Możemy spróbować, jeżeli będziecie chcieli.
Chociaż by to wolało na dźwięku zrobić jakimś.
Tutaj chodzi o to, że tak jakby możemy sobie użyć
albo tego stylu, albo tego napisu do czegoś.
Tekstu, przepraszam, do czegoś, do innej piosenki.
Krop, czyli przytnij.
Myślę, że nie wiem, czy to miałoby…
Ja to rozumiem tak, że na przykład mogę zamiast bębnów zrobić, nie wiem, talerza.
Ale nie wiem, czy to tak działa, ponieważ tego nigdy nie używałem.
I to jest w ogóle jakaś nowość.
Może ty, Tomek, coś na ten temat bardziej wiesz.
Jeszcze raz, bo tutaj szukałem troszeczkę.
To Replace Section, bo ja to rozumiem tak, że na przykład mogę wyrzucić, nie wiem, w harmonię i wrzucić zamiast niej pianino.
Bardziej Section, wydaje mi się, że to bardziej fragment utworu, od minuty do dwóch minut.
A, to w ten, no to też może tak być.
Okej, ale…
Create.
Mamy remastery, czyli możemy po prostu przemienić to na to, tak jakby on to stworzył.
Song Radio, czyli sobie tworzymy z naszych pioseneczek po prostu… no radio się sobie lecą po kolei.
I to na przykład ten remaster. Kiedyś zrobiłem taki eksperyment, zostałem do tego namówiony.
Ktoś chciał jakąś muzykę z infolinii, już nie pamiętam jakiej.
No i wrzucił mi po prostu nagranie z telefonu, czyli wiadomo,
barna jakość, mono. I wrzuciłem to do sumy, okazałem mu, co zrobić.
Jeżeli to była taka dosyć prosta muzyka, w której były, powiedzmy,
dwa, trzy instrumenty, to on sobie poradził. Zrobił to w wersji stereo,
ładna jakość i rzeczywiście zachował w miarę te nutki, które były
W oryginale gorzej, gdy przyszło do zrobienia tego samego z czymś bardziej skomplikowanym.
Wtedy sobie troszeczkę popłynął, gdzieś tam sobie potworzył.
Halucynował.
Tak.
Tak.
Co my mamy dalej?
Dead Stems, Nef 3 z 6.
Dead Stems, czyli to co mówiliśmy wcześniej, czyli możemy wyciągnąć tę partię.
Adpto QoE 4 z 6.
Będą kolejki.
Adpto Playlist 5 z 6.
Dobre listy.
Moweto Workspace 6 z 6.
Zacznijmy od miejsca, że będziemy już coś z tym robić.
Opublikuj. Szczegóły.
To znaczy inaczej. Miejsce. Chodzi o to, że możemy mieć sobie w rodzaju takich…
No właśnie, takich przestrzeni typu utwory dziwne, utwory do pracy,
utwory jakieś humorystyczne dla znajomych.
Po prostu kategoryzować je w jakiś sposób.
Tak, i to są takie powiedzmy, że kategorie, czy właśnie workspace dla nich,
w których można wrzucać różnego rodzaju utwory i wiedzieć, że to jest tu, to jest tu.
To jest kwestia uporządkowania.
No tak, taka kategoryzacja.
Podziel się, to znaczy…
Jeszcze w konkretnym czasie.
Albo na przykład nie, mail, czy messenger, czy…
No i pobierz, tak żeby zgłosić brzydy śmieci.
Audio 1 z 4, WavAudio Pro genera… WavAudio Pro 2 z 4, genera te video 4 z 4.
Czyli na przykład jakbyśmy od Juba chcieli wrzucić, to możemy z tego teraz video zrobić.
Tak.
Okej, mamy tę piosenkę.
Przecież Wav jest dostępny tylko w wersji Pro.
Tak, tak. To jest określone, widać to, bo jest to nawet tutaj zaznaczone.
Ale tak mówię, w razie czego może ktoś mnie zauważy.
Oczywiście. Oczywiście, dobra. Myślę, że spróbuję zrobić teraz ten cover.
Doc visi, son publisk, mowe tovor, ad topl, ad to getz, treat, remix, opening, sover, dwa, sunoajm, alert, sunoajm, usic, sunoajm, przy, ad dior, werse jeden.
Latają dziewczyny za moją osobą, a ja taki głupi za tobą, za tobą.
No i tu mamy po prostu tekst, który mam wyciągnięty na czysto z utworu.
W, przycisk, instrumental, se, full song, przycisk, byline, przy, przycisk, przycisk, enter, style, hip tune, hand, sub, witch.
Tu mamy cały czas ten sam styl i szczerze bym to zostawił tak dla ciekawości.
Co o tym myślisz?
Można, pewnie.
I zostawimy słowaki tak, jak były tam, czy zmieniamy je jakoś?
Można zostawić.
Zobaczymy, co z tego wyjdzie. A to może wyjść bardzo dziwne.
Może wyjść.
W ogóle też dla tych, którzy poszukują jakiejś kreatywności,
polecam wrzucanie tam dosyć jakichś nieoczywistych dźwięków.
Tak, na przykład logo Windows XP. Znaczy się, start.
To też, ale ja na przykład wrzuciłem kiedyś ekspres do kawy.
To jest jakby efekt? Aha, tak.
To ja zrobiłem kiedyś drum’n’bass z płuczonego szkła.
Ale to w sumie dobry pomysł. Spróbujmy zrobić pewną zaraz sztuczkę.
A to bież jako cover, czy jako extant?
Jako cover chyba.
Aha.
Albo extant?
Jeszcze nie pamiętam.
Także z tego naprawdę mogą wyjść ciekawe rzeczy nieraz.
Tak. A co wyszło nam z naszego disco?
No dobra, okej, okej. Jak widzicie, to wyszło bardziej takie disco, takie folkowate.
Coś takiego. Folk rock to ma jakąś nawet nazwę.
Tak, folk, metal folk.
Być może.
A druga wersja?
No i właśnie, nie?
No, a, no.
Ale trochę bardziej jazzowe.
O, jeszcze ekspresyjny się zrobił.
Tak, troszkę zmienił melodię, nie?
No.
No, to tak wygląda rzeczywiście koferowanie.
Natomiast co do tych dźwięków, o których powiedziałeś przed chwilą, możemy spróbować eksperyment.
Teraz tu coś zapodamy, jakiś dźwięk, nie wiem co. Na przykład wiertarkę.
Nie wiem czy teraz, to jak będziesz szukał dźwięków, to ja opowiem.
Tylko może Patryku, to jak będziesz szukał, to wyłącz dźwięk, żeby po prostu nie przeszkadzać.
Zerowanie udostępnianiem ekranu. Wycisk. Zatrzymaj. Naciśnij Alt-Up.
Rozpocznij.
O, już chyba jest okej? Nie słychać? Czy słychać cały czas?
Tak, to już…
Słychać się całda, czy teraz nie?
Nie, teraz nie, bo zakończyłeś udostępnianie.
W każdym razie, wrzucałem tam na przykład fasolki.
No wiem, że fasolek nie ma na niczym.
Po prostu chciałem potestować te wszystkie algorytmy.
I zauważyłem, że ten algorytm ma duże problemy,
z głosami dziecięcymi.
Tak.
Prawdopodobnie głosy dziecięce…
No mało jest piosenek z głosami dziecięcymi, więc rzeczywiście
przynajmniej w wersji 3 albo 4, chyba 4, ale nie 4,5 tylko 4,
on nie bardzo umiał
dziecięce głosy w ogóle jakoś
jakoś podrobić.
W ogóle dziecięce głosy, okazuje się, że to jest trudniejsze niż się wydaje.
Już kilka razy próbowałem z pomocą różnych sztucznych inteligencji
takie głosy dziecięce robić i to wcale nie jest takie łatwe.
I okazuje się, że głosy dziecięce to nie jest tylko barwa,
ale to jest też sposób mówienia najprawdopodobniej.
O tym w ogóle można pisać różnego rodzaju.
Myślę, że ileś prac naukowych na dobrą sprawę.
Jak rozpoznajmy, że dany głos jest dziecięcy?
Bo wcale to chyba nie jest takie proste, jak się nam może wydać.
Ja na przykład zauważyłem, kiedyś kolega pokazywał,
jak nagrał swój igiełz tam kiedyś dawno temu na kasetach,
potem zgrał to na komputer i używał tego w RVC,
ale on był tym głosem i faktycznie brzmiał to jak on mówiący,
będący dzieckiem, tylko mówiący dorosłe słowa.
No wiesz, chyba co on na myśli.
Wiem, to od pewnego momentu działa,
Ale często w takich głosach typu pięć, sześć, siedem lat, to to nie działa.
Bo właśnie też czegoś takiego próbowałem.
A jaki był ten efekt? Co sumo wtedy stworzyło, jak mu wrzuciłeś te fasolki?
To znaczy, stworzyło albo jakąś panią, która śpiewa, albo pana, który śpiewa to samo.
W sensie tak po prostu, okej.
Po prostu, tak. Nie było w ogóle słychać…
Typo dziecka.
Nie było głosów liświęcych w ogóle.
Dobra, mamy szpiliczek, już go…
To teraz jeszcze raz udostępnij ekran.
I możemy działać.
Jeszcze potem…
Bardzo głupiego wziąłem, ale specjalnie.
Mam coś tak…
A, dobra, powiem.
Zaczekam, aż się wstąpi.
Ej, dlaczego kogo nie wygrywałem?
Chyba łącza, to nie jest dźwięk.
Zrobiłeś to raz jeszcze w ogóle, nie? Ale…
Teraz jeszcze jedno, tak…
A, już wiem.
Po prostu wymażasz do ścigania.
Jest. Coś bardzo głupiego.
Ale specjalnie.
3, 2, 1…
Jestem bardzo ciekawy, co on z tego zrobi.
Naprawdę jestem mega ciekawy, co on z tego zrobi.
Ja bym chciał lepiej sobie coś skoverować.
Aha, wpisał instrumental jako…
A ja to wymarzę, po prostu zostawię to puste.
Co wpisujemy w styl? Jakiś pomysł?
Nie wiem. No, wymyśl coś.
Chciałem na przykład…
Hardcore.
Tu sobie nazywam 50 na 50 oba.
I zobaczymy, bo to jest bardzo ciekawe, co on z tego może stworzyć.
To prawda.
W ogóle też takim sposobem na to, żeby
Spróbować stworzyć śpiewającego kogoś,
typu, na przykład, nie wiem, jeżeli ja bym nie umiał śpiewać.
No, kiepsko mi to wychodzi.
Mogę wrzucić tam swój głos mówiony.
Tak, ja to zresztą zaraz pokażę.
Czasami jest w stanie stworzyć głos śpiewający.
Zresztą spróbuję sobie coś zrobić.
Przy, przy, suno, ho, przy, przy, dwa, zaz, zaznaczono, blastoff.
Chyba nic z tego nie ma i w ogóle jakiś rock powstał, to metal.
Tylko na jednym dźwięku, tak jak tam był jeden dźwięk, to tu jest jeden po prostu…
Tak. Odwróćmy.
Też.
Tak.
No dobrze, a teraz zobaczmy, co się stanie, gdybym extend tego dźwięku.
…przycich…
Bo też jest dosyć…
Zazna… zaznaczono blast off.
…plab…
…opening…
…sunowaj…
…za pole edycji z auto-uzupełnianiem 0,0…
…przycich…
…link…
…przycich…
…remix…
I remix też. Ten plik, ten przycisk, no to się dokładnie tak samo.
No i co wtedy mi zrobisz,
Zaraz właśnie pokażemy to z głosem i jeszcze pokażę remaster.
Spróbuj zremasterować swój głos, bo to też może być naprawdę interesujące.
Nie wiem czy kiedyś próbowałeś?
Swojego akurat nie.
Próbowałem chyba jakiegoś Gomułki czy kogoś takiego.
Pewnie jakieś głupoty wychodziły?
Nie, to już oczywiście taka muzyka lat 60-tych, troszeczkę taki jazz, nito coś.
I właśnie on, który śpiewa, faktycznie miał ten swój głos.
Ale zobaczmy jak jest ten…
Czuję, że sobie muszę muzyczkę narobić.
Tak…
Aha jak wypa… okej.
No też taka w sumie… taka trochę te klimaty wygłaszającej byłaby na mnie coś może pasujące.
Takie napięcie… no…
Ale mi to strasznie trensem zajeżdża, nie wiem czemu.
Dobra, a jest druga wersja?
Wow!
Jakiś tu jakąś muzyczkę…
stworzył do tego.
Tak.
A ja sobie z ciekawości spróbowałem…
Spróbowałem…
To ja spróbuję zrobić może coś z…
Teraz ten głos jeszcze rzucać.
Na chwilę go wyłączę od głosu.
Teraz ja zróbę ten głos.
No, no, no.
Ty też.
Przycisk dialog, dialog, przycisk resort, odwiedź alert suno i music, odwiedź przycisk close, 0000, 0000, przycisk 8mm audio przy 0000 przy 8mm przycisk close, przycisk, przycisk, close, przycisk.
Nie wiem czy to idzie, czy nie idzie, zaraz sprawdzimy najwyżej, jak pisać ten przycisk, czy to się faktycznie idzie.
No ja sobie tutaj mówię, mówię, mówię, prawda, nie mówię nic takiego bardzo konkretnego, ale to tylko dlatego, że chcę, żeby zobaczyć co się stanie z tym głosem.
Najpierw oczywiście go zremasterujemy. Zobaczymy, jak będzie brzmieć mój głos w remasterze.
Myślę, że tyle tego wystarczy, jeżeli to faktycznie nagrywa.
Alert, czy udostępnić dźwięk?
A, bo on rozumie.
Suno, co? Pamiętaj, udostępn…
Pamięt… Spacja, ozna…
Udostępn… Dialog.
No tak.
Zero trzy, zero zero zero jeden, zero zero zero dwa.
No więc dzień dobry, witam bardzo serdecznie w tym i tak nikomu niepotrzebnym teście.
Zobaczymy, jak wyjdzie mój głos po zremasterowaniu go przez Suno, czyli przez coś,
To jest to, co tak naprawdę ma tworzyć muzykę.
Możemy też mu zaraz spróbować cover, czy tam extend i z tym głosem na przykład, żeby coś mój głos zaśpiewał.
A pewnie to i tak nie wyjdzie. Natomiast, co z tego będzie, zobaczymy.
Chyba się nagrało.
Tak, zapiszemy to sobie.
No tutaj bym się bardzo zdziwił, gdybym walił błąd.
Zobaczymy.
To byłoby dość dziwne.
Idź teraz w bibliotekę.
Trochę zajmuje, że się załadowała.
Jeden, jeden, jeden zaznaczony element.
Playsong 32.0 s, resorting jul 9.
Jeden zaznaczony element, Playsong Blasto.
Nic ciekawego, ale jest to.
No tak.
No więc, dzień dobry, witam bardzo serdecznie w tym i tak nikomu…
Jakieś w ogóle odszumia przykład, co ja tu widzę, ale okej.
Zobaczymy, jak wyjdzie mój głos po zremasterowaniu go przez Suno.
I tak dalej, i tak dalej. I zobaczymy, co z tego da się…
Prawdopodobnie ten otrzomiacz jest w Firefoxie po prostu.
Wiesz co, jest to możliwe. I nie wiem, czy to jest coś, co zrobić, tak szczerze mówiąc.
Znaczy, jak ktoś już się nie chce być otrzymany, to zawsze można po prostu wysłać plik z głosem.
Albo odkonfigiem trzeba by się było bawić i wyłączać.
Pewnie tak, no ale tego też jakoś często się nie używa. Zresztą on też nie jest jakiś tragiczny, więc może coś z tego będzie.
Zaznaczono trzy…
Nie ma.
No więc dzień dobry, witam bardzo serdecznie w tym i tak nikomu niepotrzebnym teście.
Zobaczymy jak wyjdzie mój głos po zremasterowaniu go przez Cuno, czyli przez coś, co tak naprawdę ma tworzyć muzykę.
Możemy też mu zaraz spróbować głos…
Ale taki głos jest realny.
Myślę.
A drugi?
Troszkę mi przypomina naszego nowego kolegę wewnętrznego artystycznego.
Słuchajcie, nie wiem czemu, ale…
Zaraz spróbować. Głozer, Extend i z tym głosem, na przykład, żeby coś mój głos zaśpiewał.
A pewnie tak nie wyjdzie. Natomiast co z tego będzie?
Czym jest głozer? To mnie interesuje, tak szczerze mówiąc.
Nie wiem.
Może nawet… Widzicie, słowotwórczy jest to suno strasznie.
Cóż, głozer. No dobrze, może i głozer.
Właśnie sobie wyobraziłem kogoś, kto używa suno jako zmieniacza głosu.
Cóż, no można i było się tam.
Patrząc na jakość tego, by się dało.
Dobra, a teraz ten cover.
Czy to backstand? Nie, no chyba cover, nie? W czym takie coś?
Może…
A, no tak. Ja nie chcę spoken wordu, tylko chcę, żebym sobie zaśpiewał.
No to co wcześniej masz nawet.


Enter. Styl. N. Pusta.
Styl sobie wpiszemy. Nie wiem, disco znowu.

Albo co?
Niech sobie poleci. Zobaczymy, co wymyśli.
Bo oczywiście można też zrobić spoken word i wtedy po prostu…
Tak, spoken word. Wtedy po prostu nam jakąś część nawet z piosence po prostu powie.
Zwyczajnie.
No ciekawe jestem, czy faktycznie zaśpiewa to tym głosem, czy też nie, bo to…
To suno, więc no…
Zaz… zaznaczono trzydzień.
Zaz… trzyd… z… trzy…
Zazna… zaz…
Zaz…
O!
Zobaczymy, co to jest.
Może trochę…
Wielki dzień.
Testuj z nami, nie bądź leń.
A gdyby faktycznie był tako Extend?
Zaczekaj, żeby coś zmieniło.
3, 2, z…
Zaznaczo…
Zaznaczono 32k…
Zazna…
Zaz…
Zaznaczono trzydzieś…
Zaznaczono trzydzie…
Zaznaczono blast…
Zaznaczono trzy…
Pla…
Trzy…
Pla…
Pla…
Pla…
Pla…
Pla…
Pla…
Pla…
Pla…
Pla…
Pla…
Pla…
Pla…
Pla…
No, a tam to wrzucimy to, co zawsze.
Ale nie, no, dobra, nieważne.
To jest takie jakby to, co Suno w tym widzi, takie jak jego określenie tego, co…
Tak, zakończ.
D-I-E-C-O, przy Epitrap Boiwo X mysadz lepszyć remix.
A ja dalej oczywiście kołuję i piłuję swoje, tak, że ja chcę wcale nic z tego, co są, no, tylko…
Tylko to, co ja mu każę.
No i ciekawy jestem człowiek z tym, co wyjdzie po prostu lepiej, czy gorzej, czy po prostu inaczej, no.
Ja wcale się nie zdziwię, jak wyjdzie… podobnie.
Też mam takie wrażenie.
Bo to jest tak naprawdę chyba to, ta opcja jest chyba do tego,
Żebyś ty mógł tu podłożyć jakieś inne słowa i wygenerować po prostu mowę tym głosem.
Właśnie ciekawy jestem.
A jak to nadpisałeś, to po prostu wyjdzie. No ale posłuchajmy.
No nie, no. Totalnie nie.
No to już jest to, co było.
Ale sprawdzimy go.
Dla zasady.
No to jakby wiadomo, o co chodzi. Czyli nie chciało pójść. No niestety.
Okej, czy coś jeszcze przesuną? Tak naprawdę do pokazania tak praktycznie.
Wybieramy format, wciskamy Enter, pobieramy plik. Myślę, że to nie ma filozofii specjalnej.
Wydaje mi się, że tak naprawdę SUNO zostało dość dobrze pokazane.
To, co pozwala, jakie są mniej więcej efekty.
Wiadomo, że one będą różne za każdym razem, bo to jest AI, które działa różnie.
Natomiast ogólny zarys wydaje mi się, że jest przedstawiony.
Wydaje mi się, że możemy do tego audio przejść.
Także oddaję Tobie tą, kurcze tak powiem, stereo, tu wyłączę rozsłonienie ekranu.
Tak, to myślę, że możemy przejść powoli do…
Pokażę jeszcze tylko jedną rzecz,
bo postanowiłem, spróbowałem zrobić, wrzucić intro Tyflo Podcastu.
Czekajcie, bo tu jeden guzik cisnę. Przepraszam bardzo.
On zdaje się…
Już nie słychać, mając fałdacz, nie słychać?
Teraz nie.
On wyciął chyba w ogóle wokal z tego intra, to ciekawe.
I zrobił w ogóle, jak kazałem mu to skowerować…
Ale melodię w ogóle nie trzyma melodii.
A z czego mu dałeś, jaką dałeś mu melodię?
To dałem mu intro do tyflu podcastu.
Aha!
I on totalnie w ogóle nie skumał.
W drugiej wersji też nie.
Też jest drum and bass.
Ale totalnie się nie trzeba melodii.
Tu słychać, że ten fortepian jest taki… sobie.
Dobra, to jest najgorsze, ale…
Dobra. Tak wygląda niestety czasami…
Jak tak, tak, to właśnie czasami po prostu wygląda, no niestety.
Tak. Dobrze, to w takim razie przejdźmy sobie do audio.
W takim razie ja też zaraz sobie tutaj tylko zwolnię syntezę.
Puszczę wam, znaczy tę syntezę, żeby to było wszystko dobrze słychać.
Dobra. Jeszcze tylko przekieruję na kartę.
Odebrane. Napisz do Tomeckiego mail.
O, chyba jest.
Dobra, teraz mam akurat stronę suno, więc przełączam się na stronę udio.com.
Też oczywiście udio nie ma polskiego interfejsu.
Myślę, że prędkość powinna być okej.
Też tak wydaje.
Tak, tutaj od razu jest advanced create.
To jest znowu nasza biblioteka z tym, co sobie wyprodukowałem, moja.
Tu są jakieś opcje społecznościowe, nawet nie testowałem tego.
Tak, co nowego, które po prostu to się nazywa update.
No i już. Oczywiście ja to wszystko pokazuję już z punktu widzenia zalogowanego użytkownika,
żeby się zalogować też. Można to zrobić przez Google, można zrobić przez Discord
Jeszcze kilka chyba opcji. Jeżeli kupuje sobie, a mam wykupiony abonament ten średni za 10 dolarów miesięcznie.
Tak, no czyli podobnie, bo tam mówię, w sumie to jest tak uśrednio na polskie około 40 złotych, nie?
Tak. Jeszcze jest plan, jak to się nazywa? Ultra? Za 24 dolary miesięcznie.
I wtedy jest w tych kredytów znacznie więcej i jakieś tam dodatkowe rzeczy, których i tak nie używam.
Poza tym, no, 24 dolary to już jest konkret.
No, na miesiąc zwłaszcza, więc to…
Na miesiąc, więc tego akurat nie brałem.
Natomiast tutaj piosenka kosztuje dwa lub cztery kredyty w zależności od jej długości.
32-sekundowa wersja to są dwa kredyty, dwie minuty to są cztery kredyty i znowu są dwa warianty, tak samo jak w Suno,
generowane przez cały czas.
Z tym, że czas generowania tego wszystkiego jest dużo…
no niestety…
no dłużej trzeba czekać na to, żeby nam się coś wygenerowało.
Także tutaj trzeba będzie zagadywać więcej.
No niestety.
Nie chcemy to wszystko pokazywać.
W planie tym średnim mam zdaje się, że 1200 kredytów na miesiąc, a w planie tym większym 4800 chyba.
Tak, zresztą jest 2500, jak powiedziałem, w tym planie nazwijmy to standardowym, w sensie jednopłatnym oczywiście.
Tak. Przy czym tu chyba kredyty nie przechodzą na następny miesiąc.
Chyba na jeden miesiąc, ale przechodzą.
Już nie przechodzą. Kiedyś przechodziły, teraz już nie przechodzą.
No, to tak to wygląda.
I teraz tak.
Żeby coś stworzyć…
Mam nadzieję, że słychać mojego gadacza.
I on tu już akurat przechodzi sam na…
Na to, co trzeba, jeszcze troszeczkę cofnę.
To, co tu jest napisane, to jest tylko przykład.
To znaczy, to nawet nie jest wpisane w polu edycji,
Tylko to jest taki przykładowy tekst, co można by tu wpisać.
I to też kiedyś było w suno. To też było kiedyś w suno.
To jest ciekawe, że tego nie ma. Nie wiem.
Natomiast w polu de facto nie jest wpisane nic.
To tak mówię, żeby ktoś się nie zdziwił, że coś takiego jest.
Więc ja mu tu znowu wpiszę disco.
I tutaj są też takie propozycje…
Tak, jak można by ten styl doprecyzować?
Szkoda, że jest ten ad, tak, tu, prompt za każdym razem.
No proszę, nawet jest disco polo.
To jest popularny gatunek muzyczny, co bym miał powiedzieć.
Tak, ale jakby na tyle popularny,
że algorytm, który przecież nie jest skoncentrowany na polskiej muzyce…
No oczywiście.
Dobrze, wspominam to wszystko, bo tego troszkę nie jest.
Upload audio, czyli znowu możemy sobie, tak jak w przypadku Suno, wysłać plik.
To samo, co w Suno, czyli on może nam zaproponować tekst.
Ja chcę wpisać tekst ręcznie.
Ten sam myślę, nie?
Tak, tak, oczywiście.
Tu jest to pole, które zostało ominięte, jak wpisałem mu custom,
no bo to jest pole, które ma znaczenie w momencie, gdybym chciał wygenerować.
I tu zauważmy, że są dwa pola edycji.
Jedno pole edycji od stylu, a drugie od tego, o czym ma być piosenka.
Przycisk wbite forme. Lyrics editor.
Przycisk niedostępne regenerate lyrics.
Przycisk niedostępne undo lyrics edit.
Przycisk niedostępne…
Po… jakby…
Jeszcze raz wygeneruj tekst, bo się mi nie podoba.
Przycisk niedostępne undo lyrics edit.
Yyy…
Wycofaj zmiany edycyjne.
Przycisk niedostępne redo lyrics edit.
Ponów zmiany edycyjne, które wcześniej zostały wycofane.
One są teraz niedostępne do przyciski, bo…
O jednej rzeczy w Suno, nie wiem czy jak jest w Wood.io z tym, ale na przykład czasami, rzadko bo rzadko,
ale Suno wygeneruje tylko jeden z blik, zamiast dwóch.
To się bardzo rzadko zdarza, ale się zdarza.
Tak, to znaczy, to chyba wynika z tego, że to nie przechodzi ich jakichś takich wewnętrznych procedur,
że Suno wie, że to jest już tak popsute, że nawet się nie opłaca pokazywać tego użytkownikowi.
Tak, też myślę jak właśnie…
A czy w Wood.io też tak jest, czy nie?
O, słucham?
Czy w audio też tak jest, czy nie?
Za mało otworzyłem.
Żeby… Ale wydaje mi się, że jeżeli już, to też bardzo rzadko.
Jaki to był ten tekst?
To jest test…
Wielki test. Zobaczymy, co to jest.
To jest test…
Wielki test.
Zobaczymy, co to jest.
Zobaczymy, co to jest.
To jest dzień. Wielki dzień.
Testuj z nami, nie bądź leni.
To jest dzień, wielki dzień.
Testuj z nami, nie bądź leni.
To jest dzień, wielki dzień. Testuj z nami, nie bądź leni.
To jest test, wielki test. Zobaczymy, co to jest.
Tak sprawdziłem tylko kontrolnie, czy nie zrobiłem jakiegoś…
Koniec sekcja, sekcja wielowierszowe, edytowalne.
To jest dzień, koniec sekcji. Przycisk PREPIPS.
Przycisk PREVIOUS, LET IT SKIP. Przycisk NEXT, LET IT SKIP.
ADVERSE, BLITZGRAND, CHORUS, TAX FOR ADDITIONAL CONTROL.
Fajnie, że tutaj jest na wierzchu…
Przycisk Next Levits Skip.
Można sobie…
Drop and Guitar Solo, Sax Solo, Aldo Interesting Hints.
Drop and Guitar Solo and Drop przy koniec B, R, O.
And Guitar Solo, Sax Solo, Aldo Interesting Hints.
OK.
Przycisk Next Levits Skip.
If the model mispronounces a word,
it will sound splitty to pinto ea sierpchon emes.
No tak, tu są po prostu różne porady,
które gdzieś tam można sobie zastosować.
I można sobie tak chodzić po tych poradach
i sobie czytać, czego on by chciał znowu.
Znowu, porady są w języku angielskim, więc tutaj jeżeli ktoś tego nie zna,
no to jakiś tłumacz pewnie by się przydał.
Tutaj nie ma workspace’a, to są foldery i znowu foldery, no to jest taki sposób
na zorganizowanie sobie tych wszystkich utworów, które tworzymy, no bo podejrzewam,
że jeżeli ktoś tego robi dużo, no to może się to przydać.
I ja to sobie akurat rozwinę.
Tak, domyślnie on słucha się jakoś tego naszego promptu,
ale tak mniej więcej. I można wymusić, żeby dał dokładnie ten prompt,
jaki daliśmy. Bo oni mówią, okej, użytkownik być może wie mniej więcej,
co chce, ale my wiemy, jak to napisać, żeby to naprawdę było to,
A można rzeczywiście powiedzieć nie, ja wiem lepiej.
Wy się mi do tego nie mieszajcie.
No właśnie, to na przykład tego już nie było.
Mamy do wyboru kilka modeli. 1.5 Allegro to jest najnowszy.
Jeszcze jest 1.5, trochę starszy.
To jest najstarsze. I tu można wybrać sobie model,
którym mamy tworzyć to, co sobie tam chcemy.
O właśnie. I domyślnie, nie wiem czemu,
wybrana jest ta długość piosenki, 32 sekundy.
Dwa dziesięć, czyli dwie minuty dziesięć sekund.
I tutaj, gdzie były wcześniej dwa kredyty…
To teraz są cztery kredyty wpisane, czyli no tyle nam to zje, zje tych kredytów.
I teraz o co tu chodzi? To, co wygeneruje, czy to ma być od jakby jakiego miejsca
tego hipotetycznego całego utworu do którego miejsca hipotetycznie całego utworu.
Bo jeżeli ja bym chciał, żeby te dwie minuty, to był cały utwór, to tutaj właśnie wpisuję od 0 do 1.
Ale jeżeli będę chciał to rozbudować w tył, to mogę sobie tu wpisać, nie wiem, od 0,4, na przykład.
Czyli to będzie tak, no trochę mniej niż w połowie tego utworu.
On to po prostu na początku będzie takie już od razu, w cudzysłowie, urwane, ale do końca.
Mogę zrobić tak, że to będzie środek, tak?
Tak na przykład od 0,4 do 0,7, czyli będzie urwane od początku, urwane na końcu.
Od 0 do 1 oznacza, że będzie to miało od jakby początku, czyli będzie to miało i wstęp i zakończenie będzie jedna całość, która trwa 2 minut 10 sekund.
Ciekawe w sumie to jest i…
Tak, to jest fajne.
Więc jakby, no, to jest jeden z takich fajnych sposobów,
w którym można sobie właśnie ustalać, jak to w ogóle ma wyglądać.
Potem druga rzecz.
Przycisk STO END. LELIT STEAMING. Przycisk LELIT STEAMING to ALL TIP.
Przycisk 7S START OF SLEEP. Minimum SUVAK 0.05. Maksimum SUVAK 0.95.
Tak, czyli od jakiego momentu ma wejść tekst
i w jakim momencie ten tekst ma się zakończyć.
Zakończyć. To jest też fajne, bo w Suno tego nie ma.
Przycisk 124 S&OFT SLEEP.
Nagłówek poziom 3 PROMPT.
STYLE REDUCTION. Przycisk STYLE REDUCTION TO ALL KEEP.
Lista rozwijana, rozwinięte, zauto-uzupełnianie, medytowalne.
Otwiera listę w HUD GENRES STYLES OR SONCEPT 100 AVOID.
Tu jest… Nie wiem, dlaczego lista rozwijana…
Przycisk niedostępny. Przycisk zwinięty.
Otwiera okno dialogowe SELECT OR ADD PRESET.
Tu można sobie całe presety w ogóle tworzyć z takimi wykluczeniami stylów.
Ja się tym jeszcze nie bawiłem, tak prawdą mówiąc.
Przycisk prompt strength to all tip. Słowak 0.5.
To jest, podejrzewam, to samo co w suno,
tylko że tu jest nawet nie, że jest style influence,
tylko prompt strength, tak?
Czyli na ile ma się słuchać prompt, a na ile ma być kreatywny.
No, na razie damy sobie w połowie, czyli tak, jak jest domyślnie.
Lewic strength. Przycisk lewic strength to all tip. Słowak 0.5.
Jak ma się słuchać tekstu.
Podejrzewam, że jak jest 0,5, ale zobaczymy,
to sobie tutaj może troszeczkę wywijać.
Ale z drugiej strony ten tekst jest krótki,
więc zobaczymy, co zrobi. Sam jestem tego ciepły.
Love, kick, nagłówek, poziom 3, generacjon, slajty,
przycisk slajty to all keep, suwak 0,25.
Tym się jeszcze nie bardzo bawiłem,
no ma być jakby, na ile to ma być czyste, takie nierozmyte.
Love, kick, set, przycisk set to all set, set, pole edycji minus 1.
To z kolei jest niby takie coś…
ukreślającego taką ogólną wariację, to znaczy jak mi się nie…
jak wybierę, jak tu wpiszę co innego,
to on wyjdzie jakby z innych jakichś tam losowych danych wejściowych
w pewnym sensie. To, co i tak się losuje, będzie inaczej jakby wylosowane.
No nie wiem, jak to inaczej powiedzieć. Będzie większa szansa na to,
że to będzie no troszkę inne w tym, w tym, co on i tak robi.
Też się tym nie bardzo bawiłem. Oni to tak to jakoś tłumaczą.
Przycisk copys, przycisk reset set, przycisk randomize set,
generatjon kuality, przycisk generatjon kuality,
zsuwak 0.75.
Nie widziałem różnicy między 0.75 a 100,
choć w 100 to dłużej to trwało.
Pusta, faster, slower, przycisk create.
No i dobrze, jedziemy.
I zaczyna się to robić.
I on nie ma tego w czasie rzeczywistego twarzenia czy też ma?
Przycisk minibrary, separator 58.
Teoretycznie ma, ale to i tak musi potrwać.
I to jest… Znowu mamy coś podobnego, troszkę jak w suno,
tylko że ja robię to w taki sposób, że strzałką…
Tu teraz robię sobie…
Już tutaj mogę zrobić prawe, a strzałka w dół.
To jest to najnowsze. On mówi niedostępne,
czyli to jest jeszcze niedostępne do odtwarzania.
Druga wersja też jest nie do odtworzenia.
Wcześniejsze rzeczy…
…już jest jak najbardziej możliwe do odtworzenia,
przy czym on, co ciekawe, nadaje tu sobie domyślnie jakieś swoje nazwy.
Ma jakiś taki bardzo standardowy szablon do dodawania nazw.
Ja coś tam sobie stworzyłem. Już nawet nie pamiętam, co to było.
Drak gable link synt chwawe.
Drak gable przycisk przełączania niewciśniętej plamy neon divergence.
Mogę to spróbować, tylko sobie zrobię tak,
żeby Chroma przełączyć na tę kartę.
System gogle Chrome.
Google Chrome.
No i play, enter.
I to jest w ogóle ciekawe, że audio…
tam gdzie ja tu bym wpisał instrumental,
a on i tak gdzieś tam…
jakieś kurki przynajmniej musi dać.
Nie wiem, kto to jest.
To jest instrumental, który sobie wcześniej wygenerowałem.
Natomiast zobaczę, czy już jest.
I jest.
Play. Wielki test.
No dziwne.
Oczywiście.
Trochę jazzowe to jest jakby takie…
To znaczy, to jest rzeczywiście disco, tylko tutaj widać, że z tekstem to sobie popłynął.
Natomiast audio dużo lepiej radzi sobie na przykład z odwzorowaniem żywych instrumentów,
z takimi nieczystościami wynikającymi z tego, że to gra żywy człowiek,
Z jakimiś nierównościami rytmicznymi, które zdarzały się, zwłaszcza w latach 70-tych,
nieraz, bo po prostu tak to wygląda.
Te wokale są bardziej takie naturalne, mam wrażenie, choć samo odwzorowanie tego dźwięku,
on ma też swoje jakieś artefakty takie specyficzne, które mogą się podobać lub nie.
Druga wersja brzmi tak…
To jest test, wielki test. Zobaczymy co to jest. To jest dzień, wielki dzień. Testuj z nami, nie bądź lęk.
Ciekawe, czy będzie…
O, jest języka, jaj!
Oczywiście.
Możemy spróbować, żeby się bardziej słuchał prompta.
Można zobaczyć, co tam będzie.
Lista rozwijana, rozwinięte z auto-uzupełnianiem, edytowalne.
Otwiera listę w chat, przycisk style, redukcjon.
Nagłój przycisk max, minimum, przycisk, przycisk, lewic, teaming.
Przycisk stop, maximum, minimum, przycisk, auto, przycisk, sleep, teaming, sleep, teaming.
Lista, set, set, przyc, przyc, przyc, generacjon, przycisk, suwak, zero, usta.
Faster, slower, faster.
Generat, randomize, set, reset, set.
Copy, set, set, set, set.
Slight, lelitz, strength, toltip, przycisk, lelitz, strength,
przycisk, suwak, zero, kropka, pięć, suwak, jeden.
I zobaczymy…
Slight, set, to, copy, set, random, generat, creat, przycisk.
Niedostępne.
Znowu sobie chwilkę poczekamy.
To może za ten czas pokażę kilka takich rzeczy,
które według mnie audio robi troszkę lepiej.
Ustawienia NVD.
Dołączę na kartę dźwiękową.
Tylko sobie przełączę na swoją własną kartę, żeby tutaj nie przeszkadzać.
Audio.
Dobrze. I na przykład, o.
To jest na modelu 1.5, nie na modelu tym 1.5 Allegro.
I obawiam się, że suno takiej muzyki
nie zrobiłby dobrze.
Tu mamy normalny klavesyn, te skrzypce jakoś brzmią.
I to się bardziej trzyma epoki generalnie.
Właśnie takie rzeczy jak klasyka, suno…
Znaczy audio robi zdecydowanie lepiej.
Z ciekawości, kiedyś pisałem Polish Folk
i dla niego Polish Folk to jest coś takiego.
No gdyby jakiś kraj miał taki folk…
Ciekawe jak to było.
Ale te wszystkie instrumenty brzmią jednak dość naturalnie, jest i frazowanie, i…
Także, no, bardzo…
Audio ma swoje, swoją taką niszę, w której jest dość dobry.
Tylko rzeczywiście, no, jest to, powiedzmy, nisza,
która, obawiam się, że będzie raczej rzadko wykorzystana.
Dobrze.
Wielki test, wersja druga się zrobiła.
Zobaczymy, co to jest.
Ale disco to to…
Co to jest, się pytam.
Bardzo nowoczesne to disco.
To jakieś, nie wiem, elektro? Nie, to nie jest elektro.
Tak, i mówię właśnie…
Tak se dziwnie pływam w tym wszystkim.
No, na razie nie ma języka EI.
No, to jest teraz ciekawe faktycznie.
Jakiś, nie wiem, jakiś jalinga, sztuczne coś.
Też mi się wydaje…
Okej.
Epoka się zgadza, ale gra to jakoś tak nie bardzo.
Bardziej jakiś funk.
Tak.
Nie wiem, tu w ogóle instrumenta zrobiły?
Gdzie wokal?
Właśnie.
No właśnie.
Okej, miał mało tego tekstu, więc podejrzewam, że jakoś musiał se z tego wybrnąć.
Trudno nazwać to disco.
W jakimś sensie jest to naturalne, w sensie takim, że te instrumenty brzmią faktycznie jakby ktoś na nich grał.
Tylko, że to ma swoje jakieś artefakty takie dziwne.
To może spróbuję mu na przykład wpisać teraz Opera, na przykład, albo Classical Period, Aria.
Trochę tutaj wymyślam, ale dobra. Ojej, nie wiem czy on to zrobi, dlatego że on tutaj mówi, że
Metalcore, Melodic Black Metal, więc to chyba będzie problem.
To jeszcze wpiszemy sobie na samym początku Orchestral i jeszcze wpiszę Fugue, żeby tak było bardziej…
Opera Seria, o! O, właśnie! Opera Buffa, dobra, to będzie tak luźniejsze.
Dobrze, okej.
I proszę bardzo, coś tu jest.
I szukam przycisku create.
Jest create, dobra.
Niech się generuje, za ten czas kiedy się generuje.
Ciekawe czy mam jakieś komentarze w ogóle.
Na razie, jak sprawdzałem, to nic nowego nie przyszło.
Bawiłem się też folkiem. I znowu, wątpię, że Suno by zrobił taki folk, który…
Jakkolwiek nie wiem, czy są takie instrumenty, ale to brzmi znowu.
Pomijając te artefakty, które wynikają z algorytmu, to same instrumenty brzmią dosyć ciekawie.
Tylko znowu, to jest coś takiego, co mało osób będzie chciało stworzyć, takie coś.
Ale do jakiejś gry mogłoby się nadać, tak?
Albo do jakiejś…
Albo do jakiejś, nie wiem, jakby takie…
Tak są nieraz takie…
No właśnie, jakieś pieśni plemienne, takie, wiesz, takie sceny, jakieś takie rytuały szamańskie, coś tego typu.
Tak, i to jest rzeczywiście dość takie, które dla takiego zwykłego człowieka brzmi dosyć tak wiarygodnie.
Bo wiadomo, że jeżeli jakiś muzykolog specjalizujący się w muzyce etnicznej
coś takiego by usłyszał, to by powiedział, no bo to nie jest zgodne z kanonem czegoś tam.
No wiadomo. Natomiast obawiam się, że suno by aż tak…
Nie odwzorowało tak powiem.
…by czegoś takiego nie zrobił.
Myślę, że jest taka możliwość.
Zobaczę, czy to się zrobiło.
Jak to wygląda teraz? Mamy znowu tabelkę.
Jest!
No dobrze. Wielki test. Opera!
Tylko, że to nie jest aria.
No nie, gdzie?
Wielki dzień jest tu z nami, nie bądź go.
To jest test, wielki test. Zobaczymy, co połoniemy.
Mała przerwa… i wracamy.
To jest dzień, wielki dzień.
Mała przerwa… i wracamy.
Ale jakieś elementy takiego kontrapunktu być może Fuki Toto nawet ma.
Nie jest to na pewno brzydkie.
Tak, to jest…
Trzeba bardziej orkiestrować.
To jest strasznie blisko to wszystko ponagrywane.
Podejrzewam, że tutaj może mógłby się przydać ten sływek clarity.
Zaraz spróbuję to zrobić i zobaczymy, czy to przypadkiem tutaj właśnie nie zadziała.
Tego nie słychać, jak ja to robię, ale… bo chcę to po prostu zrobić jak najszybciej.
Gdzie to jest? Clarity…
Tak, jest 0,25. Aha, clarity jest 0,25, czyli już jest dość dużo.
Z uwag 0,25. A jak weźmy to na prawie maksa…
No nic, w każdym razie wydaje mi się, że do pewnych rzeczy może być ten audio
bardzo ciekawy. Mam wrażenie, że jest bardziej taki ambitny, ale z drugiej
strony potrafi być rzeczywiście dość mocno odklejony jakby od rzeczywistości,
jeżeli chodzi o takie gatunki zwykłe. Próbowałem utworzyć roka lat 80.,
to rzeczywiście tworzył coś takiego bardzo mocno, nie wiem jak to nazwać,
garażowego? Gdzieś coś mam nawet.
Tu mam same te wielkie testy.
A co to jest?
Aha, tu wpisałem chyba Tropical…
Tak, Tropical House. On zrobił, przy czym zaznaczam mu, żeby to był instrumental.
No to jakby jakiś wokal na początku zrobił.
Jest trochę taki Tropical, powiedzmy, że jest.
Wszystko w porządku.
Także jakieś, jakieś…
Co tu jeszcze?
Aha, to miał być jakiś fusion jazz i znowu tutaj niby jest jazz, ale strasznie taki…
Dziwne słowa, nie wiem, jak one nazwać.
I wszędzie, gdzie się da taką wokalę, nawet jak mówię instrumental, instrumental, instrumental…
Mam takie dziwne alternatywne klimaty.
Strasznie lubię się zapuszczać.
Także to raczej jest coś dla ludzi, którzy chcą…
Eksperymentować.
No dokładnie.
Tu mam jeszcze ten wielki test w wersji opery z tym clarity ustawionym.
Ale różnicy to tu wielkie nie widzę.
O, witamy sztuczny język. A jak? Musiał się w końcu pojawić.
Tak długo go nie było.
Oczywiście. I druga wersja.
Cisza. No o, jest, mamy.
Znowu witamy. Język sztuczny.
Jak widać, audio po prostu uwielbia ten język.
Tak.
On tu teraz już nawet zignorował w ogóle, że podałeś mu tekst.
To jest test, wielki test. Zaczął, ale potem to już…
Być może dlatego, że jednak jest bardzo mało tekstu, a jednak…
Jakoś tak to zrobił.
Tak czy inaczej, myślę, że do klasyki audio będzie lepszy.
Do większości rzeczy takich, nie wiem, na przykład jakbym chciał stworzyć podkład do takiej audycji w radiu, jak mamy,
to bym zdecydowanie użył suno jednak. Więc bardzo zależy kto, na co, znaczy kto, jakie ma wymagania.
Ambicje, wymagania, no właśnie, to też jest słowo klucz w tych wszystkich.
Trochę tak samo jak wy z wyborem modeli, właśnie typu, nie wiem, GPT, GPT, czy jakieś
czy innego, też troszkę się różnią swoim działaniem.
Na pewno.
Tylko tutaj to widać o wiele bardziej, jakby tak…
Tak.
Za pierwszym razem, kiedy go zobaczysz, słyszysz w działaniu, to już wiesz, co jest do czego.
Dokładnie.
Także naprawdę jest, te modele rzeczywiście mają swoje różnice.
Na przykład audio też lepiej analizuje materiał wejściowy audio.
To znaczy dałem mu, nie wiem czy możemy zapuścić,
Dałem mu dźwięk logowania z Windowsa.
Myślę, że tak.
Myślę, że to nie jest jakiś mega…
To jest dźwięk, może ktoś jeszcze pamięta, Windows Millennium, Windows 2000 i być może jakiś jeszcze.
Oczywiście.
To już nie jest ten dźwięk, jak rozumiem.
Tak, ale on bardzo płynnie przeszedł od tego dźwięku do…
Jakieś tam melodyjki.
Tak, do tego i zostawił te instrumenty rzeczywiście.
Ciekawe, co on by zrobił, jakbyś tu dał intro do Tyflo Podcastu.
Być może, tylko że tutaj da się zrobić po pierwsze Extend i tutaj da się wykorzystać chyba tylko ten model 32-sekundowy. Nie wiem czemu.
Jeszcze spróbuję poszukać czegoś, bo tu mam kilka takich rzeczy,
Na których zresztą też widać właśnie, o, kolejna rzecz.
Tutaj znowu będzie sztuczny język.
Tym razem Windows 98.
Przy czym też taka mała porada.
Często, żeby dobrze to zrobił, to warto mu uciąć końcówkę.
To znaczy, żeby nie było tak, że ten dźwięk się kończy.
Jest przerwa, bo wtedy on…
Tak?
Ciekawe.
W każdym razie, jeżeli dam mu taki ucięty dźwięk na końcu, to on będzie wiedział, że to trzeba przedłużyć.
Jeżeli mu dam cały dźwięk, to on jakby zrobi coś nowego.
Tak jakby następny dźwięk na powiedzmy, że tej samej płycie, czy jak to nazwać.
Tu na przykład zapomniałem o tym, że trzeba ten dźwięk zakończyć.
Znaczy, że trzeba, bo domyślnie kiedyś było tak, że on nie robił od 0,0 do 1,0,0,
tylko od 0,0 do tam 80 coś chyba, no nie do końca.
Efekt był taki…
O, 95 Windows, oczywiście.
Tak, oczywiście.
I tu w ogóle zostawiam mono.
Taki… taki vibe.
To spokojnie mogło się ukazać w latach dziewięćdziesiątych jako jakiś taki filmik powiedzmy w programie telekomputer z demonstracją Windowsa 95.
Bo właśnie było napisane, że to nie ma być do końca, tylko do jakiegoś momentu.
Ja też mam takie ciekawe… Zaraz próbuję to znaleźć.
Tylko z XP-ka tym razem.
A też mam z XP-ka. To możemy porównać.
No to oczywiście.
Ja mam jeden. Ty pokaż suno, a ja pokażę audio.
Okej. Będzie dźwięk z Eltena, bo teraz przy Eltena odtwarzam alt racz nie będzie raczej…
No myślę, że będzie się można…
…dostępny ekran…
…jest, już słychać.
A tu chodzi tylko o to…
Ale drugie jest jeszcze ciekawsze, bo tutaj się stała ciekawa rzecz.
Wieloma książcew na latach.
Jak były na przykład muzyczki na YouTubie, że jakby stworzone z dźwięków Windowsa.
Ja postanowiłem, że weźmy taki popularny remix, go wrzućmy w Suno.
Co Suno zrobiło? Coś takiego.
Ale o co chodzi? Zaraz zobaczcie, dlaczego ja to tak chcę pokazać, bo to ma swój punkt.
Specjalnie tego nie przewijam, żeby chwilę pograło.
Wiem, co to jest.
Tak, ale o co chodzi? Co on z tym zrobił?
Jaki on jest mądry?
O to mi chodzi.
Teraz będzie najlepsze.
To zostało!
Okej.
I dalej sobie szło dalej. Po prostu zostawiłeś dźwięk Xpeka.
Oto dlatego chciałem to właśnie pokazać.
Teraz audio, a potem znowu moje wnioski.
Teraz zobaczcie, że audio prawie przy każdym z tych remiksów
nie był taki mocno nastawiony na taką muzykę mainstreamową jak suno.
Suno nawet w tym, nawet w tym dźwięku właśnie z Hispeka, który jest zasadniczo klasyczny powiedzmy,
on go potem tak trochę upopowił w pierwszej wersji, dużo bardziej upopowił w drugiej wersji,
a tutaj trzymał się raczej klasyki, tak?
Tak, to były instrumenty klasyczne, taki ogólnopowiedzmy klasyczny vibe takiej muzyki poważnej, powiedziałbym.
I rzeczywiście tutaj, słynąc tak samo jak Windows 95, to też taką dał muzykę, okej, elektroniczną,
ale czy to jest taki regularny poplat dziewięćdziesiątych? No nie, to jest taka trochę jednak alternatywa.
Troszkę tak, natomiast np. mnie to po prostu rozwaliło totalnie, że wiedział co robi, zostawiając
właśnie w tym przypadku oryginalny dźwięk Xpeka w Suno. Po prostu wszystko zmienił.
Znaczy skowerował, ale dźwięk Xpeka taki jaki był, taki został.
Także znowu, tu trochę widać na co, nie wiem, może nieświadomie, a może właśnie
świadomie stawiają te dwie firmy. Suno na mimo wszystko taką…
taki mainstream, powiedziałbym.
Udio bardziej na kreatywność, właśnie trochę alternatywną.
Udio bardzo potrafi,
ciężko mi tu będzie coś pokazać takiego,
ale bardzo potrafi skowerować jakąś piosenkę.
Jeżeli dasz mu kawałek piosenki w języku obcym
I dasz mu polski tekst, to on bardzo wychwyci ładnie styl wokalu.
On to wszystko dość ładnie rzeczywiście uda, że tak powiem.
To znaczy, on dużo bardziej się będzie trzymał oryginalnego głosu, oryginalnego wokalu.
To ja np. zrobiłem swego czasu eksperyment, który mnie po prostu posunął i zrobił tak.
Weźmy sobie jakąś popularną piosenkę z disco polo czy tam inne.
Weźmy jakąś bajkę, tekst bajki.
I chodź tu, kochany słonek, mi to ładnie sparsujesz, czy zrobisz mi bajkła piosenkę, czy mnie zrobisz bajkła piosenki.
Efekt był dosyć dziwny, bo on starał się jak mógł to parsować, ale to, że ten tekst do bajki do końca, to w niektórych miejscach idealnie się prawie wciął,
ale w niektórych miejscach specjalnie jakbym pograł sobie trochę samą muzykę, żeby potem wejść z tekstem jakby w konkretną partię muzyczną, żeby nie przyciągać
jakoś tak dziwnie ponad krawędzią i żeby to nie zwaliło się pod łukiem z góry.
Nie ma swojego rytmu, nie ma rymów, więc on często właśnie robi jakieś takie rzeczy.
Słyszałem właśnie na udze zrobione takie bardzo znane wokale typu Phil Collins
i rzeczywiście jego głos, jego styl śpiewania oddał idealnie po polsku.
Myślę, że to już będą problemy z prawem autorskim, natomiast…
Tak jak na przykład Eleven Labs ma nadal funkcję dubbingowania.
Kiedyś…
Pytanie jak to wygląda z YouTubem, czyli jakie ma YouTube z licencjami,
bo my tak nawet to pokazujemy, jako taką robotę z różnych ciekawostki.
Bardzo różny temat.
Amerykański YouTuber od gier audio, niejakich Chris Wright, którego możecie znać,
z Teksasu, zrobił kiedyś tam w jakiejś grze,
ale w filmie. Wpadł mi głupi pomysł, a wezmę to z dubbinguje.
Efekt był naprawdę ciekawy i…
To faktycznie brzmiało tak, jakby pan Amerykanin mówił po polsku.
I faktycznie miał taki amerykański akcent, taki typowy, jakby ktoś próbował
naśladować swój język oczysty, ale musiał mówić po polsku.
I po prostu mnie to rozśmieszyło, nie powiem, że nie.
To jest na przykład taki kanał Mark Rober.
To też jest nasz popularyzator nauki.
W takim stylu troszeczkę efekciarskim, można powiedzieć.
I nie wszystko jest dla nas dostępne tam.
Natomiast on sam sobie dubbinguje filmy.
Jest również wersją polską, bo od jakiegoś czasu YouTube pozwala na
jakby stworzenie jakichś ścieżek językowych przez twórców.
I on ewidentnie używa czegoś a la Eleven Labs i rzeczywiście ten jego głos wychodzi
dobrze, ma akcenty postawione tam, gdzie trzeba i z reguły oczywiście to się
czasami gdzieś tam sypie, ale dobrze się tego słucha generalnie.
Uważam, że coś takiego faktycznie ma duży sens.
Taki dubbing właśnie swojego głosu po tylnej języki na przykład.
To moim zdaniem jest bardzo ciekawe.
I jeżeli tego się nie będzie…
Tak samo jak czytanie książek Eleven Labsem jest dobre,
jeżeli tego się nie nadużywa.
Nie wiem.
Mnie te książki wybijały z rytmu,
bo on czasami nie wiedział, gdzie akcent postawić,
bo co innego jest w momencie…
Trzeba na myśli.
Powiedzmy, że jest jakiś głos.
Powiedzmy, że ktoś, nie wiem, jest bliski śmierci.
Przekazałby sprawę swojego głosu w filmie jakiejś.
Jeżeli ten głos jest faktycznie dobry, jeżeli faktycznie algorytmy byłyby już dobre,
to możemy dalej sobie składać książek jakimś czarnym planem.
Na razie problem polega na tym, nawet nie do jakości głosu.
Problem polega na tym, że masz np. zdanie
Ala ma kota. I teraz tak.
Ala ma kota.
Nie.
Ona ma kota.
No wiadomo, chodzi o położenie akcentu, tak.
Dokładnie. I algorytm musimy zrozumieć,
Gdzie ten akcent powinien się znaleźć?
I w tych książkach dosyć często tego nie ma.
I czasami potrafią być rzeczy, na przykład
wziął nogi za pas.
I nagle robi się coś takiego, bo on to…
Albo na przykład, nie wiem…
Dramatycznie czyta tak, jak trzeba.
W sensie, on czyta to bardzo naturalnie,
ale przez to, że robi takie dziwne akcenty,
to to przynajmniej mnie kompletnie wybija z rytmu.
Tak, czytaj na przykład, nie wiem…
Zależy się na występie skalnym, porośniętym wysoką trawą?
Mhm. Tak, to jest jakby…
No, gdyby ktoś nie rozumiał tego naszego języka,
okej, no, jest to czytane.
No, jakoś jest to czytane.
Ale gdy wiemy, co to jest, to nagle…
Na przykład algorytmy typu takie 11 lapsy,
jeżeli na przykład damy mu głos bardzo ekspresywny,
On tą ekspresję chyba z pięć razy powieli, albo i więcej razy.
Naprawdę ja potrafiłem Suwakowi tak rozkręcić ten głos, który normalnie się aż tak nie gadał.
On normalnie darł się. Prawie się przesterowywał.
I to się naturalnie wychodziło.
W każdym razie, wracając do Udio, Suno, no to obie te platformy się rozwijają.
Co ciekawe, obie te platformy mają swoje, jeżeli ktoś ogarnia serwery Discorda,
To obie te platformy mają swoje serwery Discord, na których są podawane
wszelkie aktualizacje. Nieraz nawet dość drobne aktualizacje, zresztą Eleven Labs też.
Więc jeżeli ktoś jest otrzaskany, jak to się mówi, z tego typu technologiami jak Discord,
to polecam wejść sobie na serwery tych firm, żeby sobie obserwować co się dzieje,
dlatego, że rzeczywiście, no, tam dość szybko ogłaszają wszelkie
zmiany, zapowiedzi. Udio na przykład robi co jakiś czas
regularne takie spotkania gdzieś tam na Discordzie chyba,
czy chyba na Discordzie. Tam można im jakieś pytania zadać i,
co ciekawe, publikowany jest po pierwsze transkrypt z tych
spotkań. Zdaje się, że film na YouTube jest oryginałem
I chyba jest jeszcze sztuczną inteligencją jakieś streszczenie tego,
więc też można się czasami dowiedzieć, czasami gdzieś tam upuszczają,
czy tam odkrywają rąbek tajemnic, co się pojawi, jak to będzie wyglądało itd., itd.
Tak, a na przykład jeszcze taka rzecz ważna, bo właśnie w sumie to nie zapytałem o tym,
też o tym nie wspomniałeś. Tak jak Suda ma swoje tagi, czy Udy też wspiera jakieś tagi,
swoje typy właśnie jakieś tam chorusy, wersy, intro-outro i tak dalej.
Tak, to nawet było czytane gdzieś tam, że dodaj właśnie wers 1, wers 2,
chorus, drop, solo, sax, coś tam, żeby to rozmaicić.
On ma te… jak to się… prompt tips? Czy vocal tips? Już nie pamiętam.
Wiadomo o co chodzi generalnie, tak jakby…
Tak, i można sobie poczytać jakby, co masz po to.
No to bardzo dużo zmienia, jeżeli na przykład właśnie, o, dawałem mu tekst do bajki i na przykład wpisał sobie ten melodię, tak?
No to albo nic nie dawał, albo w ogóle rozwlekał sobie wszystko naraz, wyrzucał, a jak mu podzieliłem to jakoś tak prymitywnie, pociąłem to na jakieś nierówne fragmenty, no to mówię, próbował.
Tak, rzeczywiście. Promptowanie w tego typu algorytmach jest tak samo jak
promptowanie w dużych modelach językowych. Też jeżeli się człowiek tego nauczy,
to może uzyskać lepsze rezultaty niż tak po prostu.
W sumie zabawne jest też to, nie wiem czy pamiętasz, a propos SSU,
na przykład V2 miała straszne problemy z parsowaniem tekstu.
I tam było proste problemy.
I ja mało tekstów tworzyłem.
Na przykład też Udio z kolei bardzo często polski tekst czytał jak Anglik, w sensie wiesz o co chodzi, miał problem wielki z rozpoznawaniem języków.
Teraz, nie spotkałem, zobaczcie, że ten test ani razu tego nie miał, więc to w tym Allegro przynajmniej, jak widać, poprawili.
Na przykład, wczoraj się bawiłem z Suną.
Jest? Polski tekst?
Tak, wczoraj się bawiłem z Suną. Był na przykład jakiś tam tekst z jajkami.
Zamiast jajka było jaćka.
Aha.
No cóż, no…
A zamiast chowku brazmi, a zamiast chowek był szowek.
Mhm, tak.
Zrównoważ się zdarzały. Mniej, niby mało, ale jednak są.
No, także…
No i Suno dalej, niestety, lubi robić przestery.
Takie na siłę, takie sztuczne, brzydkie. Ja nawet spróbuję znaleźć plik.
Chwileczkę, żeby było cisza, żeby…
Tak, są no rzeczywiście nieraz…
Bo chcę słuchać teraz mojego tego, czy nie słychać?
Nie. Nie, teraz nie słucham.
Okej, to teraz spróbuję znaleźć ten…
W ogóle ciekawa rzecz jest taka, że jak pobiera się wave’a z audio,
to nie wiem jak teraz, kiedyś to był wave 32-bitowy.
O!
Także oni tu też idą na…
Uwaga!
Bardzo.
No sięgaj! No sięgaj!
Oj! Oj! Oj! Oj! Oj! Oj!
Oj! Oj! Oj! Oj! Oj!
Oj! Oj! Oj! Oj! Oj! Oj!
Jakie to jest przesterowane, to jest w ogóle…
Oj! Oj! Oj! Oj! Oj! Oj!
Najlepszy w tym jest to, że
to była jakaś rozmowa, to był po prostu fragment
rozmowy telefonicznej, wpuszczone w suma.
Aha… Gdzie nikt w ogóle
nie krzyczał. Nikt nie krzyczał.
Okej… A on jakiś
w ogóle wrzaski, w ogóle
jakiś poczekaj, taki jeszcze
…wieś, okolice, wykrzyczane.
Ciekawe.
I przesterowane.
Ale na przykład, z czego jestem mega dumny, to mogę pokazać, bo sam track jest zupełnie nasz darmowy.
O!
Znowu mamy…
Yesss!
Znowu mamy…
Kolejny!
Świetnie!
O!
Ze Screaming Strike’a, który swym drogą też był
tzw. Bench BGT Orchestral Pack’u,
który był złożony, licencji jego było,
używanie, rozpowszechnianie itd.
O ile jestem w całości bardzo dumny, zadowolony,
to niestety w jednym miejscu, jest brzydko przesterowane…
Słuchajcie.
O!
Był przesterek, taki dosyć szorstki.
Ale dalej całość brzmi naprawdę dobrze.
No, także…
Narzędzie jest to na pewno dosyć ciekawe, na pewno można je wykorzystać w niejednej produkcji różnego rodzaju, no i co, zachęcamy w sumie do korzystania, bo…
Jest darmowa wersja, nie trzeba płacić jakby za zabawę taką po prostu.
Tak, można sobie troszkę przetestować.
Pamiętajmy tylko o jednym, to nigdy nie będzie profesjonalny twórca, bo nie oszukujmy się, że człowiek zawsze zrobi to lepiej.
Zrobić to z pasją i tak dalej, to może być jakiegoś dżingla, reklamy, podkład w trakcie czegoś tam, muzyczka, która chce się pobrzdąkać, mówiąc brzydko, gdzieś w tle, bo potrzebujemy do pracy, ale to nigdy nie będzie jakby muzyka, taka jak muzyka muzyczna.
Zawsze zrobię to lepiej, to z tym można dyskutować. Natomiast ciekawą rzeczą jest to, że ja już… O, ktoś nam się chyba dodzwania powoli, to tylko dokończę jeszcze tutaj myśl.
Podobno na Spotify, znaczy ja, wydaje mi się, że wykryłem jakiś czas temu na Spotify,
gdy słuchałem sobie, ja nieraz lubię jazz posłuchać i odkryłem przed sobą kilka utworów
na jakiejś playlistie typu przygotowane dla użytkownika.
To było jakoś, podejrzanie mi to przypominało Udiowo, znaczy Suno właśnie.
I potem się okazuje, że rzeczywiście na Suno są produkowane setki, tysiące,
Jeśli nie więcej, numerów takich…
Właśnie to jest często jakiś taki lekki jazz, jakiś ambient.
Taka muzyka, co do której mało kto zwraca uwagę na wykonawców.
Tylko to ma być muzyka, która służy czemuś.
Odprężeniu, takiemu posłuchaniu sobie do sprzątania i tak dalej.
I w tej składzie nie ma takiej okej, tak.
Tak, i taka muzyka tła.
Podobno już są ogromne ilości takich utworów
No dobra, to odbieramy teraz telefon. Kto jest z nami?
Sławek, hej.
Cześć, słuchamy.
Tomek mnie właściwie o sekundy uprzedził, bo też właśnie ostatnio słyszałem informację o tym,
jakoby na Spotify’u były stworzone sztuczne zespoły, dosłownie, że to są niby zespoły
i w tej chwili te zespoły mają rzeczywiście miliony, miliony odsłon.
To jest jeszcze zupełnie inna historia też, bo to są zespoły, którym nawet
AI-em dorabia się biografie i chodzi po to, żeby te zespoły uchodziły za te znane,
za jakieś znane, które mają wielu fanów.
Tak, ale to jest niestety coś, co będzie w tej chwili naszą przyszłością
i to jest trochę przerażające, bo będziemy mieli po prostu muzykę
tworzoną przez wielki biznes,
a ci prawdziwi twórcy, no to będzie to trochę tak,
jak mamy tzw. główne piwo i piwo kraftowe.
No i to będzie dokładnie to.
Ja nie mam co do tego w ogóle wątpliwości.
Nie mam co do tego wątpliwości.
Po prostu wszystko jest, niestety, to jest topu robosieczny, tak?
Z jednej strony bardzo przyjemne, można się pobawić, potworzyć,
nie wiem, jakąś wizję swoją taką stworzyć,
jak naprawdę nie umiem tego, jak to zrobić z ciekawości,
albo np. do gry jakieś muzykę, no nie umiem tak projektować,
Słuchacz masowy się charakteryzuje tym, że on nie wchodzi w ogóle w detale
i nie jest w stanie tego rozróżnić. To, co żeście puszczali dzisiaj,
na przykład to na samym początku, ten niby metal, tam brakowało tylu elementów.
Wszystko było owszem dopasowane, ale było na przykład bardzo suche.
A wiadomo, że w tego rodzaju metalu, akurat w tego rodzaju,
który tam prezentowaliście. No to na przykład na perkusji
jest dorzucony z tyłu taki gigantyczny rewerb, który jest bardzo mocno z nią sklejony.
On jest krótki, ale on jest potężny. Tego brakowało, nie było przestrzeni na gitarach,
nie było odpowiedniej przestrzeni na pokalu. Dalej, jak był ten growling np.,
to on se nie radził z formantami. Formanty te wysokie nagle śpiewał w ogóle w zabawny sposób,
Człowiek tego tak nie robi.
Następna rzecz, która się rzuca w uszy,
to zwróćcie uwagę na to,
jak to jest wszystko równo zagrane.
To jest tak idiotycznie równo,
że normalnie nawet gdyby to w studiu było tak nagrane,
to żaden z realizatorów by tego nie zaakceptował,
żeby to wyszło na świat.
Dlaczego? Dlatego, że straci taki ludzki charakter,
Bo normalnie się to robi w ten sposób,
że nawet jak mamy kilka ścieżek,
np. perkusję, bas, wokal i gitarę,
to się przesuwa ścieżki względem siebie,
żeby z nich wyciągnąć ten drive, groove,
czyli innymi słowy, żeby to się przełożyło
na jeszcze silniejsze emocje.
A właśnie wyrównanie to jest zabicie tych emocji.
Jeszcze raz, masowy słuchacz tego nie wychwyci.
Młodzi ludzie tego nie wychwycą, bo są za młodzi.
Oni się w tym wychowali, co gorsza, jako dzieciaki.
I np. tak jak wielu ludziom pasuje autotune
i oni są nawet tym po prostu zachwyceni,
to ludzie, którzy są z starszego pokolenia,
to się stukają w głowę i myślą sobie,
no dobrze, okej, może jako efekt artystyczny
to w pewnych gatunkach to jest jak najbardziej.
W hip-hopie, trapie czy w dance to rzeczywiście siedzi,
mówiąc kolokwialnie.
Ale nie może być tak, że to jest stosowane wszędzie,
bo się po prostu człowiek nie nauczył śpiewać na miłość boską.
Więc moim zdaniem to chyba będzie w ten sposób szło,
że to będą dzieciaki się tym bawić,
Będą tworzyć oczywiście ludzie na szybko reklamy,
czyli podkłady jakichś muzycznych do reklam.
Gry tak samo, bo w grach to też jest produkt masowy
i ludzie raczej zwrócą uwagę na, a nawet nie raczej, na grafikę,
a muzyka jest drugorzędna.
A tutaj, jeżeli chodzi o odbiór taki czysto muzyczny,
No to właśnie pojawią się biznesmeni, którzy to wykorzystają w sposób brutalny właśnie na tych wszystkich streamingowych platformach.
I będą tak jak Michał mówił, to będą specjalnie tworzone przez EIH te zespoły już z historią, ze wszystkim.
No i miliony ludzi będą tego słuchać. Natomiast ci, co będą mieli coś do powiedzenia, to będą tak jak piwo kraftowe.
Gdzieś tam się będą szlajać, że tak powiem, po pańskich dworach nie w porę.
No i coś będą próbować udowodniać. Będzie to, myślę, tak jak w tej chwili
twórcy jazzu albo muzyki poważnej, to jest tam 3 chyba, 3% i 7%
na rynku. Natomiast nie wiem, naprawdę nie wiem,
jak to będzie, w którą stronę to zmierza.
W każdym razie tutaj, jeżeli chodzi o to, co puszczaliście,
to trzeba zrobić ze dwa kroki do tyłu,
znaczy wypadałoby to popsuć.
Tak jak pamiętacie, jak weszła cyfra
i myśmy się wszyscy zachwycili,
że ta cyfra to jest coś niesamowitego,
bo to jest takie wszystko czyste, klarowne i w ogóle,
a potem stwierdziliśmy, hola, hola, czegoś to nam brakuje.
Brakuje nam tego brudu, który gdzieś tam powstawał w torze audio.
Tego szumu winylowej płyty.
Tak, czy szum winylowej płyty, czy szum taśmy.
Czy te efekty, które tam też coś wnosiły.
Wszelkie efekty, rewerby, jakieś delaye, czy kompresory.
Każdy z nich coś wnosił. No i teraz zaczęło tego brakować.
I tutaj jest to samo.
Czyli raz, że to wszystko jest mega wyrównane.
Dwa wokalista śpiewa jak klawiszowiec, bo tak jest dobity do zera każdy dźwięk.
I jest to… właśnie też brzmi cholernie cyfrowo, cholernie cyfrowo.
I też tutaj nie ma tego brudu. Może ktoś tam z tych szanownych inżynierów informatyków
pójdzie do głowy, pójdzie prozum do głowy, przepraszam, no i ewentualnie może zatrudni
Jakiegoś muzyka, któremu to wyklaruje i może z tym algorytmem gdzieś pójdą trochę lepszą stronę.
Zdaje się, że ja kiedyś czytałem, że Suno zatrudnia generalnie muzyków.
Tam muzycy jacyś są, którzy gdzieś tam powiedzmy współpracują. Nie wiem jak to jest w przypadku Udio.
Natomiast ja podejrzewam, że to może być raczej kwestia jakichś priorytetów.
Być może oni sobie na razie postawili za cel to, żeby ta muzyka brzmiała gdzieś tam powiedzmy jakoś czysto, żeby te instrumenty odpowiednio odwzorować, wokale, a potem jak już dojdą do tego pewnego pułapu, to może właśnie będą zwracać uwagę większą na te detale.
Nie, ale wiesz co, mi się wydaje, że to naprawdę nie jest tak trudno na przykład spowodować to, żeby lekko rozjechać utwór, jeśli chodzi o instrumenty.
To są dosłownie milisekundy, a to robi o wiele większe wrażenie niż po prostu totalna kwantyzacja.
Zresztą tam później, nie wiem czy to było wcześniej, prezentował się taki…
To było świetne, taki styl, ale lata 70., taki podobny do Bee Geesów i tak.
To tam był w pewnym momencie…
Tam jeden z was zwrócił uwagę, że te klapsy są takie dziwne.
A właśnie te klapsy były genialne, bo one były rozjechane z głównym werblem.
I to o tak chodzi.
Ja powiedziałem, że one są dziwne, ale nie powiedziałem, że są złe.
To jest coś dziwnego, nie musi być złe. One były takie mięsiste, przyjemne.
Ja ogólnie takie lubię.
Tak samo mi się podobało to, że one są rozjechane w czasie.
I to tak właśnie powinno być, że nie jest pach, tylko plach.
Akurat audio tego pilnuje i na przykład w audio jest sporo takich…
właśnie takie naturalności. Te instrumenty nie są takie wyczyszczone.
To wszystko ma jakiś taki swój luz, taki czasowy.
Natomiast generalnie, no cóż, ta technologia, no też trzeba pamiętać,
i to może jest dobre, może jest złe, no to się okaże jakby z czasem.
To jest jednak bardzo rzecz nowa, to znaczy pierwsze chyba próby,
o których wiem, przynajmniej chyba był rok 2017 czy 2018,
to się do niczego nie nadawało poza eksperymentami,
tak mi się wydaje, ewentualnie może jakąś inspiracją
Gdzieś tam.
Natomiast produkty jakkolwiek komercyjne, czyli to suno,
to jest co? Dwa lata?
Dwa i pół, coś koło tego.
Czyli porównując do syntezatorów,
pierwszy komercyjny mógł lata 60.
Po dwóch latach się niewiele zmieniło.
W tym momencie bez syntezatorów
muzyka nie byłoby tą muzyką, która jest dzisiaj.
To nie tylko gatunki elektroniczne, ale i rock, i jazz nawet nieraz.
I milion różnego rodzaju gatunków, w których po prostu te syntezatory wszystkie siedzą.
Znaczy w ogóle instrumenty elektroniczne.
Ja też chcę jedną rzecz zauważyć. Niestety albo stety, ale to wszystko jest stworzone pod masówkę.
I tego musimy być świadomi.
Oczywiście, że tak. I tak samo jak syntezatory w zasadzie spowodowały, że większość muzyków, dętych, spyczkowych, nie ma co robić w muzyce popularnej w dziewięćdziesięciu paru procentach.
No bo w latach sześćdziesiątych, jakby siedemdziesiątych nie było za bardzo innej możliwości i zwłaszcza w disco, no to co tam, po prostu zatrudniało się orkiestrę.
rozrywkową, tak? Dwudziestu, trzydziestu paru muzyków,
którzy musieli dostać swoją działkę, pieniędzy.
Realizator to musiał wszystko nagrać, wszystko zmiksować,
to wszystko kosztowało. No, w tym momencie
ogarnia to jeden człowiek, tak?
Tak, a co gorsza, jeszcze się wtrącę, co gorsza, to właśnie
Nawet jeżeli chodzi o tego odbiorcę masowego,
no to słuchajcie, są cały czas ludzie, którzy są fenomenalni,
jeśli chodzi o twórców muzyki pop i też wykonawców.
Jeżeli chodzi o wokalistów, to przecież jeżeli mamy coś,
co jest wykonane przez Christina Aguilera albo kiedyś Whitney Houston,
to są rzeczy fantastyczne.
Ale co z tego? One już są dzisiaj niepotrzebne.
W ogóle są niepotrzebne.
I naprawdę już nikogo nie interesuje.
Żaden talent, po co?
To wszystko może być wytworzone przez dziennikarza, przez celebrytę.
A teraz jeszcze kolejne zjawisko, z którym mamy do czynienia,
że też zauważyłem, że celebryta, który w ogóle nie umie śpiewać,
on nagle i książkę napisał, i płytę wydał.
No super, no super po prostu, super. Piękny kwiat.
Tylko mnie zastanawia jedna rzecz.
Jeżeli takie AI, które jest produktem, nie oszukujmy się, bardzo nowym,
jest w stanie stworzyć coś, co jest w stanie albo będzie za chwilę w stanie
zadowolić naprawdę dużo ludzi, no to mamy dwie możliwości.
Albo większość ludzi no po prostu wymaga czegokolwiek,
albo ta tworzona przez nas, przez ludzi muzyka
nie jest wcale tak trudna, jak nam się wydaje.
Wydaje.
Bo wiesz, jeżeli na przykład czad GPT czy cokolwiek innego stworzy wiersz,
to przynajmniej w języku polskim nie widziałem nigdy piosenki nawet.
Zwykłej piosenki, która byłaby stworzona, nie chcę mówić, że dobrze,
ale nie byłaby stworzona gorzej niż źle.
Natomiast…
Ja wiem, wiem, tak. Wiem o co chodzi.
Oczywiście można mówić, że kwantyzacja, że autotune, że coś,
ale dla przeciętnego odbiorcy ta muzyka naprawdę może być względnie okej.
Ja doskonale rozumiem, Tomek, o co chodzi.
Też uważam, chociaż niektórzy mówią, że nie, że sztuczna inteligencja
tu nie ma szans. No niestety my nie mamy szans, ponieważ jej kreatywność
jest, można powiedzieć, właściwie nieskończona. I to jest przerażające.
Tam zachodzą miliardy operacji na sekundę czy miliony, prawda?
I tutaj czy to będą wiersze, czy będą opowiadania, czy bajki dla dzieci?
Ale wiesz, Sławku, nawet jeżeli ktoś, powiedzmy, powie, okej, no sztuczna inteligencja nie dorówna człowiekowi w kreatywności, ale czy przeciętny człowiek, bo ja nie mówię o jednostkach, które się zajmują na przykład pisaniem, bo wiadomo, że jak postadzimy czata GPT i kogoś, kto żyje z pisania, to ten, kto żyje z pisania, napisze lepszy tekst niż czat GPT, ale czy czat GPT na przykład napisze lepszy tekst od przeciętnego człowieka?
Wydaje mi się, że od takiego statystycznego przeciętnego będzie w stanie to lepiej zrobić.
To zależy jaki tekst. To znaczy, bo jeżeli mowa o tekstach takich na zasadzie
napisz krótkie opracowanie czy krótki artykuł, to być może tak,
ale wiersz albo tekst piosenki…
Tylko ile osób jest Ci w stanie napisać wiersz?
To prawda, ale z drugiej strony niemal każdy, kto to robi,
Wiesz, pisać, jakiś wypracowań, jakieś takie rzeczy, uczymy się w szkole.
Natomiast tworzyć muzyki prawie nikt się nie uczy.
To prawda.
Bo wychodzimy z założenia, że nikt tego nie potrafi.
Być może tak, być może nie. Ja tego nie wiem.
Z drugiej strony, no bo jakby to wszystko ma bardzo wiele aspektów,
przecież do którego w zasadzie XIX wieku kompozytorzy muzyki
poważnej, jak ją się teraz określa, z czego żyli.
Z tego, że ich zatrudniał książę, król czy kto tam jeszcze.
Miał swoją orkiestrę, czy co tam jeszcze.
I dlatego np. Hain większość rzeczy robił na kwartet smyszkowy,
bo po prostu miał takie instrumenty, a nie inne do dyspozycji
i nie mógł tam za wiele zrobić.
Potem gdzieś tam się wybrał.
Nie pamiętam jakoś biografii kompozytorów.
W każdym razie to wszystko było utworzone na zamówienie.
To nie było tak, że zboczna stwierdziła,
a, dobra, Mozart podobno już tam miał jakieś te,
ale Hein czy Bach, a, zrobię se pasję.
I ją potem wydam.
No nie, to nie do końca, to nie jest takie…
Jeszcze powiem wam, co mnie na przykład bardzo…
Był termin, był pieniądze, był…
Wykonawcy, którzy mieli to wykonać, po prostu pisz dla tych i do widzenia.
Jeszcze chciałem powiedzieć, co mnie na przykład zaskoczyło bardzo pozytywnie
i naprawdę stwierdziłem, że chylę czoła przed sztuczną inteligencją.
Były takie trzy rzeczy. Jedno to doskonałe nawiązanie do takich
przedwojennych orkiestr, gdzie śpiewa solista z orkiestrą albo chór z orkiestrą,
tak jak to się kiedyś komponowało,
włącznie z odwzorowaniem dźwięku.
To było coś pięknego.
Druga rzecz to kilka utworów,
które słyszałem na takich dosłownie operowych.
To znaczy, to był solista i była orkiestra.
To też było bardzo dobrze odwzorowane
i pod względem dźwięku, jakości, przestrzeni w ogóle,
takiej jakby sali, prawda?
A trzecia rzecz, która zupełnie mnie powaliła,
Ktoś na Eltenie zrobił taki utwór reggae i to było w takim starym stylu,
że te brzmienia były tak jak w latach 60-tych, takie brudne strasznie.
Ta perkusja, te gitary jakieś takie byle jakie, takie ledwo strojące.
No i jeszcze ten głos jakiegoś murzyna, który coś po angielsku niby,
Ale jak to po prostu żarło, to było coś pięknego.
Także, no, różne odcienie są tego.
Tak, to prawda, więc no…
Wszystko też jest kwestią odpowiedniego promptu, tak naprawdę.
Myślę, że wniosek dla…
Powiedzmy, dla ludzi pokroju, no powiedzmy, mojego,
czyli tacy, którzy się zajmują muzyką, coś próbujemy grać,
są takie, że no, żyjemy w takiej rzeczywistości,
No i trzeba się do tego dostosować, no nie ma inaczej.
Tak jest.
Po prostu.
Tak, tak jest.
Fajnie, dziękuję wam, pozdrawiam.
Fajna edycja.
No, trzymajcie się na razie.
No dobrze, to co?
Mamy jeszcze o czym mówić? Bo tak w sumie już trochę…
Myślę, że może to powoli właśnie w sumie już zakończyć,
bo nawet się podsumowało w jakimś stopniu.
Dokładnie.
Także, jak widać, każdy kij ma dwa końce.
Nie ma różnego z końców.
I to pozwala każdemu na stworzenie czegoś nieraz nawet ciekawego.
Z drugiej strony rzeczywiście na pewno znajdzie się ileś osób,
które po prostu stracą przez to jakieś pieniądze.
No i cóż, zobaczymy kto, jak się z tego wybroni, obroni.
Cóż, przetasowania mamy niezłe ostatnio i rzeczywiście
sztuczna inteligencja tutaj
podważa nam różne rzeczy, które do tej pory zdawałoby się bezdyskusyjnie ustalone raz na zawsze.
Okazuje się, że nie. Zobaczymy, co będzie dalej.
No i tyle. W takim razie…
Dziękuję bardzo.
Tak, ja przypomnę, że Patryk Chojnacki i ja, czyli Tomek Gwilewski rozmawialiśmy
dzisiaj na temat algorytmów sztucznej inteligencji do generowania muzyki.
Michał Dziwisz pilnował, żeby to wszystko było słyszalne przez Was,
drodzy słuchacze, odbierał telefony, czytał komentarze i dbał,
żeby to wszystko jakoś brzmiało.
Dziękujemy, do usłyszenia, dobranoc, do widzenia,
Do następnej audycji.
Był to Tyflo Podcast.
Pierwszy polski podcast dla niewidomych i słabowidzących.
Program współfinansowany ze środków Państwowego Funduszu Rehabilitacji Osób Niepełnosprawnych.

Wszystkie nagrania publikowane w serwisie www.tyflopodcast.net są dostępne na licencji CreativeCommons - Uznanie autorstwa 3.0 Polska.
Oznacza to, iż nagrania te można publikować bądź rozpowszechniać w całości lub we fragmentach na dowolnym nośniku oraz tworzyć na jego podstawie utwory Zależne, pod jedynym warunkiem podania autora oraz wyraźnego oznaczenia sposobu i zakresu modyfikacji.
Przekaż nam swoje 1,5% podatku 1,5 procent Logo FIRR Logo PFRON Logo Tyfloswiat.pl

Czym jest Tyflopodcast?

TyfloPodcast to zbiór instrukcji oraz poradników dla niewidomych lub słabowidzących użytkowników komputerów o zróżnicowanej wiedzy technicznej.

Prezentowane na tej stronie pomoce dźwiękowe wyjaśniają zarówno podstawowe problemy, jak i przedstawiają metody ułatwienia sobie pracy poprzez korzystanie z dobrodziejstw nowoczesnych technologii. Oprócz tego, Tyflopodcast prezentuje nowinki ze świata tyfloinformatyki w formie dźwiękowych prezentacji nowoczesnych urządzeń i programów. Wiele z nich dopiero znajduje sobie miejsce na polskim rynku.

Zapraszamy do słuchania przygotowywanych przez nas audycji i życzymy dobrego odbioru!

Tematyka

Pozycjonowanie i optymalizacja stron internetowych