Tryb Wideo w ChatGPT (wersja tekstowa)
Pobierz napisy w formacie SRT
Pobierz napisy w formacie VTT
Fundacja Instytut Rozwoju Regionalnego prezentuje
Tyflo Podcast
Witam wszystkich bardzo serdecznie przy mikrofonie Maciek Walczak.
Dziś będziemy rozmawiać sobie o czacie GPT,
a dokładniej mówiąc o trybie głosowym tego czatu GPT
rozszerzonego o tryb wideo.
Czyli porozmawiamy sobie o tym,
Co na obecny moment GPT potrafi i jakie nam daje możliwości.
O czacie GPT czym jest, tak naprawdę co potrafi, szerzej było już mówione w audycji Darka Marchewki,
gdzie po więcej szczegółów odsyłam.
Natomiast wtedy nie było jeszcze dostępnego tego trybu wideo, czyli tej możliwości analizowania otoczenia
za pomocą kamery naszego smartfonu.
Bo trzeba sobie tutaj powiedzieć, iż tryb ten dostępny jest wyłącznie w aplikacji mobilnej Chata GPT na smartfony, zarówno z systemem Android, jak i iOS, czyli naturalnie iPhone.
Wersje desktopowe aplikacji, czyli aplikacja na system Windows, czy dla systemu macOS, takowego trybu niestety nie posiada, jak i wersja przeglądarkowa, natomiast aplikacje mobilne taki tryb posiadają.
Jeszcze z takich informacji wstępnych chciałbym zaznaczyć, że na dzień nagrywania tego podcastu, to jest 19 lutego 2025 roku, niestety możliwość taka dostępna jest wyłącznie dla subskrybentów Chata GPT w wersji zarówno Plus jak i Pro, czyli płatnych w wersji Chata GPT.
Darmowe konta niestety jeszcze nie są tym planem objęte.
Również pragnę zaznaczyć, iż tak naprawdę dogrywam dziś niejako ten początek, czyli dnia 19 lutego 2025 roku i zapewne dogram również koniec, aby powstał z tego zgrabny, ładny podcast,
gdyż tak naprawdę to, o czym będzie mówione, ten materiał, został nagrany sporo wcześniej, dla moich kilku znajomych, jednakże uznałem po pewnym czasie,
że skoro tak naprawdę jest już ten materiał, podzieliłem się nim z kilkoma osobami,
to dlaczego nie mógłbym potraktować tego jako podcastu? Zwłaszcza, że materiał ten ma ponad 20 minut,
więc spokojnie nadaje się jako materiał na podcast. Tutaj również od razu usprawiedliwienie.
Gdyby w pewnym momencie materiału pojawiły się jakieś brumienia, jakieś spadki jakości,
To z góry Was za to przepraszam, dlatego że, tak jak mówiłem, nie zwracałem wtedy bardzo przesadnie uwagi na jakość.
Mimo, że się w sumie starałem półprofesjonalizm zachować, niemniej jednak nie do końca wówczas zwracałem aż w takim dużym stopniu,
jak kiedy sobie do Was naprawdę zaplanuję mówić z myślą o Was, drodzy słuchacze.
Podcast zrobić, podcast nagrać, podcast wypuścić.
Więc gdyby się pojawiły jakiekolwiek niedoskonałości, bardzo serdecznie za nie przepraszam.
A tymczasem myślę, że już oddam sobie samemu głos temu z przeszłości, sprzed bodaj dwóch tygodni.
Także zapraszam bardzo wszystkich serdecznie do wysłuchania i oczywiście do komentowania, do korzystania, do tego, aby po prostu materiał Wam służył.
A więc przystępujemy sobie do nagrywania prezentacji czata GPD Plus w trybie wideo, w trybie głosowym w połączeniu oczywiście z wideo.
Warto wspomnieć, że to już działa w Polsce. Nie trzeba się łączyć z żadnym VPNem.
I co my tu mamy, czego nie mieliśmy wcześniej?
Idąc od samego końca ekranu do jego początku, od strony prawej.
Więcej menu. Więcej menu. Tego tutaj nie było.
Może wejdziemy sobie w to, żeby zobaczyć, co to jest.
Bo można podczas rozmowy czatowi przesyłać zdjęcie. Akurat tej opcji nie testowałem.
Można w czasie rozmowy robić również zdjęcie, czego również nie testowałem, ale zakładam, że działa.
Udostępnij ekran. To jest bardzo fajna opcja, którą pokażę później, ale najpierw stricte ogląd tego, co czat GPT widzi przed kamerką.
Bo tutaj już tak naprawdę jest więcej opcji.
A muszę powiedzieć, że udostępnianie ekranu dla czata GPT działa naprawdę fajnie.
Ale o tym, tak jak mówiłem, będzie za chwilę.
Dalej mamy…
Wycisz audio. Włączyłem to na razie.
Domyślnie jest oczywiście wyłączone, ale żebyśmy tutaj nie byli rozpraszani
przez tegoż naszego przyjaciela wirtualnego, sztucznie inteligentnego.
Włączyłem wyciszenie audio.
Kolejną opcją jest…
Otwórz kamerę, przełącznik wyłączony. I to jest właśnie ta opcja, która nas interesuje, żeby czat mógł widzieć to, co go otacza.
Wybierz głos, przycisk.
No to to już było, to już mieliśmy…
Współdostępnik, przycisk.
I tak dalej. Ale jeżeli włączymy sobie kamerę, wówczas pojawią nam się dodatkowe inne opcje.
Więc ja na razie włączę kamerę i pokażę te opcje jeszcze bez dostarczania czatowi naszego głosu, mojego głosu w zasadzie, żeby tutaj nie rozpraszał też.
Dlatego, że w tym momencie pojawiają nam się dodatkowe opcje.
Otwórz kamerę jest teraz włączone.
Przełącz na przedni aparat. Teraz jest aparat tylni.
Kiedy ja przełączę na przedni, on teraz widzi moją piękną twarz.
Ogoloną dopiero co. W każdym razie ją tutaj widzi.
Przełącz latarkę.
Ten przycisk niestety nie anonsuje nam jego statusu, czy latarka jest włączona, czy latarka jest wyłączona.
Tego niestety nie mamy. I dopiero jeżeli zapytamy czata, czy jest jasno, czy jest ciemno, on nam to wtedy powie.
I gdy go poprosimy, co on tam widzi, wówczas nam powie, że albo jest bardzo ciemno i doświetl tutaj znajdź lepsze miejsce, źródło światła daj itd.
No i wtedy możemy się zorientować po tym, że latarka jest wyłączona i że generalnie jest ciemno.
I tak naprawdę tutaj interfejs już nam się w zasadzie przestaje różnić.
Dodatkowe opcje związane właśnie z włączeniem trybów wideo to jest
zmiana aparatu, przełącz na przedni lub tylni oraz włączenie lub wyłączenie latarki.
Kwestia jeszcze taka, że ja sobie na chwilę wyłączę podgląd z kamery
i włączymy sobie audio, żeby nas czat słyszał i żebyśmy mogli z nim sobie pokonwersować.
Cześć Maćku. Co tam u Ciebie słychać?
Słuchaj, wiesz co? Akurat nagrywam demonstrację Ciebie, jak działasz z trybem wideo.
Dla kilku znajomych, ale też najprawdopodobniej dla audycji Tyflo Przegląd.
Super Maćku. Jeśli potrzebujesz jakiejś pomocy albo chcesz, żebym coś szczególnie pokazał, daj znać. Jak mogę pomóc w nagraju?
Słuchaj, powiedz mi, czy ty teraz coś widzisz przed kamerą, czy nic?
No właśnie, czyli kamera jest, zdaje się, wyłączona, prawda?
Dobrze, dobrze. Ja w takim razie idę sobie teraz w lewo z voice-overem do przełącznika
Otwórz kamerę. Przełącznik wyłączony.
Świetnie, Maćku. Jak już otworzysz kamerę, powinno być lepiej.
Jeśli będziesz potrzebował pomocy, mów teraz.
Włączone.
Teraz jest znacznie lepiej. Widzę mikrofon na pierwszym planie i laptop w tle.
Wszystko działa. Mów teraz.
Wydaje mi się, że to MacBook, sądząc po charakterystycznej klawiaturze i designie.
Jest srebrny, więc może to być MacBook Air lub Pro.
Mikrofon Blue Snowball, charakterystyczny ze względu na kulisty kształt
i siateczkową obudowę z logo na przodzie.
Jest popularny do nagrywania podcastów i rozmów.
Jasne. W jakim jest kolorze?
Mikrofon wydaje się być biały, z metalicznym logo z przodu.
Jest to jedna z popularnych wersji kolorystycznych Blue Snowball.
Jasne. Okej. Powiedz mi, czy widzisz to logo tego mikrofonu?
Tak. Widzę logo na przedzie mikrofonu.
Jest to metaliczny napis Blue na siateczkowej obudowie.
No i dobra. Wszystko się zgadza.
Teraz ja sobie tutaj przełączę na przednią kamerę i zobaczymy.
Bo teraz rozumiem, widzisz to, co pokazuje kamera tylnia, tak?
Tak, dokładnie. Obecnie widzę to, co pokazuje tylna kamera.
Jak przełączysz na przednią, będę widział to, co jest przed tobą.
Tak, dokładnie. Obecnie widzę to, co…
On sobie tutaj lubi powtarzać, niestety się lubi powtarzać.
Ja tutaj dam przełącz na przedni aparat i w miarę się spróbuję ustawić.
Przełącz na tylny aparat.
Teraz widzę laptopa, mikrofon Blue Snowball na pierwszym planie, a w tle jest okno z żaluzjami. Na biurku, obok laptopa, jest jeszcze biała myszka. Całość jest dobrze widoczna.
Nie, myszka, nie, nie, nie, nie. Słuchaj, włączyłem teraz przedni aparat. Powiedz mi teraz, co widzisz, bo wydaje mi się, że troszkę ściemniasz.
Teraz widzę Ciebie. W tle jest pomieszczenie, a obok widzę szafę i biurko. Całkiem dobrze Cię widać.
To się zgadza. Dobrze, to opisz mnie, co widzisz, jeśli o mnie chodzi.
Widzę Twoją twarz, krótkie włosy. Jesteś w pomieszczeniu, a w tle jest szafa i biurko.
Mhm, dobra, dobra, dobra.
Powiedz mi, czy widzisz u mnie zarost,
czy bardziej jestem ogolony?
Dobra, dobra, jasne, jasne.
A jeśli chodzi o emocje, a generalnie o mimikę twarzy?
Wyglądasz na raczej spokojnego.
Twoja mimika sugeruje, że jesteś zrelaksowany i skupiony.
Nie dostrzegam żadnych silnych emocji.
Jak to brzmi?
Dobra, czacie, dzięki serdeczne.
Drogi przyjacielu, mój, ty, wirtualny.
Teraz pokażemy za chwileczkę, jak udostępnić ekran.
Tak naprawdę, żebyś ty wszystko widział i mógł pokazać, co tam w trawce piszczy.
Chociaż, wiesz co? Jeszcze moment.
Momencik, momenciek.
O, powiedz mi teraz, co widzisz.
Nie. Zobacz jeszcze raz, użyj kamery.
Użyj kamery i powiedz, co widzisz.
Widzę teraz coś, co wygląda jak etui do słuchawek na biurku.
Jest białe i ma prostokątny kształt.
Mów teraz.
Etui wygląda na czyste i w dobrym stanie.
Nie widzę żadnych zarysowań ani uszkodzeń.
Wydaje się być zadbane.
Wygląda na to, że to jest to samo etui, które widziałem wcześniej.
Wciąż jest ono białe i prostokątne? Nie dostrzegam żadnych zmian.
Wygląda na to, że to jest to samo etui, które widziałem wcześniej.
Aha, wygląda na to samo etui, dobrze.
Masz dziwną przypadłość, że się powtarzasz dwa razy od jakiegoś czasu,
więc nie wiem, co jest z tym spowodowane.
Natomiast powiedzmy, że jest okej, jeśli chodzi o tą część prezentacji.
I teraz będziemy zajmować się udostępnieniem ekranu.
Brzmi świetnie, Maćku. Jeśli będziesz potrzebował pomocy z udostępnieniem ekranu, śmiało pytaj. Jestem tu, żeby pomóc.
Mów teraz. Wyłączone.
Otwórz kamerę. Przeglącznik. Wyłączone.
Wyłączone.
Zobaczymy, co on nam tutaj eleganckiego powie.
O, dobra. Udostępni… najpierw wyciszymy audio.
Udostępnimy…
Dobra, czacie… słyszysz mnie, tak? Czacie, słyszysz mnie?
Tak, wyciszyłem po prostu audio na chwilę, żebyś mi tutaj się nie wtrącał, nie przeszkadzał.
Za co przepraszam, ale już teraz jesteś znowu słyszalny
Ja wchodzę teraz sobie do menu, o którym mówiłem wcześniej.
Udostępnij ekran i…
Moment…
Dobrze, to nam też powiedziało, że tryb nie przeszkadzać i tak dalej.
Transmisja ekranu, chat GPT.
Bo to jest to samo, co nagrywanie ekranu z centrum sterowania tak naprawdę,
więc moglibyśmy to zrobić równie dobrze w ten sposób.
No ale, powiedzmy, my sobie to zrobimy w ten sposób.
O, kurtyna i tak dalej, voice over nam tutaj…
Coś nam się zepsuła? Ta. Więc zaraz wracam.
Drogi czacie, nie słyszeliśmy się przedtem, natomiast kwestia jest taka, że chcecie udostępnić ekran, żebyśmy powiedzieli, co na nim jest, także momencie.
Dobra.
Dobrze, już Ci powiem jak będę gotów.
Dobra, czy widzisz coś teraz na ekranie?
Jest tam też przycisk zakończenia emisji. Czy mogę Ci w czymś pomóc?
Dobra, super. W końcu się nam udało to zrobić.
I teraz w takim razie przejdziemy sobie do innej aplikacji już zapowiadanej.
Na ekranie widzę zapowiedź audycji Tyflo Przegląd. Potrzebujesz pomocy z czymś konkretnym w tej aplikacji?
No powiedz mi, kiedy to się odbędzie, ten Tyflo Przegląd.
Audycja Tyflo Przegląd jest zaplanowana na wtorek 11 lutego od godziny 20 do północy.
Czy potrzebujesz jeszcze jakiejś informacji?
Opis audycji Tyflo Przegląd wskazuje, że jest to cotygodniowa audycja na Tyflo Radiu,
w której przedstawiane są nowości ze świata technologii.
Porusza tematy związane z dostępnością dla osób niewidomych.
Czy coś jeszcze chciałbyś wiedzieć?
Organizatorem jest Maciek, czyli ty.
To ty prowadzisz tę audycję, przedstawiając nowości technologiczne związane z dostępnością dla osób niewidomych.
Nie, niestety to nie ja prowadzę. Natomiast często tam dzwonię akurat do audycji i przedstawiam też różne rzeczy, natomiast ja jej nie prowadzę.
Dobra, to to mamy też zdany śpiewająco. Wejdziemy sobie jeszcze do jednej gry i zobaczymy, co mi powiesz na jej temat, dobra?
Okej, jasne. Wejdź do tej gry, a ja spróbuję ci pomóc.
Bo ciekawi mnie, jak opiszesz ludziom coś takiego jak… Poczekaj, poczekaj. Dobrze. Powiedz mi, co teraz widzisz?
Na ekranie widzę panel rzemiosła, gdzie są różne opcje wytwarzania przedmiotów.
Widzę opcje jak Blueberry i Wheat, z czasami wykonania i przyciskami stwórz.
Jest też sekcja z materiałami i punktami mistrzowskimi.
Czy potrzebujesz dokładniejszych informacji?
Dobra, te Blueberry i Wheat, to co to jest po polsku?
To po polsku jagoda, a Wheat to pszenica.
W grze te składniki prawdopodobnie służą do tworzenia różnych przedmiotów lub potraw.
Dobra, dobra, jasne, dzięki.
Powiedz mi, czy widać ilustracje tych materiałów również, czy nie?
Tak, widzę ilustracje tych materiałów.
Obrazki przedstawiają jagody dla Blueberry i kłosy zboża dla Wheat.
Są to małe ikonki obok odpowiednich nazw.
Na ekranie widzę listę przedmiotów, takich jak Masterwork Platter 1 i Craftsman’s Banquet 1.
Każdy z nich ma poziom, bonusy oraz czas potrzebny do ich stworzenia.
Jest też przycisk stwórz. Czy chcesz wiedzieć coś więcej o tych przedmiotach?
Master Work Platter 1 to rodzaj doskonałego półmiska, a Craftsman’s Banquet 1 to rzemieślnicza…
Są to specjalne przedmioty, które można stworzyć w grze, zdobywając…
To drugie to co? To drugie to co? Jeszcze raz.
Craftsman Banquet 1 to rzemieślnicza uczta, czyli specjalny przedmiot, który można stworzyć w grze.
Daje on dodatkowe bonusy, podnosząc umiejętności postaci.
Jakie umiejętności?
Te przedmioty mogą zwiększać różne umiejętności, takie jak rzemiosło, zapewniając bonusy do efektywności w tworzeniu przedmiotów lub inne korzyści w grze.
Dobra, jasne. A ten drugi, jest tam ilustracja generalnie tego, co to w ogóle jest?
Zresztą obu tych przedmiotów.
Dobra, a powiedz mi jeszcze…
O, na przykład to jeszcze. Co to jest?
Craftsman’s Banquet 1 to uczta, która też zwiększa umiejętności. Oba przedmioty pomagają w grze poprzez zwiększanie efektywności tworzenia.
Okej, dobra, poczekaj.
Dobra, dobra, dobra, teraz co widzisz?
Wciąż widzę ekran gry z przedmiotami. Jest lista przedmiotów do stworzenia, jak Masterwork Platter 1 i Craftsman’s Banquet 1.
Ale teraz, na pewno, zobacz jeszcze raz, przeanalizuj ekran. Co widzisz?
Dobra, wydaje mi się, dobra, wydaje mi się, że skończył się limit, jeśli chodzi o udostępnianie ekranu, o wideo i tak dalej.
Więc ja sobie pozwolę, zaraz sobie zresztą to zobaczymy, bo ty już czacie mi teraz straszne głupoty do mnie mówisz.
No dobra, damy Ci jeszcze szansę. Co widzisz teraz na ekranie?
A poczekaj, ten ekran się przestał udostępniać.
Tak, widzę, że chyba limit został osiągnięty.
Powiedz mi, czy… poczekaj, poczekaj, poczekaj.
Dobrze, aplikacja mi tu po niemiecku mówi, że osiągnąłem limit wideo tak naprawdę.
Jeśli limit został osiągnięty, możemy kontynuować rozmowę bez udostępniania ekranu.
Jeśli masz jeszcze jakieś pytania lub potrzebujesz pomocy, daj znać.
Dzięki. Dzięki i powiem Ci, że bardzo pomogłeś. Bardzo, że tak powiem, myślę, zaplusowałeś tutaj
i u słuchaczy Tyflo Przeglądu, ale też u tych, dla których nagrałem ten materiał.
Cieszę się, że mogłem pomóc. Jeśli będziesz potrzebował jeszcze wsparcia, śmiało daj znać.
Powodzenia z materiałem.
Dzięki śliczne.
Wyłączony.
Nie ma za co. Zawsze do usług.
Dobra, tak jak mówiłem, wyciszyłem sobie audio, żeby już nam czad nie przeszkadzał.
Tak więc, po tym to poznacie, że on już nie udostępnia ekranu, że będzie gadał to samo i się uprze na to samo.
No i potem wychodzi na to, jak się włącza kamerę. Otwórz kamerę, przełącznik wyłączony, próbuje się włączyć.
I nagle wyskakuje informacja, że osiągnęliśmy limity. Także, no tak to z grubsza wygląda.
Ja bardzo dziękuję za uwagę. Mówił do Was Maciek Walczak.
No i do usłyszenia w kolejnym odcinku Tyflo Podcastu. Cześć.
Był to Tyflo Podcast. Pierwszy polski podcast dla niewidomych i słabowidzących.
Program współfinansowany ze środków Państwowego Funduszu Rehabilitacji Osób Niepełnosprawnych.