Plaud Note
Dodany 30 grudnia 2025
4 komentarze
Jan Gawlik prezentuje wygląd i funkcje dyktafonu Plaud Note, który wykorzystuje sztuczną inteligencję do przetwarzania nagrań. W audycji omawia również możliwości towarzyszącej aplikacji na system iOS, w tym funkcje transkrypcji i organizacji nagrań. Poruszone zostają również kwestie dostępności urządzenia i aplikacji dla osób niewidomych, a użytkownicy tego dyktafonu dzielą się swoimi wrażeniami i spostrzeżeniami.
Audycja dostępna jest również w wygenerowanej automatycznie wersji tekstowej
Pliki do pobrania :
Pobierz plik z audycją: Plaud Note
Ten podcast był pobierany 1759 razy
Komentarze
Cześć,
Zakładki na dole, są w aplikacji pod iOS, 3 konkretnie. Okna komunikatów często zlewają się z treścią okna pod spodem. Polecam też gest 3 palcami z dołu do góry i to kilka razy nawet czasami, np. w ustawieniach choćby, ale chyba było tego więcej. Ogólnie, to nie jest tak źle z tą aplikacją, co nie znaczy, że jest dostępna, jak należy, z wszelkimi tego faktu konsekwencjami. Poza desktop pod macOS i Windows, jest również dostęp do czegoś przez webowy interfejs WWW. Wiadomo, wszystko na szybko, więc musiałbym słuchać jeszcze raz audycji, żeby skonfrontować szczegóły. Jeśli jeszcze czegoś nie umiem zrobić, to ewentualne ustawienia jakości dźwięku lub szczegóły transkrybowania. W ogóle to ustawiłem sobie na sztywno polski dla rozpoznawania. No więc, jeśli nawet napotkałbym ustawienia dźwięku, to przez brak kompetencji nie wchodziłbym tam, aby czegoś nie popsuć. Innymi słowy, wszystko, co potrzebuję, to wydaje się, że umiem. Przez brak dostępności, jest w tym element dreszczyku ryzyka, czy uda się zrobić, to co zamierza się, ale po audycji myślałem, że brak dostępności aplikacji jest bardziej odczuwalny. O ile pamiętam, to nawet zakładek nie miało być. Oczywiście z każdą aktualizacją może być lepiej albo gorzej. Piszę o aktualnej na ten moment wersji aplikacji i firmware, który też zainstalowałem.
Pozdrawiam
OK, to ja jestem na etapie, że dyktafon podpięty jest do iPhone, nagrywane rzeczy pojawiają się na dwóch iPhone zalogowanych na jedno konto Plaud, gdzie metoda logowania to e-mail, a hasło nie może przekraczać 16 znaków. Poza tym tymi samymi danymi zalogowany jestem przez przeglądarkę pod:
https://web.plaud.ai/
I tam automagicznie od razu po nagraniu pojawiają się pliki, jak w samej aplikacji. Na stronie można pobierać pliki dźwiękowe, generować transkrypcje i coś tam jeszcze, jak w samej aplikacji iOS. Wniosek jest taki, że jak komuś nie odpowiada aplikacja pod iOS, to wystarczy przebrnąć przez parowanie, ustawienia i pamiętać, aby była aplikacja włączona, gdy chcemy zsynchronizować dyktafon z chmurą, czyli najlepiej po prostu podczas nagrywania lub chwilę po nim, a resztę można robić przez WWW. Fajnie byłoby, gdyby aplikacja pod iOS była dostępna właściwie, ale już samo to zaczyna robić dobre wrażenie. Pewnie warto sprawdzić jeszcze aplikację pod macOS i Windows, ale to chyba nie będzie mój wiodący scenariusz pracy z tym urządzeniem, więc nie wiem, kiedy dam radę je sprawdzić. Chwilowo muszę na tym skończyć, bo inne zadania czekają, ale podpowiadam, że chyba warto eksplorować środowisko Plaud dalej. Skoro działa web, to może dałoby radę zrobić jakieś własne API na bazie parsowania WWW, o ile to nie będzie przysłowiowe trafianie do muchy z armaty. Już jest aplikacja i WWW, więc szanse na całkowitą utratę kontroli nad danymi maleją w razie regresu jednego z interfejsów. Poza tym wcale nie jestem pewien czy generowanie napisów wymaga włączonej aplikacji i, że nie można rozpocząć generowania dla więcej niż jednego pliku jednocześnie. To jest rzecz, której nie testowałem, ale mnie raczej wygląda na to, że aplikacja jest potrzebna do transferu z dyktafonu do chmury i do robienia ustawień lub wywoływania akcji do poszczególnych operacji, ale reszta chyba dzieje się w chmurze. Co najmniej tak myślę, próbując wyobrazić sobie, jak może być zaprojektowany ten system. Skoro rozpoznawanie robi model, jak rozumiem chyba w chmurze, to po co miałby sprawdzać, czy aplikacja jest uruchomiona. Wystarczyłoby, że generowanie zostanie uruchomione, a z tej lub innej instancji aplikacji albo z WWW, to już chyba wszystko jedno. No chyba, że ten model jest pobierany lokalnie razem z aplikacją, ale ten wariant zgaduję, jako bardzo mało prawdopodobny.
Za wszelkie pomyłki, nieścisłości i błędy w powyższym przepraszam i poprawki, uzupełnienia i nowe wiadomości w temacie są mile widziane i z góry dziękuję bardzo.
[email protected]
Biorąc pod uwagę, jak to nagrywa, za 50 zł bym nie kupił. To Iphone 5s ma znacznie lepszy dźwięk, a przy takim z przyciskiem akcji, pod który można przypiąć skrót, urządzonko nie ma dla mnie sensu. Transkrypcje można sobie robić lokalnie, za darmo w aplikacji Aiko. Apek i stron z darmową sztuczną inteligencją nie brakuje.