Buzz
Dodany 26 kwietnia 2023
8 komentarzy
Możliwości tej graficznej nakładki na Whispera, czyli narzędzie do przekształcania mowy na tekst prezentuje Paweł Masarczyk.
Zapoznaj się z tekstową wersją odcinka
Pliki do pobrania :
Ten podcast był pobierany 1451 razy
Komentarze
Witajcie:
Przepraszam, że pod tym podcastem piszę, ale potrzebuję pomocy!
Zakupiłam jakiś czas interfejs audio firmy Behringer dokładnie Behringer UMC202HD. Kupiłam go po to, aby móc podłączyć do niego mikrofon dynamiczny Voice Craft VK-5. Chciałam używać tego mikrofonu po prostu do śpiewania. Moim oczekiwaniem było, że podłączając interfejs do komputera i przekierowując na niego dźwięk z komputera oraz podłączając do karty mikrofon jak będę puszczać np. podkład do jakiejś piosenki i do niego śpiewać przez mikrofon to będę słyszeć muzykę i swój śpiew w czasie rzeczywistym. Niestety tak się nie dzieje. Sprawdzałam instrukcję obsługi, która niestety jest w języku niemieckim czy coś tam na ten temat jest napisane i nic nie znalazłam.
Czy może ktoś z Was orientuje się jak tę sprawę rozwiązać żeby efekt był taki jakbym chciała?
W ostatnim tyfloprzeglądzie Tomek wspominał coś o jakiejś obcji w zakładce odtwarzanie w dźwięku, ale w pewnym momencie strasznie coś cieło i nie dało się nikogo zrozumieć ponadto Tomek nie dokończył swojej myśli o co mu chodziło.
Pozdrawiam!
Prawdopodobnie chodzi o to, że niektóre interfejsy audio na zakładce odtwarzanie w panelu sterowania w opcji dźwięk we właściwościach użądzenia jest widoczny suwak od mikrofonu do regulacji głośności nasłuchu i pole wyboru służące do wyciszania lub odciszania tego nasłuchu. Odbywa się to bezpośrednio przez sam interfejs i wtedy nie trzeba borykać się z opóźnieniami, tak jak w przypadku nasłuchiwania z zakładki nagrywanie we właściwościach użądzenia nagrywającego. Na przykład moje słuchawki na usb widziane są przez system jako głośniki USB device w zakładce odtwarzanie we właściwościach użądzenia mam suwak o nazwie microphone i obok niego jest pole wyboru, które domyślnie było wyciszone w moim przypadku. Odznaczenie spowodowało, że słyszałem siebie bez opóźnień, więc pewnie w twoim interfejsie trzeba by było to sprawdzić, bo jeśli jest tam taka opcja to spowoduje najprawdopodobniej aktywacje tego wbudowanego nasłuchu w interfejsie. Wiem, że podcast dotyczy whispera, ale postanowiłem odpowiedzieć i podzielić się przemyśleniami, mam nadzieję, że uda mi się pomóc pozdrawiam.
Witam:
Dziękuję za szczegółową odpowiedź na mój komentarz. Co do kwesti, o której Pan piszę to nie wiem czy w zakładce odtwarzanie we właściwościach jest suwak do mikrofonu. Jeśli będę w domu to oczywiście to sprawdzę i dam znać. Jeśli chodzi o kwestię, która Mnie nurtowała to została ona rozwiązana. Wystarczyło tylko dowiedzieć się, gdzie znajduję się przycisk odpowiadający za monitorowanie na urządzęniu i go wcisnąć. to tyle, albo aż tyle.
Cieszę się, że udało się pomóc, w takim razie skoro na urządzeniu jest przycisk aktywujący monitorowanie to szukanie suwaka mikrofonu na zakładce odtwarzanie nie jest już koniecznością, pozdrawiam.
Witam:
Z ciekawości jednak i tak sprawdziłam czy w zakładce odtwarzanie jest suwag od mikrofonu i nie ma go tam.
Dzień dobry, czy jeśli nie wyczyścimy historii, kontrol o otworzymy nowy plik i klikniemy transkrybuj to ten poprzedni też będzie jeszcze raz transkrybowany, albo tekst z niego będzie w pliku który wyjdzie? Czy tylko gdzieś na dysku się zapisze i będziemy mogli go edytować tym edytorem wbudowanym, lub wyeksportować jeszcze raz, np. do jakiegoś innego rodzaju pliku niż txt? Jak ta historia się zachowuje?
Wyszła nowa wersja z poprawkami dostępności?
Cześć.
Nie, na razie nie wyszła. Ja też czekam na nią z utęsknieniem.
Witajcie!
Jakąś godzinę temu wyszła najnowsza wersja buzz, do której link poniżej. Dodano skróty klawiszowe, obsługę Faster Whisper i zaktualizowano modele CPP.
https://objects.githubusercontent.com/github-production-release-asset-2e65be/540842713/aae72df8-15c6-4c76-8e04-3d8dcfd5e909?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAIWNJYAX4CSVEH53A%2F20230430%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20230430T181401Z&X-Amz-Expires=300&X-Amz-Signature=4f115186fcd12019f97df371a380574fa120ddbbe7b7fa6377193fd9c2251d4d&X-Amz-SignedHeaders=host&actor_id=0&key_id=0&repo_id=540842713&response-content-disposition=attachment%3B%20filename%3DBuzz-0.8.0-windows.exe&response-content-type=application%2Foctet-stream