Rozwiązywanie typowych problemów z rozpoznawaniem mowy
W poprzednich samouczkach dotyczących rozpoznawania mowy(Speech Recognition) nauczyłeś się, jak skonfigurować tę aplikację i podstawy jej używania. Rozpoznawanie mowy(Speech Recognition) działa zaskakująco dobrze „od razu po wyjęciu z pudełka” i jest dość wyrafinowane dla wbudowanej aplikacji. Nie oznacza to jednak, że jest niezawodny. Przyjrzyjmy się niektórym typowym problemom związanym z rozpoznawaniem mowy(Speech Recognition) i sposobom ich rozwiązywania.
mówię, ale absolutnie nic się nie dzieje
Spójrzmy prawdzie w oczy, wszyscy znamy najbardziej prawdopodobną przyczynę i wszyscy zostaliśmy złapani przez coś takiego w tym czy innym momencie. Na szczęście naprawienie najbardziej prawdopodobnych problemów jest bardzo proste:
- Czy Twój mikrofon jest podłączony?
- Jeśli mikrofon ma przycisk wyciszania, czy został naciśnięty?
- Czy wejście mikrofonu jest wyciszone w Control Panel -> Hardware and Sound -> Adjust System Volume lub we własnym oprogramowaniu karty dźwiękowej?
Podłącz mikrofon lub wyłącz jego wyciszenie i powinieneś być gotowy do pracy. Firma Microsoft(Microsoft) ma tutaj kilka innych sugestii dotyczących rozwiązywania problemów z mikrofonem, dotyczących mniej typowych problemów: Rozwiązywanie problemów z rozpoznawaniem mowy(Troubleshoot Speech Recognition problems) .
Mówię, a niebieski pasek wskazuje jakiś rodzaj danych wejściowych, ale funkcja Rozpoznawanie mowy(Speech Recognition) nie odpowiada.
- Upewnij(Make) się, że mikrofon nie jest wyciszony. Mikrofony biurkowe(Desk) często mają przycisk na podstawie, który zapala się, gdy mikrofon jest aktywny, więc łatwo jest stwierdzić, czy mikrofon jest włączony, czy wyłączony. Zestawy słuchawkowe zwykle mają przycisk na przewodzie i mogą nie mieć żadnego wyraźnego wskazania, że mikrofon jest aktywny. Nawet jeśli masz pewność, że przełącznik jest we właściwej pozycji, spróbuj nacisnąć go ponownie.
- Pamiętaj, że musisz powiedzieć „Rozpocznij słuchanie”("Start Listening") , aby obudzić aplikację. Możesz także kliknąć prawym przyciskiem myszy okrągły przycisk z mikrofonem i wybrać „Włącz: słuchaj wszystkiego, co mówię”("On: Listen to everything I say") . Można by pomyśleć, że takie ustawienie zostanie zapamiętane, a Rozpoznawanie mowy(Speech Recognition) zawsze będzie się wtedy uruchamiać w trybie „Słuchanie”("Listening") , ale niestety tak nie działa.
Czekaj... jeśli mój mikrofon jest wyciszony, dlaczego funkcja rozpoznawania(Recognition) mowy widzi dane wejściowe?
To zaskakująco powszechne „gotcha”. Mikrofon lub zestaw słuchawkowy może być wyciszony, ale może istnieć inny aktywny mikrofon, o którym nie pomyślałeś — na przykład w kamerze internetowej. Pamiętasz(Remember) , jak skonfigurowaliśmy mikrofon w pierwszym samouczku ( Praca z rozpoznawaniem mowy: konfiguracja i konfiguracja(Working with Speech Recognition: Setup and Configuration) )?
Po skonfigurowaniu zestawu słuchawkowego łatwo przeoczyć inne źródło sygnału wejściowego. Tutaj, jak widać, aktywny był mikrofon mojej kamery internetowej.
Kliknij(Click) to źródło, a następnie kliknij Właściwości(Properties) . Stamtąd możesz wyłączyć źródło.
I tutaj natkniesz się na kolejną „łatkę”. Gdy zdecydujesz się wyłączyć urządzenie, zniknie ono z listy dostępnych urządzeń.
Urządzenie właściwie nie zniknęło. Kliknij prawym przyciskiem myszy(Right-click) w dowolnym miejscu w polu i wybierz „Pokaż wyłączone urządzenia”("Show disabled devices") .
A teraz znowu zobaczysz ten mikrofon, z adnotacją, że jest wyłączony. Możesz go ponownie włączyć w dowolnym momencie. (Twój panel dźwiękowy(Sound) pokaże twoje własne urządzenia i prawdopodobnie nie będzie wyglądał dokładnie tak.)
Mówię powoli i wyraźnie, ale funkcja Rozpoznawanie mowy(Speech Recognition) ciągle wstawia do tekstu bełkot.
Tak samo(Same) jak powyżej — jest prawie pewne, że masz aktywny więcej niż jeden mikrofon. Sprawdź dwukrotnie i wyłącz ten, którego nie używasz.
Mówię powoli i wyraźnie, ale Rozpoznawanie mowy(Speech Recognition) wciąż mnie źle rozumie. Wybrane słowa nie są poprawne.
Rozpoznawanie mowy(Speech Recognition) jest dobre, ale nie jest doskonałe. Jeśli nadal masz problemy, dobrze byłoby poświęcić trochę czasu na nauczenie go rozpoznawania Twojego głosu i wymowy. Pamiętasz(Remember) , jak pominęliśmy ten element w Control Panel -> Speech Recognition ? Możesz wrócić do Panelu sterowania(Control Panel) i wybrać go.
Możesz też kliknąć prawym przyciskiem myszy niebieski przycisk mikrofonu i wybrać Configuration -> Improve Voice Recognition .
Tak czy inaczej, otworzysz Trening głosowy(Voice Training) . Jest to oczywiste i możesz przechodzić przez to tyle razy, ile chcesz. Następnie Rozpoznawanie mowy(Speech Recognition) zrozumie Cię znacznie lepiej.
Gadżet Rozpoznawanie mowy(Speech Recognition) blokuje coś, co muszę zobaczyć.
Domyślnie gadżet jest zadokowany w górnej środkowej części ekranu. Możesz go jednak przeciągnąć i upuścić w dowolnym miejscu na ekranie. Jak widać, zmieni nieco kształt. I pozostanie na wierzchu wszystkiego innego na ekranie.
Bez względu na to, co robię, nie mogę zmusić rozpoznawania mowy(Speech Recognition) do pracy z programem, którego naprawdę chcę używać.
Chociaż Rozpoznawanie mowy(Speech Recognition) będzie działać z szeroką gamą programów innych niż Microsoft (próbowałem go na przykład z Google Chrome i klientem poczty Eudora z rozsądnym sukcesem), nie będzie działać ze wszystkim. Jest to jedno z ograniczeń rozpoznawania mowy(Speech Recognition) i nie ma na to rozwiązania. Jak wspomniałem wcześniej, oprogramowanie Adobe wydaje się być najbardziej odporne. Jeśli naprawdę chcesz używać rozpoznawania mowy we wszystkich swoich ulubionych programach, będziesz znacznie bardziej zadowolony z komercyjnego oprogramowania do rozpoznawania mowy, takiego jak Dragon Naturally Speaking .
Czy jesteś rozpoznawany?
Czy próbowałeś rozpoznawania mowy(Speech Recognition) ? Jakie było twoje doświadczenie? Czy miałeś z tym problemy, które nie zostały tutaj omówione? Poświęć(Please) trochę czasu na zostawienie wiadomości i daj nam znać. Ponadto, aby uzyskać więcej przydatnych artykułów na temat tego narzędzia, zapoznaj się z naszymi zaleceniami poniżej.
Related posts
Praca z rozpoznawaniem mowy: konfiguracja i konfiguracja
Praca z rozpoznawaniem mowy: polecenia, dyktowanie tekstu i przeglądanie sieci
7 sposobów minimalizowania i maksymalizowania aplikacji w systemie Windows 10
5 sposobów na dwukrotne kliknięcie jednym kliknięciem w systemie Windows
Jak otworzyć Defragmentator dysków w systemie Windows (12 sposobów) -
Rozpoznawanie mowy: refleksje na temat jego mocnych i słabych stron
Jak tworzyć skróty do plików, folderów, aplikacji i stron internetowych w systemie Windows
Tryb Boga w Windows 11 vs. Windows 10 vs. Windows 7 -
Proste pytania: Co to jest tryb głośnomówiący w systemie Windows 8.1?
Jak zrobić zrzut ekranu w systemie Windows (8 sposobów) -
9 sposobów na uruchomienie Internet Explorera we wszystkich wersjach Windows
Jak wybrać wiele plików w systemie Windows
8 sposobów na uruchomienie aplikacji Skype w systemie Windows 10
Jak uruchomić i skonfigurować Narratora za pomocą ustawień komputera w systemie Windows 8.1?
Jak wyłączyć historię aktywności i oś czasu w systemie Windows 10?
Jak rozpocząć korzystanie z Cortany w systemie Windows 11 lub Windows 10 —
8 sposobów otwierania okna Opcje folderów w systemie Windows (wszystkie wersje)
Jak uruchomić Eksplorator plików systemu Windows 10 w dowolnym folderze?
12 wskazówek dotyczących wyszukiwania w systemie Windows 10
Oś czasu systemu Windows 10 i jak najlepiej ją wykorzystać