Rozwiązywanie typowych problemów z rozpoznawaniem mowy

W poprzednich samouczkach dotyczących rozpoznawania mowy(Speech Recognition) nauczyłeś się, jak skonfigurować tę aplikację i podstawy jej używania. Rozpoznawanie mowy(Speech Recognition) działa zaskakująco dobrze „od razu po wyjęciu z pudełka” i jest dość wyrafinowane dla wbudowanej aplikacji. Nie oznacza to jednak, że jest niezawodny. Przyjrzyjmy się niektórym typowym problemom związanym z rozpoznawaniem mowy(Speech Recognition) i sposobom ich rozwiązywania.

mówię, ale absolutnie nic się nie dzieje

Rozpoznawanie mowy

Spójrzmy prawdzie w oczy, wszyscy znamy najbardziej prawdopodobną przyczynę i wszyscy zostaliśmy złapani przez coś takiego w tym czy innym momencie. Na szczęście naprawienie najbardziej prawdopodobnych problemów jest bardzo proste:

  • Czy Twój mikrofon jest podłączony?
  • Jeśli mikrofon ma przycisk wyciszania, czy został naciśnięty?
  • Czy wejście mikrofonu jest wyciszone w Control Panel -> Hardware and Sound -> Adjust System Volume lub we własnym oprogramowaniu karty dźwiękowej?

Panel sterowania

Podłącz mikrofon lub wyłącz jego wyciszenie i powinieneś być gotowy do pracy. Firma Microsoft(Microsoft) ma tutaj kilka innych sugestii dotyczących rozwiązywania problemów z mikrofonem, dotyczących mniej typowych problemów: Rozwiązywanie problemów z rozpoznawaniem mowy(Troubleshoot Speech Recognition problems) .

Mówię, a niebieski pasek wskazuje jakiś rodzaj danych wejściowych, ale funkcja Rozpoznawanie mowy(Speech Recognition) nie odpowiada.

Rozpoznawanie mowy

  • Upewnij(Make) się, że mikrofon nie jest wyciszony. Mikrofony biurkowe(Desk) często mają przycisk na podstawie, który zapala się, gdy mikrofon jest aktywny, więc łatwo jest stwierdzić, czy mikrofon jest włączony, czy wyłączony. Zestawy słuchawkowe zwykle mają przycisk na przewodzie i mogą nie mieć żadnego wyraźnego wskazania, że ​​mikrofon jest aktywny. Nawet jeśli masz pewność, że przełącznik jest we właściwej pozycji, spróbuj nacisnąć go ponownie.
  • Pamiętaj, że musisz powiedzieć „Rozpocznij słuchanie”("Start Listening") , aby obudzić aplikację. Możesz także kliknąć prawym przyciskiem myszy okrągły przycisk z mikrofonem i wybrać „Włącz: słuchaj wszystkiego, co mówię”("On: Listen to everything I say") . Można by pomyśleć, że takie ustawienie zostanie zapamiętane, a Rozpoznawanie mowy(Speech Recognition) zawsze będzie się wtedy uruchamiać w trybie „Słuchanie”("Listening") , ale niestety tak nie działa.

Czekaj... jeśli mój mikrofon jest wyciszony, dlaczego funkcja rozpoznawania(Recognition) mowy widzi dane wejściowe?

To zaskakująco powszechne „gotcha”. Mikrofon lub zestaw słuchawkowy może być wyciszony, ale może istnieć inny aktywny mikrofon, o którym nie pomyślałeś — na przykład w kamerze internetowej. Pamiętasz(Remember) , jak skonfigurowaliśmy mikrofon w pierwszym samouczku ( Praca z rozpoznawaniem mowy: konfiguracja i konfiguracja(Working with Speech Recognition: Setup and Configuration) )?

Po skonfigurowaniu zestawu słuchawkowego łatwo przeoczyć inne źródło sygnału wejściowego. Tutaj, jak widać, aktywny był mikrofon mojej kamery internetowej.

Nagrywanie dźwięku

Kliknij(Click) to źródło, a następnie kliknij Właściwości(Properties) . Stamtąd możesz wyłączyć źródło.

Właściwości mikrofonu

I tutaj natkniesz się na kolejną „łatkę”. Gdy zdecydujesz się wyłączyć urządzenie, zniknie ono z listy dostępnych urządzeń.

Rozpoznawanie mowy

Urządzenie właściwie nie zniknęło. Kliknij prawym przyciskiem myszy(Right-click) w dowolnym miejscu w polu i wybierz „Pokaż wyłączone urządzenia”("Show disabled devices") .

Rozpoznawanie mowy

A teraz znowu zobaczysz ten mikrofon, z adnotacją, że jest wyłączony. Możesz go ponownie włączyć w dowolnym momencie. (Twój panel dźwiękowy(Sound) pokaże twoje własne urządzenia i prawdopodobnie nie będzie wyglądał dokładnie tak.)

Rozpoznawanie mowy

Mówię powoli i wyraźnie, ale funkcja Rozpoznawanie mowy(Speech Recognition) ciągle wstawia do tekstu bełkot.

Tak samo(Same) jak powyżej — jest prawie pewne, że masz aktywny więcej niż jeden mikrofon. Sprawdź dwukrotnie i wyłącz ten, którego nie używasz.

Mówię powoli i wyraźnie, ale Rozpoznawanie mowy(Speech Recognition) wciąż mnie źle rozumie. Wybrane słowa nie są poprawne.

Rozpoznawanie mowy(Speech Recognition) jest dobre, ale nie jest doskonałe. Jeśli nadal masz problemy, dobrze byłoby poświęcić trochę czasu na nauczenie go rozpoznawania Twojego głosu i wymowy. Pamiętasz(Remember) , jak pominęliśmy ten element w Control Panel -> Speech Recognition ? Możesz wrócić do Panelu sterowania(Control Panel) i wybrać go.

Rozpoznawanie mowy

Możesz też kliknąć prawym przyciskiem myszy niebieski przycisk mikrofonu i wybrać Configuration -> Improve Voice Recognition .

Rozpoznawanie mowy

Tak czy inaczej, otworzysz Trening głosowy(Voice Training) . Jest to oczywiste i możesz przechodzić przez to tyle razy, ile chcesz. Następnie Rozpoznawanie mowy(Speech Recognition) zrozumie Cię znacznie lepiej.

Rozpoznawanie mowy

Gadżet Rozpoznawanie mowy(Speech Recognition) blokuje coś, co muszę zobaczyć.

Domyślnie gadżet jest zadokowany w górnej środkowej części ekranu. Możesz go jednak przeciągnąć i upuścić w dowolnym miejscu na ekranie. Jak widać, zmieni nieco kształt. I pozostanie na wierzchu wszystkiego innego na ekranie.

Rozpoznawanie mowy

Bez względu na to, co robię, nie mogę zmusić rozpoznawania mowy(Speech Recognition) do pracy z programem, którego naprawdę chcę używać.

Chociaż Rozpoznawanie mowy(Speech Recognition) będzie działać z szeroką gamą programów innych niż Microsoft (próbowałem go na przykład z Google Chrome i klientem poczty Eudora z rozsądnym sukcesem), nie będzie działać ze wszystkim. Jest to jedno z ograniczeń rozpoznawania mowy(Speech Recognition) i nie ma na to rozwiązania. Jak wspomniałem wcześniej, oprogramowanie Adobe wydaje się być najbardziej odporne. Jeśli naprawdę chcesz używać rozpoznawania mowy we wszystkich swoich ulubionych programach, będziesz znacznie bardziej zadowolony z komercyjnego oprogramowania do rozpoznawania mowy, takiego jak Dragon Naturally Speaking .

Czy jesteś rozpoznawany?

Czy próbowałeś rozpoznawania mowy(Speech Recognition) ? Jakie było twoje doświadczenie? Czy miałeś z tym problemy, które nie zostały tutaj omówione? Poświęć(Please) trochę czasu na zostawienie wiadomości i daj nam znać. Ponadto, aby uzyskać więcej przydatnych artykułów na temat tego narzędzia, zapoznaj się z naszymi zaleceniami poniżej.



About the author

Jestem inżynierem oprogramowania z ponad 10-letnim doświadczeniem w branży Xbox. Specjalizuję się w tworzeniu gier i testowaniu bezpieczeństwa. Jestem także doświadczonym recenzentem i pracowałem nad projektami dla największych nazwisk w branży gier, w tym Ubisoft, Microsoft i Sony. W wolnym czasie lubię grać w gry wideo i oglądać programy telewizyjne.



Related posts