Ovládání našich domovů a počítačů je stále častější. Tam, kde se před deseti lety mohlo Alexě nebo Google Home žádat o ovládání světel nebo objednání produktu z internetu, se mohlo zdát neobvyklé, ale nyní je to normou.
Jednou ze společností, které do tohoto typu technologií investovaly nejvíce, je Google, který umožňuje svým domácím zařízením Google a systémům Android přijímat slovní příkazy a dokonce rozpoznávat mluvčího.
Dnes se podíváme na to, jak propojili tuto technologii se svou platformou Dokumentů Google, a zvážíme, zda je to schůdná alternativa k jiným komerčním řešením hlasu na text.
Ceny
Tento software je součástí Dokumentů Google a je tedy ve své podstatě zdarma. K jeho použití potřebujete pouze účet Google a mobilní zařízení nebo počítač s mikrofonem. Je to další zdroj dat, který má Google sklízet, ale to je v dnešní době část ceny „zdarma“.
Design
Pro vstup do Dokumentů Google je možné použít hlas, tato funkce se nazývá „Hlasové psaní“ a lze ji najít v nabídce Nástroje v dokumentu Google nebo v Prezentacích Google. Lze jej také aktivovat na kterémkoli místě pomocí klávesové zkratky Ctrl-Shift-S.
Při první aktivaci se zobrazí výzva k povolení přístupu k mikrofonu na webu docs.google.com.
Jakmile přijmete, že se zobrazí malé pole s logem mikrofonu, můžete kliknutím aktivovat hlasový vstup. Toto je poté nahrazeno červeným symbolem mikrofonu vedle dokumentu, což znamená, že je systém v režimu poslechu.
Než aktivujete hlasové psaní na ovládacím panelu, můžete vybrat jazyk z nabídky a protože se jedná o Google, existuje spousta možností. Můžete také kliknout na otazník a získat pomoc s používáním systému.
Jak tyto systémy fungují, jedná se o vysoce zhuštěné řešení.
Google co nejlépe řekne, co řeknete, a pokud si systém není jistý přesně slovem, podtrhne to šedě. Na tato „podezřelá“ slova lze poté kliknout a systém nabídnout některé alternativy.
Můžete se však rychle pohybovat po dokumentu a opravit problémy ručně nebo umístit kurzor a dát mu další bodnutí Hlasovým zadáváním.
Pokud potřebujete při práci mluvit s jinou osobou, můžete požádat Google, aby přestal poslouchat a poté pokračovat.
Abychom však získali plnou kapacitu tohoto řešení, je třeba si zapamatovat dlouhý seznam příkazů, které mohou kopírovat, vkládat, pohybovat se po dokumentu, vkládat tabulky a nesčetné množství dalších funkcí.
A můžete vložit interpunkci, formátovat dokument a dokonce vložit hypertextové odkazy.
Při maximálním využití se ale předpokládá, že si tyto příkazy pamatujete nebo si necháte otevřít nápovědu, která vám pomůže probudit paměť.
Seznam je rychle dostupný pohodlným vyslovením „Seznamu hlasových příkazů“.
Jazyky
Tam, kde mnoho řešení převodu hlasu na text pokrývá pouze malý počet jazyků, má Google značnou část. Aktuální definitivní seznam je:
Afrikánština, amharština, arabština, arabština (Alžírsko), arabština (Bahrajn), arabština (Egypt), arabština (Izrael), arabština (Jordánsko), arabština (Kuvajt), arabština (Libanon), arabština (Maroko), arabština (Omán) , Arabština (Palestina), arabština (Katar), arabština (Saúdská Arábie), arabština (Tunisko), arabština (Spojené arabské emiráty), arménština, Ázerbájdžánština, Bahasa Indonesia, baskičtina, bengálština (Bangladéš), bengálština (Indie), bulharština, Katalánština, čínština (zjednodušená), čínština (tradiční), čínština (Hongkong), chorvatština, čeština, dánština, holandština, angličtina (Austrálie), angličtina (Kanada), angličtina (Ghana), angličtina (Indie), angličtina (Irsko) , Angličtina (Keňa), angličtina (Nový Zéland), angličtina (Nigérie), angličtina (Filipíny), angličtina (Jihoafrická republika), angličtina (Tanzanie), angličtina (Velká Británie), angličtina (USA), perština, filipínština, finština, francouzština , Galicijština, gruzínština, němčina, řečtina, gudžarátština, hebrejština, hindština, maďarština, islandština, italština, italština (Itálie), italština (Švýcarsko), japonština, jávština, kannadština, khmérština, korejština, laosština, lotyština, litevština, malabarština, Malajsie n, maráthština, nepálština, norština, polština, portugalština (Brazílie), portugalština (Portugalsko), rumunština, ruština, slovenština, slovinština, srbština, sinhálština, španělština, španělština (Argentina), španělština (Bolívie), španělština (Chile), španělština (Kolumbie), španělština (Kostarika), španělština (Ekvádor), španělština (Salvador), španělština (Španělsko), španělština (USA), španělština (Guatemala), španělština (Honduras), španělština (Latinská Amerika), španělština (Mexiko) ), Španělština (Nikaragua), španělština (Panama), španělština (Paraguay), španělština (Peru), španělština (Portoriko), španělština (Uruguay), španělština (Venezuela), sundanština, svahilština (Keňa), svahilština (Tanzanie), Švédština, tamilština (Indie), tamilština (Malajsie), tamilština (Singapur), tamilština (Srí Lanka), thajština, turečtina, ukrajinština, urdština (Indie), urdština (Pákistán), vietnamština a Zuluština.
To je 119 jazyků, včetně 13 arabských forem, 19 španělských variant, 13 anglických dialektů a dokonce čtyř chutí tamilštiny.
Jsou zahrnuty i jazyky, které diktátový software zřídka podporuje, jako je Zulu a Islandština, kvůli relativně malému počtu mluvčích.
Jazykové pokrytí je pravděpodobně největší silnou stránkou Google Voice Typing.
Nahrávky
Pokud má toto řešení slabost, pak to, že nemůže snadno zpracovat záznamy.
I když to není nemožné, je to nutné, vyžaduje to opravu audio systému počítače, aby přijímal výstup určený pro reproduktory a nasměroval jej, jako by vycházel z mikrofonu. Ale to vám neumožňuje rozlišovat mezi různými lidmi na nahrávkách a mohlo by to narušit umělou inteligenci, kterou Google používá k lepší verbální přesnosti tím, že se naučí, jak mluvíte.
Pokud si přejete přepsat podcasty nebo nahrané rozhovory, doporučujeme vám použít něco jiného, protože tento nástroj není pro tento účel vytvořen.
Přesnost
Je těžké posoudit přesnost systému zpracování hlasu, když mu nemůžete poslat stejné nahrávky, které převáděly jiné produkty. A každý, kdo pravidelně používá Alexa nebo Google Home, bude vědět, že nám to občas nebude rozumět, hlavně kvůli cizím zvukům nebo nekonzistentnímu mluvení.
To znamená, že v aktivním testování, které jsme provedli, tento nástroj obecně získal většinu slov správný, nebo bylo správné slovo rychle dostupné v nabídce podezřelých slov.
K dosažení nejlepších výsledků je třeba projevit určitou kontrolu nad rychlostí, hlasitostí a tónem mluvení, což nepochybně přichází s praxí. Schopnost zapamatovat si všechny speciální příkazy také může kriticky snížit množství požadovaných úprav po záznamu.
V závislosti na vašich očekáváních je přesnost zde přijatelná. Jeho interpretace jsou konzistentní, což udržuje během našich testů. Jak dobře to pro vás funguje, nemůžeme předvídat. Ale protože je to zdarma, nebude to rozhodovat nic jiného než váš čas.
Bezpečnostní
Jelikož se jedná o Google, je model zabezpečení stejný jako ten, který řídí přístup ke všem účtům Google. To sahá od jednoduché ochrany heslem až po rozumnější metodiku až po dvoufaktorovou autentizaci (TFA).
Vzhledem k počtu zlodějů identity v okolí jsou ti, kteří používají Google bez TFA, vystaveni značnému riziku, že budou jejich účty ohroženy.
I tato možnost zabezpečení má svá omezení, ale je lepší než pouhé heslo.
Pro ty, kteří nejsou dostatečně paranoidní, důrazně doporučujeme přejít na https://myactivity.google.com/myactivity
Uvidíte, co na vás Google denně shromažďuje, a to může zahrnovat záznamy vašich hlasových příkazů.
Konečný verdikt
Může to být delší kontrola, pokud tento software nabízí více funkcí, ale není.
Řešení hlasu na text není komplikované, ale má dostatek funkcí, aby bylo skutečně užitečné.
Jsou vytvořena další řešení pro přepis konverzací mezi více lidmi, kde byla navržena tak, aby zvládla jednu osobu, která mluví kontrolovaným a přesným způsobem.
Jeho použití předpokládá, že rádi používáte Google a Dokumenty Google, i když to není konečný cíl zadaného textu.
Zkopírovat diktát vložení z Dokumentů Google do jiné aplikace není fuška a budete mít cloudovou kopii, na kterou byste se mohli spolehnout, pokud ji budete potřebovat.
Někteří uživatelé mají pochopitelně problémy s krmením nenasytné chuti Googlu k uživatelským datům, a tento mechanismus je dalším zdrojem dat, aby mohl svalovat.
Pokud se tak cítíte, nebudete používat Google Voice Typing ani nic od Googlu.
Pro ty, kteří jsou ochotni přijmout, kolik o nich Google může vědět, je řešení hlasového diktování v Dokumentech Google dostačující pro všeobecné použití, zvláště pokud tuto funkci potřebujete jen příležitostně.