Recenze Microsoft Azure: Špičkové zpracování hlasu

Microsoft Azure Speech to Text je jednou z nejpokročilejších platforem pro rozpoznávání hlasu. Jako součást produktové řady Microsoft Cognitive Speech Services využívá algoritmy hlubokého učení k překonání špatné kvality zvuku a může se přizpůsobit různým stylům mluvení pro přesné zvukové přepisy. V této recenzi Microsoft Azure Speech to Text se této službě podrobně věnujeme.

Stojí za zmínku, že Microsoft Azure Speech to Text není tradiční součástí uživatelsky přívětivého diktovacího softwaru. Místo toho se jedná o platformu zaměřenou na vývojáře, která má podnikům pomoci vytvářet, testovat a spravovat jejich vlastní produkty. Pokud chcete pouze přepsat dávku zvukových souborů, mohou být lepší volbou alternativní aplikace řeči na text. Podívejte se na naši příručku Best software pro převod řeči na text, kde najdete nejlepší alternativy.

Microsoft Azure Speech to Text: Plány a ceny

Pomocí Microsoft Azure Speech to Text můžete bezplatně přepsat až pět hodin zvuku a vytvořit jeden vlastní hlasový model za měsíc. S bezplatným plánem je však k dispozici pouze jeden souběžný zvukový požadavek, což znamená, že tato možnost není pro většinu podniků životaschopná.

Fakturace za řečovou službu Azure je rozdělena na přírůstky jedné sekundy.

Pokud chcete přepsat více než jeden hlasový klip najednou, budete muset upgradovat na standardní cenový systém Azure. To stojí 1 $ za hodinu zvuku a podporuje až 20 souběžných požadavků. Pokud potřebujete použít vlastní zvukový model nebo přepsat vícekanálové zvukové soubory, jsou účtovány další poplatky. Cena těchto doplňkových služeb je 1,40 USD, respektive 2,10 USD za zvukovou hodinu.

Ačkoli Microsoft uvádí své ceny ve formátu „za zvukovou hodinu“, což je průmyslový standard, fakturace je ve skutečnosti rozdělena na přírůstky jedné sekundy, takže nebudete platit za více času zpracování, než je požadováno.

Microsoft Azure Speech to Text: Funkce

Klíčovou funkcí Azure Speech to Text je přístup, který poskytuje výkonnému systému zpracování přirozeného jazyka společnosti Microsoft. V posledních několika letech dosáhla umělá inteligence společnosti Microsoft několika důležitých milníků. To znamená, že nyní může dokončit úkoly, které dříve pro službu rozpoznávání řeči nebylo možné, například přesný přepis konverzace během konverzací v malých skupinách.

Službu Microsoft Azure Speech to Text lze integrovat s Office 365 pro optimální přesnost.

Azure pracuje s desítkami jazyků a dialektů a může být proškoleno - pomocí vlastních modelů rozpoznávání řeči - aby se lépe přizpůsobilo mluvícímu stylu uživatele, hluku pozadí a slovní zásobě. Pokud se vaše organizace již zavázala k ekosystému produktů společnosti Microsoft, můžete využít uživatelská data Office 365 k lepšímu zlepšení přesnosti rozpoznávání řeči pro specifické podmínky organizace. Důležité je, že to lze provést bez ohrožení zabezpečení dat, protože Speech to Text lze spustit místně.

Microsoft Azure Speech to Text: Nastavení

Microsoft Azure byl navržen spíše pro vývojáře než pro spotřebitele. To znamená, že jeho zavedení je zapojený a poněkud náročný postup, který je nejlépe ponechat někomu, kdo má hodně technického know-how.

Nastavení Azure není úplně jednoduché, pokud nemáte zkušenosti s kódováním.

Nejrychlejším způsobem konfigurace Azure je použití sady Azure Speech SDK v programovacím jazyce, jako je Java nebo C ++. K tomu budete muset zaregistrovat bezplatný účet Azure a vytvořit prázdný projekt ve vývojovém prostředí. Poté budete muset použít Microsoft Visual Studio a napsat krátký program k inicializaci objektu Microsoft SpeechRecognizer.

Microsoft Azure Speech to Text: Rozhraní

Stejně jako ostatní platformy pro hromadný přepis, Microsoft Azure Speech to Text je určen ke spuštění jako aplikační programovací rozhraní (API), přidán do programů Office 365 nebo integrován do nových platforem a služeb. Z tohoto důvodu neexistuje jediné rozhraní Azure Speech to Text. To, co uvidí koncový uživatel, závisí na tom, jak byla integrována řeč Azure to Text.

Online portál Azure je intuitivní a snadno použitelný.

Mezitím vývojář spravující Azure tak učiní prostřednictvím online portálu Azure společnosti Microsoft, který je moderní a snadno se v něm orientuje. Vyhledání stránky zdroje řečových služeb zabere jen několik minut a po přidání instance k vašemu účtu lze v jednom okně zobrazit výstrahy monitorování a využití.

Microsoft Azure Speech to Text: Výkon

V rámci naší recenze Microsoft Azure Speech to Text jsme chtěli vidět, jak tato platforma zvládla výzvu zpracování nezpracovaných hlasových záznamů, takže jakmile byl náš účet Azure připraven, nahráli jsme řadu klipů s různou úrovní šumu na pozadí . Napříč Azure odvedl dobrou práci se zpracováním našich vzorků, protože jsme v průběhu našeho hodnocení neviděli víc než hrst chyb.

Povolení vlastního řečového modelu Azure zlepšilo naši přesnost přepisu.

Azure zpočátku trochu bojoval při zpracování neobvyklých nebo speciálních frází, jako jsou názvy sportovních týmů a vědecké výrazy, ale toto bylo rychle vyřešeno povolením možnosti výstupu vlastního modelu. Jakmile jsme tuto možnost aktivovali, Azure se dokázala přizpůsobit jedinečnému slovníku a stylu mluvení, které jsme použili.

Microsoft Azure Speech to Text: Podpora

Pokud se chcete dozvědět, jak komunikovat s Azure Speech Services SDK prostřednictvím různých programovacích jazyků a integrovat funkce Azure Speech to Text do vaší vlastní platformy, budete určitě potřebovat pomoc. Společnost Microsoft naštěstí vytvořila komplexní katalog školicích materiálů pro platformu Azure, ve kterém najdete příklady kódu a užitečné tipy.

Sekce školení na webu Azure obsahuje mnoho užitečných zdrojů.

Všichni zákazníci Azure také získají bezplatnou podporu fakturace a správy předplatného, ​​ke které lze přistupovat prostřednictvím systému lístků. K vašemu účtu lze za opakující se poplatek přidat podrobnější podporu, která začíná na 29 $ měsíčně.

Microsoft Azure Speech to Text: Konečný verdikt

Platforma Azure Speech to Text využívá špičkové technologie k poskytování téměř dokonalé přepisové služby. Je nejvhodnější pro firmy, které již investovaly do ekosystému Microsoft Office 365, protože vlastní modely hlasu a slovní zásoby lze bezpečně generovat z vašeho stávajícího archivu dokumentů. Některé malé firmy se mohou s Azure potýkat, protože jeho správné nastavení vyžaduje pozornost kvalifikovaného vývojáře cloudu Microsoft.

Konkurence

Amazon Transcribe, Google Cloud Speech-to-Text a Watson Speech to Text jsou přímými konkurenty Microsoft Azure. Tyto tři platformy jsou také schopné přesně provádět hromadné přepisy dávek přesně. Google Cloud je jediným blízkým konkurentem schopným pracovat s více jazyky než Azure, ale je dražší a jeho počáteční cena je pouhých 0,006 USD za 15 sekund, ve srovnání s 0,017 USD za minutu (0,00425 USD za 15 sekund).

Chcete-li najít další alternativy k Microsoft Azure Speech to Text, podívejte se na naši nejlepší softwarovou příručku pro převod řeči na text.

Zajímavé články...