Najboljša orodja za prepoznavanje govora za Linux

Ozadje za prepoznavanje glasu

Glas je vedno bolj metoda, ki se uporablja za interakcijo z našimi napravami, poleg tega pa je edina metoda za tiste, ki potrebujejo tovrstne metode dostopnosti. V vsakem primeru je povsem prijetno govoriti, da narekuje besedilo, ali preprosto vnašati glasovne ukaze v naše sisteme, tako da lahko izvajajo nekakšno operacijo, ne da bi uporabljali roke. Težava je v tem prepoznavanje glasu temeljijo na motorjih, ki uporabljajo matematične algoritme za prepoznavanje govora in niso 100% zanesljivi.

Tehnološki napredek vse bolj prinaša zanesljivost do popolnosti, umetna inteligenca in sistemi za velike podatke pa tudi veliko pripomorejo k izjemnemu izboljšanju programov za prepoznavanje govora. V zadnjem času se veliko trudi izboljšati te sisteme v največji možni meri in številne študije se osredotočajo na to, da bi izboljšale nadzor in postale vmesnik prihodnosti. Upoštevajte, da so trenutni vmesniki manj naravni za ljudi in manj hitri kot glas.

Sistemi za prepoznavanje glasu bodo v prihodnjih letih imeli vrednost približno 10 milijard dolarjev in zato se velika podjetja osredotočajo na razvoj pomočnikov, kot so Applova Siri, Microsoftova Cortana oz. Mycroft za Linux, poleg tega da postajajo vse bolj priljubljeni in pogosti izdelki, kot so Amazon Echo, Google Home ali Apple HomePod za dom, pa tudi integriranje dovršenih sistemov za prepoznavanje glasu v povezanih avtomobilih.

To je rekel, naš seznam orodij za prepoznavanje govora za Linux Zvok:

  • Julius: je zmogljiv sistem za neprekinjeno prepoznavanje govora z veliko besedišča.
  • DeepSpeech: je implementacija Baidujeve arhitekture DeepSpeech TensorFLow.
  • Simon: dokaj prilagodljiva programska oprema za prepoznavanje govora.
  • kaldi: je nabor orodij za raziskovanje prepoznavanja govora C ++.
  • CMUSphinx: v tem primeru gre za mehanizem za prepoznavanje glasu za mobilne aplikacije in strežnike.
  • deepspeech.python: je izvedba DeepSPeech s Pythonom in uporabo Baidu Warp-CTC.

Pustite svoj komentar

Vaš e-naslov ne bo objavljen. Obvezna polja so označena z *

*

*

  1. Odgovoren za podatke: AB Internet Networks 2008 SL
  2. Namen podatkov: Nadzor neželene pošte, upravljanje komentarjev.
  3. Legitimacija: Vaše soglasje
  4. Sporočanje podatkov: Podatki se ne bodo posredovali tretjim osebam, razen po zakonski obveznosti.
  5. Shranjevanje podatkov: Zbirka podatkov, ki jo gosti Occentus Networks (EU)
  6. Pravice: Kadar koli lahko omejite, obnovite in izbrišete svoje podatke.

      Miguel Angel je dejal

    Zelo dobro in ali bo kakšen dober TTS (besedilo v govor) za linux?

    V sistemih Windows in Android obstajajo zelo kakovostni glasovi, kot so Loquendo, Ivona ali NeoSpeech, vendar niso za Linux. V Linuxu sem preizkusil glasove mbrola in picoTTS, vendar so zelo robotski.

    Cepstral ponuja brezplačen glas Alejandre za linux, ki je precej dober, vendar nisem vedel, kako ga namestiti.

         RAUL je dejal

      Če dobim dober delež, hodim enako

           Armando je dejal

        Loquendo lahko uporabljate z vinom na Linuxu. Priporočam ta video ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

      Nasher_87 (ARG) je dejal

    Poskušal sem namestiti pomočnika, torej Googlovega pomočnika in nisem mogel, ostal sem v delu registrske datoteke, mislim, da se imenuje. Škoda, da je Alexa sranje ...

      Gerardo je dejal

    Program espeak deluje na konzoli despeak apt install espeak. In pridružite se na primer espeak -ves «Hello World»

    -ves je v = glasovi so = španščina

    Imate veliko možnosti za branje besedilne datoteke, zapis rezultata v wav datoteko.

    pozdrav

      raul je dejal

    resnica je zelo slaba, okna, to je drug svet ... tukaj zaostajajo 10 let

         Raul je dejal

      In 3 leta kasneje, ja! to je še zamujeno.