GC-2910S:AI語音識別系統管理軟件
AI語音識別系統需要解決語音轉換成文字的問題。機器語音識別技術是一種實現從“聲音”到“文字”轉換的技術,通過將人的語音直接轉換成相應的文本。傳統的語音識別技術主要用于解決人與機器的交互問題,而在會議、咨詢、直播等場景需要轉成文字的音頻內容是人與人之間交互,所以AI會議語音識別系統提供的以下核心功能是基于AI語音識別技術構建的語音轉寫引擎。
核心功能:
系統架構:采用BS架構,國產Linux系統;
分布式采集:支持跨會議室,跨區域實時分布式采集語音;
分布式顯示:支持跨會議室,跨區域實時顯示語音識別內容;
高頻詞匯優先:一場會議中經常會出現頻次較多的熱詞和同聲詞,通過高頻詞優化,可有效提高高頻詞匯識別率。
敏感詞匯報警:針對特殊行業,可選擇敏感詞匯報警,提醒工作人員關注交流、協同內容。
禁忌詞屏蔽:語音識別過程中遇到禁忌詞,系統自動過濾處理;后臺可以自助添加禁忌詞。
語音合成:支持主流音頻文件的離線語音識別,具有多任務批處理識別能力。
合成播報:支持主流文件導入后的語音合成,提供不同聲音音庫。
多模式轉寫:實時會議下,支持單人發言和多人發言顯示模式,用戶可根據會議類型、會議場合,自由切換顯示模式。
人員識別:通過系統對接,語音識別系統自動分離參會人員,文件中可以清晰查看參會人員識別結果。
聲紋識別:支持系統采集參會人員聲紋信息,開會過程中通過聲紋信息做角色分離。
會議字幕:對于新聞發言、大型會議、發布會等場景,提供會議字幕功能。
記錄存檔:后臺自動保存過程錄音文件和語音識別文件。
文件下載:系統可選擇性帳號下載音頻或識別文件。
在線升級:提供軟件在線升級服務,可更新軟件固件版本。
語氣詞過濾:支持在語音識別的過程中屏蔽語氣詞匯,以保證文稿的規整;語氣詞可在后臺自助添加。
定點定時回聽:可定時定點回聽錄音,更改識別文件。