形式:已錄制音頻
聲道:?jiǎn)温暤?amp;多聲道
支持格式:wav,flac,opus,m4a,mp3
基于語(yǔ)音流的不間斷、免喚醒實(shí)時(shí)語(yǔ)音識(shí)別算法,具備強(qiáng)大的語(yǔ)音聽寫、語(yǔ)音轉(zhuǎn)寫、語(yǔ)音合成等能力,識(shí)別結(jié)果響應(yīng)時(shí)間低于10ms,系統(tǒng)運(yùn)行效率讓信息溝通變得無(wú)比順暢。
擁有領(lǐng)先的語(yǔ)音識(shí)別技術(shù),核心技術(shù)達(dá)到國(guó)際領(lǐng)先水平,語(yǔ)音識(shí)別準(zhǔn)確率已經(jīng)超過(guò)98%,在業(yè)界遙遙領(lǐng)先。
用戶可將一些非常見的詞匯上傳至識(shí)別引擎,當(dāng)實(shí)時(shí)轉(zhuǎn)寫的音頻流中出現(xiàn)該詞匯時(shí),引擎可將其識(shí)別出來(lái),提高專業(yè)用語(yǔ)識(shí)別準(zhǔn)確率。
運(yùn)用超大規(guī)模的語(yǔ)言模型,智能預(yù)測(cè)語(yǔ)境,提供智能斷句和標(biāo)點(diǎn)符號(hào)的預(yù)測(cè)。
對(duì)結(jié)果中出現(xiàn)數(shù)字、日期、時(shí)間等內(nèi)容格式化成規(guī)整的文本。
形式:已錄制音頻
聲道:?jiǎn)温暤?amp;多聲道
支持格式:wav,flac,opus,m4a,mp3
形式:json格式字符串
編碼:UTF-8
結(jié)果:分詞形式&完整句子形式,詞&句置信息度詞&句時(shí)間戳,詞屬性,多候選詞,文法格式智能轉(zhuǎn)換,多發(fā)音人分離
將坐席通話轉(zhuǎn)成文字,幫助電話質(zhì)檢和信息同步,也為數(shù)據(jù)挖掘提供原料基礎(chǔ)。
將會(huì)議和訪談的音頻轉(zhuǎn)換成文字存稿,讓后期的信息檢索和整理更方便快捷。
將視頻中音頻文件進(jìn)行語(yǔ)音轉(zhuǎn)寫,輕松生成與視頻相對(duì)應(yīng)的字幕文件。
可以從轉(zhuǎn)寫出的文字結(jié)果中搜索匹配相關(guān)詞類,對(duì)黃暴/涉政內(nèi)容進(jìn)行高效鑒別。