<dd id="qxqau"></dd>

<label id="qxqau"></label>

<meter id="qxqau"></meter> <dd id="qxqau"><font id="qxqau"></font></dd>

為什么現(xiàn)在人工智能這么火，語(yǔ)音輸入還是這么弱智

更新日期：2024年10月05日 11時(shí)10分21秒來(lái)源：高職招生網(wǎng)

網(wǎng)上報(bào)名

錄取通知書(shū)

　　為什么現(xiàn)在人工智能這么火，語(yǔ)音輸入還是這么弱智

為什么現(xiàn)在人工智能這么火，語(yǔ)音輸入還是這么弱智

　　語(yǔ)音輸入是根據(jù)操作者的講話，電腦識(shí)別成漢字的輸入方法(又稱聲控輸入)。它是用與主機(jī)相連的話筒讀出漢字的語(yǔ)音，利用語(yǔ)音識(shí)別系統(tǒng)分析辯識(shí)漢字或詞組，把識(shí)別后的漢字顯示在編輯區(qū)中，再通過(guò)“發(fā)送”功能將編輯區(qū)的文字傳到其他文檔的編輯中。

為什么現(xiàn)在人工智能這么火，語(yǔ)音輸入還是這么弱智

　　語(yǔ)音識(shí)別技術(shù)的原理是將人的話音轉(zhuǎn)換成聲音信號(hào)，經(jīng)過(guò)特殊處理，與計(jì)算機(jī)中已存儲(chǔ)的已有聲音信號(hào)進(jìn)行比較，然后反饋出識(shí)別的結(jié)果。其關(guān)鍵在于將人的話音轉(zhuǎn)換成聲音信號(hào)的準(zhǔn)確性，以及與原有聲音信號(hào)比較時(shí)的智能化程度。語(yǔ)音識(shí)別技術(shù)是人工智能的有機(jī)組成部分。

為什么現(xiàn)在人工智能這么火，語(yǔ)音輸入還是這么弱智

　　這種輸入法的好處是不再用手去輸入，把雙手解放出來(lái)，只要會(huì)讀出漢字的讀音即可，但是受每個(gè)人漢字發(fā)音的限制，不可能都滿足語(yǔ)音識(shí)別軟件的要求，因此在實(shí)際應(yīng)用中錯(cuò)誤率較鍵盤(pán)輸入高。特別是一些專業(yè)技術(shù)方面的語(yǔ)言，識(shí)別系統(tǒng)幾乎不能確認(rèn)，錯(cuò)誤率較高。

　　目前，主流的大詞匯量語(yǔ)音識(shí)別系統(tǒng)多采用統(tǒng)計(jì)模式識(shí)別技術(shù)。典型的基于統(tǒng)計(jì)模式識(shí)別方法的語(yǔ)音識(shí)別系統(tǒng)由以下幾個(gè)基本模塊所構(gòu)成

　　信號(hào)處理及特征提取模塊。該模塊的主要任務(wù)是從輸入信號(hào)中提取特征，供聲學(xué)模型處理。同時(shí)，它一般也包括了一些信號(hào)處理技術(shù)，以盡可能降低環(huán)境噪聲、信道、說(shuō)話人等因素對(duì)特征造成的影響。統(tǒng)計(jì)聲學(xué)模型。典型系統(tǒng)多采用基于一階隱馬爾科夫模型進(jìn)行建模。發(fā)音詞典。發(fā)音詞典包含系統(tǒng)所能處理的詞匯集及其發(fā)音。發(fā)音詞典實(shí)際提供了聲學(xué)模型建模單元與語(yǔ)言模型建模單元間的映射。語(yǔ)言模型。語(yǔ)言模型對(duì)系統(tǒng)所針對(duì)的語(yǔ)言進(jìn)行建模。理論上，包括正則語(yǔ)言，上下文無(wú)關(guān)文法在內(nèi)的各種語(yǔ)言模型都可以作為語(yǔ)言模型，但目前各種系統(tǒng)普遍采用的還是基于統(tǒng)計(jì)的N元文法及其變體。解碼器。解碼器是語(yǔ)音識(shí)別系統(tǒng)的核心之一，其任務(wù)是對(duì)輸入的信號(hào)，根據(jù)聲學(xué)、語(yǔ)言模型及詞典，尋找能夠以最大概率輸出該信號(hào)的詞串。從數(shù)學(xué)角度可以更加清楚的了解上述模塊之間的關(guān)系。首先，統(tǒng)計(jì)語(yǔ)音識(shí)別的最基本問(wèn)題是，給定輸入信號(hào)或特征序列，符號(hào)集(詞典)，求解符號(hào)串使得：

　　W = argmaxP(W | O) 通過(guò)貝葉斯公式，上式可以改寫(xiě)為

　　由于對(duì)于確定的輸入串O，P(O)是確定的，因此省略它并不會(huì)影響上式的最終結(jié)果，因此，一般來(lái)說(shuō)語(yǔ)音識(shí)別所討論的問(wèn)題可以用下面的公式來(lái)表示，可以將它稱為語(yǔ)音識(shí)別的基本公式。 W = argmaxP(O | W)P(W)

　　從這個(gè)角度來(lái)看，信號(hào)處理模塊提供了對(duì)輸入信號(hào)的預(yù)處理，也就是說(shuō)，提供了從采集的語(yǔ)音信號(hào)(記為S)到特征序列O的映射。而聲學(xué)模型本身定義了一些更具推廣性的聲學(xué)建模單元，并且提供了在給定輸入特征下，估計(jì)P(O | uk)的方法。

　　為了將聲學(xué)模型建模單元串映射到符號(hào)集，就需要發(fā)音詞典發(fā)揮作用。它實(shí)際上定義了映射的映射。為了表示方便，也可以定義一個(gè)由到U的全集的笛卡爾積，而發(fā)音詞典則是這個(gè)笛卡爾積的一個(gè)子集。并且有：

　　最后，語(yǔ)言模型則提供了P(W)。這樣，基本公式就可以更加具體的寫(xiě)成：

　　對(duì)于解碼器來(lái)說(shuō)，就是要在由,,ui以及時(shí)間標(biāo)度t張成的搜索空間中，找到上式所指明的W。

　　語(yǔ)音識(shí)別是一門(mén)交叉學(xué)科，語(yǔ)音識(shí)別正逐步成為信息技術(shù)中人機(jī)接口的關(guān)鍵技術(shù)，語(yǔ)音識(shí)別技術(shù)與語(yǔ)音合成技術(shù)結(jié)合使人們能夠甩掉鍵盤(pán)，通過(guò)語(yǔ)音命令進(jìn)行操作。語(yǔ)音技術(shù)的應(yīng)用已經(jīng)成為一個(gè)具有競(jìng)爭(zhēng)性的新興高技術(shù)產(chǎn)業(yè)。

　　與機(jī)器進(jìn)行語(yǔ)音交流，讓機(jī)器明白你說(shuō)什么，這是人們長(zhǎng)期以來(lái)夢(mèng)寐以求的事情。語(yǔ)音識(shí)別技術(shù)就是讓機(jī)器通過(guò)識(shí)別和理解過(guò)程把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。語(yǔ)音識(shí)別是一門(mén)交叉學(xué)科。近二十年來(lái)，語(yǔ)音識(shí)別技術(shù)取得顯著進(jìn)步，開(kāi)始從實(shí)驗(yàn)室走向市場(chǎng)。人們預(yù)計(jì)，未來(lái)10年內(nèi)，語(yǔ)音識(shí)別技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等各個(gè)領(lǐng)域。語(yǔ)音識(shí)別聽(tīng)寫(xiě)機(jī)在一些領(lǐng)域的應(yīng)用被美國(guó)新聞界評(píng)為1997年計(jì)算機(jī)發(fā)展十件大事之一。很多專家都認(rèn)為語(yǔ)音識(shí)別技術(shù)是2000年至2010年間信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。

　　人工智能專業(yè)前景如何?

網(wǎng)上報(bào)名

文中圖片素材來(lái)源網(wǎng)絡(luò)，如有侵權(quán)請(qǐng)聯(lián)系644062549@qq.com刪除

轉(zhuǎn)載注明出處：http://www.haoleitv.com

?

成人无码一区二区三区视频,成人无码区免费A∨毛片,国产午夜成人免费一区,久久成人毛片国产毛片 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();