商城系統(tǒng) 注冊

微信小程序語音識別、合成如何實現(xiàn)

2020-09-27|HiShop
導(dǎo)讀:網(wǎng)上前篇一律的微信小程序語音識別博客,在小程序api更新之后讓莘莘學子看的一頭霧水,這里只敘述前端的工作內(nèi)容,以下是微信小程序語音識別、合成如何實現(xiàn) ...

網(wǎng)上前篇一律的微信小程序語音識別博客,在小程序api更新之后讓莘莘學子看的一頭霧水,這里只敘述前端的工作內(nèi)容,以下是微信小程序語音識別、合成如何實現(xiàn) 

先敘述下原理:

利用微信小程序api,錄音結(jié)束后返回mp3文件;

 

使用方法請看:https://developers.weixin.qq.com/miniprogram/dev/api/getRecorderManager.html

 

錄音轉(zhuǎn)換成文件的格式只有兩種:acc mp3,所以網(wǎng)上老api返回的是silk格式的都是過時的。

切記:

 

微信開發(fā)者工具拿到的MP3連接是不可用的,只有在真機上調(diào)試返回的是本地文件的路徑,這個路徑指向錄音的mp3文件,是可以用的。

如此輕松的拿到mp3文件了,很簡單吧~

接下來我們將利用百度語音識別合成api:http://ai.baidu.com/docs#/ASR-API/top

這里配置微信小程序錄音api

微信小程序語音識別、合成如何實現(xiàn)

配置后start的值為:

{
    numberOfChannels: 1,
    sampleRate:16000,
    format: 'mp3',
    frameSize: 50
  }

這樣錄音后取到的mp3文件是百度語音想要的。

方式一 :是不是要問了百度語音識別不支持mp3格式啊,這就是java后臺的事了,網(wǎng)上java mp3轉(zhuǎn)pcm格式的博客數(shù)不勝數(shù),讓你的java后臺去看百度語音api獲取token順便將轉(zhuǎn)換后的pcm格式給轉(zhuǎn)換成文字傳給前臺吧。

是不是百度一大堆的配置和前端沒有關(guān)系了~

松了一口氣~好強的前端當然可以拿到后臺傳輸過來的pcm文件地址再去調(diào)百度api。

選擇方式一跳過方式二,直接看再續(xù)。

方式二 :如果前端要去做的話,請看api詳解

 

 

地址:http://ai.baidu.com/docs#/ASR-API/top

再續(xù): 這樣錄音后的mp3文件就被轉(zhuǎn)換成了文字。如果想要語音播放的功能,請繼續(xù)往下看~很簡單

微信小程序api:

wx.createInnerAudioContext(),地址:https://developers.weixin.qq.com/miniprogram/dev/api/createInnerAudioContext.html

看參數(shù);

 

這里要的是src即是MP3的鏈接啊,我只拿到后臺穿過來的文字啊。

對,百度語音合成API,不去百度官網(wǎng)看了,太簡單了,奉上:

  https://tsn.baidu.com/text2audio?tok=xxxx&cuid=867905025778863&ctp=1&spd=6&lan=zh&tex=xxxx;
  tok:百度語音token,  (獲取請看額外篇)
  text:你想要播報的文字。
  這是一個完整的mp3鏈接,調(diào)用微信小程序api可直接播放。


  額外:百度token的獲取;
  
/*百度語音合成獲取token*/
  export let getBaiDuToken=()=>{
    return new Promise((resolve)=>{
      wx.request({
        url:  'https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=xxxxxxxx&client_secret=xxxxxxxxxx',
        method:'GET',
        success: function(r){
          resolve(r);
        },
        fail(res){
          wx.showToast({
            title:"百度語音合成獲取token接口錯誤",
            icon:'none'
          });
        }
      })
    });
  };

這里的client_id和client_secret是注冊百度語音識別平臺在控制臺中創(chuàng)建應(yīng)用獲取的。


電話咨詢 預(yù)約演示 0元開店