关于几个主流语音SDK的接入问题

时间:2023-03-09 03:23:01
关于几个主流语音SDK的接入问题

这两周都在忙着游戏上线还有接入游戏语音,两周分别接了腾讯语音和百度语音!!!

关于腾讯语音的一些问题

由于发现腾讯语音的在录完音频后的数据是编过码的所以出现了一些问题:

*不能解码(腾讯方不提供解码算法,能理解),所以导致不能以MP3原有的格式数据传到服务器

*版本兼容问题 因为游戏已经上线所以旧的语音数据可以说不能再播放了

其实不能解码的问题已经解决,可以将pcm数据传给服务器 在客户端接受后通过腾讯的播放接口来播放编过码的数据(而且验证了一下离线也能播放的)

但兼容问题就不行所以放弃了腾讯语音的接入(上上周的工作白费),转投接入百度语音!!!

关于百度语音的一些问题

由于可以真机调试所以提高了工作效率!!!

关于接入百度语音的一些思考:

关于几个主流语音SDK的接入问题

由于之前接的平台是讯飞所以为保证假设接完百度后如果出错,还有讯飞这条腿可以抱住,所以在lua层加了开关(在通信层加了选择判断)

这样就可以实现切换了!!!

Android遇到的问题:

主要还是遇到某些接口必须在对应线程调用,比如在监听识别时需要将接口在android主UI线程做调用在回调时(游戏使用cocos2dx开发)需要在GL线程做回调

避免崩溃!!!

 //调用监听在主ui线程
Cocos2dxActivity _mainActivity = (Cocos2dxActivity)Cocos2dxActivity.getContext();
_mainActivity.runOnUiThread(new Runnable() {
@Override
public void run() {
// 每次启动录音时设置录音参数
m_yyRet = "";
m_isListening = true;
Intent it = setRecordParm();
speechRecognizer.startListening(it);
}
});
//回调在GL线程
Cocos2dxActivity _mainActivity = (Cocos2dxActivity)Cocos2dxActivity.getContext();
_mainActivity.runOnGLThread(new Runnable() {
@Override
public void run() {
BDSpeechEngineAndroid.nativeOnSpeechEndOfSpeech(ret, s_SpeechSavePath);
}
});

IOS遇到的问题:

* 对oc的代码的不熟悉导致NSData在解析完后是一个NSArray类型 我用NSString 直接去赋值导致一直报错

* 就是IOS不能指定对应的pcm文件保存路径所以要保存音频格式需要在回调是做一个数据的append等完成是将数据保存至指定路径

* 就是开始识别后到识别结束游戏声音没有了我还以为自己出了bug,后来看百度官方的解答(由于对底层的音频逻辑不熟,这个问题暂时还没解决):

关于几个主流语音SDK的接入问题

每周都写一篇总结一下这周的工作,还是挺好的!!