自然语言交流系统 phxnet团队 创新实训 项目博客 (三)

时间:2021-08-28 17:03:45

语音转文本部分是调用的科大讯飞的在线语音,它的激发方式是按键,通过按钮触发开启安卓设备的录音,此部分需要在源码中写入关于安卓权限的要求,来调用安卓的录音权限,当按钮被激发,则开始进入语音录制阶段,将麦克风所录下的语音实时的传给云端的科大讯飞服务器。、

从声音之中得到文本:

public void GetWordFromVoice() {

boolean isShowDialog = mSharedPreferences.getBoolean("iat_show", true);

if (isShowDialog) {

showIatDialog();

} else {

if (null == iatRecognizer) {

iatRecognizer = SpeechRecognizer.createRecognizer(this);

}

if (iatRecognizer.isListening()) {

iatRecognizer.stopListening();

} else {

}

}

}

所借用的接口是科大讯飞开放平台提供的接口,实现实时的语音传输,通过云端的服务器利用科大讯飞的语音包将语音转为文字,传回客户端,这样就实现了客户端的语音转文字,拿到需要的文字之后,客户端的处理方式是将收到的text文本传入unity3D之中,再通过unity3d将文字text发送给服务器端,下一步由服务器进行语音的智能识别,主谓短语的切分,调用相关的库进行回复。

以下是调用VoiceToText的接口的方法:

@Override

public void onClick(View v) {

switch (v.getId()) {

case R.id.button1:

VoiceToWord voice = new VoiceToWord(MainActivity.this,"54ae8c54");

voice.GetWordFromVoice();

break;

}

}

声音监听:

private SpeechListener listener = new SpeechListener() {

@Override

public void onData(byte[] arg0) {

}

@Override

public void onCompleted(SpeechError error) {

if (error != null) {

System.out.println("user login success");

}

}

文本转语音,使用的是科大讯飞的接口,因为此作品之中语音包不是重点,所以语音包的转换我们统一调用的科大讯飞的语音包接口,依旧是在线的文字转语音,客户端将来自智能自然语音识别的服务器的text文本以文字的形式发送给科大讯飞的云端服务器,科大讯飞的云端服务器完成将文字转化为语音的步骤,再将语音实时的传送回来,由客户端将语音读出,此处需要申请客户端(安卓)的扬声器的权限,由扬声器将传回的语音读出。

有关的安卓的权限的要求:

<!-- 讯飞语音权限开始 -->

<uses-permission android:name="android.permission.INTERNET" />

<uses-permission android:name="android.permission.ACCESS_NETWORK_STATE" />

<uses-permission android:name="android.permission.ACCESS_WIFI_STATE" />

<uses-permission android:name="android.permission.RECORD_AUDIO" />

<uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE" />

<uses-permission android:name="android.permission.READ_EXTERNAL_STORAGE"/>

<!-- 讯飞语音权限结束 -->