使用百度语音识别REST API,做全平台语音识别

时间:2023-11-14 15:41:38

百度语音开发介绍文档:

http://yuyin.baidu.com/docs/asr#

使用语音识别,需要在百度申请一个应用,然后拿到API Key和Secret Key,然后才可以使用语音识别

ps:我的示例里面有放了一组可用的Key,但是仅供各位测试使用,有需要开发App的请自行申请,放在示例中的Key我可能随时会撤销。

ps:编译需要开启C++11的支持

ps:我写示例在OS X下是没问题的。但是当我移植到Windows下的时候,在刷新token那一步有问题,貌似和https有关,等到我想到解决方法的时候回来更新。

ps:示例里,在刷新token的地方我直接写了apikey的明文字符串,应该替换成m_apiKey,请手动替换。本页面中我已经更改了。

直接上代码

.h头文件部分

  1. class BaiduVop: public QObject
  2. {
  3. Q_OBJECT
  4. private:
  5. QAudioDeviceInfo m_currentDevice;
  6. QString m_apiKey;
  7. QString m_secretKey;
  8. QString m_token;
  9. QAudioInput *m_audioInput = NULL;
  10. QByteArray m_buf;
  11. QBuffer *m_buffer = NULL;
  12. JasonQt_Net::HTTP m_http;
  13. public:
  14. BaiduVop(const QString &apiKey, const QString &secretKey);
  15. void setDevice(const QAudioDeviceInfo &device);
  16. public slots:
  17. bool refreshToken(void);
  18. bool start(void);
  19. std::pair<bool, QString> finish(void);
  20. };

.cpp实现文件

  1. BaiduVop::BaiduVop(const QString &apiKey, const QString &secretKey):
  2. m_apiKey(apiKey),
  3. m_secretKey(secretKey)
  4. {
  5. const auto &&availableDevices = QAudioDeviceInfo::availableDevices(QAudio::AudioInput);
  6. if(!availableDevices.isEmpty())
  7. {
  8. m_currentDevice = availableDevices.first();
  9. QAudioFormat format;
  10. format.setSampleRate(8000);
  11. format.setChannelCount(1);
  12. format.setSampleSize(16);
  13. format.setSampleType(QAudioFormat::SignedInt);
  14. format.setByteOrder(QAudioFormat::LittleEndian);
  15. format.setCodec("audio/pcm");
  16. m_audioInput = new QAudioInput(m_currentDevice, format, this);
  17. }
  18. }
  19. void BaiduVop::setDevice(const QAudioDeviceInfo &device)
  20. {
  21. m_currentDevice = device;
  22. }
  23. bool BaiduVop::refreshToken(void)
  24. {
  25. QNetworkRequest request(QUrl(QString("https://openapi.baidu.com/oauth/2.0/token?")));
  26. QByteArray append = QString("grant_type=client_credentials&client_id=%1&client_secret=%2&").arg(m_apiKey, m_secretKey).toLatin1();
  27. QByteArray buf;
  28. request.setRawHeader("Content-Type", "application/json");
  29. const auto &&flag = m_http.post(request, append, buf, 15000);
  30. if(!flag) { return false; }
  31. const auto &&data = QJsonDocument::fromJson(buf).object();
  32. if(data.isEmpty() || !data.contains("access_token")) { return false; }
  33. m_token = data["access_token"].toString();
  34. return true;
  35. }
  36. bool BaiduVop::start(void)
  37. {
  38. if(m_token.isEmpty())
  39. {
  40. qDebug("BaiduVop::start fail, Need refresh token befor start.");
  41. return false;
  42. }
  43. m_buffer = new QBuffer;
  44. m_buffer->open(QIODevice::ReadWrite);
  45. m_audioInput->start(m_buffer);
  46. return true;
  47. }
  48. std::pair<bool, QString> BaiduVop::finish(void)
  49. {
  50. m_audioInput->stop();
  51. const auto &sendData = m_buffer->data();
  52. m_buffer->deleteLater();
  53. QNetworkRequest request(QUrl("http://vop.baidu.com/server_api"));
  54. QJsonObject append;
  55. request.setRawHeader("Content-Type", "application/json");
  56. append["format"] = "pcm";
  57. append["rate"] = 8000;
  58. append["channel"] = 1;
  59. append["token"] = m_token;
  60. append["lan"] = "zh";
  61. append["cuid"] = "JasonQt";
  62. append["speech"] = QString(sendData.toBase64());
  63. append["len"] = sendData.size();
  64. QByteArray buf;
  65. m_http.post(request, QJsonDocument(append).toJson(), buf, 15000);
  66. QJsonObject acceptedData(QJsonDocument::fromJson(buf).object());
  67. if(buf.isEmpty() || acceptedData.isEmpty() || !acceptedData.contains("result")) { return { false, buf }; }
  68. const auto &&message = acceptedData["result"].toArray()[0].toString();
  69. return { true, message.mid(0, message.size() - 1) };
  70. }

其中有几个http的接口已经被我封装了,需要自行开发的请更改代码或者直接下载我的示例,里面有完整的工程。

可以到下方链接中下载

http://download.****.net/detail/wsj18808050/8659091

http://blog.****.net/wsj18808050/article/details/45478983