使用百度语音识别REST API,做全平台语音识别

时间:2022-08-31 14:33:18

百度语音开发介绍文档:

http://yuyin.baidu.com/docs/asr#

使用语音识别,需要在百度申请一个应用,然后拿到API Key和Secret Key,然后才可以使用语音识别

ps:我的示例里面有放了一组可用的Key,但是仅供各位测试使用,有需要开发App的请自行申请,放在示例中的Key我可能随时会撤销。

ps:编译需要开启C++11的支持

ps:我写示例在OS X下是没问题的。但是当我移植到Windows下的时候,在刷新token那一步有问题,貌似和https有关,等到我想到解决方法的时候回来更新。

ps:示例里,在刷新token的地方我直接写了apikey的明文字符串,应该替换成m_apiKey,请手动替换。本页面中我已经更改了。

直接上代码

.h头文件部分

  1. class BaiduVop: public QObject
  2. {
  3. Q_OBJECT
  4. private:
  5. QAudioDeviceInfo m_currentDevice;
  6. QString m_apiKey;
  7. QString m_secretKey;
  8. QString m_token;
  9. QAudioInput *m_audioInput = NULL;
  10. QByteArray m_buf;
  11. QBuffer *m_buffer = NULL;
  12. JasonQt_Net::HTTP m_http;
  13. public:
  14. BaiduVop(const QString &apiKey, const QString &secretKey);
  15. void setDevice(const QAudioDeviceInfo &device);
  16. public slots:
  17. bool refreshToken(void);
  18. bool start(void);
  19. std::pair<bool, QString> finish(void);
  20. };

.cpp实现文件

  1. BaiduVop::BaiduVop(const QString &apiKey, const QString &secretKey):
  2. m_apiKey(apiKey),
  3. m_secretKey(secretKey)
  4. {
  5. const auto &&availableDevices = QAudioDeviceInfo::availableDevices(QAudio::AudioInput);
  6. if(!availableDevices.isEmpty())
  7. {
  8. m_currentDevice = availableDevices.first();
  9. QAudioFormat format;
  10. format.setSampleRate(8000);
  11. format.setChannelCount(1);
  12. format.setSampleSize(16);
  13. format.setSampleType(QAudioFormat::SignedInt);
  14. format.setByteOrder(QAudioFormat::LittleEndian);
  15. format.setCodec("audio/pcm");
  16. m_audioInput = new QAudioInput(m_currentDevice, format, this);
  17. }
  18. }
  19. void BaiduVop::setDevice(const QAudioDeviceInfo &device)
  20. {
  21. m_currentDevice = device;
  22. }
  23. bool BaiduVop::refreshToken(void)
  24. {
  25. QNetworkRequest request(QUrl(QString("https://openapi.baidu.com/oauth/2.0/token?")));
  26. QByteArray append = QString("grant_type=client_credentials&client_id=%1&client_secret=%2&").arg(m_apiKey, m_secretKey).toLatin1();
  27. QByteArray buf;
  28. request.setRawHeader("Content-Type", "application/json");
  29. const auto &&flag = m_http.post(request, append, buf, 15000);
  30. if(!flag) { return false; }
  31. const auto &&data = QJsonDocument::fromJson(buf).object();
  32. if(data.isEmpty() || !data.contains("access_token")) { return false; }
  33. m_token = data["access_token"].toString();
  34. return true;
  35. }
  36. bool BaiduVop::start(void)
  37. {
  38. if(m_token.isEmpty())
  39. {
  40. qDebug("BaiduVop::start fail, Need refresh token befor start.");
  41. return false;
  42. }
  43. m_buffer = new QBuffer;
  44. m_buffer->open(QIODevice::ReadWrite);
  45. m_audioInput->start(m_buffer);
  46. return true;
  47. }
  48. std::pair<bool, QString> BaiduVop::finish(void)
  49. {
  50. m_audioInput->stop();
  51. const auto &sendData = m_buffer->data();
  52. m_buffer->deleteLater();
  53. QNetworkRequest request(QUrl("http://vop.baidu.com/server_api"));
  54. QJsonObject append;
  55. request.setRawHeader("Content-Type", "application/json");
  56. append["format"] = "pcm";
  57. append["rate"] = 8000;
  58. append["channel"] = 1;
  59. append["token"] = m_token;
  60. append["lan"] = "zh";
  61. append["cuid"] = "JasonQt";
  62. append["speech"] = QString(sendData.toBase64());
  63. append["len"] = sendData.size();
  64. QByteArray buf;
  65. m_http.post(request, QJsonDocument(append).toJson(), buf, 15000);
  66. QJsonObject acceptedData(QJsonDocument::fromJson(buf).object());
  67. if(buf.isEmpty() || acceptedData.isEmpty() || !acceptedData.contains("result")) { return { false, buf }; }
  68. const auto &&message = acceptedData["result"].toArray()[0].toString();
  69. return { true, message.mid(0, message.size() - 1) };
  70. }

其中有几个http的接口已经被我封装了,需要自行开发的请更改代码或者直接下载我的示例,里面有完整的工程。

可以到下方链接中下载

http://download.csdn.net/detail/wsj18808050/8659091

http://blog.csdn.net/wsj18808050/article/details/45478983

使用百度语音识别REST API,做全平台语音识别的更多相关文章

  1. 百度语音识别REST API——通过使用Http网络请求方式获得语音识别功能

    百度语音识别通过REST API的方式给开发人员提供一个通用的HTTP接口,基于该接口,开发人员能够轻松的获取语音识别能力,本文档描写叙述了使用语音识别服务REST API的方法. 长处: 较之开发人 ...

  2. 百度语音识别REST API用法(含JAVA代码)——不须要集成SDK的方法

    版权声明:本文为博主原创文章,未经博主同意不得转载. https://blog.csdn.net/zpf8861/article/details/32329457 上一篇文章http://blog.c ...

  3. Linux VPS使用百度网盘API上传备份文件

    最近百度网盘将空间升级到了永久1TB,鉴于百度的实力用做数据备份空间不错,不过百度网盘没有Linux下的客户端,上传管理文件需通过百度开放云平台访问PCS资源的系列接口. 1.首先加入百度开发者:ht ...

  4. 可能是目前市面上唯一能够支持全平台的RTMP推流组件:Windows、Linux、Android、iOS、ARM

    EasyRTMP是什么? EasyRTMP是一套RTMP直播推送功能组件,内部集成了包括:基本RTMP协议.断线重连.异步推送.环形缓冲区.推送网络拥塞自动丢帧.缓冲区关键帧检索.事件回调(断线.音视 ...

  5. &period;NET之全平台一体化的体验

    一.前言 近来利用空闲时间研究了一下Xamarin的技术,想想既然提供了如此好的支持,就该尝试一切可能,来一个”大小通吃“. 何为全平台:APP包括Android.IOS.WP,WEB可在Window ...

  6. 百度地图JavaScript API覆盖物旋转时出现偏移

    在项目中,调用百度地图JavaScript API,做覆盖物的旋转再添加到地图上,结果出现偏移了. 调试过程中的效果图: 发现图片的旋转并不是按车子的中心来的,而是之外的一个点.最后发现犯了一个很细节 ...

  7. NET之全平台一体化

    NET之全平台一体化的体验 一.前言 近来利用空闲时间研究了一下Xamarin的技术,想想既然提供了如此好的支持,就该尝试一切可能,来一个”大小通吃“. 何为全平台:APP包括Android.IOS. ...

  8. WPF技术触屏上的应用系列(二)&colon; 嵌入百度地图、API调用及结合本地数据库在地图上进行自定义标点的实现

    原文:WPF技术触屏上的应用系列(二): 嵌入百度地图.API调用及结合本地数据库在地图上进行自定义标点的实现 去年某客户单位要做个大屏触屏应用,要对档案资源进行展示之用.客户端是Window7操作系 ...

  9. 百度地图JavaScript API使用

    最近在完成优达学城前端开发(入门)课程的P4项目中,要求调用google地图进行交互,项目已提供部分js代码和html代码.但在申请google地图API密钥时由于网络等原因,打不开或者连接超时,所以 ...

随机推荐

  1. FTP协议

    1. FTP协议 什么是FTP呢?FTP 是 TCP/IP 协议组中的协议之一,是英文File Transfer Protocol的缩写. 该协议是Internet文件传送的基础,它由一系列规格说明文 ...

  2. WordPress Shareaholic 插件跨站请求伪造漏洞

    漏洞名称: WordPress Shareaholic 插件跨站请求伪造漏洞 CNNVD编号: CNNVD-201308-250 发布时间: 2013-08-19 更新时间: 2013-08-19 危 ...

  3. BZOJ 1648&colon; &lbrack;Usaco2006 Dec&rsqb;Cow Picnic 奶牛野餐&lpar; dfs &rpar;

    直接从每个奶牛所在的farm dfs , 然后算一下.. ----------------------------------------------------------------------- ...

  4. &lbrack;妙味JS基础&rsqb;第二课:for应用、this关键字

    知识点总结 getElementsByTagName(动态方法) 与 getElementById(静态方法) 的区别 1.ID前面只能跟document,不能跟其他元素,比如:document.ge ...

  5. python与opencv的结合之人脸识别值

    首先还是要感谢http://www.jb51.net/article/67392.htm这位大神的无私奉献,开源的代码,让我省去了很多事,但是就光系统环境的配置就花去了我将近一个星期的时间,真是不容易 ...

  6. lumen的自定义依赖注入

    比如我现在有个token认证系统,目前我用mysql的token表实现,将来有可能会改成redis,怎么实现未来的无缝连接呢. 先定义一个合约文件app/Contracts/TokenHandler. ...

  7. 处理安卓和ios当页面原生键盘弹出,输入框不显示

    $('input').on('click', function () { var target = this; // 使用定时器是为了让输入框上滑时更加自然 setTimeout(function() ...

  8. UltraISO制作CentOS 7&period;6 U盘引导安装盘

    一.制作准备: 1.UltraISO下载安装 2.CentOS镜像文件下载(阿里镜像下载) 二.制作引导盘: 1.电脑插入U盘 2.UltraISO加载镜像文件: 文件->打开->选择对应 ...

  9. shell基础:环境变量

    子shell是在父shell中打开的shell. 使用pstree查看进程树. $调用环境变量 set查看所有变量内容, env查询环境变量 只是临时改变

  10. anaconda的spyder打不开

    因为最近一段时间没有用Spyder,今天使用时,发现Spyder又又打不开了. 之前遇到Spyder打不开的情况时,是根据这里的教程:删除.matplotlib和.spyder两个文件,但这次删除这两 ...