使用百度云API进行语音转文字(基于python的wav文件转换)

时间:2024-02-20 11:52:03
  1. 登录http://ai.baidu.com/,控制台->人工智能->语音技术,创建一个应用
  2. 根据其Python SDK文档 进行Demo测试
    • 安装依赖包:pip install baidu-aip
    • wav文件转换成文字Demo:
    • 注意:1、存储的wav文件采样率为16000 2、wav文件为单声道,否则会影响语音识别的准确性
    •  1 #!/usr/bin/python
       2 # -*- coding: UTF-8 -*-
       3 from aip import AipSpeech
       4 
       5 #从百度AI开放平台创建应用处获取
       6 APP_ID = \'\'
       7 API_KEY = \'\'
       8 SECRET_KEY = \'\'
       9 
      10 client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
      11 
      12 # 读取文件
      13 def get_file_content(filePath):
      14     with open(filePath, \'rb\') as fp:
      15         return fp.read()
      16 
      17 # 识别本地文件
      18 def get_text():
      19     result = client.asr(get_file_content(\'record.wav\'), \'wav\', 16000, {
      20     \'dev_pid\': 1536,})
      21     print(result)
      22     text = result[\'result\'][0]
      23     return text
      24 
      25 print(get_text())