网站首页 > 技术文章 正文
首先,我们需要 import 几个工具包,一个是 python 标准库中的 wave 模块,用于音频处理操作,另外两个是 numpy 和 matplot,提供数据处理函数
一:读取本地音频数据
处理音频第一步是需要从让计算机“听到”声音,这里我们使用 python 标准库中自带的 wave模块进行音频参数的获取。
(1) 导入 wave 模块
(2) 使用 wave 中的函数 open 打开音频文件,wave.open(file,mode)函数带有两个参数, 第一个 file 是所需要打开的文件名及路径,使用字符串表示;第二个 mode 是打开的模式,也是用字符串表示 (’rb’或’wb’)
(3) 打开音频后使用 getparams() 获取音频基本的相关参数(nchannels:声道数,sampwidth:量化位数或量化深度,framerate:采样频率,nframes:采样点数)
driver.find_element_by_xpath('//*[@id="zpNav"]/em/a[1]').click()
sleep(2)
driver.find_element_by_xpath('//*[@id="keyword1"]').send_keys('互联网')
# 导入 wave 模块
import wave
# 用于绘制波形图
import matplotlib.pyplot as plt
# 用于计算波形数据
import numpy as np
# 用于系统处理,如读取本地音频文件
import os
# 打开WAV文档
f = wave.open(r"2.wav", 'rb')
# 读取格式信息
params = f.getparams()
nchannels, sampwidth, framerate, nframes = params[:4]
print(framerate)
二:读取单通道音频,并绘制波形图(常见音频为左右2个声道)
(1) 通过第一步,可以继续读取音频数据本身,保存为字符串格式
readframes:读取声音数据,传递一个参数指定需要读取的长度(以取样点为单位),readframes返回的是二进制数据(一大堆bytes),在Python中用字符串表示二进制数据。
strData = f.readframes(nframes)
(2) 如果需要绘制波形图,则需要将字符串格式的音频数据转化为 int 类型
frombuffer:
根据声道数和量化单位,将读取的二进制数据转换为一个可以计算的数组。
通过frombuffer函数将二进制转换为整型数组,通过其参数dtype指定转换后的数据格式。
waveData=np.frombuffer(strData,dtype=np.int16)
此处需要使用到 numpy 进行数据格式的转化
(3) 将幅值归一化
把数据变成(0,1)之间的小数。主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速。
waveData=waveData*1.0/(max(abs(waveData)))
这一步去掉也可画出波形图,可以尝试不用此步,找出波形图的不同
(4) 绘制图像
通过取样点数和取样频率计算出取样的时间:
time = np.arange(0,nframes)*(1.0/framerate)
import wave
# 导入 wave 模块
import matplotlib.pyplot as plt
# 用于绘制波形图
import numpy as np
# 用于计算波形数据
import os
# 用于系统处理,如读取本地音频文件
f = wave.open(r"di.wav", 'rb')
params = f.getparams()
nchannels, sampwidth, framerate, nframes = params[:4]
print(framerate)
# 读取波形数据
strData = f.readframes(nframes)
# 将字符串转换为16位整数
waveData = np.frombuffer(strData, dtype=np.int16)
# 幅值归一化
waveData = waveData * 1.0 / (max(abs(waveData)))
# 计算音频的时间
time = np.arange(0, nframes) * (1.0 / framerate)
plt.plot(time, waveData)
plt.xlabel("Time(s)")
plt.ylabel("Amplitude")
plt.title("Single channel wavedata")
plt.show()
效果图
猜你喜欢
- 2025-04-27 Python实现语音识别与人脸识别技术结合,打造高效安全门禁系统。
- 2025-04-27 Python实现变声器功能,萝莉音御姐音都有的哦
- 2025-04-27 python让你的文字会说话
- 2025-04-27 python将文本转化为语音 pyttsx3 详解
- 2025-04-27 Python爬虫--喜马拉雅三国音频爬取
- 2025-04-27 python实现用语音识别打开windows应用,调节亮度,声音很简单的
- 2025-04-27 这一款极好:轻松用Python完成文字转语音
- 2025-04-27 使用Google Speech API在Python中进行语音识别
- 2025-04-27 开源人声分离音频标注工具—基于Python
- 2025-04-27 机器学习中的音频特征:理解Mel频谱图
- 263℃Python短文,Python中的嵌套条件语句(六)
- 263℃python笔记:for循环嵌套。end=""的作用,图形打印
- 261℃PythonNet:实现Python与.Net代码相互调用!
- 256℃Python实现字符串小写转大写并写入文件
- 255℃Python操作Sqlserver数据库(多库同时异步执行:增删改查)
- 116℃原来2025是完美的平方年,一起探索六种平方的算吧
- 96℃Python 和 JavaScript 终于联姻了!PythonMonkey 要火?
- 89℃Ollama v0.4.5-v0.4.7 更新集合:Ollama Python 库改进、新模型支持
- 最近发表
- 标签列表
-
- python中类 (31)
- python 迭代 (34)
- python 小写 (35)
- python怎么输出 (33)
- python 日志 (35)
- python语音 (31)
- python 工程师 (34)
- python3 安装 (31)
- python音乐 (31)
- 安卓 python (32)
- python 小游戏 (32)
- python 安卓 (31)
- python聚类 (34)
- python向量 (31)
- python大全 (31)
- python次方 (33)
- python桌面 (32)
- python总结 (34)
- python浏览器 (32)
- python 请求 (32)
- python 前端 (32)
- python验证码 (33)
- python 题目 (32)
- python 文件写 (33)
- python中的用法 (32)