语音信号的时域、频域含义及其表示
1. 时域 & 频域时域:自变量是时间,即横轴是时间,纵轴是信号的变化(振幅)。如下图中红色曲线, 描述信号随时间变化情况 (二维空间: Time-Amplitude)频域:自变量是频率,即横轴是频率,纵轴是该频率信号的幅度(振幅)。声音信号在频域表现为多个不同频率、振幅信号组成。(给定频率和振幅,可以得到该信号表示,下图中一条蓝色曲线,周期信号)2. 时域图(波形图) & 频谱图
1. 时域 & 频域
时域:自变量是时间,即横轴是时间,纵轴是信号的变化(振幅)。
如下图中红色曲线, 描述信号随时间变化情况 (二维空间: Time-Amplitude)
频域:自变量是频率,即横轴是频率,纵轴是该频率信号的幅度(振幅)。
声音信号在频域表现为多个不同频率、振幅信号组成。(给定频率和振幅,可以得到该信号表示,下图中一条蓝色曲线,周期信号)
2. 时域图(波形图) & 频谱图
时域图:表现的是一段音频在一段时间内音量的变化
波形实质上是将各个频率的波形叠加在了一起(波形是由各频率不同幅值和相位的简单正弦波复合叠加得到的。)
频谱图:表现的是一段音频在某一时刻各个频率的音量的高低,表示的是一个静态的时间点上各频率正弦波的幅值大小的分布状况 (各个时刻是一样的,即与时间无关)
直白一点,频谱就是为了找出一个波是由多少波复合而成的
3. 时域 --> 频域
在频域的世界观察,你会发现世界是永恒不变的
语音信号经过傅里叶变化,从时域转换到频域表示,如下图所示
4. 时频谱图(语谱图)
语谱图:先将语音信号作傅里叶变换,然后以横轴为时间,纵轴为频率,用颜色表示幅值即可绘制出语谱图。
在一幅图中表示信号的频率、幅度随时间的变化,故也称“时频图”。
python包绘制语谱图
matplotlib.pyplot.specgram(x, NFFT=None, Fs=None, Fc=None, detrend=None, window=None,
noverlap=None, cmap=None, xextent=None, pad_to=None, sides=None, scale_by_freq=None,
mode=None, scale=None, vmin=None, vmax=None, *, data=None, **kwargs)
参数:
x:信号,一维数组或序列
NFFT:fft,点数,默认256,不用0填充,最好为2的整数次方
Fs:采样率,默认为2
Fc:信号x的中心频率,默认为0,用于移动图像
window:窗函数,长度必须等于NFFT(帧长)。默认为汉宁窗
mode:使用什么样的频谱,默认为PSD谱(功率谱)
noverlap:帧重叠点数,默认128
返回值:
spectrum:频谱矩阵
freqs:频谱图每行对应的频率
ts:频谱图每列对应的时间
fig :图像
from scipy.io import wavfile
import matplotlib.pyplot as plt
file='E:/MEAD/database/MEAD-W017/audio/angry/0.wav'
sampling_freq, audio = wavfile.read(file) # 读取文件
# 语谱图获取
matrix,freqs,ts,fig=matplotlib.pyplot.specgram(audio[:,1],NFFT=256, Fs=sampling_freq)
plt.xlabel("time")
plt.ylabel("frequency")
plt.show()
更多推荐
所有评论(0)