1.  时域 & 频域

时域:自变量是时间,即横轴是时间,纵轴是信号的变化(振幅)。

           如下图中红色曲线, 描述信号随时间变化情况  (二维空间:  Time-Amplitude)

频域:自变量是频率,即横轴是频率,纵轴是该频率信号的幅度(振幅)。

           声音信号在频域表现为多个不同频率、振幅信号组成。(给定频率和振幅,可以得到该信号表示,下图中一条蓝色曲线,周期信号)           

在这里插入图片描述

 

2. 时域图(波形图) & 频谱图

时域图:表现的是一段音频在一段时间内音量的变化

              波形实质上是将各个频率的波形叠加在了一起(波形是由各频率不同幅值和相位的简单正弦波复合叠加得到的。)

频谱图:表现的是一段音频在某一时刻各个频率的音量的高低,表示的是一个静态的时间点上各频率正弦波的幅值大小的分布状况  (各个时刻是一样的,即与时间无关)

             直白一点,频谱就是为了找出一个波是由多少波复合而成的

在这里插入图片描述

3. 时域  -->  频域

        在频域的世界观察,你会发现世界是永恒不变的

        语音信号经过傅里叶变化,从时域转换到频域表示,如下图所示

       

4. 时频谱图(语谱图)

语谱图:先将语音信号作傅里叶变换,然后以横轴为时间,纵轴为频率,用颜色表示幅值即可绘制出语谱图。

               在一幅图中表示信号的频率、幅度随时间的变化,故也称“时频图”

python包绘制语谱图

matplotlib.pyplot.specgram(x, NFFT=None, Fs=None, Fc=None, detrend=None, window=None,
 noverlap=None, cmap=None, xextent=None, pad_to=None, sides=None, scale_by_freq=None, 
 mode=None, scale=None, vmin=None, vmax=None, *, data=None, **kwargs)

参数:

x:信号,一维数组或序列

NFFT:fft,点数,默认256,不用0填充,最好为2的整数次方

Fs:采样率,默认为2

Fc:信号x的中心频率,默认为0,用于移动图像

window:窗函数,长度必须等于NFFT(帧长)。默认为汉宁窗

mode:使用什么样的频谱,默认为PSD谱(功率谱)

noverlap:帧重叠点数,默认128

返回值:
spectrum:频谱矩阵
freqs:频谱图每行对应的频率
ts:频谱图每列对应的时间
fig :图像

from scipy.io import wavfile
import matplotlib.pyplot as plt

file='E:/MEAD/database/MEAD-W017/audio/angry/0.wav'
sampling_freq, audio = wavfile.read(file)   # 读取文件

# 语谱图获取
matrix,freqs,ts,fig=matplotlib.pyplot.specgram(audio[:,1],NFFT=256, Fs=sampling_freq)

plt.xlabel("time")
plt.ylabel("frequency")
plt.show()


 

 

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐