Python在音频(Audio)领域中,如何进行数据扩充呢?

python音频的数据扩充
经典的深度学习网络alexnet使用数据扩充(data augmentation)的方式扩大数据集,取得较好的分类效果。在深度学习的图像领域中,通过平移、 翻转、加噪等方法进行数据扩充。但是,在音频(audio)领域中,如何进行数据扩充呢?
音频的数据扩充,主要有以下四种方式:
音频剪裁(clip)
音频旋转(roll)
音频调音(tune)
音频加噪(noise)
音频解析基于librosa音频库;矩阵操作基于scipy和numpy科学计算库。
以下是python的实现方式
01
音频剪裁
import librosa
from scipy.io import wavfile y, sr = librosa.load(../data/love_illusion.mp3)
# 读取音频print y.shape, sr wavfile.write(../data/love_illusion_20s.mp3, sr, y[20 * sr:40 * sr])
# 写入音频
02
音频旋转
import cv2
import librosa
from scipy.io import wavfile y, sr = librosa.load(../data/raw/love_illusion_20s.mp3)
# 读取音频ly = len(y) y_tune = cv2.resize(y, (1, int(len(y) * 1.2))).squeeze() lc = len(y_tune) - ly y_tune = y_tune[int(lc / 2):int(lc / 2) + ly]print y.shape, sr wavfile.write(../data/raw/xxx_tune.mp3, sr, y_tune)
# 写入音频
03
音频调音
import cv2
import librosa
from scipy.io import wavfile y, sr = librosa.load(../data/raw/love_illusion_20s.mp3)
# 读取音频ly = len(y) y_tune = cv2.resize(y, (1, int(len(y) * 1.2))).squeeze() lc = len(y_tune) - ly y_tune = y_tune[int(lc / 2):int(lc / 2) + ly]print y.shape, sr wavfile.write(../data/raw/xxx_tune.mp3, sr, y_tune)
# 写入音频
04
音频加噪
import librosa
from scipy.io import wavfile
import numpy as np
y, sr = librosa.load(../data/raw/love_illusion_20s.mp3)
# 读取音频wn = np.random.randn(len(y)) y = np.where(y != 0.0, y + 0.02 * wn, 0.0)
# 噪声不要添加到0上!print y.shape, sr wavfile.write(../data/raw/love_illusion_20s_w.mp3, sr, y)
# 写入音频

疲劳试验机选购要素须知
易华录光存储技术有效保护数据安全
一加5什么时候上市?最新消息:一加5再曝光 黑科技来袭,配置党最爱!
科学家与工程师:技术研究的价值
台积电选择力挺华为的决策依据?
Python在音频(Audio)领域中,如何进行数据扩充呢?
基于Transformer和深度证据学习的立体匹配框架
7.0英寸串口屏应用
EIB协议原理、实现的功能与应用实例分析
开发一种新的可持续路线来制备超小铜纳米团簇@MOFs
基于RBF神经网络的照明定量计算数据实现提高照明精度的设计
SMT自动化生产线联机
想创业先看看马云的忠告 这4类人要重用
凌力尔特推超级电容器充电器 主动电容器平衡以实现快速充电
中美科技摩擦频发,全球半导体现状如何?
远距医疗助MSTU一臂之力 争取脑中风黄金急救时间
中国区块链企业占比高 初创企业开始进入井喷模式
小米MIX3和荣耀Magic2买哪个最好
基于PTN的移动回传方案概览
周视经纬携ZT5手抛长航时无人机和新品V5垂直起降无人机产品亮相