Python在音频（Audio）领域中，如何进行数据扩充呢？

python音频的数据扩充
经典的深度学习网络alexnet使用数据扩充（data augmentation）的方式扩大数据集，取得较好的分类效果。在深度学习的图像领域中，通过平移、翻转、加噪等方法进行数据扩充。但是，在音频（audio）领域中，如何进行数据扩充呢？
音频的数据扩充，主要有以下四种方式：
音频剪裁（clip）
音频旋转（roll）
音频调音（tune）
音频加噪（noise）
音频解析基于librosa音频库；矩阵操作基于scipy和numpy科学计算库。
以下是python的实现方式
01
音频剪裁
import librosa
from scipy.io import wavfile y, sr = librosa.load(../data/love_illusion.mp3)
# 读取音频print y.shape, sr wavfile.write(../data/love_illusion_20s.mp3, sr, y[20 * sr:40 * sr])
# 写入音频
02
音频旋转
import cv2
import librosa
from scipy.io import wavfile y, sr = librosa.load(../data/raw/love_illusion_20s.mp3)
# 读取音频ly = len(y) y_tune = cv2.resize(y, (1, int(len(y) * 1.2))).squeeze() lc = len(y_tune) - ly y_tune = y_tune[int(lc / 2):int(lc / 2) + ly]print y.shape, sr wavfile.write(../data/raw/xxx_tune.mp3, sr, y_tune)
# 写入音频
03
音频调音
import cv2
import librosa
from scipy.io import wavfile y, sr = librosa.load(../data/raw/love_illusion_20s.mp3)
# 读取音频ly = len(y) y_tune = cv2.resize(y, (1, int(len(y) * 1.2))).squeeze() lc = len(y_tune) - ly y_tune = y_tune[int(lc / 2):int(lc / 2) + ly]print y.shape, sr wavfile.write(../data/raw/xxx_tune.mp3, sr, y_tune)
# 写入音频
04
音频加噪
import librosa
from scipy.io import wavfile
import numpy as np
y, sr = librosa.load(../data/raw/love_illusion_20s.mp3)
# 读取音频wn = np.random.randn(len(y)) y = np.where(y != 0.0, y + 0.02 * wn, 0.0)
# 噪声不要添加到0上！print y.shape, sr wavfile.write(../data/raw/love_illusion_20s_w.mp3, sr, y)
# 写入音频

疲劳试验机选购要素须知
易华录光存储技术有效保护数据安全
一加5什么时候上市？最新消息：一加5再曝光黑科技来袭，配置党最爱！
科学家与工程师:技术研究的价值
台积电选择力挺华为的决策依据?
Python在音频（Audio）领域中，如何进行数据扩充呢？
基于Transformer和深度证据学习的立体匹配框架
7.0英寸串口屏应用
EIB协议原理、实现的功能与应用实例分析
开发一种新的可持续路线来制备超小铜纳米团簇@MOFs
基于RBF神经网络的照明定量计算数据实现提高照明精度的设计
SMT自动化生产线联机
想创业先看看马云的忠告这4类人要重用
凌力尔特推超级电容器充电器主动电容器平衡以实现快速充电
中美科技摩擦频发，全球半导体现状如何？
远距医疗助MSTU一臂之力争取脑中风黄金急救时间
中国区块链企业占比高初创企业开始进入井喷模式
小米MIX3和荣耀Magic2买哪个最好
基于PTN的移动回传方案概览
周视经纬携ZT5手抛长航时无人机和新品V5垂直起降无人机产品亮相