99热久久精品最新地址,日本中文字幕不卡无码视频

用python實現(xiàn)語音端點檢測(Voice Activity Detection,VAD)

發(fā)布日期：2022/10/11 7:19:28 瀏覽量：

1.準備環(huán)境
https://github.com/marsbroshok/VAD-python
里面的vad.py文件

2.具體代碼

from vad import VoiceActivityDetector
import wave

if __name__ == "__main__":
load_file = "test.wav"
save_file = "process.wav"
# 獲取vad分割節(jié)點
v = VoiceActivityDetector(load_file)
raw_detection = v.detect_speech()
speech_labels, point_labels = v.convert_windows_to_readible_labels(raw_detection)
if len(point_labels) != 0:
# 根據(jù)節(jié)點音頻分割并連接
data = v.data
cut_data = []
Fs = v.rate
for start, end in point_labels:
cut_data.extend(data[int(start):int(end)])

# 保存音頻
f = wave.open(save_file, ’w’)
nframes = len(cut_data)
f.setparams((1, 2, Fs, nframes, ’NONE’, ’NONE’)) # 聲道，字節(jié)數(shù)，采樣頻率，*，*
wavdata = np.array(cut_data)
wavdata = wavdata.astype(np.int16)
f.writeframes(wavdata) # outData
f.close()

3.部分參數(shù)
vad.py文件

class VoiceActivityDetector():
""" Use signal energy to detect voice activity in wav file """

def __init__(self, wave_input_filename):
self._read_wav(wave_input_filename)._convert_to_mono()
#沿音頻數(shù)據(jù)移動 20 毫秒的窗口。
self.sample_window = 0.02 # 20 ms
self.sample_overlap = 0.01 # 10ms
#應(yīng)用長度為 0.5s 的中值濾波器來平滑檢測到的語音區(qū)域。
self.speech_window = 0.5 # half a second
#計算語帶能量與窗口總能量的比值。如果比率大于閾值（默認為 0.6），則將窗口標記為語音
self.speech_energy_threshold = 0.6 # 60% of energy in voice band
#中值濾波器（濾波保留2000-8000hz）
self.speech_start_band = 2000
self.speech_end_band = 8000
self.data_speech = []

業(yè)務(wù)實施流程

需求調(diào)研 →

團隊組建和動員 →

數(shù)據(jù)初始化 →

調(diào)試完善 →

解決方案和選型 →

硬件網(wǎng)絡(luò)部署 →

系統(tǒng)部署試運行 →

系統(tǒng)正式上線 →

合作協(xié)議

系統(tǒng)開發(fā)/整合

制作文檔和員工培訓(xùn)

售后服務(wù)

馬上咨詢： 如果您有業(yè)務(wù)方面的問題或者需求，歡迎您咨詢！我們帶來的不僅僅是技術(shù)，還有行業(yè)經(jīng)驗積累。
QQ: 39764417/308460098 Phone: 13 9800 1 9844 / 135 6887 9550 聯(lián)系人：石先生/雷先生

蜜桃av色欲a片精品一区,麻豆aⅴ精品无码一区二区,亚洲人成网站在线播放影院在线,亚洲 素人 字幕 在线 最新

用python實現(xiàn)語音端點檢測(Voice Activity Detection,VAD)

蜜桃av色欲a片精品一区,麻豆aⅴ精品无码一区二区,亚洲人成网站在线播放影院在线,亚洲素人字幕在线最新