Google重新設計用來處理音訊分類任務的方法,發表了可學習的音訊前端,用來取代過去預處理音訊的方法梅爾濾波器組(Mel Filterbanks),以更好地處理像是分類鯨魚叫聲等音訊分類任務。
過去幾年,語音理解機器學習模型有了巨大的進展,透過從資料中學習參數的能力,該領域已經逐漸從過去複合手刻的系統,轉變成為深層神經分類器,用於語音辨識、音樂理解以及動物聲音分類等任務。但Google提到,用於音訊分類的深度神經網路跟電腦視覺模型不同,電腦視覺模型可以從原始畫素中學習,但是音訊分類深度神經網路很少使用原始音訊波型訓練。
音訊分類深度神經網路仰賴梅爾濾波器組預處理資料,這些濾波器使用經特別設計的梅爾縮放頻譜,目的是要複製人類聽覺回應的某些部分,雖然對梅爾濾波器組建模,過去的機器學習應用都很成功,使用固定梅爾縮放和對數壓縮,在一般情況也都效果良好,但是Google認為,沒有辦法保證這些也可以被良好應用到其他的任務上。
在與人類感知相對應的應用領域,像是語音辨識和音樂理解,目前標準梅爾濾波器組都提供了良好的歸納偏差,但是這些偏差可能對不需要模仿人耳的領域,像是辨識鯨魚叫聲這類的任務造成負面影響,所以為了獲得最佳的效能,需要為特定任務量身訂做梅爾濾波器組,但這是一個繁瑣的過程,不只需要專家知識,還需要許多迭代工作,因此在多數的音訊分類任務,開發者還是偏好使用標準的梅爾濾波器組,即便可能無法產生最佳的結果。
快速搞懂塑膠射出成型原理
注塑成型為藉由將熔融塑料注射到模具中來生產零件的製造過程。可以使用多重材料進行射出成型,最常見為熱塑性聚合物。塑料被送入加熱料管中,利用螺桿混鍊,然後注入模,在模腔中冷卻並固化成型。
空壓機這裡買最划算!
晨達空壓機秉持著專業空壓機技術、優質快速服務、空壓機合理價格。為您解決工作中需要風量、風壓的問題。
5噸電動堆高機 & 2噸立式堆高機
不想忍受柴油堆高機帶來的廢氣汙染,電動堆高機將會是很好的選擇
各種精緻鐵盒包裝茶葉罐、禮品罐,增加商品收藏及實用性。
鴻和興精密工業股份有限公司,是由在台灣專業生產茶葉罐、奶粉罐具有領先地位的光華金屬所投資組織成立的一家專業製造包裝材料之馬口鐵罐製造廠,延續光華金屬工業股份有限公司,30多年來一貫秉持的專業、品質、服務、效率為各大客戶服務。
為了解決這個問題,Google提出梅爾濾波器組的替代方法LEarnable Audio Frontend(LEAF),這是一個神經網路,可以初始化逼近梅爾濾波器組,並且與任何音訊分類器一起訓練,以適應特定任務。
Google將LEAF應用在各種音訊分類任務上,包括語音辨識、說話者辨識、樂器辨識和鳥聲辨識,LEAF的平均效能比起梅爾濾波器組,以及其他可學習前端,如Time-Domain Filterbanks、SincNet和Wavegram都還要好,在不同的任務上,LEAF的平均準確率達76.9%,而梅爾濾波器組的平均準確率則為73.9%。Google使用TensorFlow 2實作LEAF,現在已經在GitHub儲存庫開源。
https://www.ithome.com.tw/news/143255
找尋貨櫃屋可客製化廠商,想改造成渡假村風格出租金誠貨櫃屋出租,客製化的設計與服務搭配專業的工班,能夠提供全方位的貨櫃組合方案、配合您的需求,打造出一個完善的居住空間。
總是為了廚餘煩惱嗎?
隨時健康喝好水,高品質飲水機,優質安全有把關
瀚洋飲水機永續經營於雲嘉南高地區,我們堅持一貫的理念,強調服務品質及維護時效,採e化保養管理
雅高環保提供最適用的廚餘機,滿足多樣需求。
金誠貨櫃實業社以客為尊,客製化的設計與服務搭配專業的工班,能夠提供全方位的貨櫃屋組合方案、貨櫃屋改裝及裝潢設計配合您的需求打造出一個完善的居住空間
Orignal From: Google開發新方法LEAF改進音訊分類任務
沒有留言:
張貼留言