Datasource International Translation Media

錯誤: 找不到符合條件的聯絡表單。

語音數據收集

自動語音識別功能（ASR）於智能產品和系統的應用越趨普及。 Google Alexa 和聲控汽車導航系統等應用程式能令用戶體驗更上一層樓，然而系統要正確識別用戶指令，需要利用各種語音數據進行訓練。我們提供大量語音數據，涵蓋各種語言及場景，協助相關企業開發機器學習或人工智能產品。

我們能按照不同語言、發言人數、話語方式、年齡層和性別分佈來錄製您的講稿。

我們可按項目要求而在錄音室（無背景噪音）或其他環境（能接受一定背景噪音）錄製講稿。此類程式通常要求自然話語（非配音），並逐句建立獨立音訊檔 — 專為配合語音識別引擎的訓練程序而設。

不難想像，此類項目最後會產生數以萬計的檔案——但對我們來說，絕對不是問題！

而其他應用ASR的程式如語言偵測，就需要收集大量文本和音頻語料庫。

這類程式就與上述的有所不同，較適合使用非受控環境下的自然言語。這種情況下，我們可配合精細的要求，收集文本和音訊數據，包括語言、發言人數、話語長度、主題類型（例如：法律、社評、科學研究、社交媒體……）等等。

再罕見的方言數據，我們也能收集。歡迎聯繫我們，並提供您的項目要求，我們期待為您服務！

在尋找語音數據來訓練您的 ASR 系統？立即聯繫我們，一起商討細節！