test

Need more Information?
[contact-form-7 404 "Not Found"]

任何性別、年齡、語言或環境的語音數據

自動語音識別功能(ASR)於智能產品和系統的應用越趨普及。  Google Alexa 和聲控汽車導航系統等應用程式能令用戶體驗更上一層樓,然而系統要正確識別用戶指令,需要利用各種語音數據進行訓練。  我們提供大量語音數據,涵蓋各種語言及場景,協助相關企業開發機器學習或人工智能產品。

語音數據收集

我們能按照不同語言、發言人數、話語方式、年齡層和性別分佈來錄製您的講稿

我們可按項目要求而在錄音室(無背景噪音)或其他環境(能接受一定背景噪音)錄製講稿。此類程式通常要求自然話語(非配音),並逐句建立獨立音訊檔 — 專為配合語音識別引擎的訓練程序而設。

不難想像,此類項目最後會產生數以萬計的檔案——但對我們來說,絕對不是問題!

文本和音訊語料庫

而其他應用ASR的程式如語言偵測,就需要收集大量文本和音頻語料庫

這類程式就與上述的有所不同,較適合使用非受控環境下的自然言語。這種情況下,我們可配合精細的要求,收集文本和音訊數據,包括語言、發言人數、話語長度、主題類型(例如:法律、社評、科學研究、社交媒體……)等等。

再罕見的方言數據,我們也能收集。歡迎聯繫我們,並提供您的項目要求,我們期待為您服務!

聯繫我們

在尋找語音數據來訓練您的 ASR 系統?立即聯繫我們,一起商討細節!