Datasource International Translation Media | Speech Data Collection

Need more Information?

Error: Contact form not found.

speechdata-cover

语音数据采集

不限性别、年龄、语言或环境的语音数据

如今，运用自动语音识别功能（ASR）的智能产品及系统越来越来。类似“Google Alexa”和汽车语音导航系统的应用程序能够为用户提供更高层次的使用体验，然而这些应用程序需要通过各种语音数据进行训练，从而准确地识别用户指令。我们的使命正是帮助这一领域的公司，为机器学习或人工智能技术提供不限语言和环境的海量语音数据。

语音数据采集

我们能够将您的脚本，录制为涵盖各种语言、人数、讲话方式、年龄和性别的语音内容。

我们可以依据您的项目设定参数，在录音室环境（无背景噪音）或非录音室环境（略带背景噪音）中进行录音。这一类的应用程序通常需要语气自然（无演技成分）的语音，并且将每句话保存为一个单独的音频文件，以便语音识别引擎进行训练。

不难想象，项目完成时您可能要面对数以万计的文件。对我们而言，解决这个问题易如反掌!

shutterstock_573769474-min

文本和音频语料库采集

那些运用自动语音识别功能（ASR）的其他应用程序，例如语种检测类应用程序，则离不开海量的文本和音频语料库采集。

这与上述的应用程序不同，这些应用程序首选使用在非受控环境中自然发生的对话。在此情况下，我们能够依据极为精确的参数设定，包括语言、人数、长度、话题（法律、收集文本和音频数据，这些参数可以包括语言、说话人的数量、长度要求、话题类型（法律、评论、科研、社交媒体等）等，来采集文本和音频数据。

我们还具备为客户采集罕见方言数据的雄厚实力。欢迎联络我们并告知您的采集参数，我们将竭诚为您提供卓越服务！

shutterstock_1706732899-min

联络我们

正在寻找海量语音数据，以便训练您的自动语音识别系统？我们热忱期待您的联络！