TimesVIVA端侧多媒体技术

首页    核心技术    TimesVIVA端侧多媒体技术

TimesVIVA是一套完整的端侧语音和视觉处理、分析、识别技术,包括TimesVision视觉处理技术, TimesImage图像处理技术, TimesVoice语音识别技术和TimesAudio音频处理技术。TimesVIVA为各类端侧人工智能应用的核心算法提供了灵活高效的解决方案。

 

TimesVision视觉处理技术


TimesVision视觉处理技术是一项与第三方算法和方案合作伙伴合作开发,基于时擎科技的TimesFormer处理器和TimesFlow算法开发部署工具的软硬件平台,提供完整的、软硬件联合优化的视觉处理方案。可以为包括人脸检测、人形侦测、(活体)人脸识别、人体关键点检测、年龄识别、口罩识别、车型/车牌识别、背景分割、超分辨率在内的各类端侧视觉应用提供解决方案。

 

TimesImage图像处理技术


时擎科技的TimesImage图像处理技术主要包括高性能ISP技术、灵活可裁剪的2D图像加速技术、超低带宽图像压缩技术以及超低延迟图像传输技术,能够支撑各类高性能、低功耗的端侧视觉芯片的图像数据处理需求,有效降低系统延时、带宽需求和整体成本。

 

TimesVoice语音识别技术


TimesVoice语音识别技术是一项与第三方算法和方案合作伙伴合作开发,基于时擎科技的TimesFormer处理器和TimesFlow算法开发部署工具的软硬件平台,提供完整的、软硬件联合优化的语音识别方案,涵盖了如人声检测、关键词识别、定制命令词识别、模糊命令词识别等本地处理的智能语音应用场景。

 

TimesAudio音频处理技术


TimesAudio语音识别技术是一项与第三方算法和方案合作伙伴合作开发,基于时擎科技的TimesFormer处理器和TimesFlow算法开发部署工具的软硬件平台,提供完整的、软硬件联合优化的语音前端处理方案。主要包括回声消除、噪声抑制、麦克风阵列和语音编码技术,可以为会议、对讲等场景提供高性价比核心算法与方案。

2022年5月20日

新闻中心