Speech AI Engineer

Job Description

岗位职责

参与 ASR 语音识别系统的数据建设、评估体系搭建与效果分析。

负责语音数据的清洗、标注规范制定、质量检查、数据集管理与版本维护。

设计和维护 ASR 评测集，分析模型在不同场景、口音、噪声、长音频等条件下的识别效果。

协助定位 ASR 模型问题，包括错词、漏识别、热词识别、标点恢复、长音频识别等。

参与 ASR 训练数据准备、实验配置、训练流程跟进和结果分析，逐步掌握模型训练与调优方法。

协助构建 ASR 训练与评估体系，包括数据版本管理、训练任务管理、实验记录、指标看板和效果回归分析。

与算法、工程、产品和标注团队协作，推动数据闭环、模型迭代和系统效果持续优化。

任职要求

计算机、人工智能、电子信息、自动化、数学、语言学等相关专业，本科及以上学历。

熟悉 Python，具备基本的数据处理、脚本开发和问题分析能力。

对语音识别、自然语言处理、机器学习或深度学习有基础了解。

具备良好的数据敏感度，做事细致，能够发现并总结数据、评估和实验中的问题。

有较强的学习能力和工程意识，愿意从数据与评估切入，逐步成长为能够独立训练和优化 ASR 模型的工程师。

具备良好的沟通协作能力，能够与算法、工程和业务团队高效配合。

加分项

有 ASR、NLP、语音数据处理、模型训练或模型评测相关项目经验。

熟悉 WER/CER 等语音识别评估指标。

了解 PyTorch、TensorFlow、Kaldi、ESPnet、WeNet、Whisper 等任一训练框架或开源 ASR 系统。

有数据标注、语料构建、错误分析、实验分析或训练 pipeline 搭建经验。

参加过语音、NLP、机器学习相关竞赛、科研项目或开源项目。

你将获得

从 ASR 数据、评估、实验分析到模型训练的完整成长路径。

参与真实业务场景下 ASR 训练体系和评估体系的建设。

与算法和工程团队一起解决真实语音识别问题，持续提升模型效果。

逐步成长为能够独立处理数据、设计实验、训练模型和分析效果的 ASR 工程师。