程序员文章、书籍推荐和程序员创业信息与资源分享平台

网站首页 > 技术文章 正文

开源人声分离音频标注工具—基于Python

hfteth 2025-04-27 13:53:13 技术文章 23 ℃

前言

之前一篇介绍过音频标注开源工具包,大家反馈不错,今天介绍一个更易用专用性的人声分离音频标注开源工具,工具地址在文末。

工具简介

此工具是基于wavesurfer.js与Flask开发。提供Web界面进行人声分离音频标注,wavesurfer.js为此工具提供了简洁清爽的界面。

工具实现了一个核心功能,将音频分割成任意长度,并标注各段音频的标签,以便进行人声分离的训练数据标注或测试。

功能与使用

工具提供了几个标时的实用功能:

  • 以不同颜色呈现不同标签的音频段
  • Shift+鼠标左键,分割生成新的一段待标注音频
  • 单击音频段,弹出标注元数据界面,编辑后保存
  • 单击Play按钮,从指定位置开始播放声音
  • 单击Export按钮,导出标数据
  • 提供mini-map呈现整个音频的波形图,方便查看全局的波形能量

软件地址

https://github.com/smart-audio/audio_diarization_annotation

Tags:

最近发表
标签列表