人工智能

谷歌公布鲸鱼声音识别 AI 科研模型，可辨别 8 种不同鲸群

2024-09-28 07:17:46人工智能 IT之家漾仔

据谷歌新闻稿，谷歌公司正持续投入资源开发可用于识别鲸鱼声音的 AI 模型，其新的多物种鲸鱼声音模型能够识别 8 种鲸鱼的叫声，并进一步细分其中两种鲸鱼的不同发声类型。谷歌表示，这项技术主要用于海洋学术研究，能够帮助科研团队获取布氏鲸等“较难以观察的”鲸群行为模式，目前该模型已公开供学术人员下载使用

最新 9 月 27 日消息，据谷歌新闻稿，谷歌公司正持续投入资源开发可用于识别鲸鱼声音的 AI 模型，其最新的多物种鲸鱼声音模型能够识别 8 种鲸鱼的叫声，并进一步细分其中两种鲸鱼的不同发声类型。

谷歌表示，这项技术主要用于海洋学术研究，能够帮助科研团队获取布氏鲸等“较难以观察的”鲸群行为模式，目前该模型已公开供学术人员下载使用，最新附地址（点此访问）。

据悉，谷歌公司自 2018 年以来便与美国国家海洋和大气管理局（NOAA）的太平洋群岛渔业科学中心合作，展开鲸鱼叫声分类的研究。最初，他们针对座头鲸开发了检测模型，成功辨识座头鲸的鸣叫声，从而成功获得了相关鲸群在特定时间地点的鸣叫规律，还借此发现了鲸群新栖息地。

谷歌还与加拿大渔业及海洋部（DFO）、Rainforest Connection 合作，针对濒临灭绝的南方定居型虎鲸开发了一系列检测模型，并将其应用于水下麦克风监测网络，能够实时报告虎鲸的位置给 DFO 和相关单位。

谷歌公司提到，如今该公司的鲸鱼声音识别模型可以识别座头鲸、虎鲸、蓝鲸、长须鲸、小须鲸、布氏鲸、北大西洋露脊鲸和北太平洋露脊鲸，考虑到鲸鱼声音覆盖频率范围极广（例如蓝鲸发声为 10 Hz 低频、齿鲸发声为 120 kHz 高频），因此该模型在科研层面可谓创举。

谷歌公布鲸鱼声音识别 AI 科研模型，可辨别 8 种不同鲸群

▲ 鲸鱼声音频率，图源谷歌

最新获悉，在开发这款鲸鱼声音识别模型时，研究人员首先将原始音频转换为时频谱（Spectrogram）以作为模型识别声音的基础，其中每个时间窗包含 5 秒钟的声音片段。接着，模型利用梅尔刻度法调整这些时频谱的声音频率，并通过压缩和正则化突出声音特征，进而将其分类为不同鲸鱼的鸣叫类别。

由于海中存在各种声音，研究人员还加入了大量背景声音来训练模型，以确保能够准确识别鲸鱼声音并排除噪音。实验结果显示该鲸鱼声音识别模型能够良好地区分不同种类的鲸鱼，特别是小须鲸和布氏鲸的声音。