谷歌公布鲸鱼声音识别 AI 科研模型,可辨别 8 种不同鲸群
最新 9 月 27 日消息,据谷歌新闻稿,谷歌公司正持续投入资源开发可用于识别鲸鱼声音的 AI 模型,其最新的多物种鲸鱼声音模型能够识别 8 种鲸鱼的叫声,并进一步细分其中两种鲸鱼的不同发声类型。
谷歌表示,这项技术主要用于海洋学术研究,能够帮助科研团队获取布氏鲸等“较难以观察的”鲸群行为模式,目前该模型已公开供学术人员下载使用,最新附地址(点此访问)。
据悉,谷歌公司自 2018 年以来便与美国国家海洋和大气管理局(NOAA)的太平洋群岛渔业科学中心合作,展开鲸鱼叫声分类的研究。最初,他们针对座头鲸开发了检测模型,成功辨识座头鲸的鸣叫声,从而成功获得了相关鲸群在特定时间地点的鸣叫规律,还借此发现了鲸群新栖息地。
谷歌还与加拿大渔业及海洋部(DFO)、Rainforest Connection 合作,针对濒临灭绝的南方定居型虎鲸开发了一系列检测模型,并将其应用于水下麦克风监测网络,能够实时报告虎鲸的位置给 DFO 和相关单位。
谷歌公司提到,如今该公司的鲸鱼声音识别模型可以识别座头鲸、虎鲸、蓝鲸、长须鲸、小须鲸、布氏鲸、北大西洋露脊鲸和北太平洋露脊鲸,考虑到鲸鱼声音覆盖频率范围极广(例如蓝鲸发声为 10 Hz 低频、齿鲸发声为 120 kHz 高频),因此该模型在科研层面可谓创举。
最新获悉,在开发这款鲸鱼声音识别模型时,研究人员首先将原始音频转换为时频谱(Spectrogram)以作为模型识别声音的基础,其中每个时间窗包含 5 秒钟的声音片段。接着,模型利用梅尔刻度法调整这些时频谱的声音频率,并通过压缩和正则化突出声音特征,进而将其分类为不同鲸鱼的鸣叫类别。
由于海中存在各种声音,研究人员还加入了大量背景声音来训练模型,以确保能够准确识别鲸鱼声音并排除噪音。实验结果显示该鲸鱼声音识别模型能够良好地区分不同种类的鲸鱼,特别是小须鲸和布氏鲸的声音。
相关文章
- 2024 胡润中国人工智能企业 50 强公布:寒武纪 2380 亿
- 阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频
- 开源媒体播放器 VLC 下载破 60 亿次,预览本地 AI 字幕
- 英伟达迷你超算遭友商嘲讽:宣传 FP4 算力,实际“不如买
- 银河通用发布全球首个端到端具身抓取基础大模型 Grasp
- 雷蛇推出“AI 游戏伴侣”Project AVA:支持实时指导 +
- 京东方 CES 2025 发布行业首款 65 英寸 4K 超高清“AI
- 微软开源 140 亿参数小语言 AI 模型 Phi-4,性能比肩 GP
- 微软承认必应 AI 图像生成器 PR16“开倒车”,现回滚至
- 西藏地震期间“小孩被埋”等 AI 图大量传播,严重可追责