首页 > 业界 > 关键词  > 谷歌最新资讯  > 正文

能理解海豚声音!谷歌开发全新AI模型DolphinGemma

2025-04-15 17:45 · 稿源: 快科技

快科技4月15日消息,谷歌公布了一款名为DolphinGemma”的大型语言模型,旨在帮助科学家理解海豚的声音,并生成类似海豚的声音序列。

研究人员预计在未来几个月内测试DolphinGemma及其配套的Cetacean Hearing Augmentation Telemetry(CHAT)发声系统,以探索是否能够翻译并模仿海豚的声音,进而实现与海豚的某种对话”。

能理解海豚声音!谷歌开发全新AI模型DolphinGemma

海豚是地球上最聪明且最善于沟通的动物之一,其社交互动极其复杂,不仅能通过各种声响辨识不同的个体,还能在不同活动中发出不同的声音。

科学家们长期以来一直试图破解”这些声音的含义,并尝试模拟海豚的声音与它们沟通。

为此,谷歌与野生海豚计划”(WDP)组织以及美国乔治亚理工学院合作,利用WDP收集的大量海豚哨声、喀嗒声和脉冲声数据,训练了DolphinGemma这一AI模型。

DolphinGemma基于与谷歌Gemini系统相同的技术构建,拥有约4亿个参数,其运作方式与ChatGPT等生成式语言模型类似,但生成的是海豚声音而非文字。

目前的研究方向是让DolphinGemma在听完海豚声音的前半部分”后,由AI生成后半部分”,并比对AI生成的后半部分与海豚实际发出的后半部分是否一致,以初步判断海豚语”是否有固定的单词或结构。

研究计划初期定位在将海豚喜欢的物体与特定的合成声”相关联,期望海豚在想要这些物体时能发出对应的合成音,达成初步沟通。

但DolphinGemma究竟能达到什么程度,以及是否能让海豚与人类真正对话,目前仍是一个遥远的课题。

举报

  • 相关推荐
  • 科学家卡洛琳·卢格接受专访,畅谈如何培养青年科学家

    诺贝尔奖得主卡洛琳·卢格教授在专访中分享科研心得。她强调科学始于好奇心而非天赋,11岁时通过显微镜观察洋葱表皮细胞激发兴趣。她认为科研不是背诵知识,而是寻找答案的过程,鼓励年轻人敢于质疑、勇于表达。卢格指出,中国年轻科研者近年更积极提问,跨领域交流平台有助于打破壁垒。她建议女性科研者接受不完美、争取权益,并肯定中国在STEM领域的进步。科学的意义在于传承火种,未来将有更多突破来自中国。

  • AI日报:美团发布推理大模型LongCat-Flash-Thinking;阿里Wan-Animate开源;字节推豆包翻译大模型

    AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking;阿里开源Wan-Animate模型革新AI视频生成;字节跳动发布豆包翻译模型,支持28种语言互译;华为与浙大联合推出安全大模型DeepSeek-R1-Safe;阿里云即将发布跨模态模型Qwen3-Omni;xAI推出计算成本降低98%的Grok4Fast模型;YouTube发布多项AI创作辅助功能;IBM推出轻量级文档处理模型Granite-Docling-258M;中科院发布类脑大模型SpikingBrain实现百倍速度突破;OpenAI将推出仅限Pro用户的计算密集型新功能。

  • 蓝凌BPM,中大型组织流程数智化升级首选品牌

    蓝凌软件推出企业大脑LanBots,通过"四步升级"实现AI与BPM流程深度融合。该系统以16字方针为指导,统一接入管理大模型能力,覆盖流程规划、建设、执行、监控、分析全周期。核心功能包括:智能流程规划自动生成流程体系、AI辅助快速搭建业务表单、语义解析发起流程、智能填单与审批摘要、数据驱动的决策支持、规则化自动审批、实时风险监控及流程挖掘优化。助力企业构建高效、智能、安全的新工作方式,推动业务流程智能化升级与数字化转型。

  • GEO排名查询工具推荐:霸屏AI大模型答案的核心方法,做好AI大模型排名优化

    随着AI大模型成为用户获取信息的主要入口,AIBase推出GEO排名查询工具,帮助品牌监测在豆包、DeepSeek、文心一言等主流AI平台中的曝光情况。该工具支持多平台检测、关键词追踪、可视化数据展示,可精准分析品牌是否被推荐、出现频次及具体场景,为制定AI大模型排名优化策略提供数据支撑。在GEO时代,抢占AI回答推荐位意味着获得全新流量入口。

  • 破解海外旅游语言困境,时空壶新T1以端侧模型开启全球畅行

    国庆假期临近,海外旅游热度攀升,语言沟通成为游客面临的主要障碍。网络不稳定更使依赖在线翻译工具的旅行者陷入困境。时空壶新T1翻译机通过端侧AI模型,实现无网或弱网环境下的流畅翻译,支持31种语言互译,覆盖全球98%主流旅游地。其离线翻译准确率达90%,响应迅速,并具备拍照翻译和降噪功能,有效解决机场、餐厅等嘈杂场所的沟通难题。新T1助力游客跨越语言壁垒,尽享无忧旅程,真正实现“无网也能畅行全球”。

  • 从品牌咨询到语言培训:小鹅通如何助力花花语言艺术实现培训产品数字化落地

    文章介绍小鹅通平台助力语言培训品牌“花花语言艺术”实现数字化转型的案例。创始人任瑞丽从品牌咨询转型,创立“母语应用式”培训体系,通过小鹅通完成产品数字化、私域运营等全链路升级,服务超1万用户。该案例体现了小鹅通以工具赋能为核心理念,帮助培训从业者实现业务可持续增长,未来将继续深化合作,完善表达训练体系并拓展文化传播领域。

  • GEO排名查询工具深度解析:如何科学监测AI应用的搜索优化效果

    在AI应用爆发式增长的背景下,生成引擎优化(GEO)已成为产品增长的关键策略。与传统SEO不同,GEO专注于优化AI平台和生成式搜索引擎中的内容可见度。文章介绍了AIBase推出的GEO排名查询工具,支持实时监测豆包、DeepSeek、通义千问等主流平台,具备多平台监控、智能检测和关键词追踪功能。通过科学的数据分析,帮助用户制定差异化优化策略,提升应用在各大平台的搜索表�

  • AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型

    本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。

  • 美团发布高效推理模型LongCat-Flash-Thinking:部分性能接近GPT5

    9月23日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时,性能更强大、更专业,在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力,扩展了形式化定理证明能力,成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出,多项基准测试成绩领先开源及闭源顶尖模型,已在HuggingFace、Github全面开源。

  • 小米17 Pro Max首发超级像素!官方晒对比:屏幕清晰度碾压iPhone 17 Pro Max

    小米17 Pro Max屏幕技术实现重大突破:首发超级像素技术,在1.5K功耗下达到2K级清晰度,功耗降低26%。采用全新M10发光技术及国产红色发光材料,发光效率达全球顶尖水平。与iPhone 17 Pro Max对比显示,字体更清晰锐利,红色像素亮度和白色色温表现更优。该技术由小米与卢米蓝联合研发,通过独立RGB子像素设计,实现938万子像素量。这是双方OLED联合实验室的首个落地成果,标志着国产屏幕技术的重要进步。

今日大家都在搜的词: