首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:字节发布同声传译模型Seed LiveInterpret 2.0;秘塔搜索API上线;Lovart AI正式版全球发布

2025-07-24 15:52 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、字节跳动发布端到端同声传译模型 Seed LiveInterpret 2.0

字节跳动Seed团队推出了最新研发成果——Seed LiveInterpret 2.0,该模型在中英同传翻译质量上达到业界顶尖水平,具备低延迟和实时声音复刻功能,显著提升了跨语言交流的自然度和流畅性。

image.png

【AiBase提要:】

🚀 Seed LiveInterpret 2.0实现了接近真人同传的翻译准确率,且延迟极低,仅需3秒。

🎙️ 支持实时声音复刻功能,无需提前采集声音样本即可合成“原声”语音翻译。

📊 在专业评测中,Seed LiveInterpret 2.0在中英互译任务中表现优异,评分远超其他系统。

详情链接:https://arxiv.org/pdf/2507.17527

2、秘塔搜索 API 上线:定价3分钱 提供多模态搜索能力

秘塔 AI 搜索正式推出其搜索 API,为开发者提供了一个替代 Bing Search API 的新选择。该 API 定价0.03元/查询,支持多模态搜索,并且无使用门槛,便于快速接入。

image.png

【AiBase提要:】

✅ 秘塔 AI 搜索 API 正式上线,为开发者提供新的搜索替代方案。

💡 定价0.03元/查询,具有市场竞争力,支持多模态搜索。

🚀 开发者可即测即用,无需复杂申请流程,提升接入效率。

3、Lovart AI 正式版全球发布:全链路智能设计重塑创作体验

文章介绍了 Lovart AI 正式版的全球发布,强调其作为首个人工智能设计 Agent 的创新性,以及其通过自然语言交互和全链路设计能力重新定义设计行业标准。文章还提到其新功能 ChatCanvas 和针对中国市场的“星流 Agent”,并指出其对设计行业的深远影响。

image.png

【AiBase提要:】

🎨 Lovart AI 通过自然语言交互和全链路设计能力,提供高质量视觉资产生成服务。

🧠 新功能 ChatCanvas 支持多轮对话和实时调整布局、配色等,提升创作效率。

🇨🇳 针对中国市场优化的“星流 Agent”支持中文语义和国风审美,助力本土创作者高效创作。

4、李沐团队发布 Higgs Audio v2,开创语音合成新纪元

李沐团队推出的Higgs Audio v2是语音合成领域的一次重大突破,具备多语言对话生成、韵律自动调整和声音克隆等功能。该模型融合了1000万小时的语音数据进行训练,在多项测试中表现出色,成为行业标杆。

image.png

【AiBase提要:】

🔥 Higgs Audio v2支持多语言对话生成与声音克隆,实现复杂任务。

📊 在EmergentTTS-Eval测试中,Higgs Audio v2在情绪和问题类别中表现优异。

🚀 支持实时语音聊天和音频内容创作,适用于虚拟主播和语音助手等场景。

5、Sora2浮出水面:OpenAI 欲在生成式AI视频领域重夺C位

文章介绍了OpenAI正在开发其文本到视频模型Sora的继任者Sora2,同时提到谷歌Veo3的普及情况。这表明生成式AI视频领域的竞争将更加激烈。

image.png

【AiBase提要:】

🚀 OpenAI正在积极开发Sora2,以应对谷歌Veo3的竞争。

💡 Sora2尚未公开发布,但未来几周内可能有更多消息。

🌐 谷歌Veo3已向大学生免费开放,并可通过Google Cloud体验。

6、OpenAI与Oracle携手扩展Stargate项目,已创造数千个工作岗位

OpenAI与Oracle达成新协议,将Stargate项目在美国的数据中心容量扩大至4.5吉瓦,整体容量超过5吉瓦。这标志着OpenAI在2029年前实现10吉瓦目标的重要一步。该项目旨在推动美国成为全球人工智能发展的主导力量,并吸引了多家科技公司和国际投资者的参与。

【AiBase提要:】

🔥 Stargate项目容量扩大至超过5吉瓦,目标是到2029年实现10吉瓦。

🤝 OpenAI与Oracle等多家科技公司联合推动项目,预计将创造超10万个工作岗位。

💰 项目获得了超过190亿美元的资金支持,吸引了多国投资者参与。

7、Google Photos新增AI功能:照片秒变动漫、一键生成视频

Google Photos推出了多项基于AI的新功能,包括将静态照片转化为动态视频以及将照片转换为不同艺术风格的创意工具。这些功能旨在提升用户的创作体验,并通过实验性方式不断优化产品。

image.png

【AiBase提要:】

📷 照片转视频功能利用Veo2模型,让用户轻松将静态照片变成6秒动态视频。

🎨 Remix功能由Imagen AI驱动,可将普通照片转换成动漫、漫画等艺术风格。

📌 Google在Photos应用中新增了‘创建’标签页,整合多种创意工具,提供一站式创作体验。

8、YouTube Shorts将推全新AI特效 照片秒变视频!

YouTube宣布为Shorts创作者开放一系列革命性的生成式AI功能,包括图片转视频和AI特效。这些工具能够将静态照片转化为动态视频,并提供多种创意选项,显著降低了创作门槛,同时提升了内容的吸引力。

【AiBase提要:】

📷 图片转视频功能让静态照片在6秒内获得生命力,提升短视频创作效率。

🎨 AI特效可将涂鸦、自拍等简单素材转化为精美艺术作品,激发创作者灵感。

🎥 新一代Veo3视频生成器将同步生成音频,提供更完整的创作解决方案。

9、谷歌推出 Aeneas 模型:为古代文本解读开辟新路径

谷歌推出的 Aeneas 模型为古代铭文的解读提供了全新的方法,通过人工智能技术加速了历史学家对铭文的恢复、鉴定和年代定位工作,同时还能扩展到其他古代语言和材料,极大地提升了历史研究的效率和深度。

image.png

【AiBase提要:】

🧠 Aeneas 模型由谷歌 DeepMind 推出,旨在帮助历史学家理解古代文本。

🗣️ 该模型能够分析古代文本的相似性,填补文本空白,减轻历史研究者的负担。

📜 Aeneas 将文本转化为 “历史指纹”,帮助历史学家在更广泛的背景下解读铭文。

详情链接:https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/

10、GitHub Spark横空出世:一句话打造Web应用,AI开发进入新时代!

GitHub Spark通过自然语言处理技术,让开发者和非开发者都能快速构建个性化Web应用,显著降低了编程门槛,并为微应用开发提供了全新可能。

【AiBase提要:】

🌟 GitHub Spark允许用户通过自然语言描述需求,快速生成完整的Web应用。

🚀 提供全托管运行环境,支持一键部署和PWA适配,简化了开发流程。

🔧 支持多模型选择,与GitHub生态深度整合,提升开发效率。

详情链接:https://github.blog/changelog/2025-07-23-github-spark-in-public-preview-for-cop ilot-pro-subscribers/

11、华为M-Pencil Pro发布:699元 支持一键唤起小艺智能助手

华为发布了全新一代手写笔HUAWEI M-Pencil Pro,定价699元,具备16384级压感、侧旋功能和多种笔尖选择,同时支持AI功能快捷入口和星闪精确查找功能,为创作者带来更便捷和真实的创作体验。

image.png

【AiBase提要:】

✨ HUAWEI M-Pencil Pro拥有16384级压感,精准感应力度变化,提升创作真实感。

💡 笔尾智慧键采用鸿蒙星环设计的呼吸灯,可一键唤起小艺智能助手,提升操作便捷性。

📍 星闪精确查找功能支持50米范围内的精确定位,解决手写笔丢失问题。

举报

  • 相关推荐
  • 字节跳动TRAE2.0真的好用吗?同类型AI产品上哪找?

    字节跳动TRAE2.0 AI编程工具升级亮点:1)新增语音交互功能,支持中英文混合输入,实现"说话写代码";2)Builder模式迭代后项目生成成功率提升至92%,复杂需求可一次性跑通;3)免费版每月100次调用额度,支持GPT-4o和Claude-3.5模型;4)五大隐藏技巧:语音调试、图片生成代码、API批量测试等可提升300%效率;5)针对中文开发者优化,支持阿里云/腾讯云SDK调用。实测3分钟

  • 智慧养老预告| 让养老更有AI!作为科技邀您共赴WAIC 2025世界人工智能大会

    2025世界人工智能大会(WAIC2025)将于7月26-28日在上海举办,主题为"智能时代 同球共济"。本届大会展览面积首次突破7万平方米,吸引800余家企业参展,展示3000余项前沿展品,涵盖40余款大模型、50余款AI终端、60余款智能机器人及80余款"全球首发"新品。12位诺贝尔奖与图灵奖得主、80余位中外院士、30余国1200位重磅嘉宾将齐聚申城,围绕大模型革命、算力新基建等十大方向展开对话。大会首次将"AI+医疗"列为核心议题,中国主导制定的全球养老机器人国际标准将在会上发布。面对中国3亿老年人口(其中失能半失能老人超4500万)的养老需求痛点,大会将探讨AI赋能智慧养老解决方案,推动"全域数据贯通→精准需求洞察→资源动态调度"闭环,重塑养老产业生态。

  • 加速AI场景落地和产业赋能 云谷“论数”之人工智能产业应用大会圆满举办

    7月16日,云谷"论数"之"AI·场景落地+产业崛起 就在浙里"人工智能产业应用大会在杭州举行。活动由浙江省工程师学会等多家单位联合主办,聚焦AI规模化落地与科技成果转化。与会专家指出,2025年是AI发展关键年,浙江将深化场景落地实践,打造"应用实践-技术优化-价值创造"闭环。企业代表分享了AI在智能制造、智慧交通等领域的应用案例,强调技术需扎根产业需求。活动还成立了大数据与人工智能专委会,未来将促进产学研协同创新,推动AI在千行百业规模化应用,助力浙江打造全球AI创新高地。

  • 金融壹账通智能客服赋能普惠金融,人工智能+助力新质生产力

    金融壹账通"小壹智能客服机器人"在第七届数字普惠金融大会上入选创新成果。该系统采用"大模型+小模型"组合策略,实现60%以上人工替代率,月均处理客户咨询数千万次。其创新点在于:1)通过自动问答与坐席辅助双模块设计,解决传统金融服务效率瓶颈;2)具备智能化运营能力,可自动生成优化方案、构建训练数据;3)已覆盖银行、保险等20余家金融机构,显著降低运营成本。该成果为中小金融机构提供了可复制的数字化解决方案。

  • 人工智能行业每日资讯汇总:国内值得关注的AI资讯网站推荐

    本文介绍了在AI技术快速发展的当下,如何高效获取行业资讯的方法。推荐了国内5个优质AI资讯平台:量子位(专注国内AI企业动态)、机器之心(学术与产业并重)、AI科技评论(深度行业分析)、AIbase(综合信息聚合)和新智元(聚焦AI产业化)。文章建议通过关注公众号、使用RSS工具、创建浏览器书签等方式提升信息获取效率,强调持续关注权威资讯源能保持知识更新、提

  • 世界人工智能大会SAIL奖TOP30出炉!天鹜科技荣登榜单!

    世界人工智能大会SAIL奖TOP30榜单发布,天鹄科技凭借蛋白质大模型项目入选。该项目通过90亿条极端环境蛋白质序列数据和5亿条酶功能数据,训练出能跨越结构直接预测功能的AI模型AIACCLBIO™。该模型已服务30余家生物医药企业,成功优化30余款蛋白质,其中8款实现产业化应用。典型案例包括:将抗体稳定性提升4倍,每年为企业节省上千万元成本;优化后的急性胰腺炎检测酶成本仅为国际同类产品的10%,并实现千公斤级量产。SAIL奖是世界人工智能大会最高奖项,旨在激励技术创新和产业融合。

  • 字节、腾讯、阿里,AI 编码“三国杀”

    大厂正在集火最具PMF(产品市场契合度)价值的赛道——AI编码。 从7月21日开始,字节、腾讯、阿里轮番更新AI编码产品和模型:字节已有的AI编码产品Trae放出Solo版本,加入上下文工程,让平台变得更“聪明”;腾讯则把一整套用来部署产品的工具放到其中,做了个“全栈工程师”;阿里更是发布编程大模型Qwen3-Coder剑指Claude4,直接从模型层下功夫。 在Cursor面向中国市场取消了An

  • 万里数据库GreatDB亮相上合组织数字经济论坛 与哈萨克斯坦人工智能发展协会签署合作协议

    2025年7月11日,上海合作组织数字经济论坛在天津开幕。论坛由国家数据局与天津市政府联合主办,丁薛祥副总 理出席并致辞。会上,万里数据库与哈萨克斯坦人工智能发展协会签署合作协议,推出GreatDB上合版数据库产品。该产品具有安全可信、生态兼容、高性能等优势,是中国首个进入上合框架的标准化数据库产品。论坛汇聚600余位中外政要、企业代表和专家学者,共商数�

  • 字节的豆包居然有了自己的IP宇宙

    ​作为一名科技内容创作者,我的日常就是追踪最新的技术和商业进展。 在我眼中,豆包APP更多的是牌桌上一位来自巨头的玩家——有着强大的技术背景和不计成本的推广资源,是一个了解字节最新模型进展的窗口,一个被精心打磨的AI产品。 直到“邓超,gogogo”的旋律,席卷了我的信息流。 今年3月,在一个直播切片中,博主“克里西”无厘头地非要豆包改名

  • 工业大模型进入能力正赛,权威评测北电数智骄阳·工业大模型拿下综合排名第一

    国产工业大模型正从概念热潮走向应用深水区。7月24日,SuperCLUE发布中文工业大模型评测基准SC-Industry最新榜单,北电数智"骄阳·工业大模型"以83.44分获综合第一,在应用能力(90.07分)、工业数据分析(90.38分)和工业智能体(89.97分)三个细分维度均居榜首。报告指出,产业级应用能力成为新分水岭,国产模型在工业任务能力方面实现突破。北电数智通过建立工业数据标准体系、研发场景化微调数据生成技术等举措,构建了精准垂类认知、高质量数据治理和合规管控机制三大优势。该模型将亮相2025世界人工智能大会,分享"AI+生产"等核心场景的创新实践。