首页 > 原创 > 关键词  > AI最新资讯  > 正文

AI日报:字节视频模型Waver 1.0发布;百度AI搜索APP“梯子AI”发布;谷歌推全新Gemini 2.5 Flash图像编辑模型

2025-08-27 16:31 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、谷歌推出全新的Gemini 2.5 Flash图像编辑模型

谷歌DeepMind推出的Gemini 2.5 Flash图像编辑模型在精准编辑和创意实现方面表现出色,支持角色一致性、局部文字编辑、风格迁移和现实推理等功能,为用户提供了强大的图像处理工具。

image.png

【AiBase提要:】

✨ Gemini 2.5 Flash 提供了更精准的图像编辑体验,允许通过文字指令对照片进行大幅修改。

🖼️ 支持角色一致性功能,确保人物或物体在不同场景中外观一致,提升品牌素材制作效率。

🎨 具备风格迁移和现实推理功能,可模拟因果关系并融合多张图像,增强创作可能性。

2、字节的新AI视频模型 Waver 1.0 发布,支持多种艺术风格的视频生成

字节推出的Waver1.0 AI视频模型在视频生成质量、艺术风格多样性和多镜头叙事能力方面表现出色,为用户提供了强大的创作工具。

image.png

【AiBase提要:】

🎥 Waver1.0支持文本到视频和图像到视频的转换,提供全新的创作体验。

🎨 支持多种艺术风格和长达10秒的视频生成,带来丰富的视觉效果。

🏆 在运动质量和视觉质量上表现优于现有模型,适用于多镜头叙事。

详情链接:https://www.waver.video/

3、百度AI搜索APP“梯子AI”发布:由Tizzy.ai改名而来

百度AI搜索APP“梯子AI”正式发布,由Tizzy.ai改名而来,主打无广告智能搜索服务,同时构建了丰富的短剧生态,为用户提供极致的搜索和观影体验。

百度正式发布AI搜索APP“梯子AI”:主打无广告智能搜索!

【AiBase提要:】

🧠 梯子AI支持AI双模智能搜索,提供精准的个性化答案。

📺 梯子AI构建了丰富的短剧生态,提供无广告、无会员的沉浸式观剧体验。

🚀 梯子AI是百度在人工智能搜索领域的重要一步,预示着智能搜索市场的变革。

4、文心快码推出多项新功能,新增Zulu-CLI终端编码能力

文心快码推出多项新功能,包括Zulu-CLI终端编码能力、企业版自定义模型支持、一键设置自动执行、本地代码库知识增强索引以及导出图片功能,显著提升了开发体验和协作效率。

image.png

【AiBase提要:】

🧠 Zulu-CLI 功能上线,支持终端命令行编程,让开发者使用更便捷。

💡 企业版支持自定义模型,灵活切换满足不同场景的需求。

📈 新增对话中导出图片功能,提升文档及共享的效率。

5、腾讯游戏发布AI工具集VISVISE 动画制作效率提升8倍

腾讯游戏在科隆国际游戏展上发布了名为VISVISE的AI工具集,旨在提高游戏美术师的工作效率。该工具集包含MotionBlink和GoSkinning等核心功能,能够显著减少动画制作和3D模型蒙皮的时间,为开发者提供更智能、高效的创作支持。

image.png

【AiBase提要:】

🎬 MotionBlink工具能自动补全动画中间帧,将10秒动画生成时间从数天缩短至4秒。

🧱 GoSkinning通过AI技术实现3D角色蒙皮自动化处理,2万顶点模型仅需30秒完成。

💡 VISVISE重新设计了游戏开发工作流程,让美术师专注于创意设计而非重复性劳动。

6、自动驾驶送货机器人杀入外卖战场!3美元包邮要颠覆整个行业

文章介绍了Robomart公司推出的RM5配送机器人,其具备四级自动驾驶功能,最大载重500磅,并采用模块化设计支持批量配送。该机器人旨在通过3美元的固定配送费和无隐藏费用的模式,颠覆传统外卖平台的商业模式,同时降低配送成本70%。

【AiBase提要:】

🤖 RM5机器人具备四级自动驾驶能力,支持批量配送,提升效率。

💰 配送费用固定为3美元,无其他隐藏费用,吸引消费者。

📉 单次配送成本可降低高达70%,大幅削减运营成本。

7、DeepSeek V3.1被曝“极字Bug”:API调用惊现神秘字符,官方已回应

文章报道了DeepSeek V3.1模型因“极字Bug”引发的广泛讨论,该Bug导致API调用时输出中随机出现“极”字,影响代码开发的准确性。目前,问题已被锁定为模型本身,官方已承诺修复。

【AiBase提要:】

🧠 模型输出中随机夹杂“极”字,引发开发者担忧。

🌐 问题蔓延至多个平台,包括DeepSeek官方服务。

🛠️ 官方已承诺在近期版本更新中修复此Bug。

8、谷歌翻译大升级!实时同传+AI陪练,学外语就像聊天一样简单!

谷歌翻译基于Gemini AI模型推出了实时同传和智能语言陪练功能,极大提升了跨语言交流的便捷性和学习效率。该更新不仅优化了语音识别技术,还为用户提供了个性化的语言学习场景。

image.png

【AiBase提要:】

🌍 实时同传功能支持70多种语言,让跨语言对话更流畅。

📚 智能语言陪练提供个性化学习场景,提升口语能力。

🧠 Gemini AI模型增强语义理解,提升翻译准确性。

9、全球首现AI勒索软件PromptLock:跨平台黑客新武器来袭

PromptLock是首个利用AI技术的勒索软件,能够生成恶意代码并跨平台运行。其使用OpenAI的gpt-oss:20b模型,具备高度隐蔽性和适应性,可能成为未来网络安全的重大威胁。

【AiBase提要:】

🚨 PromptLock 是首个利用AI技术的勒索软件,能够在多种操作系统上运行。

🔒 它通过本地生成恶意代码窃取和加密文件,具有高度隐蔽性。

🌐 攻击者可通过外部服务器绕过本地显存限制,进一步增强攻击能力。

10、Claude杀入Chrome浏览器!Anthropic推出史上最强AI上网助手

Anthropic推出了Claude for Chrome浏览器AI代理,这款工具通过Chrome扩展程序常驻浏览器侧边栏,提供智能协助。其安全性得到了显著提升,同时具备执行任务的能力,为用户提供全新的上网体验。

image.png

【AiBase提要:】

🧠 Claude for Chrome浏览器AI代理的推出,标志着AI助手从聊天窗口走向更广阔的数字世界。

🔒 Anthropic在安全防护方面下足了功夫,成功将即时注入攻击的成功率大幅削减。

🚀 该AI代理能够深度理解用户的浏览行为和上下文信息,实现人机协作的无缝衔接。

举报

  • 相关推荐
  • 新Siri或明年春季发布 苹果公司或引入谷歌Gemini大模型 AI技术

    苹果因自研大模型项目遇瓶颈,决定引入谷歌Gemini大模型升级Siri,计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数,将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能,支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送,后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

  • AI日报:上海首例涉AI提示词著作权案宣判;Kimi K2 Thinking发布;中文图像编辑新王UniWorld-V2发布

    今日AI领域动态:上海首例AI提示词著作权案宣判,法院认定提示词不具独创性;月之暗面发布Kimi K2思考模型,实现自主多轮工具调用;UniWorld-V2图像编辑模型支持中文框选即改,性能超越GPT-Image;谷歌推出AI文件检测工具Magika 1.0,支持超200种格式;Sora安卓版首日下载量达47万次;我国发布全球首个AI海洋大模型“瞰海”,可精准预测10天内海洋变化;宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控;谷歌Gemini API推出文件搜索工具,简化私有RAG系统集成。

  • AI日报:豆包视频1.0pro fast发布;谷歌Gemini新功能上线;百度推上体体育大模型 2.0

    本期AI日报聚焦多项技术突破:火山引擎发布豆包视频生成模型1.0pro+fast,速度提升3倍且价格下降72%;百度与上海体育大学推出“上体体育大模型2.0”,拓展AI在运动员训练等场景应用;谷歌Gemini新增一键生成PPT功能;美团发布LongCat-Video模型,支持5分钟连贯视频生成;xAI推出虚拟女友Mika引发热议;MiniMax开源高性能M2编码模型;OpenAI上线企业知识管理功能;另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万,展现年轻创业者的技术影响力。

  • MiniMax让AI语音有了新基建

    熟悉MiniMax的人都了解这家公司的调性——不鸣则已,一鸣惊人。 要么选择低调,要么发动技术连招,其发展路径呈现出鲜明的“技术深潜”与“节点式爆发“的双重特征。 十月的最后一周,再次进入MiniMax式技术迭代新周期。MiniMax模型“全家桶”全面向Agent方向进化,基础文本模型M1升级至M2,“专为Agent和代码而生”;视频模型升级至Hailuo2.3,Hailuo Video Agent迭代为“全模态全�

  • AI日报:昆仑万维SkyReels V3模型上线;月之暗面推Kimi Linear模型;MiniMax Music 2.0 发布

    本期AI日报聚焦多领域创新:昆仑万维推出SkyReels V3模型,整合顶尖视频生成能力;月之暗面Kimi Linear模型处理长文本速度提升2.9倍;MiniMax Music 2.0实现专业级音乐创作;字节跳动启动豆包股权激励计划吸引AI人才;苹果iOS 27将迎AI重大升级,Siri更个性化;Dia浏览器融合Arc设计理念与AI技术;文心魔法漫画工具实现一键生成连载作品;谷歌Gemini Canvas新增PPT自动生成功能,由Gemini 2.5 Pro驱动,提升职场效率。

  • 今年双11,为什么买百吋电视更推荐RGB-Mini LED?

    今年双11,百吋电视因用户消费升级与居住改善需求增长显著。京东数据显示其销量同比增长200%,反映用户不再满足“够用”尺寸,而是追求影院级沉浸体验。百吋电视受追捧源于超高清内容普及与技术门槛降低,但需注意大屏对显示技术要求更高。RGB-Mini LED技术通过红绿蓝三原色独立背光实现精准控光,解决传统电视色彩与亮度矛盾,如海信UX等产品以高色域、分区控光提升画质。选购时需关注画质芯片与屏幕抗反射能力,确保色彩真实与观看舒适。尺寸是基础,画质才是灵魂。

  • AI日报:视觉中国与多家大模型公司达成合作;OpenAI紧急暂停Sora生成已故名人;谷歌推出Gemini地图数据集成工具

    视觉中国与多家AI公司合作开发可商用视觉大模型,已获阿里、微软等订单。OpenAI因不当内容暂停Sora生成马丁·路德·金形象视频,引发AI伦理讨论。DeepSeek在加密货币交易实验中表现领先。WhatsApp将禁止第三方通用AI聊天机器人,仅保留Meta AI。宇树科技推出仿人机器人Unitree H2,具备拟人化设计。谷歌为Gemini集成地图数据工具,可访问25亿地点实时信息。Opera推出集成三款AI助手的Neon浏览器,但用户体验存在困惑。Facebook在美加推出AI照片编辑建议功能,可分析手机未分享照片。

  • MiniMax M2:所有坑都踩过,才能做出所有人都能用上的Agent

    最近一个月,基础模型似乎又有点多起来。但若仔细去看这些模型厂商的动作,大体还是走出了两条路。 一种是在诸多难点里选择一个死磕,成为这个单点上的SOTA。这种路线可以快速在开发者群体留下一个明确的印象,但也可能限制住了一家模型公司的“基座”属性。另一种则是在各个模态上全面前进,在一个最全面的基础模型蓝图里不停交出一个个关键拼图。 已经有了全

  • 被AI引用才是真的流量:写出让GPT、Gemini主动引用的AI搜索友好型内容(实操清单 + 工具推荐)

    本文系统介绍生成式引擎优化(GEO)的核心方法,帮助内容从“给人看”升级为“AI友好型”。关键策略包括:1.采用结构化写作框架,在开头设置可直接回答问题的“黄金段落”;2.运用分步清单、数据标注、FAQ等模块提升内容引用率;3.通过多平台同步分发增加曝光;4.使用AIBase等工具量化监测内容被AI引用的频率与场景,并给出5天落地执行表。

  • iPad mini 8外观巨变:去掉扬声器开孔

    iPad mini 8将采用全新设计,去掉扬声器开孔并提升防水性能,同时苹果也在为iPad mini 8研发一套新的扬声器系统。 据悉,iPad mini 8可能采用屏幕激励器方案,通过驱动屏幕振动来发出声音,其原理是将振动机械能直接传输到屏幕,然后让屏幕代替传统扬声器振膜发声。 具体来说,它是通过在机身内部的微驱动单元(激励器)来激励中框 ,从而带动屏幕振动发声。

今日大家都在搜的词: