首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:火山引擎发布豆包3.0;通义开源Qwen3非思考模型;谷歌偷偷升级Imagen 4

2025-07-30 15:58 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、火山引擎发布豆包最新图像编辑、同传模型,加速Agent开发落地

火山引擎在厦门站活动上发布了豆包系列新模型及AI云原生服务升级成果,包括图像编辑模型3.0、同声传译模型2.0以及大模型1.6系列。同时推出扣子核心能力开源和企业自有模型托管方案,助力开发者构建Agent并落地AI应用。

image.png

【AiBase提要:】

🔥 豆包·图像编辑模型3.0提升自然语言指令处理能力,适用于影像创作与广告营销领域。

🎙️ 豆包·同声传译模型2.0实现低延迟语音同步生成,支持方言口音匹配。

🚀 豆包大模型1.6系列优化代码、推理与数学能力,降低延迟与成本。

2、通义千问开源Qwen3-30B-A3B-Instruct-2507非思考模式模型

Qwen3-30B-A3B-Instruct-2507新版本在非思考模式下表现出色,性能媲美顶级闭源模型,并在多个领域实现了显著提升,同时支持多语言和长文本处理,为开发者和研究人员提供了便利的开源平台。

image.png

【AiBase提要:】

🧠 新版本Qwen3-30B-A3B-Instruct-2507在非思考模式下仅激活3B参数,性能媲美Gemini2.5-Flash(non-thinking)、GPT-4o等顶尖闭源模型。

🌐 通用能力显著提升,涵盖指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等多个方面。

📚 长文本理解能力达到256K,多语言长尾知识覆盖更广,适合全球化应用场景。

3、OpenAI 推出全新学习助手 ChatGPT Study

OpenAI 发布了全新的 ChatGPT Study 学习模式,旨在为学生和教育工作者提供更加个性化和互动的学习体验。该功能集成了交互式提示、支架式回应、个性化教育和知识点检查,适用于多种学科,并对所有用户开放。

image.png

【AiBase提要:】

🚀 ChatGPT Study 提供个性化和互动的学习体验,适合学生和教育工作者。

📚 集成四种主要功能,包括交互式提示、支架式回应、个性化教育和知识点检查。

🌐 该功能对所有免费版、Plus、Pro 以及 Team 用户开放,标志着 OpenAI 在教育技术上的进一步推进。

4、我国发布HYPIR图像复原大模型 老照片1.7秒变8K高清图

HYPIR 图像复原大模型的发布,展示了中国在人工智能领域的创新能力,并为文化传承、影视修复及科研医疗等多个领域带来了革命性改变。

image.png

【AiBase提要:】

🧠 HYPIR 图像复原大模型能在1.7秒内将老照片修复至8K超高清画质

📄 HYPIR 在保真文字方面表现出色,能高保真还原文字内容

🚀 HYPIR 的发布标志着图像复原技术进入全新时代

5、谷歌 NotebookLM 推出视频概览功能,提升学习体验

谷歌推出了 NotebookLM 的视频概览功能,通过将复杂信息转化为带旁白的幻灯片,为用户提供更直观的学习体验。该功能能够从用户上传的资料中提取信息,并计划未来扩展多语言支持。

【AiBase提要:】

📹 新功能上线: 谷歌推出 NotebookLM 的视频概览功能,为学习增添直观的视觉体验。

📄 数据提取能力: 该功能能够从用户上传的资料中提取信息,自动生成带旁白的幻灯片。

🌍 未来扩展: 视频概览功能将支持多语言,未来还将不断丰富和扩展表现形式。

6、谷歌悄然升级Imagen 4!碾压GPT-4o,AI图像生成王者归来?

谷歌对其文本转图像生成模型Imagen4进行了重大升级,升级后的Imagen4Ultra在权威的Artificial Analysis图像竞技场排行榜中跃升至第三位,与OpenAI的GPT-4o和Seedream3.0并肩,成为全球顶尖的图像生成模型之一。其在图像质量、处理复杂提示词、价格优势及生成速度等方面表现突出。

Google has quietly upgraded Imagen 4! Imagen 4 Ult.jpg

【AiBase提要:】

🖼️ Imagen4Ultra在图像细节、真实感和风格一致性方面表现出色,性能显著提升。

💰 Imagen4标准版和Ultra版的价格远低于GPT-4o,性价比高。

⚡ Imagen4Ultra生成一张图像的平均时间仅为9.5秒,效率领先于多数竞品。

7、昆仑万维开源多模态统一预训练模型 Skywork UniPic

昆仑万维推出的Skywork UniPic多模态统一预训练模型,融合了图像理解、文本到图像生成和图像编辑能力,基于大规模数据端到端预训练,展现了优异的通用性和可迁移性。该模型在性能上表现突出,尤其在消费级显卡上即可流畅运行,显著降低了技术应用门槛。

image.png

【AiBase提要:】

🧠 MAR编码器与SigLIP2主干网络实现跨任务深度协同

🖼️ 支持图像理解、生成及风格转绘等复杂操作

🚀 1.5B参数规模接近大型统一模型效能

详情链接:https://huggingface.co/Skywork/Skywork-UniPic-1.5B

8、理想i8发布,首搭智能司机大模型,售价 32.18 万元起!

理想汽车推出全新六座纯电SUV——理想i8,提供三个版本,售价分别为32.18万元、34.98万元和36.98万元。该车在技术配置上诚意满满,全系标配双电机四驱系统、自研5C电池以及激光雷达,并全球首搭VLA司机大模型,提升了车辆的安全性和智能化水平。

【AiBase提要:】

🚗 理想i8配备双电机四驱系统,最大功率高达400kW,扭矩达660Nm。

🔋 自研5C电池提供两种容量,续航里程分别为670公里和720公里。

🤖 全球首搭VLA司机大模型,支持自然语言交互,提升智能操作体验。

9、谷歌在在英国推出 AI 搜索模式,提升复杂问题解答体验

谷歌在英国推出全新的AI搜索模式,能够帮助用户提出更复杂的问题并获得精准的AI驱动回复。该模式基于Gemini2.5模型,利用查询扩展技术深入挖掘网络内容,并支持多种交互方式,如文字、语音或图像提问。

image.png

【AiBase提要:】

🧠 AI模式基于谷歌最新Gemini2.5模型,支持复杂多部分问题处理。

🔍 查询扩展技术分解用户问题为多个子主题,深入挖掘网络内容。

📱 支持语音和图像提问,提升交互体验和便利性。

10、OWL团队开源一款多智能体Manus类工具Eigent

Eigent是CAMEL-AI团队开发的多智能体协作工具,基于OWL框架构建,旨在提升复杂任务处理效率。其核心在于任务拆解与并行执行,支持多种大语言模型和多模态数据处理,展现了开源AI在性能与可访问性上的优势。

image.png

【AiBase提要:】

🧠 Eigent通过多智能体协作实现高效任务处理,显著提升复杂任务的执行效率。

📊 支持多种大语言模型和多模态数据处理,生成内容更加专业且全面。

🌐 开源特性允许开发者自由检查代码、贡献功能或定制化使用,推动社区发展。

详情链接:https://github.com/eigent-ai/eigent

11、2025年用户增速最快亿级APP榜单发布,DeepSeek位居第一

文章分析了2025年6月活跃用户规模超过1亿且同比增长率最高的前20款应用程序,其中DeepSeek在AIGC领域表现突出,豆包和红果免费短剧也展现出强劲的增长势头。

image.png

【AiBase提要:】

🌟 DeepSeek 以1.63亿月活跃用户位居 AIGC 行业 第一

📈 豆包实现410.69% 的同比增长,月活跃用户达1.41亿。

🎥 红果免费短剧吸引2.12亿用户,迎合了碎片化娱乐需求。

举报

  • 相关推荐
  • 厚植AI创新沃土!麒麟信安打造人工智能孵化器,赋能创业梦想

    10月28日,麒麟信安人工智能孵化器在长沙启动,旨在汇聚AI领域人才、技术与资本,构建开放协同的创新生态。该项目获湖南省多部门支持,已吸引60余个项目入围,组建了首批30余位专家导师团,并与多家顶尖机构共建联合体,通过政策扶持、资本对接等多维度赋能,培育优质AI项目在湘落地发展,助力区域打造人工智能产业创新高地。

  • 人工智能巨头OpenAI拟上市 估值或高达1万亿美元

    OpenAI正积极推进上市计划,据知情人士透露,该公司可能最早于2026年下半年向证券监管机构提交上市申请,目标在2027年正式上市。 此次IPO的估值有望达到约1万亿美元,或将跻身全球规模最大的IPO之列。 在初步讨论中,OpenAI曾考虑通过上市筹集至少600亿美元资金,实际融资规模可能进一步扩大。

  • OPPOFind X9 新机发布, 火山引擎助力打造AI应用新体验

    OPPO Find X9系列以“画质革命”为核心,全面升级移动影像能力,致力于打造手机摄影新标杆。该系列搭载火山引擎,强化AI功能,支持AI写作、播客创作、多模态问答及AI作图,重点优化旅行场景,简化创作流程。同时,作为业界首款支持机密计算AI推理的消费级手机,通过AICC平台保障用户数据全生命周期安全,提供放心、便捷的智能服务体验。

  • 共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

    10月28日,AtomGit平台在北京国家会议中心举行升级发布会,正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞,强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源,打造开放中立的基础设施,计划于11月21日正式上线。华为、百度等企业代表分享了开源实践,多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

  • 1024数百场活动致敬鸿蒙开发者,鸿蒙如何与开发者“双向奔赴”

    在1024程序员节之际,华为鸿蒙生态发起"星光不负 码向未来"致敬活动,通过全国超百场开发者交流,展现鸿蒙生态的蓬勃活力。目前HarmonyOS 5终端设备数已突破2300万,上架应用超3万款,鸿蒙游戏超1.2万款,近400款政务应用完成鸿蒙适配。华为每年投入超60亿元激励创新,并启动"鸿蒙天工计划"投入10亿元支持AI生态建设。从HarmonyOS 5到HarmonyOS 6,鸿蒙生态正从"破冰"走向深度融合创新,这离不开千万开发者的智慧与汗水。

  • 卖家精灵加入中国人工智能产业发展联盟(AIIA),加速AI赋能跨境电商

    卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力,近日正式加入中国人工智能产业发展联盟(AIIA),成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可,未来将携手联盟推动AI技术研发与产业化,助力中国品牌全球化。依托八年积累的海量电商数据与算法体系,卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案,服务超百万跨境卖家,显著提升运营效率与决策精准度。

  • 科大讯飞1024发布:讯飞翻译APP迭代焕新,同声传译+音视频翻译重构沟通体验

    在2025科大讯飞全球1024开发者节期间,讯飞翻译APP迎来关键升级,重点强化同声传译功能。通过搭载全新语音同传大模型,实现翻译更准、响应更快;新增实时分享、记录留存、悬浮字幕等特性,支持跨场景高效应用。该产品已在东盟博览会等国际场合验证实用性,结合IDC报告八大维度第一的权威背书,彰显了AI翻译技术从研发到落地的全链条优势,为跨语言沟通提供简单如母语的体验。

  • AI日报:上海首例涉AI提示词著作权案宣判;Kimi K2 Thinking发布;中文图像编辑新王UniWorld-V2发布

    今日AI领域动态:上海首例AI提示词著作权案宣判,法院认定提示词不具独创性;月之暗面发布Kimi K2思考模型,实现自主多轮工具调用;UniWorld-V2图像编辑模型支持中文框选即改,性能超越GPT-Image;谷歌推出AI文件检测工具Magika 1.0,支持超200种格式;Sora安卓版首日下载量达47万次;我国发布全球首个AI海洋大模型“瞰海”,可精准预测10天内海洋变化;宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控;谷歌Gemini API推出文件搜索工具,简化私有RAG系统集成。

  • 行业首个!海尔冰箱获ISO/IEC 42001人工智能管理体系认证

    2025年10月,海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业,标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程,确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品,推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术,为用户提供更安全、智能的健康饮食体验。

  • 人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

    科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲,强调高质量数据集是人工智能产业决胜关键。他指出,算力、算法和数据构成AI三大要素,而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施,通过集中管理、分散赋能模式,打通数据采集、治理到AI训练全链路,推动产业智能化升级。该平台已在制造、金融等领域落地,助力企业释放数据要素价值,实现弯道超车。

今日大家都在搜的词: