首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:阿里视觉推理模型QVQ-Max;可灵AI上新AI音效功能;GPT-4o升级后性能飙升;Midjourney V7将于下周发布

2025-03-28 15:50 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用

新鲜AI产品点击了解:https://top.aibase.com/

1、阿里巴巴发布最新视觉推理模型 QVQ-Max

阿里巴巴旗下的AI研究团队Qwen发布了其最新的视觉推理模型QVQ-Max。该模型能够理解图片和视频,并进行深入分析与推理,应用场景广泛,涵盖教育、编程和艺术创作等多个领域。用户可以通过Qwen Chat平台体验这一模型,初步反馈显示其推理速度和准确性受到好评。

【AiBase提要:】

🖼️ QVQ-Max是阿里巴巴Qwen团队推出的新视觉推理模型,具备强大的多模态信息处理能力。

🚀 该模型的发布时间在凌晨三点,展现了团队的研发热情与不懈努力。

🌍 QVQ-Max的推出标志着阿里巴巴在AI领域的进一步布局,推动了全球AI技术的发展。

2、快手可灵AI全面焕新升级 上新“AI音效”、“资产管理”等新功能

快手旗下的可灵AI平台进行了全面的升级,以“可灵AI,灵感成真”为核心理念,优化了视觉设计和交互体验。新设计采用极简主义风格,提升了创作者的创意表现。新增的“AI音效”功能和“资产管理”功能,极大地提高了创作者的工作效率和创意表达的丰富性。

image.png

【AiBase提要:】

🎨 视觉设计采用极简主义风格,全新Logo简洁现代,减少视觉干扰,突出创意表现。

🎵 新增“AI音效”功能,为作品注入更多灵魂,丰富音频表达,使视频内容生动有趣。

📂 “资产管理”功能提升文件管理效率,优化创作流程,让创作者更专注于创意。

3、ChatGPT迎来重大升级:GPT-4o性能飙升,推出全新记忆功能Moonshine Nux V2

OpenAI于3月27日对其ChatGPT进行了重大升级,推出了新版GPT-4o模型及全新的记忆功能“Moonshine Nux V2”。新版模型在理解和执行用户指令方面显著提升,竞技场排名跃升至第二,尤其在多任务处理和创造性输出上表现出色。记忆功能的革新使得ChatGPT能够跨越对话保持记忆,极大提高了用户体验。

image.png

【AiBase提要:】

🌟 新版GPT-4o模型在多个维度上显著提升,尤其是在多任务处理和创造性输出方面表现优异。

🧠 新增的记忆功能“Moonshine Nux V2”使ChatGPT能够跨窗口保持记忆,提高了交互的连贯性和智能性。

💰 GPT-4o以低成本高性能的特性挑战市场,超越了竞争对手,巩固了OpenAI的技术领先地位。

4、Cline现已支持Gemini2.5Pro:AI开发迎来新助力

随着人工智能技术的发展,Cline宣布支持Google DeepMind推出的Gemini2.5Pro模型,为开发者提供了一个强大的免费工具,提升了编码和调试的效率。Gemini2.5Pro以其卓越的多模态能力和长上下文窗口受到广泛关注,尤其在处理复杂任务时展现出巨大的潜力。

image.png

【AiBase提要:】

🚀 Cline与Gemini2.5Pro的结合,为开发者提供了高效的编码和调试工具,降低了使用门槛。

🧠 Gemini2.5Pro具备长达100万token的上下文窗口和多模态输入能力,适用于复杂项目的处理。

🌍 开发者社区对Gemini2.5Pro的反馈积极,期待其在实际应用中的潜力,尽管速度问题仍需优化。

5、豆包推出新版深度思考功能 支持边想边搜

字节跳动旗下的AI助手豆包于3月28日推出新版深度思考功能,开启测试阶段。这一更新显著提升了AI助手的信息处理和推理能力,用户能够享受更全面和准确的智能服务。新版功能结合了推理过程的思维链与搜索深度,支持‘边想边搜’,并在多个场景中展现出更大的应用潜力,尤其在方案制定和专业写作方面,豆包的表现令人期待。

【AiBase提要:】

🔍 新版深度思考功能支持边想边搜,结合推理与搜索,提升信息处理能力。

📝 在方案制定中,豆包可推理缺失信息并定向搜索,提供完善的结果。

📚 在写作辅助方面,豆包通过深层检索提升思考深度,为专业文章提供参考思路。

6、OpenAI升级 GPT-4o:付费用户即刻体验,免费用户需再等数周

OpenAI最近在社交媒体上宣布了其旗舰模型GPT-4o的升级,付费用户将立即体验到新功能,而免费用户则需等待数周。此次升级显著提升了模型处理复杂指令的能力、技术与编程能力,以及直觉与创造力。此外,模型在对话中减少了表情符号的使用,以提高交流的自然性。

【AiBase提要:】

✨ 更擅长处理复杂指令,提升用户需求响应能力。

💻 技术与编程能力显著增强,支持开发者和技术爱好者。

🎨 直觉与创造力再升级,为内容创作和教育带来新可能。

7、Midjourney V7将于3月31日发布:重新定义AI生成艺术的疆界

Midjourney V7的发布标志着AI图像生成技术的重大进步,尤其是在自然语言理解和视觉表现方面。新版本不仅提升了图像生成的细节和美学质量,还降低了艺术创作的门槛,使得用户能够通过简单的文字描述创造复杂的艺术作品。

image.png

【AiBase提要:】

🖼️ Midjourney V7将于2025年3月31日发布,距离上一个版本已有22个月,标志着技术的重大更新。

🌟 新版本在视觉连贯性、细节渲染和自然语言理解方面取得显著进步,拓展了创意表达的可能性。

🤖 Midjourney V7旨在降低艺术创作门槛,使用户通过简单文字生成复杂艺术作品,强化其在AI图像生成市场的竞争力。

8、更智能!OpenAI 推新功能:ChatGPT可直接连接企业内部知识库

OpenAI最近推出了一项新功能,允许ChatGPT Team用户将内部知识直接与平台连接。这一功能旨在提升企业用户的信息响应效率和决策质量。通过连接内部知识库,用户能够进行语义搜索,确保回答与企业环境相符,同时系统会学习组织内部的特定语言和术语。

image.png

【AiBase提要:】

🔗 连接内部知识库,提升信息响应的精准度和上下文相关性。

📊 支持语义搜索和内部资料引用,确保回答符合最新企业语境。

🔒 严格管理用户权限,保护内部数据的安全性和隐私。

9、PIKA新功能发布:AI视频技术“让您遇见更年轻的自己”

随着人工智能技术的快速发展,iPIKA推出了新功能“您可以遇见更年轻的自己”,允许用户通过上传童年照片和自拍视频生成互动视频。这一创新结合了科技与情感,用户可以自定义“年轻版自己”的动作和表情,生成真实感十足的视频,受到用户的高度评价。

image.png

【AiBase提要:】

📸 用户可以通过上传童年照片与自拍视频生成与“年轻版自己”互动的视频。

🎭 该功能支持将网络热门迷因角色融入视频,增强娱乐性与个性化体验。

🚀 iPIKA展示了其技术实力,未来可能优化功能,支持多人互动和提升视频质量。

详情链接:https://pika.art/login

10、Nvidia 推出 G-Assist:本地运行的 AI 助手为玩家提供全方位支持

Nvidia 最近推出了实验性 AI 助手 G-Assist,专为 GeForce RTX 显卡设计,能够在本地运行,提升玩家的游戏体验。该助手具备系统诊断、游戏优化、GPU 超频等多种功能,并支持控制兼容外设。与云端 AI 助手不同,G-Assist 完全依赖用户的 GPU 资源,使用基于 Llama 的模型。

image.png

【AiBase提要:】

🖥️ G-Assist 是一个本地运行的 AI 助手,专为 GeForce RTX 显卡设计。

🎮 该工具具备系统诊断、游戏优化、GPU 超频等多种功能,提升玩家体验。

🔧 Nvidia 为 G-Assist 提供了开发者平台,鼓励用户反馈以不断改进该助手。

11、开源版Suno来了!AI音乐生成模型YuE可生成专业级的歌声和伴奏

YuE是由香港科技大学与DeepSeek合作开发的开源音乐生成模型,能够生成多种风格的音乐并模拟人声。其双LLaMA语言模型架构使其在音乐生成质量上达到了前所未有的高度,甚至与著名的闭源工具相抗衡。

image.png

【AiBase提要:】

🎵 YuE能够生成多种风格的音乐,并模拟人声,提供全新的音乐体验。

🎤 采用双轨版下一token预测策略,确保音乐创作的细腻度和一致性,提升音质。

🔍 引入独特的音乐上下文学习技术,避免抄袭,增强创作的独特性。

详情链接:https://github.com/multimodal-art-projection/YuE

12、中国初创公司蝴蝶效应谋求5亿美元融资,Manus AI智能体备受瞩目

蝴蝶效应是一家中国初创公司,正在与美国投资者洽谈新一轮融资,目标估值达到5亿美元。其AI智能体Manus能够执行多种任务,受到市场关注。尽管中美科技竞争加剧,该公司仍在寻求美国风投支持,因其专注于应用程序开发而不受投资禁令限制。

【AiBase提要:】

💰 蝴蝶效应正在与美国风投洽谈融资,目标估值5亿美元,较之前增长五倍。

🌍 Manus AI智能体在社交媒体上引起关注,主要目标市场为美国,也开始在中国提供服务。

🚀 蝴蝶效应计划在东京开设办公室,旨在拓展日本市场,同时扩大全球用户规模。

举报

  • 相关推荐
  • 卓世科技亮相 2026海南(三亚)人工智能科技大会,具身智能通用大脑赋能自贸港产业升级

    5月19日-25日,2026海南(三亚)人工智能科技大会以“睿见未来”为主题举办。卓世科技作为国家级专精特新“小巨人”企业受邀参展,创始人李伟伟发表主题演讲,展示自研“璇玑玉衡”大模型与具身智能通用大脑技术体系,深度对接海南自贸港AI产业生态。大会聚焦物理AI、智能制造、医疗康养等前沿赛道,搭建政产学研资用一体化平台。卓世科技针对行业痛点,提出分层赋能、即插即用的通用大脑解决方案,涵盖AI数字员工、陪伴交互大脑、非人形协同大脑及人形自主作业大脑等,并公布“数据资产、模型能力、场景方案、适配服务、验证认证”五大货架体系,助力海南打造全球人工智能“自贸高地”。

  • 受邀走进阿里巴巴总部,GEO理论奠基人罗小军为百余位跨境商家讲授GEO实战方法论

    2026年5月25日,阿里国际站浙江大区AI先锋营在杭州开课,猛犸AI创始人罗小军受邀主讲,为100余位跨境电商企业家系统讲解AI时代跨境经营的底层逻辑与实战路径。培训涵盖理论、实操与核心操作,指出外贸进入A2A时代,算力含量决定企业竞争力。罗小军重点解析GEO内容体系,强调品牌内容被AI采信的关键要素,并给出30天完成AI化经营基础搭建的行动指南。

  • 小米大模型推理速度全球最快!1000 tokens/s是啥概念:官方科普

    日前,小米正式上线Xiaomi MiMo-V2.5-Pro-UltraSpeed模式。 据介绍,这是全球首个在通用GPU上突破1000 tokens/s的万亿参数模型,刷新了旗舰模型的全球最快推理速度。 今日,小米技术”公众号发文科普了什么是1000 tokens/s,以及这一速度到底有多快。 小米表示,token即词元,是大模型中的计量单位,类似日常买菜时使用的斤”两”。 1000 tokens/s也就是1000 Tokens Per Second,简称1000 TPS,意

  • 京东云率先上线MiniMax M3:显著提升模型推理吞吐

    MiniMax M3正式上线,京东云JoyBuilder模型开发平台已第一时间接入MiniMax M3模型并同步开放服务。 依托京东云自研推理框架,JoyBuilder采用了PD分离部署、KV Cache缓存、投机采样等先进推理优化技术,显著提升了模型推理吞吐量与响应效率。 MiniMax M3在编程、智能体等专业任务上达到了前沿水平。其采用全新的MiniMax稀疏注意力架构(MSA),最高支持100万token的超长上下文。作为一款�

  • 视觉中国科技行业垂类AIGC素材 解锁视觉新图景

    视觉中国携手1.2万+签约AI创作者,汇集超900万优质AIGC图片、视频素材,覆盖医疗生物、航天航空、智能制造、互联网数字科技、新能源环保五大科技领域。通过AI镜头,将科创蓝图具象化,提供从写实摄影到创意构想的多样化素材,适配品牌海报、科普视频、科研配图等场景,持续更新正版AIGC素材,助力用户“看见”未来。

  • 模型即审美:生图模型们正建起自己的“视觉方言”

    ​最近在测试各种AI生图模型的时候,我们发现了一个现象:同样一个提示词,丢给不同的模型,出来的图片风格差异大到像是出自不同摄影流派。 Image-2生成的图就像我昨天随手拍的,但Nano Banana生成的图感觉像某个家居品牌的广告大片。有些模型执着于捕捉现实的每一丝瑕疵,有些则痴迷于把日常场景变成精致的艺术品。这背后反映的不是能力差别,而是每个模型对"什么

  • 慧荣科技推出专为AI PC打造的SM2524XT主控,提供2.5M IOPS的AI推理与KV Cache性能

    慧荣科技推出SM2524XT,专为AI推理和KV Cache密集型负载设计的PCIe Gen5 DRAM-less SSD主控芯片。采用四核处理器、TSMC 6nm制程,连续读取达14GB/s,随机访问性能达250万IOPS,每瓦性能提升25%。该芯片针对高碎片化、低延迟敏感的AI工作负载优化,集成SCA、FTL调度及NANDXtend技术,确保持续负载下稳定性能。

  • 专业视听视角:嗨动视觉AirLink如何重构企业级无线投屏体验标准

    企业数字化进程中,会议系统稳定性直接影响决策效率。无线投屏虽成标配,但兼容性差、画质损耗和延迟问题迫使专业人员回归有线方案。嗨动视觉AirLink投屏器通过全协议栈覆盖、4K@60Hz低延迟传输、多终端并发协作及场景适配等工程优化,解决了跨平台连接难题,并依托诺瓦星云在显控领域的技术积累,提供专业级工程可靠性。未来,专业无线投屏将从信号传输向智能协作平台演进,厂商工程实力成关键。

  • 3E | See The Future · AI Glasses: 高交会首设AI眼镜专区,大湾区吹响视觉交互革命集结号

    2026年11月26-28日,高交会3E展将在深圳宝安国际会展中心举办,首次重磅推出“AI眼镜专区”并启动直播活动。展会由深圳市政府主办、振威国际会展集团承办,汇聚全球顶尖消费电子企业,聚焦AI眼镜全产业链,提供专展曝光、官方直播及精准对接三大核心价值,助力企业抢占万亿市场先机。现面向全国AI眼镜企业开启招商与直播合作招募。

  • 小米手机版龙虾!Xiaomi miclaw封测招募小米17 Max、REDMI K90 Max

    小米官方龙虾”Xiaomi miclaw封闭测试迎来新一轮机型扩容,新增小米17 Max、REDMI K90 Max两款机型,用户可通过小米社区填写问卷申请资格。 Xiaomi miclaw是小米基于自研MiMo大模型打造的移动端AI智能体(AI Agent),也是国内首个手机端类OpenClaw AI智能体。 基于小米自研MiMo大模型打造,拥有系统底层调用、上下文理解、生态互联与自进化能力,可自主拆解任务、调用50 系统工具,实�

今日大家都在搜的词: