首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:淘宝全平台启动AI假图治理;OpenAI官宣支持MCP协议;阿里开源全模态模型Qwen2.5-Omni

2025-03-27 15:28 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用

新鲜AI产品点击了解:https://top.aibase.com/

1、阿里通义千问开源发布新一代端到端多模态模型Qwen2.5-Omni

阿里云通义千问团队推出了Qwen2.5-Omni,这是一个新一代的多模态旗舰模型,旨在实现文本、图像、音频和视频的无缝处理。该模型采用了创新的Thinker-Talker架构,能够进行实时音视频交互,并在多模态任务中表现出色。Qwen2.5-Omni在多个领域的基准测试中超越了现有的单模态和封闭源模型,展示了其强大的性能与广泛的应用潜力。

image.png

【AiBase提要:】

🛠️ Qwen2.5-Omni是新一代端到端多模态模型,支持文本、图像、音频和视频的无缝处理。

⚡ 采用Thinker-Talker架构,实现实时流式响应,提升了语音生成的自然性和稳定性。

📊 在多模态任务OmniBench中表现出色,并在多个领域的基准测试中超越了同类模型。

详情链接:https://chat.qwenlm.ai

2、OpenAI宣布支持Anthropic的MCP标准

OpenAI的首席执行官山姆·阿尔特曼宣布,该公司将支持竞争对手Anthropic推出的模型上下文协议(MCP),旨在提升AI助手在特定查询中的响应准确性和相关性。MCP的整合将应用于多个OpenAI产品,包括ChatGPT的桌面应用程序。MCP允许AI模型从多种数据源获取信息,促进开发者与AI应用之间的双向连接。

image.png

【AiBase提要:】

🌟 OpenAI宣布支持Anthropic的MCP标准,以提升AI助手的响应质量。

🔗 MCP允许AI模型从多种数据源获取信息,构建双向连接。

📈 多家公司已加入MCP的支持行列,推动开放标准的发展。

详情链接:https://openai.github.io/openai-agents-python/mcp/

3、Ideogram 正式发布3.0版本,真实感与创意表现再突破

Ideogram3.0的发布标志着图像生成技术的一次重要进步,特别是在真实感、创意表现力和风格一致性方面。新模型不仅在文本渲染能力上取得了质的飞跃,还支持多种复杂排版设计,增强了用户的创作体验。其新增的功能如“Style Reference”和“Random Style”使得用户能够快速生成多样化的高质量图像。

【AiBase提要:】

🌟 Ideogram3.0在真实感和创意表现力上实现显著突破,成为图像生成领域的重要里程碑。

🖋️ 新模型支持复杂排版和多语言设计,生成清晰可读的艺术化文本,提升了平面设计的应用场景。

⚡ 通过优化算法架构,Ideogram3.0的生成速度大幅提升,为用户提供更高效的创作体验。

4、可灵AI重大更新:多图参考优化、生成速度提升与视频延长功能上线

可灵AI(Kling)近期进行了一次重要的功能升级,显著提升了用户界面和创作能力。更新后的界面更加简洁直观,提升了用户体验,帮助创作者更专注于内容创作。此外,多图参考功能的升级使得生成速度更快,语义理解更准确,用户通过上传多张图片可以更好地表达创作意图。

【AiBase提要:】

⚡️生成速度显著提升,用户体验更流畅。

🖼️多图参考功能优化,支持更精准的创作意图捕捉。

🎥视频延长功能上线,适合短视频创作者和专业用户。

5、OpenAI即将完成由软银领投的400亿美元融资

根据彭博社的最新报道,OpenAI即将完成由软银牵头的一项高达400亿美元的融资,这将使其成为人工智能领域历史上最大规模的融资。融资完成后,OpenAI的估值将达到3000亿美元,几乎是其2023年10月时估值的两倍。此次融资不仅显示了市场对人工智能技术的认可,也体现了投资者对OpenAI未来潜力的信心。

【AiBase提要:】

🌟 OpenAI即将完成由软银牵头的400亿美元融资,成为AI历史上最大规模的融资。

💰 融资完成后,OpenAI的整体估值将达到3000亿美元,几乎翻倍于2023年10月的估值。

🚀 后续计划启动300亿美元融资,其中软银将继续加大投入,进一步支持OpenAI的发展。

6、淘宝全平台启动AI假图治理,严厉打击利用AI假图欺骗消费者等行为

淘宝近期宣布在全平台范围内启动AI假图治理行动,以打击利用AI技术生成的欺骗性图片,保护消费者和原创品牌商家的合法权益。随着电商行业的发展,AI生成的假图日益猖獗,严重影响消费者的购物体验和品牌商家的信誉。淘宝明确要求商家使用真实商品图片,并呼吁全行业共同维护电商环境的公平与透明。

微信截图_20250327140103.png

【AiBase提要:】

🖼️ 淘宝启动AI假图治理行动,旨在打击欺骗性图片,保护消费者权益。

🚫 明确规定商品图片应以实拍图为核心,禁止显著失真的合成图。

🤝 向全行业发出倡议,呼吁商家规范使用AI生成图片,确保信息真实性。

7、AI搜索引擎公司 Perplexity 年收入突破1亿美元

Perplexity是一家人工智能搜索引擎初创公司,最近宣布年收入突破1亿美元,CEO阿拉文・斯里尼瓦斯在LinkedIn上分享了这一喜讯。尽管产品尚未完全货币化,但公司在过去一年实现了6.3倍的增长。Perplexity Pro计划提供更丰富的功能,且正计划融资5亿至10亿美元,预计公司估值将达到180亿美元。

【AiBase提要:】

💰 Perplexity年收入突破1亿美元,实现了6.3倍的年增长率。

📈 公司计划融资5亿至10亿美元,估值将达到180亿美元。

⚡ Sonar AI模型现已面向所有Pro用户开放,并声称是全球最快的推理引擎。

8、美图WHEE接入DeepSeek R1,提示词优化可自动补全关键词

美图公司旗下的AI素材生成器WHEE与DeepSeek R1的成功接入,标志着AI创作领域的一次重要进步。此次合作旨在通过DeepSeek的提示词设计能力,帮助用户在没有专业背景的情况下,轻松生成高质量的图像内容。WHEE的提示词优化功能能够自动补全关键词,降低了用户的使用门槛,促进了创意的实现。

image.png

【AiBase提要:】

🌟 WHEE接入DeepSeek R1,降低了无专业背景用户的提示词使用门槛。

🎨 提示词优化功能可自动补全关键词,生成丰富的文案内容。

🚀 行业专家指出,该技术填补了用户创意与专业指令之间的技术鸿沟。

9、OpenAI 计划建设数据中心 或将成全球最大存储客户之一

OpenAI正在考虑建立其首个数据中心,这一计划可能使其成为全球最大的存储客户之一。预计OpenAI将投资数十亿美元采购硬件和软件,以满足高达5EB的存储需求。这一举措不仅能减少对云服务商的依赖,还可能降低运营成本。尽管项目尚在评估阶段,涉及技术可行性和数据安全等多个因素,但自建数据中心的潜力引人注目。

【AiBase提要:】

🌐 OpenAI考虑建设首个数据中心,或成为全球最大存储客户之一。

💰计划采购价值数十亿美元的硬件和软件,预计需要5EB存储容量。

🔍自建数据中心有助于降低对云服务商的依赖,可能节约运营成本。

10、合成数据立功!AccVideo实现高质量视频生成、速度飙升8.5倍

AccVideo是一项突破性的技术,显著提升了视频扩散模型的生成速度,使其提升了8.5倍。通过创新的蒸馏方法和合成数据集,AccVideo不仅提高了生成效率,还保持了高质量的视频输出。这项技术为视频生成领域带来了新的发展机遇,尤其是在文本到视频生成等应用场景中,展现了巨大的潜力。

image.png

【AiBase提要:】

⚡ AccVideo通过创新的蒸馏方法和合成数据集,成功将视频生成速度提升了8.5倍。

🎥 该技术在保持与预训练模型相当的性能的同时,能够生成高达720x1280分辨率、24fps的高质量视频。

🌟 AccVideo的高效生成能力为文本到视频生成等领域提供了广泛的应用前景,拓展了视频创作的可能性。

详情链接:https://top.aibase.com/tool/accvideo

举报

  • 相关推荐
  • AI日报:阿里通义推Qwen-TTS模型;Cursor已支持网页和手机端;字节发布图像合成技术XVerse

    【AI日报】今日AI领域7大突破:1)阿里通义Qwen-TTS实现方言语音合成重大突破;2)Cursor发布Web版AI编程工具;3)字节XVerse技术实现多对象精准图像生成;4)NoteGen跨平台AI笔记工具革新知识管理;5)ManimML动画库可视化Transformer架构;6)TEN+Agent开源语音交互技术降低延迟;7)Chai-2抗体设计模型将药物研发周期缩短至两周。淘宝同时上线RecGPT推荐模型提升购物体验。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • AI日报:腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

    本文介绍了AI领域最新动态:1)腾讯开源混元3D2.1大模型,提升3D生成质量;2)OpenAI Codex升级,优化代码生成功能;3)字节跳动AI Lab负责人李航卸任;4)微软发布700个AI应用案例;5)微软推出Code Researcher工具,解决58%系统崩溃问题;6)Observer AI实现屏幕操作自动化;7)Genspark发布AI浏览器;8)麻省理工用AI技术3.5小时修复15世纪名画;9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni;10)MagicTryOn视频换衣框架;11)字节跳动发布实时互动AI视频生成模型Seaweed APT2;12)ChatGPT搜索功能升级;13)字节跳动与老凤祥合作开发AI智能眼镜。

  • 「6月30日AI日报」百度开源文心大模型4.5系列;通义千问发布多模态生成模型Qwen VLo

    AI日报精选:1)百度开源文心大模型4.5系列,含10款新模型,性能优异;2)通义千问发布多模态模型Qwen-VL,支持图文交互;3)阿里开源3亿参数多模态模型Ovis-U1;4)华为开源盘古7B稠密和72B混合专家模型;5)美图MOKI推出AI创意广告功能,一键生成专业视频;6)谷歌Gemini 2.5 Pro API重新免费开放;7)豆瓣上线"深入研究"AI功能;8)小米"AI百宝箱"结束内测;9)北京智研院开源多模态系统OmniGen2;10)知乎升级"直答"知识库功能。

  • AI日报:MiniMax-M1开源;阿里Qwen3升级版适配苹果MLX架构;月之暗面发布新模型Kimi-Dev-72B

    《AI日报》汇总了近期AI领域多项重要进展:1)月之暗面推出开源编程模型Kimi-Dev-72B,在软件工程任务测试中创下新纪录;2)MiniMax开源M1模型,支持超长上下文推理且训练成本低;3)腾讯发布AI音乐模型LeVo,支持音色克隆和分轨生成;4)阿里云Qwen3升级版适配苹果MLX架构;5)豆包推出"AI播客"功能,可将PDF转为对话播客;6)夸克App上线个性化AI家教"夸克老师";7)松下发布多模态大模型OmniFlow,实现文本/图像/音频自由切换;8)TikTok推出三款AI视频创作工具;9)极氪与火山引擎合作,将豆包大模型接入智能座舱系统;10)Meta的Llama3.1模型在文本记忆方面表现突出;11)Grok上线定时追踪X热门话题功能;12)Gemini2.5Pro即将更新Deep Think功能;13)谷歌地图引入AI技术升级导航和个性化推荐功能。

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • AI日报:MiniMax发布视频智能体Hailuo Agent;昆仑万维开源 Skywork-SWE-32B;B站接入Qwen 3等模型

    本期AI日报聚焦多项AI领域创新:1)MiniMax推出视频Agent工具,支持文本生成高清视频及人脸驱动;2)昆仑万维开源Skywork-SWE-32B模型,提升软件工程任务表现;3)B站接入通义千问模型,推出数据分析智能体InsightAgent;4)ChatGPT深度整合Gmail与日历功能;5)腾讯云发布全链路AI开发平台"AI Builder";6)HeyGen推出UGC广告数字人功能;7)研究显示过度依赖AI或削弱批判性思维。此外还涵盖AI音乐生成、内容检测工具停运等动态,展现AI技术快速发展的多元应用与潜在影响。

  • AI日报:ChatGPT支持MCP和会议记录功能;Cursor 1.0 版本重磅发布;Midjourney视频功能将在本月上线

    本期AI日报聚焦多项AI领域突破:1)OpenAI为ChatGPT新增企业数据连接和会议记录功能;2)Cursor 1.0发布集成BugBot等开发工具;3)Midjourney即将推出视频生成功能;4)秘塔AI搜索新增PPT导出功能;5)Manus推出文本生成视频工具挑战Sora;6)法国Mistral发布企业级编程助手;7)英伟达推出文档处理专用AI模型;8)腾讯公益引入大模型提升互动体验;9)Firecrawl推出网页抓取API工具;10)Bland AI实现超真实语音克隆;11)报告显示AI训练成本逼近百亿美元;12)开源设计工具Jaaz支持批量图像生成;13)《逆水寒》手游接入AI实现图片动效玩法。

  • 「6月27日AI日报」腾讯开源轻量级混元-A13B模型;可灵AI推“视频音效”功能

    AI日报主要内容: 1. 腾讯开源混元A13B模型,采用MoE架构,总参数量800亿,激活参数130亿,支持低端GPU部署 2. 可灵AI推出"视频音效"功能,实现所见即所听的沉浸体验 3. Black Forest开源图像编辑模型FLUX.1Kontext,支持消费级硬件运行 4. OpenAI发布Deep Research API新模型o3/o4-mini,支持自动化网页搜索和数据分析 5. 小米推出1999元起AI眼镜,集成拍摄、支付、音乐等功能 6. 迅雷推出下载MCP服务,一句话指令让AI自动完成下载任务 7. HeyGen推出AI视频Agent,几分钟内生成专业级视频内容 8. 谷歌开源端侧多模态大模型Gemma3n,手机也能运行云端AI性能

  • AI日报:Midjourney重磅推出视频生成模型V1;OpenAI将在今年夏季发布GPT-5;谷歌推Search Live语音搜索功能

    本期AI日报聚焦多项AI领域重要进展:1) Midjourney推出首款视频生成模型V1,支持21秒视频生成;2) OpenAI CEO确认GPT-5将于今夏发布;3) Google上线语音对话搜索功能Search Live;4) OpenAI开源客户服务代理框架;5) MiniMax发布智能代理Agent;6) 恶意工具WormGPT出现新变种;7) OpenAI推出企业版ChatGPT折扣;8) DeepSite V2支持3D网页动画生成;9) AI工具可秒变PPT;10) 比亚迪与字节跳动合作开发动力电池技术;11) 马斯克否认xAI巨额亏损传闻。