首页 > 原创 > 关键词  > AI日报最新资讯  > 正文

AI日报:腾讯混元推出5个开源3D模型;Anthropic发布MCP传输机制重大升级;Mistral开源模型Mistral Small 3.1

2025-03-18 15:23 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、腾讯混元推出5个开源3D模型:30秒生成,兼容多平台

腾讯混元宣布推出五个全新开源3D生成模型,基于Hunyuan3D-2.0,具备更快的生成速度和更丰富的细节。Turbo系列模型利用FlashVDM框架实现生成加速,缩短至30秒内完成。升级后的3D AI创作引擎支持多视图输入,用户可通过上传少量图片快速生成高质量3D模型,降低制作成本。新模型广泛应用于UGC、商品素材合成和游戏资产生成,满足游戏3D资产标准。

image.png

【AiBase提要:】

⚡ Turbo系列模型通过FlashVDM框架实现数十倍加速,生成时间缩短至30秒。

🖼️ Hunyuan3D-2-MV模型能更好地捕捉细节,生成符合用户预期的3D资产。

🛠️ 升级后的引擎支持多视图输入,用户只需上传2-4张图片即可快速生成高质量3D模型。

2、Anthropic发布MCP传输机制重大升级:告别长连接,迎接更灵活的Streamable HTTP

Anthropic对Model Context Protocol(MCP)进行了重大更新,推出了Streamable HTTP传输方式,取代了传统的HTTP+SSE方案。这一创新解决了MCP远程传输的关键限制,提升了灵活性和兼容性。新机制允许客户端与服务器之间更高效的双向通信,支持无状态服务器运行,简化了部署流程,并提高了系统的可扩展性。

【AiBase提要:】

🚀 移除专用的/sse端点,所有消息通过统一的/message端点传输,简化了通信流程。

🔄 服务器可动态将HTTP请求升级为SSE流,支持灵活的双向通信,解决了SSE的单向限制。

🌐 新方案兼容性大幅提升,适用于各种网络基础设施,支持无状态模式,降低了资源消耗。

详情链接:https://github.com/modelcontextprotocol/specification/pull/206

3、生数科技Vidu将打造首部海外AI原创科幻动漫剧集

生数科技有限公司与Aura Productions达成战略合作,计划推出首部海外AI原创科幻动漫剧集。这一合作标志着AI技术在动漫制作中的应用,开启了动漫行业新的篇章。双方将共同制作50集短篇科幻动漫系列,利用Vidu的先进视频生成技术,提升制作效率和质量,预示着未来动漫创作将更加智能化和高效化。

image.png

【AiBase提要:】

🚀 合作推出50集短篇科幻动漫系列,计划在全球主流社交媒体平台发布。

🤖 Vidu的多主体一致性功能确保角色与场景的无缝融合,实现高质量动画叙事。

⏱️ Vidu2.0版本大幅提升视频生成效率,能在10秒内快速生成高质量视频。

4、谷歌云重磅推出高清语音模型 Chirp3,支持248种声音

谷歌云在伦敦的DeepMind总部推出了高清语音模型Chirp3,旨在为开发者提供强大的语音合成工具。该模型支持248种不同的声音和31种语言,能够帮助开发者创建智能语音助手、有声读物和视频配音等应用。为了确保负责任的使用,谷歌限制了语音克隆功能的访问权限,并重申了对数据隐私的承诺。

image.png

【AiBase提要:】

🌟 谷歌云推出Chirp3语音模型,支持248种声音和31种语言,助力开发者构建智能应用。

🔒 谷歌限制语音克隆功能的访问权限,以确保伦理AI的实践和防止滥用。

💼 谷歌发起计划提升英国AI技能,并向初创企业提供云基础设施支持,促进创新。

详情链接:https://cloud.google.com/text-to-speech/docs/chirp3-hd

5、马斯克xAI收购视频生成初创公司Hotshot,AI视频领域竞争再升级

埃隆·马斯克旗下的xAI公司收购了视频生成AI初创公司Hotshot,标志着其在多模态AI技术领域的进一步扩展。Hotshot以其独特的技术优势和强大的算力支持,致力于提升视频生成能力。

【AiBase提要:】

🤖 Hotshot专注于AI视频生成,利用600万个视频片段进行训练,提升了模型理解视频内容的能力。

⚙️ 收购后,Hotshot将继续扩大视频生成器的开发,利用xAI的Colossus超级计算机的强大算力。

💼 此次收购标志着马斯克在AI技术领域的进一步布局,预示着AI视频生成技术将迎来新一轮的突破。

6、Roblox开源Cube3D:首个基础AI模型实现3D对象生成

Roblox近日推出并开源了Cube3D,这是其首个用于生成3D对象的基础AI模型,旨在提升3D创作效率。该模型通过创新的训练方法,将3D对象标记化,能够快速生成完整的3D形状。未来,Cube3D将发展为一个多模态模型,支持多种输入类型,包括文本、图像和视频,进一步增强与Roblox现有AI创作工具的整合。

image.png

【AiBase提要:】

🛠️ Cube3D是Roblox首个开源的3D对象生成AI模型,旨在提高开发者的创作效率。

🔍 该模型通过创新的训练方法,能够将3D对象标记化并预测下一个形状,快速构建完整的3D对象。

🌐 Roblox计划将Cube3D发展为多模态模型,未来将支持文本、图像和视频输入,增强创作工具的功能。

7、Zoom AI助手AI Companion功能升级

Zoom公司最近宣布了其AI助手Zoom AI Companion的新一轮功能升级,标志着这一工具的演变,旨在提升用户在视频会议中的互动体验和工作效率。新功能包括自动识别和完成待办事项的Zoom Tasks、转录线下对话的新语音录音器、以及定制AI助手等,预计将显著增强用户的生产力和协作能力。

image.png

【AiBase提要:】

🌟 Zoom Tasks功能可以自动识别会议中的待办事项并完成相关任务。

🗣️ 新语音录音器能够转录线下对话并提供实时会议笔记。

📅 定制AI助手功能将于4月推出,用户可根据需求定制功能。

8、128K超长记忆!Mistral最新开源模型Mistral Small3.1登场,参数方面优于 GPT-4o Mini

Mistral AI发布了开源模型Mistral Small3.1,凭借240亿参数的设计,其性能可与谷歌和OpenAI的产品相媲美。该模型在文本处理和多模态理解上有显著提升,支持128k tokens的上下文窗口,处理速度达到每秒150个tokens。

image.png

【AiBase提要:】

🌟 Mistral Small3.1具备240亿参数,性能媲美谷歌和OpenAI的同类产品,推动AI市场竞争。

📈 该模型支持128k tokens的上下文窗口,处理速度高达每秒150个tokens,适用于长文档和快速响应场景。

🌍 Mistral采取开源策略,发布Apache2.0许可证,强调欧洲数字主权,吸引全球开发者参与创新。

详情链接:https://top.aibase.com/tool/mistral-small-3-1

9、谁说视频只能“一镜到底”?字节创新技术LCT,让AI像导演一样拍摄电影大片!

长上下文调整(LCT)技术的出现,极大提升了AI生成视频的叙事能力,使其能够像电影导演一样自由切换镜头,构建更连贯的故事场景。通过引入全注意力机制、交错的3D位置嵌入和异步噪声策略,LCT解决了多镜头生成中的视觉一致性和时间动态问题。

【AiBase提要:】

🎥 LCT技术使AI视频生成模型能够执导多镜头叙事视频,提升叙事能力。

🔍 通过全注意力机制和交错的3D位置嵌入,LCT确保视觉一致性和时间动态。

🚀 LCT支持自回归镜头扩展,便于长视频创作和交互式修改。

详情链接:https://top.aibase.com/tool/zhangshangxiawentiaoyoulct

10、32B参数的“逆袭”!OLMo232B横空出世,叫板GPT-3.5Turbo

OLMo232B是艾伦人工智能研究所发布的最新大型语言模型,凭借320亿参数和完全开源的特性,挑战了许多专有模型。通过精细的训练过程,OLMo232B在多项基准测试中超越了GPT-3.5Turbo和GPT-4o mini,展现出卓越的性能和更高的训练效率。

image.png

【AiBase提要:】

🌐 OLMo232B是完全开源的语言模型,公开了所有数据、代码和训练过程,促进全球研究合作。

📈 该模型拥有320亿参数,在多项基准测试中超越了GPT-3.5Turbo,证明了开源模型的强大实力。

⚡ OLMo232B在训练效率上表现优异,仅使用三分之一的计算资源,展现出高效的AI开发潜力。

详情链接:https://github.com/allenai/OLMo-core

举报

  • 相关推荐
  • AI日报:美团Tabbit浏览器开启公测;通义发布语音双模型;Notion 引入首个开源权重模型 MiniMax M2.5

    本期AI日报聚焦多领域AI新动态:美团旗下Tabbit浏览器公测,集成多模型AI Agent,实现网页自动化执行;阿里通义发布语音双模型,支持自然语言控制音色与场景;Notion引入开源模型MiniMax M2.5,打破闭源垄断,提升性价比;谷歌升级Flow AI工具,整合视频、绘画与特效功能;阿里巴巴AI品牌统一更名为“千问”,强化战略聚焦;三星宣布2030年迈向“AI工厂”,以Agentic AI驱动全链路自治;OpenAI疑似收购顶级域名GPT.com,巩固品牌地位;北京大学与OceanBase打造LoVR基准,入选WWW 2026,开启全视频智能检索新模式。

  • 单卡RTX 4090可运行 、96 FPS,Soul App开源实时数字人生成模型SoulX-FlashHead

    Soul AI Lab推出轻量化实时数字人生成模型SoulX-FlashHead,仅1.3B参数,在消费级显卡RTX 4090上实现96FPS高帧率,同时画质达SOTA水平。模型通过“先验”训练机制和时序音频上下文缓存技术,解决了小模型画质差和长视频身份漂移问题,支持电商直播、游戏NPC等广泛场景,权重与代码已全面开源。

  • AI日报:MiniMax公布上市后首份财报;千问开源Qwen3.5小型模型系列;Claude Code官方语音模式上线

    本期AI日报涵盖多项重要动态:MiniMax发布上市后首份财报,展示其AI平台战略进展;阿里通义千问开源Qwen3.5小型模型系列,支持多模态处理,适用于边缘设备;Google NotebookLM上线信息图自定义样式功能,简化知识可视化流程;Claude Code推出语音模式,提升编程协作效率;疑似GPT-5.4细节泄露,或具备超长上下文和状态化能力;Zopia实现多智能体协作自动化视频制作;QM发布2025年AI应用榜,豆包、DeepSeek、元宝等位列前五;DeepSeek V4 Lite凭借2000亿参数展现顶尖性能,成为国产模型新标杆。整体显示AI技术正快速向多模态、轻量化、场景化方向演进。

  • AI日报:小米发布Agent产品Xiaomi miclaw;OpenAI 发布 GPT-5.4系列;微软宣布必应视频全面接入Sora2模型

    本期AI日报涵盖多项重要动态:小米发布首款移动端Agent产品Xiaomi miclaw,基于自研MiMo大模型,旨在实现智能终端自动化交互。OpenAI推出GPT-5.4系列模型,包括标准版、推理版和高性能版,上下文窗口达百万级,在金融和法律领域表现优异。微软宣布必应视频创作者全面接入Sora2模型,提供免费高质量视频生成服务。Roblox推出AI实时改写功能,将违规内容自动转为礼貌合规语言。3D生成模型公司VAST获5000万美元融资,由阿里巴巴领投,将用于构建UGC互动生态。携程下线自动调价工具,推动酒店行业转向服务竞争。陈天桥九年后首度露面,透露正投入20亿美元研发“发现式AI”。阿里巴巴澄清千问团队集体离职传闻,称团队稳定,服务正常。

  • MWC首秀即焦点!讯飞AI眼镜携多模态同传大模型革新智能穿戴体验

    在2026年世界移动通信大会(MWC)上,科大讯飞以“AI Connecting Ideas”为主题,首次全球亮相其AI眼镜。该产品集多模态同传翻译与极致轻量化设计于一身,凭借领先的多模态降噪、全能翻译及多模态记录功能,吸引了众多海外运营商、技术伙伴及专业媒体的关注。其创新的唇动识别多模态降噪方案,通过摄像头捕捉说话者唇部运动,融合骨传导麦克风捕捉佩戴者声音,将音视频两路信息融合处理,在多人交谈的嘈杂背景中精准锁定目标讲话人,将语音识别和翻译的准确率提升50%以上。整机重量仅40克,相比当前市面主流同类产品重量降低了约20%,是目前全球最轻的双目单色显示多模态智能眼镜。此外,讯飞AI眼镜还具备多模态记录功能,能自动智能生成图文声并茂的会议纪要,覆盖信息记录和总结的全流程,为跨国商务人群提升工作效率。讯飞AI眼镜于北京时间3月4日上午10:10在国内电商开启预约。

  • Meta调整薪酬结构:为聚焦人工智能 员工股权激励缩水5%

    为给巨额人工智能投入腾出资金,Meta正推进新一轮成本控制措施,包括将数万名员工的股权激励缩减5%。这是该公司连续第二年削减员工薪酬。去年已削减股票期权分配约10%,此次再下调5%。扎克伯格正加大AI领域投入,希望与OpenAI、谷歌等对手竞逐前沿模型开发,同时安抚尚未看到AI投资回报的投资者。他还在其他业务领域持续裁员,今年1月就在持续亏损的元宇宙部门裁减约1500个岗位。不过知情人士透露,尽管股权激励普遍下调,Meta今年仍在改革绩效考核体系,为业绩优异者提供更丰厚奖励。这意味着公司整体薪酬预算并未下降,而是进行了结构性调整。一名员工表示,考虑到当前科技行业就业市场不景气,而Meta薪酬水平仍然具备竞争力,员工大概率不会因这一变化而选择离职。

  • 实测OpenClaw中文版Molili自定义大模型:这才是真·AI智能体

    本文介绍了OpenClaw中文版Molili,一款能真正执行任务的桌面AI智能体。它解决了传统AI“只会说不会做”的痛点,通过微信等平台直接下达指令,即可自动操作电脑完成查找文件、发送文档等任务。核心亮点包括:支持自定义接入各类大模型,打破模型绑定;提供8000+现成技能,覆盖办公、编程、生活等场景;注重安全与隐私,设有操作权限管控和本地数据处理机制;对中文指令和国产生态有深度优化。

  • 小度全产品矩阵亮相 AWE,看大模型时代如何让 AI 真正走进千家万户

    3月12日,中国家电及消费电子博览会(AWE2026)将在上海开幕。作为行业领先的AI助手硬件品牌,小度科技将首次携全系产品矩阵亮相,展示其“场景+AI+硬件”战略的落地成果。从智能音箱、智能屏到AI眼镜、智能摄像头等硬件,以及AI酒店、AI养老等行业解决方案,小度将呈现一个完整的AI生态。这一切的背后,是2025年底升级的“超能小度”——基于大模型打造的多模态AI智能助手,让小度产品真正具备了“看见”世界、“思考”需求的能力。在AWE现场,观众将有机会亲身体验多模态AI如何重塑家庭看护、随身办公、智能交互等场景。小度正以实际行动回答:大模型时代,AI应如何走进千家万户。

  • AI日报:谷歌Nano Banana 2正式上线;可灵3.0全球视频模型第一;周鸿祎直言AI眼镜难做

    本期AI日报聚焦多领域进展:谷歌Gemini App更新,图像生成模型Nano Banana 2上线,支持2K分辨率与文字渲染;快手可灵3.0在视频生成基准测试中表现优异,彰显中国AI技术领先地位;周鸿祎指出AI眼镜硬件门槛高,未来应聚焦智能体技术;阿里巴巴推出千问AI眼镜,整合生态提供智能生活体验;xAI联合创始人离职引发核心团队变动关注;豆包手机助手回应安全争议,称未收到漏洞报�

  • OpenClaw中文版Molili开放自定义大模型接入 国产AI智能体再突破

    3月5日,OpenClaw中文版Molili正式上线自定义接入大模型功能。该产品以极致自由度、全链路本土化适配与零门槛操作为特点,为个人及企业用户提供全新AI自动化解决方案,推动桌面AI智能体从“对话交互”向“落地执行”深度转型。核心亮点包括自定义大模型接入、全场景使用自由,支持企业无缝接入私有模型,个人用户可自主选择偏好模型,打破传统AI工具模型绑定限制。产品突破“重对话、轻执行”行业痛点,实现真实电脑端操作,覆盖文件处理、信息搜索等重复性任务,支持微信、钉钉等多平台远程指挥,并搭载8000+技能矩阵,全方位保障用户隐私与数据安全。

今日大家都在搜的词: