首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:美团已开发内部大模型LongCat;vivo成立机器人LAB独立中心;腾讯发布混元T1正式版

2025-03-24 15:23 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、阿里通义实验室LHM技术实现从单图像的快速3D 人体重建与动画生成

阿里通义实验室的LHM技术在3D人体重建领域取得了重要突破,利用多模态变换器架构和头部特征金字塔编码方案,显著提高了重建精度和效率。该技术能够从单个图像快速生成动画化的3D人体模型,且无需复杂的后期处理,展现出优越的泛化能力,适应不同场景和光照条件,推动了该领域的应用前景。

【AiBase提要:】

🛠️ LHM模型通过多模态变换器架构,有效编码人体位置和图像特征,实现高精度的3D重建。

👤 头部特征金字塔编码方案增强了对头部细节的捕捉,使生成的模型更加逼真。

⏱️ LHM技术在几秒钟内生成动画人体,显著节省时间和人力成本,适用于实际应用。

详情链接:https://lingtengqiu.github.io/LHM/

2、腾讯发布混元 - T1正式版,推理能力大幅提升

腾讯最近正式推出了混元 - T1,这款新模型在推理能力上有了显著提升,特别是在深度思考和复杂问题解决方面表现优异。基于行业领先的TurboS底座,混元 - T1通过大规模后训练,解决了长文本推理中的上下文丢失问题,并在计算资源消耗上进行了优化。

image.png

【AiBase提要:】

⚡ 混元 - T1基于TurboS底座,推理能力显著增强,尤其在深度思考方面表现突出。

📊 经过大规模后训练,模型在解码速度上达到了两倍提升,同时优化了计算资源的消耗。

🧠 团队专注于强化学习,收集了大量理科难题,确保模型在多领域推理任务中展现卓越表现。

详情链接:https://llm.hunyuan.tencent.com/?ref=producthunt#/chat/hy-t1

3、手机巨头进军机器人赛道,vivo 机器人 LAB 正式成立

vivo 最近成立了专注于家庭机器人研发的实验室,标志着其在机器人领域的进一步探索。公司高层表示,vivo 在人形机器人领域具备独特的技术优势,尤其是在智能算法和混合现实技术方面。未来,vivo 计划利用这些技术解决行业中的技术难点,并在医疗和养老等领域应用机器人,以应对人力资源短缺的挑战。

【AiBase提要:】

🤖 vivo 成立机器人 LAB,专注于家庭机器人研发,标志着其在机器人领域的探索。

🧠 胡柏山表示,人形机器人是未来可能切入的行业,vivo 在智能算法和混合现实技术方面具备优势。

🏥 机器人在医疗和养老等领域的应用,旨在缓解人力资源紧缺的问题,体现企业社会责任。

4、王兴:美团已开发内部大模型LongCat 投资数十亿元GPU资源

美团在2024年全年实现了3376亿元人民币的营收,增长22%。CEO王兴在业绩发布会上阐述了美团在人工智能领域的战略,包括对AI基础设施的投资和大模型Longcat的研发。美团计划将AI技术广泛应用于员工工作流程和产品升级,提升运营效率。

【AiBase提要:】

💰 美团2024年营收达到3376亿元,同比增长22%,展现出稳健的增长动力。

🧠 CEO王兴透露,美团将加大对AI基础设施的投资,计划在2025年进一步强化AI布局。

🚚 自动配送领域的进展显著,完成491万单配送任务,并在全球范围内拓展商业化运营。

5、苹果重组AI高管团队,Siri升级推迟至2026年

苹果公司近期对其高管团队进行了重大调整,旨在提升人工智能战略的执行力,尤其是针对其语音助手Siri的项目。由于研发进展滞后,原定于今年推出的升级计划被推迟至2026年,反映出苹果在面对竞争压力时的紧迫感。新任命的Siri项目负责人迈克·洛克威尔将直接向软件工程主管汇报,标志着苹果在AI领域的重大调整。

【AiBase提要:】

🔍 苹果对高管团队进行重组,以提升人工智能战略的执行力。

📅 Siri多项升级计划已被推迟至2026年,显示出研发进展的滞后。

👔 迈克·洛克威尔接替前负责人,标志着苹果在AI领域的重大调整。

6、谷歌推Gemini实时AI视频功能,手机摄像头实时解读画面内容

谷歌最近推出了Gemini Live的新功能,使其能够通过手机摄像头实时回答用户的问题。这一创新是在近一年的研发后首次面世,用户在小米手机上已经体验到了这一功能,并分享了演示视频。此次更新不仅增强了谷歌在智能助手市场的竞争力,也为用户提供了更加智能和便捷的互动体验,显示了AI技术的进步和应用潜力。

【AiBase提要:】

🌟 谷歌 Gemini Live 推出新 AI 功能,能够通过手机摄像头实时回答用户问题。

📱 用户在小米手机上已体验到新功能,并发布了相关演示视频。

🚀 此次更新进一步巩固谷歌在智能助手市场的领先地位。

7、新一代AI图像生成模型Reve Image震撼登场,引领创作新潮流

Reve Image是一款全新的AI图像生成模型,专注于提升美学表现和提示遵循能力,旨在为用户提供高质量的视觉创作体验。该模型展现出强烈的设计感,生成的作品简洁大气,具有海报风格的视觉冲击力。用户反馈其生成能力已足以媲美市场领先技术,且平台设计友好,操作流畅。

image.png

【AiBase提要:】

✨ Reve Image专注于提升美学表现和提示遵循能力,提供高质量视觉创作体验。

🖼️ 该模型生成的作品简洁大气,展现出强烈的设计感,具有海报风格的视觉冲击力。

💻 平台界面友好,操作流畅,已开放免费使用,吸引大量创作者尝试。

详情链接:https://top.aibase.com/tool/reve

8、全球首个体重管理AI大模型 “减单” 在合肥发布

在合肥发布的全球首个体重管理AI大模型“减单”,是由安徽医科大学、中国科学技术大学附属第一医院与浙江诺特健康科技股份有限公司共同研发的,旨在帮助超重和肥胖患者有效管理体重。当前中国成人超重率已达34.3%,预计2030年将飙升至70.5%。

【AiBase提要:】

🌍 全球首个体重管理AI大模型“减单”在合肥发布,旨在应对肥胖问题。

📈 当前中国成人超重率达到34.3%,预计到2030年将飙升至70.5%。

🤖 “减单”模型结合多种数据,能智能分析饮食情况,帮助用户健康管理体重。

9、开源实时识别模型RF-DETR:实时识别画面中的物体,开源可商用

RF-DETR是由Roboflow团队开发的一款开源实时目标检测模型,旨在解决YOLO系列模型在速度和精度上的不足。它在COCO数据集上实现了超过60%的平均精度,并且在GPU上具备极低的延迟,适用于自动驾驶、工业质检等需要快速反应的场景。

image.png

【AiBase提要:】

⚡ RF-DETR是开源的实时目标检测模型,速度和精度超越YOLO系列。

📊 在COCO数据集上,RF-DETR实现了超过60%的平均精度,展现出强大的性能。

🔧 支持多分辨率训练,开发者可灵活调整模型以平衡精度和延迟。

详情链接:https://top.aibase.com/tool/rf-detr

10、Cloudflare 推出 “AI 迷宫”,引导恶意爬虫走入虚假数据陷阱

Cloudflare 最新推出的 “AI Labyrinth” 工具旨在通过引导恶意网络爬虫进入 AI 生成的虚假页面,来有效打击未经授权的数据抓取行为。这一创新措施不仅可以拖延和迷惑爬虫,还能帮助网站管理员识别新的爬虫模式。通过这种主动出击的方式,Cloudflare 希望减少爬虫对网站的影响,并为未来构建更复杂的虚假数据网络奠定基础。

image.png

【AiBase提要:】

🛡️ AI Labyrinth 通过生成虚假页面来引导恶意爬虫,浪费其资源。

📊 网站管理员可在 Cloudflare 仪表板上启用此功能,未来还将扩展为更复杂的链接网络。

🔍 该工具帮助识别恶意爬虫,并了解新出现的爬虫模式和特征。

详情链接:https://blog.cloudflare.com/ai-labyrinth/

11、AbletonMCP :调用Ableton的MCP服务,让Claude能够创作音乐

AbletonMCP 是一款创新工具,通过模型上下文协议将音乐制作软件 Ableton Live 与 Claude AI 连接,提供了一种全新的音乐创作体验。该系统由 Ableton 远程脚本和 MCP 服务器组成,用户可以通过 Claude 与 Ableton 进行互动,执行各种音乐制作指令。

image.png

【AiBase提要:】

🎛️ AbletonMCP 将 Ableton Live 与 Claude AI 连接,实现音乐创作的新方式。

🛠️ 系统由 Ableton 远程脚本和 MCP 服务器两部分组成,支持多种音轨和剪辑操作。

💻 用户通过 Claude 与 Ableton 互动,执行指令以控制音乐制作流程。

详情链接:https://top.aibase.com/tool/abletonmcp

举报

  • 相关推荐
  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • AI日报美团AI编程工具NoCode将上线;火山引擎发布MCP Servers;腾讯混元上线游戏视觉生成平台

    本文汇总了近期AI领域的重要动态:1)美团将推出对话式编程工具"NoCode";2)火山引擎发布大模型生态平台MCP Servers;3)B站开源动画视频生成模型Index-AniSora;4)字节跳动升级AI耳机Ola Friend的英语学习功能;5)GitHub推出AI编程助手自动修复代码漏洞;6)腾讯混元上线游戏视觉生成平台;7)微软将VS Code转型为开源AI编辑器;8)Windows 11原生支持MCP协议;9)Anthropic发布AI代理开发指南;10)谷歌推出编程AI代理Jules;11)NotebookLM推出iOS版;12)Genspark创3600万美元ARR纪录;13)Bright Data发布开源MCP服务器;14)马斯克宣布Grok模型将登陆Azure平台。这些进展展示了AI技术在编程、内容生成、操作系统等领域的快速发展和应用创新。

  • AI日报:谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • 普渡机器人发布AI全能清洁机器人PUDU CC1 Pro,商用清洁迈入AI时代

    5月27日,深圳普渡科技发布AI全能清洁机器人PUDU CC1 Pro。该产品通过AI技术实现全流程智能化清洁,具备垃圾识别、力度调节、效果监测等功能,每小时清洁面积达1500-3000㎡。创新性地采用后视AI相机检测二次污染,搭载VSLAM+激光融合定位技术,简化部署流程。产品获得CE-MD认证,适用于商业综合体、医院等大场景。普渡科技作为服务机器人领导品牌,产品已覆盖全球60多个国家�

  • AI日报ChatGPT免费开放记忆功能;华为WATCH 5智能手表接入双大模型Claude Pro升级重磅功能

    本期AI日报主要报道了多项AI领域重要进展:1)OpenAI向所有ChatGPT用户免费开放记忆功能;2)蚂蚁集团推出"AI健康管家",服务4000万用户;3)Anthropic与DeepLearning.AI合作推出免费MCP课程;4)谷歌DeepMind开发无需3D模型即可生成逼真运动视频的新技术;5)Exa与OpenRouter合作为400+大模型提供实时网络搜索功能;6)中国知网推出CNKI AI学术研究助手;7)Anthropic推出Claude Explains博客项目;8)Claude Pro新增研究模式和远程MCP整合功能;9)Fish Audio发布基于200万小时数据训练的OpenAudio S1语音模型;10)OpenAI升级Codex编程工具;11)华为WATCH5接入盘古和DeepSeek双大模型。

  • AI日报腾讯混元图像2.0毫秒级生图;Windsurf重磅发布SWE-1系列;MiniMax Speech-02登顶全球TTS榜首

    本期AI日报重点报道了多项AI领域最新进展:1)腾讯发布混元图像2.0模型,实现毫秒级图像生成;2)Windsurf推出全流程软件工程AI模型SWE-1系列;3)DeepSeek发布V3模型论文,揭示低成本训练大模型方法;4)Manus推出图像生成Agent,支持多工具协同完成任务;5)ElevenLabs发布可定制音效控制面板工具;6)MiniMax语音模型Speech-02超越OpenAI和ElevenLabs;7)DeepL升级翻译服务并推出写作助手;8)OpenAI占据AI工具市场80%份额;9)Llamafile 0.9.3支持Qwen3模型;10)Hugging Face推出WebGPU驱动的实时摄像头AI SmolVLM;11)Hugging Face上线免费MCP教程;12)复旦与腾讯联合推出视频生成工具DICE-Talk。

  • AI日报:GPT-4.1正式上线ChatGPT;阿里通义万相Wan2.1-VACE开源;可灵大模型视频生成量约占30%份额

    本文报道了AI领域最新动态:1)阿里通义万相开源视频编辑统一模型VACE;2)OpenAI发布GPT-4.1增强编码能力;3)Stability AI推出超轻量341M文字转语音模型;4)快手可灵视频生成模型占据30%市场份额;5)微软WizardLM团队整体加入腾讯混元大模型研发体系;6)腾讯宣布混元图像2.0将于5月16日发布;7)上海成立人工智能标识生态联盟;8)Lightricks发布13B参数视频生成模型LTX-Video;9)谷歌DeepMind推出AlphaEvolve优化AI训练速度;10)腾讯元宝浏览器插件上线Chrome平台。这些进展展示了AI技术在视频处理、大模型、语音合成等领域的快速发展。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • AI日报:夸克发布首个高考志愿大模型Trae月活跃用户破100万;Manus推出免费无限聊天模式

    【AI日报】今日AI领域热点速览: 1. 夸克APP推出高考志愿大模型,免费提供个性化填报指导 2. Manus AI开放免费无限聊天模式,挑战行业巨头 3. Trae开发者平台月活破百万,累计交付60亿行代码 4. 迪士尼环球起诉Midjourney侵犯影视版权 5. 维基百科暂停AI生成摘要实验 6. 360发布"纳米AI超级搜索智能体",内置80多款大模型 7. PartCrafter项目实现单张图片生成高精度3D模型 8. Meta推出AI视频编辑工具,支持50多种预设效果 9. 阿里工程师放弃春节假期全力追赶DeepSeek技术 10. 火山引擎发布PromptPilot智能提示优化平台 11. OpenAI洽谈400亿美元融资,拓展AI生态系统 12. 新一代o3-pro推理模型发布并调整API定价策略