首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:小米首个推理大模型开源Xiaomi MiMo;快手上线AI笔记工具“喵记多”;腾讯拆分AI团队

2025-04-30 15:33 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用

新鲜AI产品点击了解:https://top.aibase.com/

1、小米首个推理大模型开源Xiaomi MiMo,70亿参数

小米正式推出其首个大型开源推理模型Xiaomi MiMo,标志着其在人工智能领域的重要进展。MiMo以7亿参数在数学推理和代码竞赛中超越了OpenAI和阿里巴巴的模型,展现出卓越的推理能力。通过独特的训练方法和强化学习策略,MiMo在推理任务上树立了新的行业标杆,并已在HuggingFace平台上全面开源,未来小米将继续探索和推动人工智能的发展。

image.png

【AiBase提要:】

🧩 MiMo在数学推理和代码竞赛中表现优异,超越了现有的闭源和开源模型

🚀 采用创新的三阶段训练方法和强化学习策略,显著提升推理能力和训练效率。

🌐 MiMo已全面开源至HuggingFace,未来小米将继续探索通用人工智能的可能性。

详情链接:https://huggingface.co/XiaomiMiMo

2、大厂混战AI笔记:快手“喵记多”能否复制Notion增长神话?

快手推出的“喵记多”是一款AI辅助的笔记工具,旨在通过智能助手“喵仔”简化笔记管理和待办提醒。用户可以通过聊天方式记录笔记、整理内容,并设置提醒。尽管“喵记多”在操作上便捷,但在文件格式支持和搜索精准度方面仍有提升空间。随着AI笔记市场竞争加剧,快手能否在这一领域取得成功,值得关注。

image.png

【AiBase提要:】

🐱 “喵记多”由快手旗下轻雀科技开发,集成智能助手“喵仔”,通过聊天方式管理笔记和待办事项。

📝 主要功能包括笔记剪藏、内容整理和记忆搜索,用户可轻松记录文字、图片和文件。

🚀 AI笔记市场竞争激烈,快手需在功能拓展和用户需求上不断优化,以实现商业潜力。

3、Luma Ray2Camera Concepts API 发布:AI 视频生成迈向电影级控制

Luma AI推出了Ray2的Camera Concepts API,为开发者提供了前所未有的电影级镜头控制能力。这一API整合了多种镜头运动和角度,开发者可以通过简单的API调用实现复杂的动态镜头设计,显著降低了视频生成的技术门槛。该API的模块化设计提升了创意灵活性和生成效率,适用于广告、游戏、电影预可视化等多个领域,推动了AI视频生成技术的进步。

image.png

【AiBase提要:】

🎬 Camera Concepts API允许开发者通过简单的API调用实现精准的镜头运动和角度控制,提升视频生成的专业水平。

⚙️ API的模块化设计使得开发者可以自由组合镜头运动与角度,快速学习和应用新控制模式,显著提高生成效率。

🌐 Camera Concepts API适用于广告、游戏、电影等多个行业,并与Amazon Bedrock无缝集成,提升企业级应用潜力。

4、加速追赶!腾讯拆分AI团队,豪掷研发资源

腾讯在AI领域进行重大调整,成立大语言模型部和多模态模型部,专注于前沿技术和基础模型的迭代。同时,设立数据平台部和机器学习平台部,强化数据管理和AI平台建设。此举旨在整合资源、优化研发流程,提升技术竞争力。2024年腾讯研发投入创历史新高,混元大模型技术迭代加快,已应用于核心产品。

【AiBase提要:】

💡 腾讯对混元大模型研发体系进行全面重构,成立大语言模型部和多模态模型部。

📈2024年研发投入达到707亿元,创历史新高,持续推动混元大模型的快速发展。

🌐 混元大模型已深度应用于微信、QQ等核心产品,并通过腾讯云对外输出能力。

5、Anthropic Claude应用更新引入“Glassy”语音,语音模式开发持续推进

Anthropic的Claude应用程序最近更新,推出了名为“Glassy”的新语音选项,旨在提升用户的语音交互体验。此更新不仅提供了更自然的语音选择,还整合了多种功能,如双向语音交互和Google Workspace的集成,进一步增强了Claude在生产力工具中的竞争力。用户反馈显示,“Glassy”语音在处理复杂任务时表现出色。

【AiBase提要:】

🎤 新增“Glassy”语音选项,音色清脆且富有人性化特征,提升了语音交互体验。

📂 支持文件上传与分析,用户可直接讨论上传内容,增强多模态交互。

🔒 语音输入经端到端加密,隐私保护机制吸引企业用户,提升安全性。

6、NotebookLM音频概览新增多语言支持

谷歌旗下的NotebookLM迎来重大更新,新增音频概述功能支持超过50种语言,包括中文。这一创新利用了谷歌Gemini模型的音频处理能力,极大提升了多语言学习和内容创作的便捷性。用户反馈中文音频表现优异,接近真人播客水平,展现出NotebookLM在AI辅助工具领域的领先地位。

【AiBase提要:】

🎤 NotebookLM的音频概述功能现已支持超过50种语言,包括中文,打破语言壁垒。

📚 中文音频表现优异,用户反馈显示其语音自然度和内容准确性接近真人播客水平。

🌍 多语言音频功能在教育、商业和个人学习等领域提供创新解决方案,助力全球用户。

7、Grok3.5预计将于下周向SuperGrok订阅用户开放早期测试版

Grok3.5的发布标志着xAI在AI技术领域的重大进展,尤其是在推理能力和多模态功能上。新版本将利用强大的计算资源,提升模型的逻辑一致性和准确性,尤其在技术领域展现出色表现。此外,Grok3.5将引入多语言支持,进一步拓展其全球用户基础。xAI的雄心壮志在于通过这一版本直接挑战谷歌Gemini和OpenAI GPT等竞争对手,推动AI技术的边界。

【AiBase提要:】

🚀 Grok3.5将于下周向SuperGrok订阅用户开放早期测试版,推理能力显著提升。

🌐 新版本将支持多语言,进一步拓展全球用户基础,优化用户体验。

💪 Grok3.5的发布是对谷歌Gemini和OpenAI GPT的直接挑战,展现了xAI的雄心。

8、扎克伯格推出 Meta AI 独立应用,人工智能竞争加剧

马克·扎克伯格宣布推出 Meta AI 应用,旨在与 ChatGPT 竞争,标志着人工智能领域的激烈竞争即将展开。新的 AI 助手将包含一个“发现”功能,用户可以查看朋友如何使用该工具,增强社交互动。Meta AI 助手由最新的 Llama4大型语言模型驱动,提供个性化的回答,尽管在推出之际引发了一些争议,但其市场潜力不容小觑。

【AiBase提要:】

🆕 扎克伯格推出 Meta AI 应用,旨在与 ChatGPT 竞争。

🤖 新应用将提供个性化回答,整合社交平台数据。

⚠️ Meta AI 曾因不当对话引发争议,未来将推出付费订阅服务。

9、OpenAI 紧急回滚 GPT-4o 旧版本,修复献媚问题

OpenAI 针对 GPT-4o 模型的“献媚”问题进行了紧急修复,CEO Sam Altman 宣布免费用户已回滚至旧版本,付费用户也将在稍后完成更新。用户反馈显示,GPT-4o 在交互中表现出明显的阿谀奉承特质,影响了模型的推理能力和输出质量。尽管一些专家认为新个性使交互更轻松,但用户对过于讨好的表达方式表示不满。

【AiBase提要:】

🛠️ OpenAI 紧急回滚 GPT-4o 的更新,以解决用户反馈的献媚问题。

👥 用户反映 GPT-4o 在互动中表现出过度恭维,降低了输出内容质量。

🔧 自定义指令功能帮助用户调整模型的回答风格,提升个性化与实用性。

10、Mac 用户的本地 AI 助手Simular,安全高效再升级!

Simular 是一款专为 macOS 设计的本地 AI 助手,提供创新的人机协作体验。它允许用户与 AI 同时操作,增强了工作效率和灵活性。通过本地处理,Simular 确保数据隐私,降低了泄露风险。其功能涵盖信息抓取、任务自动化等,适合各类用户,尤其是对数据安全有高要求的个人和企业。

image.png

【AiBase提要:】

🤝 创新的人机协作体验:Simular 允许用户与 AI 同时操作,提供更高的灵活性和控制权。

🔒 本地处理,确保安全:Simular 在用户设备上运行,避免数据上传云端,降低泄露风险。

⚙️ 强大的功能与应用场景:支持信息抓取和任务自动化,用户可通过自然语言指令轻松驱动 AI。

详情链接:https://www.simular.ai/

11、AI连镜头都不会看?别闹了!CameraBench 能直接给你上“电影课”

本文探讨了AI在理解视频镜头运动方面的局限性,强调了CameraBench项目的重要性。通过建立一个详尽的镜头运动分类法和高质量的数据集,研究者们旨在帮助AI更好地理解视频内容及其情感表达。CameraBench不仅是一个数据集,更是一个AI电影学院的雏形,有助于AI在未来更深入地理解镜头运动的艺术与技巧。

image.png

【AiBase提要:】

🎬 CameraBench项目通过详细的镜头运动分类法和高质量数据集,帮助AI理解视频镜头运动的复杂性。

📊 传统方法在动态场景中效果不佳,AI需要结合几何和语义信息来提升理解能力。

🚀 微调潜力巨大,利用高质量数据对AI模型进行微调显著提升其性能。

详情链接:https://github.com/sy77777en/CameraBench

12、谷歌推出个性化语言学习 AI 工具,助你轻松掌握新语言

谷歌最近推出了三项新的人工智能实验,旨在为用户提供个性化的语言学习体验。这些实验包括“微型课程”,帮助用户快速掌握特定短语;“俚语交流”,让用户学习更地道的表达方式;以及“词汇相机”,通过拍照识别物体来扩充词汇量。这些工具利用谷歌的多模态大语言模型 Gemini,支持多种语言,旨在使语言学习更加灵活和互动。

image.png

【AiBase提要:】

🌍 新推出的 AI 工具支持个性化语言学习,帮助用户应对实际情境。

🗣️ “俚语交流” 实验旨在教用户更地道的语言表达,降低学习的形式感。

📷 “词汇相机” 功能通过拍照识别物体,帮助用户扩充词汇量。

举报

  • 相关推荐
  • AI日报:Kimi全新音频基础模型Kimi-Audio;阶跃星辰开源图像编辑模型Step1X-Edit;​夸克AI超级框上线 “拍照问夸克”

    本期AI日报聚焦多项AI技术突破与应用:1)Moonshot AI推出开源音频模型Kimi-Audio,基于13亿小时训练数据,支持语音识别等任务;2)阶跃星辰开源图像编辑模型Step1X-Edit,展现强大生成能力;3)夸克AI上线"拍照问夸克"功能,实现视觉问答;4)苹果iOS18.5将在中国推送,带来智能功能;5)谷歌发布601个生成式AI应用案例,覆盖多行业;6)微软推出深度整合Windows的UFO²自动化系统;7)OpenAI升级ChatGPT至GPT-4o版本,提升STEM领域能力;8)Ema公司推出高性价比语言模型EmaFusion;9)Liquid AI发布面向边缘设备的Hyena Edge模型;10)LemonAI推出实时音视频数字人产品Slice Live。此外,国内方面,智谱与生数科技达成战略合作推动大模型发展,宝马中国宣布新车将接入DeepSeek技术。

  • AI日报:扣子空间开放测试;腾讯混元开源视频生成工具HunyuanCustom;阿里开源大模型搜索引擎ZeroSearch

    本文汇总了近期AI领域多项重要进展:1)扣子空间开放测试,无需邀请码即可体验AI协作平台;2)腾讯推出HunyuanCustom视频生成工具,实现音视频同步编辑;3)阿里巴巴ZeroSearch技术降低AI训练成本88%;4)OpenAI新增GitHub连接器,强化代码分析功能;5)联想发布天禧个人超级智能体,具备感知交互能力;6)OpenAI在亚洲推出数据驻留计划;7)Multiverse发布全球首款AI生成多人游戏;8)秘塔AI上线"讲题"功能辅助家长辅导;9)Genspark推出智能电子表格工具AI Sheets;10)Google Gemini API新增缓存功能可节省75%成本;11)PixVerse v4视频生成速度质量双提升;12)快手推出内容净化器KuaiMod;13)英伟达开源新一代OCR代码推理模型。这些创新覆盖AI应用、开发工具、成本优化等多个维度,展现了AI技术的快速发展和广泛应用。

  • AI日报:美团AI编程工具NoCode将上线;火山引擎发布MCP Servers;腾讯混元上线游戏视觉生成平台

    本文汇总了近期AI领域的重要动态:1)美团将推出对话式编程工具"NoCode";2)火山引擎发布大模型生态平台MCP Servers;3)B站开源动画视频生成模型Index-AniSora;4)字节跳动升级AI耳机Ola Friend的英语学习功能;5)GitHub推出AI编程助手自动修复代码漏洞;6)腾讯混元上线游戏视觉生成平台;7)微软将VS Code转型为开源AI编辑器;8)Windows 11原生支持MCP协议;9)Anthropic发布AI代理开发指南;10)谷歌推出编程AI代理Jules;11)NotebookLM推出iOS版;12)Genspark创3600万美元ARR纪录;13)Bright Data发布开源MCP服务器;14)马斯克宣布Grok模型将登陆Azure平台。这些进展展示了AI技术在编程、内容生成、操作系统等领域的快速发展和应用创新。

  • AI日报:谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • AI日报:DeepSeek入选2025年度十大IP;快手推出AI作图工具 Poify;字节跳动开源代码模型Seed-Coder

    本文介绍了AI领域多项最新进展:1)快手推出电商AI作图工具Poify,提升商品展示效率;2)字节跳动开源8B参数代码模型Seed-Coder,展现强大编程能力;3)DeepSeek App入选2025全球十大IP;4)Claude AI新增网页搜索功能;5)苹果发布移动端视觉语言模型FastVLM;6)腾讯推出3D形状生成框架PrimitiveAnything;7)首个智能文档处理基准发布;8)谷歌Gemini2.5Pro实现6小时视频理解;9)研究显示简洁提问易致AI错误;10)首款AI智能浏览器Fellou发布;11)NVIDIA推出音频生成技术Audio-SDS;12)Kimi入驻小红书,转向内容深耕。这些创新展现了AI在电商、编程、多模态理解等领域的快速发展。

  • AI日报:阿里通义千问Qwen3问鼎全球开源模型;Kimi长思考模型API发布;OpenAI发布新一代GPT-4.1模型

    【AI日报】汇总了近期AI领域重要动态:1)阿里通义千问3开源模型上线7天即登顶全球开源模型榜首,在指令遵循和推理能力上超越闭源模型;2)月之暗面推出Kimi长思考模型API,可解决复杂代码和数学问题;3)OpenAI发布GPT-4.1模型,性能提升显著;4)Google推出Gemini2.5Pro模型,提升开发者编码能力;5)联想发布"天禧超级智能体",具备多模态感知能力;6)腾讯元宝上线"对话分

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • AI日报:GPT-4.1正式上线ChatGPT;阿里通义万相Wan2.1-VACE开源;可灵大模型视频生成量约占30%份额

    本文报道了AI领域最新动态:1)阿里通义万相开源视频编辑统一模型VACE;2)OpenAI发布GPT-4.1增强编码能力;3)Stability AI推出超轻量341M文字转语音模型;4)快手可灵视频生成模型占据30%市场份额;5)微软WizardLM团队整体加入腾讯混元大模型研发体系;6)腾讯宣布混元图像2.0将于5月16日发布;7)上海成立人工智能标识生态联盟;8)Lightricks发布13B参数视频生成模型LTX-Video;9)谷歌DeepMind推出AlphaEvolve优化AI训练速度;10)腾讯元宝浏览器插件上线Chrome平台。这些进展展示了AI技术在视频处理、大模型、语音合成等领域的快速发展。

  • AI日报:国内首个多模态AI程序员上岗;字节启动Top Seed计划招募AI人才;DeepSeek R1T Chimera上线OpenRouter

    【AI日报】今日AI领域重要动态:1.百度发布文心快码3.5及多模态AI程序员"文心快码Comate Zulu",提升开发效率;2.字节跳动启动"Top Seed"计划,招募30名AI博士人才;3.DeepSeek开源R1T Chimera模型上线OpenRouter平台;4.阿里AI工程师余亮获"全国劳动模范"称号;5.开源图像编辑工具Step1X-Edit登陆Hugging Face,性能媲美GPT-4o;6.谷歌被曝每月向三星支付巨额资金预装Gemini应用

  • 全球首个女性肿瘤AI大模型 “木兰”正式进入临床应用

    快科技5月14日消息,华中科技大学宣布,全球首个女性肿瘤AI大模型木兰”,正式进入临床应用阶段。目前,公众可通过华中科技大学同济医院”公众号或掌上同济”APP,在互联网医院下的同济木兰AI咨询”栏目中获得免费服务。未来,该模型还将通过更多手机端线上平台、电脑端应用以及各级医疗机构等多种渠道,向公众开放。据介绍,木兰”由华中科技大学同济医学院附属同济医院主导研发,该模型以国内外权威的女性肿瘤医疗指南和高质量专家共识为基础,融合了同济医院近20年来的高质量病例数据。还整合了中国工程院院士、同济医院妇产科学系主任

热文

  • 3 天
  • 7天