首页 > 原创 > 关键词  > AI日报最新资讯  > 正文

AI日报:MiniMax发布视频智能体Hailuo Agent;昆仑万维开源 Skywork-SWE-32B;B站接入Qwen 3等模型

2025-06-20 16:30 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、MiniMax重磅发布视频Agent工具:一句话生成高清视频,人脸ID还能完美一致!

MiniMax推出了视频Agent工具,支持文本到视频生成及人脸图片驱动的视频生成,大幅降低创作门槛,适用于多种场景,展现了其多模态AI技术的实力。

image.png

【AiBase提要:】

🎥 文本到视频生成,一句话即可生成高清视频,适合各类创作需求。

👤 支持人脸图片驱动,视频中人物身份特征高度一致,满足个性化需求。

🌐 基于多模态AI技术,提供视频生成API接口,助力开发者和企业创新。

2、昆仑万维发布并开源 Skywork-SWE-32B:开源软件工程智能体模型引领新风潮

昆仑万维发布的Skywork-SWE-32B在软件工程任务中表现出色,刷新了开源模型的最佳成绩,并通过自动化流程构建了大规模高质量数据集。

image.png

【AiBase提要:】

🌟 Skywork-SWE-32B在SWE-bench Verified基准上取得38.0%的pass@1准确率,刷新了现有32B开源模型的最佳成绩。

📈 引入测试时扩展技术后,准确率提升至47.0%,显著缩小了与闭源模型的性能差距。

🔍 昆仑万维建立了自动化流程,构建出超1万条高质量、可验证的SWE任务数据集,为模型训练奠定基础。

详情链接:https://quixotic-sting-239.notion.site/eb17f379610040ceb54da5d5d24065bd

3、B站接入通义千问Qwen3等模型 推出数据洞察智能体InsightAgent

B站通过接入通义千问Qwen3、Qwen-VL等模型,推出了数据洞察智能体InsightAgent,显著提升了其商业平台‘花火’和‘必达’的效率。在618电商大促期间,‘花火’平台的AI选人功能使商单成交效率提高了5倍以上,而‘必达’平台则利用InsightAgent生成智能报告,缩短了品牌投放决策时间。

【AiBase提要:】

✨ B站接入通义千问Qwen3等模型,推出数据洞察智能体InsightAgent。

🚀 ‘花火’平台的AI选人功能大幅提升商单成交效率,实现5倍增长。

📊 ‘必达’平台应用InsightAgent生成智能报告,加速品牌投放决策过程。

4、灰测!ChatGPT 深度整合谷歌 Gmail 与日历功能

ChatGPT 新增与谷歌 Gmail 和日历的深度整合功能,支持自动邮件回复和日程创建,未来将极大提升工作效率。

image.png

【AiBase提要:】

📧 ChatGPT 整合 Gmail,可自动分析邮件并生成回复与待办事项。

🗓️ 支持通过自然语言指令创建日历事件,同步至设备。

🚀 预计2-3个月内全球上线,强化工作与时间管理效率。

5、名为 “The OpenAI Files” 新网站启动,深扒 OpenAI 内部运作

新网站 ‘The OpenAI Files’ 上线,汇集 OpenAI 内部文件及批评,引发公众对其是否偏离非营利目标的讨论,同时聚焦AI开发的透明度、安全性和监管。

image.png

【AiBase提要:】

🌐 新网站 ‘The OpenAI Files’ 汇集对 OpenAI 的内部批评与文档。

📊 该平台关注 OpenAI 是否偏离非营利目标,转而服务投资者。

🛡️ 目的是引发公众讨论 AI 开发中的透明度、安全性与监管问题。

详情链接:https://www.openaifiles.org/

6、腾讯云推出全链路AI驱动应用开发平台“AI Builder”

腾讯云AI Builder通过自然语言处理技术,降低应用开发门槛,使无技术背景用户也能轻松创建小程序或网页应用。

image.png

【AiBase提要:】

✨ 用户仅需用自然语言描述需求,AI Builder即可自动完成从设计到上线的全流程。

⚙️ 平台自动配置后端资源,确保应用生成即可用,支持用户局部修改与部署。

🌐 提供低代码编辑器和代码包导出功能,满足普通用户和专业开发者不同需求。

详情链接:https://tcb.cloud.tencent.com/

7、HeyGen重磅推出UGC广告数字人

HeyGen推出的UGC广告数字人功能利用AI技术,通过简单的操作就能生成高质量的广告视频,大幅降低制作成本和时间,为品牌营销带来革新。

【AiBase提要:】

✨ 一键生成真实感UGC广告:上传产品图片、选择数字人形象、输入脚本,几分钟内即可生成高质量广告视频。

🤖 Avatar IV技术支持超现实体验:实现高度逼真的面部表情、肢体动作和语音同步,适用于多语言版本。

📈 推动UGC营销普及:解决传统UGC创作痛点,提高互动性和转化率,助力品牌全球化营销。

8、无需邀请码!Manus AI推出Windows桌面应用程序

Manus AI的Windows桌面应用程序已上线Microsoft Store,提供从数据分析到代码生成的全面支持,通过本地化性能优化和深度集成Windows生态,显著提升用户体验。

【AiBase提要:】

✨ 强大的自主性:Manus AI能自主规划并执行复杂任务,如任务管理和代码生成,大幅提升效率。

💻 本地化体验:利用本地计算资源,提供更快响应速度和更低延迟,支持离线任务处理。

🌐 深度集成:与Windows生态深度融合,适配多种场景,包括办公、开发和创意领域。

9、用AI会让人变笨!研究揭示:过度依赖AI或导致损坏批判性思维与记忆力

麻省理工学院的一项研究表明,尽管大型语言模型(LLM)如ChatGPT能带来便利,但过度依赖可能削弱个体的学习技能,包括记忆力和批判性思维能力。

image.png

【AiBase提要:】

🧠 LLM组参与者的大脑连接性减弱,记忆和所有权受损,长期使用可能削弱学习技能。

⏳ 即便LLM初期提升效率,但长期看可能以牺牲深度学习成果为代价,形成认知负债。

📚 教育环境中结合AI工具与无工具学习阶段,有助于平衡即时技能转移与长期神经发展。

10、Perplexity重磅升级!定时任务+SEC金融数据,炒股分析神器来了!

Perplexity推出定时任务功能,结合SEC数据,为金融从业者提供高效研究工具,提升信息获取效率。

【AiBase提要:】

📈 定时任务功能上线,自动整理金融资讯,节省手动搜索时间。

📊 SEC数据加持,将复杂数据转化为易懂分析结果,支持多维度查询。

🤖 AI交互体验直观,适合个人投资者及专业分析师,助力精准投资决策。

11、Mozilla 宣布停运 AI 内容检测工具 “Deep Fake Detector”

Mozilla 宣布将于6月26日停运其 AI 内容检测扩展程序“Deep Fake Detector”。尽管该工具曾帮助用户识别AI生成内容,但活跃用户不足3300人。这一决定可能反映了Mozilla对AI生成内容的默认接受态度,也凸显了用户对辨别AI内容真实性工具的需求。

image.png

【AiBase提要:】

🌟 Mozilla 将于6月26日停运 “Deep Fake Detector” 扩展程序,标志着对AI生成内容态度的转变。

🔍 该工具虽基于开源模型,但因活跃用户少,未能广泛推广,暴露了用户需求与实际使用之间的差距。

📰 关闭检测工具可能暗示Mozilla对AI内容的默认接受,这对依赖高质量内容的用户来说是个挑战。

12、人人皆可创作音乐!腾讯 AI Lab 推出开源音乐生成大模型 SongGeneration

SongGeneration 是腾讯 AI Lab 推出的开源音乐生成大模型,解决了音质、音乐性和生成速度的问题,支持文本控制、多轨合成和风格跟随等功能,通过预训练的3B参数架构,为音乐创作提供强大支持。

image.png

【AiBase提要:】

🎶 SongGeneration 提升了音乐生成的音质与速度,解决行业难题。

🎤 用户可通过关键词或参考音频生成个性化音乐,创作更自由。

🎵 基于3B参数的大型架构,经过海量歌曲预训练,实现智能化音乐生成。

详情链接:https://huggingface.co/spaces/tencent/SongGeneration

13、快手重磅推出 OneRec 推荐系统,开启智能推荐新时代!

我对于快手推出OneRec感到非常兴奋,它不仅大幅提升了推荐效率,还降低了运营成本,让用户获得更加个性化的体验。这种创新让我看到了短视频行业未来的无限可能。

【AiBase提要:】

利用先进大模型技术重塑传统推荐架构,计算效率提升10倍。

OneRec已上线快手App及极速版,承担约25%的每秒请求数量,显著提升用户体验。

系统降低运营成本至传统方案的10.6%,推动行业进入‘端到端生成式觉醒’新阶段。

14、ChatGPT 新笔记工具发布:隐形记录,智能整理会议精华

ChatGPT推出新笔记工具,主打隐形记录与智能整理,主要面向会议记录、头脑风暴及个人笔记管理,通过强大的自然语言处理能力实时生成结构化笔记。

image.png

【AiBase提要:】

✨ 主打‘隐形’记录体验,用户点击图标即可后台录音并自动生成转录与结构化笔记。

📝 利用记忆功能与提示词,提供个性化笔记生成,支持提炼关键点与总结报告。

🌟 逐步开放至Pro、Enterprise等用户,与API集成后可拓展至更多工作流平台。

15、宇树科技近期已完成C轮融资交割

宇树科技完成了C轮融资交割,多家知名投资机构参与,投前估值超100亿元人民币,公司可能为未来上市做准备。

【AiBase提要:】

宇树科技完成C轮融资交割,多家知名投资机构参与,包括中国移动旗下基金、腾讯、阿里、蚂蚁金服和吉利资本。

公司投前估值超100亿元人民币,部分投资人认为估值仍显保守,表现引人注目。

宇树科技更名为股份有限公司,可能为上市做准备,创始人王兴兴对在香港上市持开放态度。

举报

  • 相关推荐
  • AI日报:阿里通义开源音频生成模型ThinkSound;谷歌Veo3支态图片生成视频;昆仑万维发布 Skywork-R1V 3.0

    【AI日报】今日AI领域重要动态:1)阿里开源支持链式推理的音频生成模型ThinkSound,实现高保真空间音频生成;2)谷歌Veo3升级,支持静态图片生成生动视频;3)Hugging Face发布30亿参数小模型SmolLM3,性能优于Llama-3.2-3B;4)阿里开源网络智能体WebSailor,展现强大推理和检索能力;5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5;6)Vidu Q1支持最多七张参考图像生成一致性视频;7)苹果�

  • AI日报:美图发布影像AI Agent RoboNeo;1.8bit量化Kimi K2模型上线;亚马逊推AI代码编辑器 Kiro

    【AI日报】今日AI领域重要动态:1)美图推出RoboNeo,通过自然语言指令实现图片精修、品牌设计等全能影像处理;2)Unsloth AI将Kimi K2模型量化至1.8bit,体积缩减78%保持性能;3)谷歌Gemini嵌入模型登顶MTEB榜单,超越OpenAI;4)亚马逊发布免费AI代码编辑器Kiro,集成Claude模型;5)Claude新增应用工具目录功能提升工作效率;6)MiniMax完成近3亿美元融资,估值超40亿美元;7)UTCP新协议让AI代理直

  • A日报:月之暗面开源大模型Kimi K2;智源全面开源RoboBrain2.0;通义千问发布Qwen Chat桌面客户端

    本期AI日报重点报道了多项AI领域突破性进展:1.月之暗面推出万亿参数开源大模型Kimi K2,展现强大智能能力;2.智源研究院开源RoboBrain2.0和RoboOS2.0机器人系统;3.通义千问发布桌面客户端Qwen Chat;4.IndexTTS2实现影视级语音合成;5.HuggingFace开源机器人Reachy Mini热销;6.Meta推出实时视频生成模型StreamDiT;7.PixVerse新增多关键帧视频生成功能;8.特斯拉推出仅支持AMD处理器的Grok AI助手;9.OpenAI推迟开源大模型发布以加强安全测试;10.Liquid AI开源边缘AI模型LFM2;11.AI"时间穿越"特效在社交媒体走红。

  • A日报:B站升级动漫视频生成模型AniSora V3;字节开源4D视频生成框架EX-4D;DeepSWE开源AI Agent系统强势登顶

    AI日报栏目汇总了近期AI领域的重要进展:1)字节跳动开源EX-4D框架,可将单目视频转换为多视角4D视频;2)B站开源动漫视频生成模型AniSora V3,支持多种风格;3)DeepSWE+开源基于Qwen3-32B的AI Agent系统;4)字节开源3亿参数图像编辑模型VINCIE-3B;5)Stability AI推出移动端音频生成模型Stable Audio Open Small;6)谷歌发布免费教育AI工具套件Gemini for Education;7)Topview推出革命性AI数字人带货技术Avatar

  • LiblibAI 重磅发布「星流 Agent」:中文语义 + 图片视频3D全能生成,中国最强设计 Agent

    LiblibAI推出Lovart中文版"星流Agent",这是一款专为中国市场深度优化的AI设计工具。该产品在保留Lovart全球版"生成-编辑-排版-交付"全链路能力基础上,针对中文语义、国风审美和本土使用场景进行了全面重构。星流Agent支持从创意构思到设计交付的全流程自动化,可处理平面设计、视频生成和3D建模等跨模态创作,内置符合中国文化的视觉风格库。该产品的推出标�

  • 最强Agent?3分钟看懂Kimi K2真的好用吗?

    Moonshot AI于2025年7月11日发布开源大模型Kimi K2,主打代码编写、数学推理和Agent工具调用功能。该模型采用MoE架构(1T参数,激活32B),在SWE-Bench等测试中表现优异,数学推理得分达97.4。支持128k上下文、工具调用和API集成,定价为输入4元/百万tokens、输出16元/百万tokens。相比闭源模型,Kimi K2具有开源免费、成本低等优势,适合开发者和企业使用。同时推荐AIbase平台,可系统比较�

  • MasterAgent颠覆性上线:一键式生成智能体集群,分钟级构建专属AI协作网络

    全球首个L4+级智能体母系统MasterAgent在深圳发布,标志着AI从"被动执行工具"升级为能主动思考、跨界解决问题的"数字伙伴"。该系统突破性实现三大功能:一键生成智能体集群、多智能体自主协作、灵活定制优化。核心技术突破包括动态Agent生成框架将开发周期压缩至分钟级,以及去中心化多智能体协同机制,支持数百个智能体像"数字团队"一样高效协作。由深圳深元人工智能科技自主研发,其团队依托中国科学技术大学专家资源,已快速成长为国家级高新技术企业。这一突破让AI真正成为能创造实际价值的"新生产力单元"。

  • AI日报:xAI 震撼发布Grok4;微软开源全新Phi-4-mini版本;上海累计82款大模型通过备案

    AI日报栏目聚焦人工智能领域最新动态:1)xAI发布旗舰模型Grok4,在数学推理和代码生成表现突出,同时推出开发者专用Grok4Code;2)微软开源Phi-4-mini模型,推理效率提升10倍,适合边缘设备;3)上海82款大模型完成备案,垂直领域应用取得突破;4)Hugging Face推出开源桌面机器人Reachy Mini,支持Python编程;5)Perplexity发布AI浏览器Comet挑战Chrome;6)OpenAI将首次发布开放权重模型,打破闭源惯例;7)谷歌医疗AI模型MedGemma系列上新,单个GPU即可运行;8)OpenAI以约65亿美元收购AI硬件公司io Products,正式进军硬件市场。

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • 「6月26日AI日报」可灵AI推全球首部AIGC单元剧;谷歌开源AI智能体Gemini CLI

    AI行业近期动态汇总:1)豆包AI编程升级为"应用创作1.0",支持可视化编辑和实时预览,降低开发门槛;2)谷歌开源Gemini CLI工具,集成Gemini 2.5 Pro模型,提供免费编程助手;3)Anthropic推出"Artifacts"功能,用户无需编程即可在Claude中创建AI应用;4)出门问问发布TicNote+硬件产品,内置Shadow AI技术;5)OpenAI将Codex CLI重构为Rust语言以提升性能;6)谷歌发布Imagen4文生图模型,突�