首页 > 原创 > 关键词  > AI日报最新资讯  > 正文

AI日报:MiniMax发布视频智能体Hailuo Agent;昆仑万维开源 Skywork-SWE-32B;B站接入Qwen 3等模型

2025-06-20 16:30 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、MiniMax重磅发布视频Agent工具:一句话生成高清视频,人脸ID还能完美一致!

MiniMax推出了视频Agent工具,支持文本到视频生成及人脸图片驱动的视频生成,大幅降低创作门槛,适用于多种场景,展现了其多模态AI技术的实力。

image.png

【AiBase提要:】

🎥 文本到视频生成,一句话即可生成高清视频,适合各类创作需求。

👤 支持人脸图片驱动,视频中人物身份特征高度一致,满足个性化需求。

🌐 基于多模态AI技术,提供视频生成API接口,助力开发者和企业创新。

2、昆仑万维发布并开源 Skywork-SWE-32B:开源软件工程智能体模型引领新风潮

昆仑万维发布的Skywork-SWE-32B在软件工程任务中表现出色,刷新了开源模型的最佳成绩,并通过自动化流程构建了大规模高质量数据集。

image.png

【AiBase提要:】

🌟 Skywork-SWE-32B在SWE-bench Verified基准上取得38.0%的pass@1准确率,刷新了现有32B开源模型的最佳成绩。

📈 引入测试时扩展技术后,准确率提升至47.0%,显著缩小了与闭源模型的性能差距。

🔍 昆仑万维建立了自动化流程,构建出超1万条高质量、可验证的SWE任务数据集,为模型训练奠定基础。

详情链接:https://quixotic-sting-239.notion.site/eb17f379610040ceb54da5d5d24065bd

3、B站接入通义千问Qwen3等模型 推出数据洞察智能体InsightAgent

B站通过接入通义千问Qwen3、Qwen-VL等模型,推出了数据洞察智能体InsightAgent,显著提升了其商业平台‘花火’和‘必达’的效率。在618电商大促期间,‘花火’平台的AI选人功能使商单成交效率提高了5倍以上,而‘必达’平台则利用InsightAgent生成智能报告,缩短了品牌投放决策时间。

【AiBase提要:】

✨ B站接入通义千问Qwen3等模型,推出数据洞察智能体InsightAgent。

🚀 ‘花火’平台的AI选人功能大幅提升商单成交效率,实现5倍增长。

📊 ‘必达’平台应用InsightAgent生成智能报告,加速品牌投放决策过程。

4、灰测!ChatGPT 深度整合谷歌 Gmail 与日历功能

ChatGPT 新增与谷歌 Gmail 和日历的深度整合功能,支持自动邮件回复和日程创建,未来将极大提升工作效率。

image.png

【AiBase提要:】

📧 ChatGPT 整合 Gmail,可自动分析邮件并生成回复与待办事项。

🗓️ 支持通过自然语言指令创建日历事件,同步至设备。

🚀 预计2-3个月内全球上线,强化工作与时间管理效率。

5、名为 “The OpenAI Files” 新网站启动,深扒 OpenAI 内部运作

新网站 ‘The OpenAI Files’ 上线,汇集 OpenAI 内部文件及批评,引发公众对其是否偏离非营利目标的讨论,同时聚焦AI开发的透明度、安全性和监管。

image.png

【AiBase提要:】

🌐 新网站 ‘The OpenAI Files’ 汇集对 OpenAI 的内部批评与文档。

📊 该平台关注 OpenAI 是否偏离非营利目标,转而服务投资者。

🛡️ 目的是引发公众讨论 AI 开发中的透明度、安全性与监管问题。

详情链接:https://www.openaifiles.org/

6、腾讯云推出全链路AI驱动应用开发平台“AI Builder”

腾讯云AI Builder通过自然语言处理技术,降低应用开发门槛,使无技术背景用户也能轻松创建小程序或网页应用。

image.png

【AiBase提要:】

✨ 用户仅需用自然语言描述需求,AI Builder即可自动完成从设计到上线的全流程。

⚙️ 平台自动配置后端资源,确保应用生成即可用,支持用户局部修改与部署。

🌐 提供低代码编辑器和代码包导出功能,满足普通用户和专业开发者不同需求。

详情链接:https://tcb.cloud.tencent.com/

7、HeyGen重磅推出UGC广告数字人

HeyGen推出的UGC广告数字人功能利用AI技术,通过简单的操作就能生成高质量的广告视频,大幅降低制作成本和时间,为品牌营销带来革新。

【AiBase提要:】

✨ 一键生成真实感UGC广告:上传产品图片、选择数字人形象、输入脚本,几分钟内即可生成高质量广告视频。

🤖 Avatar IV技术支持超现实体验:实现高度逼真的面部表情、肢体动作和语音同步,适用于多语言版本。

📈 推动UGC营销普及:解决传统UGC创作痛点,提高互动性和转化率,助力品牌全球化营销。

8、无需邀请码!Manus AI推出Windows桌面应用程序

Manus AI的Windows桌面应用程序已上线Microsoft Store,提供从数据分析到代码生成的全面支持,通过本地化性能优化和深度集成Windows生态,显著提升用户体验。

【AiBase提要:】

✨ 强大的自主性:Manus AI能自主规划并执行复杂任务,如任务管理和代码生成,大幅提升效率。

💻 本地化体验:利用本地计算资源,提供更快响应速度和更低延迟,支持离线任务处理。

🌐 深度集成:与Windows生态深度融合,适配多种场景,包括办公、开发和创意领域。

9、用AI会让人变笨!研究揭示:过度依赖AI或导致损坏批判性思维与记忆力

麻省理工学院的一项研究表明,尽管大型语言模型(LLM)如ChatGPT能带来便利,但过度依赖可能削弱个体的学习技能,包括记忆力和批判性思维能力。

image.png

【AiBase提要:】

🧠 LLM组参与者的大脑连接性减弱,记忆和所有权受损,长期使用可能削弱学习技能。

⏳ 即便LLM初期提升效率,但长期看可能以牺牲深度学习成果为代价,形成认知负债。

📚 教育环境中结合AI工具与无工具学习阶段,有助于平衡即时技能转移与长期神经发展。

10、Perplexity重磅升级!定时任务+SEC金融数据,炒股分析神器来了!

Perplexity推出定时任务功能,结合SEC数据,为金融从业者提供高效研究工具,提升信息获取效率。

【AiBase提要:】

📈 定时任务功能上线,自动整理金融资讯,节省手动搜索时间。

📊 SEC数据加持,将复杂数据转化为易懂分析结果,支持多维度查询。

🤖 AI交互体验直观,适合个人投资者及专业分析师,助力精准投资决策。

11、Mozilla 宣布停运 AI 内容检测工具 “Deep Fake Detector”

Mozilla 宣布将于6月26日停运其 AI 内容检测扩展程序“Deep Fake Detector”。尽管该工具曾帮助用户识别AI生成内容,但活跃用户不足3300人。这一决定可能反映了Mozilla对AI生成内容的默认接受态度,也凸显了用户对辨别AI内容真实性工具的需求。

image.png

【AiBase提要:】

🌟 Mozilla 将于6月26日停运 “Deep Fake Detector” 扩展程序,标志着对AI生成内容态度的转变。

🔍 该工具虽基于开源模型,但因活跃用户少,未能广泛推广,暴露了用户需求与实际使用之间的差距。

📰 关闭检测工具可能暗示Mozilla对AI内容的默认接受,这对依赖高质量内容的用户来说是个挑战。

12、人人皆可创作音乐!腾讯 AI Lab 推出开源音乐生成大模型 SongGeneration

SongGeneration 是腾讯 AI Lab 推出的开源音乐生成大模型,解决了音质、音乐性和生成速度的问题,支持文本控制、多轨合成和风格跟随等功能,通过预训练的3B参数架构,为音乐创作提供强大支持。

image.png

【AiBase提要:】

🎶 SongGeneration 提升了音乐生成的音质与速度,解决行业难题。

🎤 用户可通过关键词或参考音频生成个性化音乐,创作更自由。

🎵 基于3B参数的大型架构,经过海量歌曲预训练,实现智能化音乐生成。

详情链接:https://huggingface.co/spaces/tencent/SongGeneration

13、快手重磅推出 OneRec 推荐系统,开启智能推荐新时代!

我对于快手推出OneRec感到非常兴奋,它不仅大幅提升了推荐效率,还降低了运营成本,让用户获得更加个性化的体验。这种创新让我看到了短视频行业未来的无限可能。

【AiBase提要:】

利用先进大模型技术重塑传统推荐架构,计算效率提升10倍。

OneRec已上线快手App及极速版,承担约25%的每秒请求数量,显著提升用户体验。

系统降低运营成本至传统方案的10.6%,推动行业进入‘端到端生成式觉醒’新阶段。

14、ChatGPT 新笔记工具发布:隐形记录,智能整理会议精华

ChatGPT推出新笔记工具,主打隐形记录与智能整理,主要面向会议记录、头脑风暴及个人笔记管理,通过强大的自然语言处理能力实时生成结构化笔记。

image.png

【AiBase提要:】

✨ 主打‘隐形’记录体验,用户点击图标即可后台录音并自动生成转录与结构化笔记。

📝 利用记忆功能与提示词,提供个性化笔记生成,支持提炼关键点与总结报告。

🌟 逐步开放至Pro、Enterprise等用户,与API集成后可拓展至更多工作流平台。

15、宇树科技近期已完成C轮融资交割

宇树科技完成了C轮融资交割,多家知名投资机构参与,投前估值超100亿元人民币,公司可能为未来上市做准备。

【AiBase提要:】

宇树科技完成C轮融资交割,多家知名投资机构参与,包括中国移动旗下基金、腾讯、阿里、蚂蚁金服和吉利资本。

公司投前估值超100亿元人民币,部分投资人认为估值仍显保守,表现引人注目。

宇树科技更名为股份有限公司,可能为上市做准备,创始人王兴兴对在香港上市持开放态度。

举报

  • 相关推荐
  • AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

    近日AI领域迎来多项重要更新:阿里夸克发布AI创作平台“造点”,整合通义万相Wan2.5与Midjourney V7,支持音画同步视频生成;Wan2.5-Preview实现多模态输入与电影级视频同步生成,提升视觉创作能力;可灵AI推出视频生成模型2.5Turbo并降价30%,降低使用门槛;阿里通义推出Qwen3-ASR-Toolkit,实现小时级音视频转录;谷歌相册AI编辑功能扩展至安卓用户,支持语音修图;谷歌Mixboard工具助力创意设计,生成情绪板;Qwen发布Qwen3-Max模型,在代码生成与智能体能力表现突出;Figma推出MCP服务器,实现设计到代码的一键转换,提升开发效率。

  • 每日互动参与发起《人工智能安全行业自律倡议》 守护人工智能产业可持续发展

    9月17日,2025年国家网络安全宣传周人工智能安全治理分论坛在昆明召开,会上正式发布《人工智能安全行业自律倡议》。该倡议由中国网络空间安全协会联合多家科研院所、互联网头部企业、网络安全厂商及人工智能企业共同发起,提出筑牢安全根基、强化技管结合、深化协同共治等七方面共识,旨在推动构建可控、可信、可靠的人工智能产业生态,为全球人工智能治理贡献中国智慧。

  • 马斯克:Grok 5模型有望实现通用人工智能的突破

    马斯克旗下xAI公司正研发Grok 5模型,有望实现通用人工智能(AGI)重大突破。该模型采用全新架构设计,预计未来几周启动训练。若成功将代表AI从专用领域向通用认知能力的质的飞跃,被视为人工智能发展的终极目标。科技界密切关注xAI能否在激烈竞争的大模型赛道实现突破。

  • 基于通义万相 美图多款APP上线全新动漫特效、AI变身等视频生成功能

    今日,美图公司旗下美图秀秀、RoboNeo、Wink和开拍等多款产品,推出全新动漫特效、AI变身等视频生成功能。 据悉,新功能基于通义万相系列模型进行深度开发与训练,为美图的全球用户提供全新的创作体验。 近年来,美图加速布局生产力场景,不仅推出面向企业的AI算法服务和解决方案,旗下消费级产品也在快速集成大模型。 去年6月,美图就开始和阿里展开大模型合作。

  • 十方融海:以开源生态为基,绘就“人工智能 +”产业融合新蓝图

    国务院印发《关于深入实施“人工智能+”行动的意见》,推动AI技术与产业深度融合。深圳企业十方融海凭借AI大模型研发、产品创新及开源生态构建等领域的卓越实践,成为行业先锋。其开源模型如OpenBuddy、小智AI等突破传统技术局限,实现多模态交互与跨领域知识融合,覆盖教育、办公、养老、文体等多元场景。通过开放共享模式,十方融海有效降低AI应用门槛,激发行业创新活力,助力我国人工智能产业迈向新征程。

  • 祝贺!诺云荣登“人工智能+”新质生产力领航企业百强!

    2025年9月8日,国务院发布人工智能发展指导意见后,诺云凭借AI营销创新实践入选“人工智能+新质生产力百强榜单”,成为河南唯一入选企业。作为数字化营销技术服务商,诺云提供企业直播SaaS系统与私域运营工具,覆盖电商直播、企业培训等全场景需求。已服务超20万家企业,覆盖3亿用户,拓展至零售、教育等150多个行业,客户包括携程、华为等头部机构。诺云将持续深化AI技术应用,激发新质生产力潜能。

  • AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型

    本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。

  • 王忠林赴格创东智调研人工智能产业高质量发展情况

    9月11日,湖北省领导王忠林一行调研格创东智人工智能产业发展。公司CEO何军汇报了自主研发的工业智能平台、能碳管理系统等应用成果。王忠林强调要深化人工智能在工业研发、生产等领域的应用,促进全要素智能联动,更好服务制造业向智能制造转型升级。

  • 小度发布多模态智能摄像机,AI大模型重塑家庭看护体验

    小度科技推出首款多模态智能摄像机C800,搭载800万像素4K超清摄像头,支持AI大模型技术。该产品不仅能实现高清监控,还具备智能行为识别、语音交互等功能,可自定义看护提醒。结合视觉与语音交互,支持复杂语义查询和家庭设备联动,扩展智能家居应用场景。目前产品已全网发售,年底还将推出三摄版本,持续探索AI硬件创新。

  • 免费生成10秒高清视频!通义App接入通义万相2.5

    在2025云栖大会上,阿里发布通义万相Wan2.5 Preview系列模型,覆盖文生视频、图生视频、文生图和图像编辑四大功能。其视频生成模型首次实现音画同步,可生成匹配画面的人声、音效和BGM,时长从5秒提升至10秒,支持24帧/秒的1080P高清输出,降低影视级创作门槛。模型指令遵循能力增强,支持运镜等复杂连续变化控制。用户通过通义App输入指令即可自动生成10秒高清视频,每日免费使用15次,支持导出无水印视频。同时,图像生成能力全面升级,可生成中英文字符和图表,支持图像编辑功能,一句话即可完成P图。

今日大家都在搜的词: