首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:昆仑万维开源Skywork-OR1系列模型;讯飞星辰Agent开发平台全面支持MCP;字节跳动布局AI智能眼镜

2025-04-14 15:31 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、Kimi开源视觉语言模型 Kimi-VLKimi-VL-Thinking,多项基准超越 GPT-4o

Moonshot AI 最近开源了 Kimi-VL 和 Kimi-VL-Thinking 两款视觉语言模型,展现出卓越的多模态理解与推理能力。这些模型采用轻量级的 MoE 架构,参数仅有30亿,却在多个基准测试中超越了 GPT-4o。Kimi-VL 系列在数学推理、智能体操作和高分辨率图像处理等方面表现突出,支持超长上下文理解,展现出广泛的应用潜力。

image.png

【AiBase提要:】

🛠️ Kimi-VL 和 Kimi-VL-Thinking 采用轻量级 MoE 架构,参数仅30亿,运行效率高。

📊 在 MathVision 和 ScreenSpot-Pro 测试中,Kimi-VL 分别取得36.8% 和34.5% 的优异成绩,展示强大的推理能力。

📈 支持高达128K tokens 的上下文输入,适用于长文档和视频分析,展现出广泛的应用潜力。

详情链接:https://github.com/MoonshotAI/Kimi-VL https://huggingface.co/moonshotai/Kimi-VL-A3B-Instruct

2、科大讯飞旗下讯飞星辰Agent开发平台已全面支持MCP

科大讯飞近日宣布其讯飞星辰Agent开发平台全面支持MCP,旨在帮助开发者高效构建Agent应用。该平台不仅支持轻松配置和调用行业领先的MCP Server,还允许一键发布自定义MCP Server,实现真正的“即插即用”。首批支持的MCP Server覆盖多个行业,推动AI应用的中间层标准化。

image.png

【AiBase提要:】

🌟 开发者可以轻松配置和调用行业领先的MCP Server,支持一键发布自定义MCP Server。

🔧 首批支持20+行业精品MCP Server,涵盖AI能力、生活服务等多个领域。

🌐 讯飞星辰Agent开发平台支持零代码和低代码创建模式,赋能个人和企业快速开发大模型应用。

详情链接:https://mcp.xfyun.cn/

3、昆仑万维开源Skywork-OR1系列模型 数学代码能力出色

昆仑万维天工团队于4月13日推出了全新升级的Skywork-OR1系列模型,标志着在逻辑推理和复杂任务求解方面的重大突破。该系列包含三款高性能模型,分别针对数学和代码领域,展现出卓越的推理能力和性价比。Skywork-OR1-32B-Preview在竞赛编程任务中表现尤为突出,显示出其训练策略的先进性。

image.png

【AiBase提要:】

🔍 Skywork-OR1系列模型在逻辑理解与复杂任务求解方面实现了业界领先的推理性能。

💻 包括Skywork-OR1-Math-7B、Skywork-OR1-7B-Preview和Skywork-OR1-32B-Preview三款高性能模型,满足不同需求。

🏆 Skywork-OR1-32B-Preview在竞赛编程任务中表现突出,接近DeepSeek-R1的能力,展现出优越的性价比。

详情链接:https://github.com/SkyworkAI/Skywork-OR1

4、字节跳动推出Seed-Thinking-v1.5:推理AI竞赛中的新力量

字节跳动推出的新型大语言模型Seed-Thinking-v1.5在推理AI竞争中展现出强大的实力。该模型采用混合专家架构,能够在多项基准测试中超越行业巨头,尤其是在科学、技术、数学和工程领域。通过技术创新和高效的训练方法,Seed-Thinking-v1.5不仅提高了推理能力,还在非推理任务中表现出色。

QQ20250414-090120.png

【AiBase提要:】

🚀 字节跳动推出Seed-Thinking-v1.5,专注于STEM领域,采用混合专家架构。

🏆 在多项基准测试中表现优异,超越Google和OpenAI的产品。

🔍 采用先进的训练技术和强化学习框架,提升模型性能与效率。

5、商汤大装置SenseCore2.0全新升级 推出1亿元代金券计划

在2025商汤技术交流日上,商汤科技宣布其大装置SenseCore2.0全面升级,旨在为企业提供高效、灵活的全栈AI基础设施服务。此次升级响应了大模型产业的三大挑战,并通过技术创新显著提升了算力利用率和推理性能。此外,商汤科技投入1亿元专项代金券,助力各行业加速AI落地。

image.png

【AiBase提要:】

⚙️ SenseCore2.0全面升级,提升AI基础设施服务的性价比和灵活性。

🤝 商汤与松应科技战略合作,推动具身智能技术的发展,解决智能化落地难题。

💰 投入1亿元代金券,支持企业从咨询到模型训练的全流程AI服务。

6、Google AI Studio开放Veo2视频模型有限免费试用

Google AI Studio最近向部分用户开放了Veo2视频模型的有限免费试用,引发了广泛关注。Veo2作为最新一代AI视频生成工具,支持高达4K分辨率和真实的物理模拟,展现了其强大的技术实力。然而,试用权限受到严格限制,用户对冷却时间和后续使用的未知感到困惑。

image.png

【AiBase提要:】

🌟 Veo2视频模型由Google DeepMind开发,支持高达4K分辨率,展现出卓越的生成能力。

🕒 试用权限有限,用户反馈冷却时间不明确,可能影响体验。

🔒 Google对生成内容进行严格把控,确保用户隐私和安全。

7、上海AI实验室开源InternVL3系列多模态大型语言模型

OpenGVLab于4月11日发布了InternVL3系列模型,标志着多模态大型语言模型领域的新里程碑。该系列模型包含从1B到78B的多种尺寸,具备处理文字、图片、视频等多种信息的能力,性能显著提升。与前代产品相比,InternVL3在多模态感知和推理上有了显著进步,扩展了工具使用、工业图像分析等多个领域的能力。

image.png

【AiBase提要:】

🧠 InternVL3系列模型支持从1B到78B的多种尺寸,展现出卓越的多模态处理能力。

🔍 与InternVL2.5相比,InternVL3在多模态感知和推理能力上有显著提升,支持多图像和视频数据。

⚙️ 模型可通过LMDeploy的api_server部署为OpenAI兼容API,用户可轻松进行模型调用。

详情链接:https://modelscope.cn/collections/InternVL3-5d0bdc54b7d84e

8、AI“智商”大考变革!全新GAIA基准超越 ARC-AGI

随着人工智能技术的迅速发展,如何准确评估AI的智能水平成为行业关注的重点。传统的评估基准如MMLU虽然广泛使用,但其局限性逐渐显现,无法全面反映AI在实际应用中的能力。新推出的GAIA基准通过模拟真实世界的复杂问题,强调了AI在多步骤任务中的灵活性与专业化,标志着AI评估方法的重大转变。

image.png

【AiBase提要:】

🔍 新基准GAIA旨在评估AI在实际应用中的能力,涵盖多模态理解和复杂推理等关键技能。

📊 传统基准如MMLU的高分并不代表AI的真实能力,实际应用中的表现差异显著。

🚀 GAIA基准的初步结果显示,灵活性强的模型在复杂任务中表现优于其他知名模型。

详情链接:https://huggingface.co/gaia-benchmark

9、百元成本炼成开源视频模型Pusa:基于Mochi微调,低成本复现高质量

Pusa是一个基于Mochi微调的开源视频生成模型,具有低成本和完全开源的特点。仅需约100美元的训练成本,Pusa展现出较好的视频生成能力,支持多种生成任务。其开放的微调流程促进了社区的合作与发展,吸引更多研究者参与到视频模型的研究中。

image.png

【AiBase提要:】

💰 Pusa模型的训练成本仅为100美元,显著低于传统大型视频模型的数万甚至数十万美元的成本。

🔧 Pusa完全开源,提供完整的代码库和训练方法,支持研究者复现实验并进行创新。

🎬 基于Mochi的微调,Pusa支持多种视频生成任务,尽管当前分辨率为480p,但在运动保真度和提示遵循性方面表现出潜力。

详情链接:https://top.aibase.com/tool/pusa

10、字节跳动开源项目UNO:图片生成可以保持角色、物体一致性

字节跳动的开源项目UNO在AI图像生成领域取得了重要突破,解决了以往生成图像时角色或物体一致性的问题。通过创新的高一致性数据合成流程和模型设计,UNO能够确保无论是单主体还是多主体场景,生成的图像都能保持特征一致性。

image.png

【AiBase提要:】

🧠 UNO项目旨在解决AI图像生成中的角色一致性问题,避免“脸盲症”。

🔍 采用高一致性数据合成流程和创新模型设计,UNO提升了图像生成的可控性。

🎨 同时支持单主体和多主体场景,确保生成结果的高度一致性。

详情链接:https://huggingface.co/bytedance-research/UNO

11、小鹏汽车推新物理大模型,定位AI汽车公司

小鹏汽车创始人何小鹏在社交媒体上强调了公司作为AI汽车公司的定位,认为人工智能的最大价值在于改变物理世界。他透露小鹏在自动驾驶领域的创新技术,尤其是强化学习与模型蒸馏,使其在行业内具备独特竞争力。此外,小鹏正在训练一个超大规模的物理世界模型,标志着其在AI技术应用上的领先地位。

【AiBase提要:】

🤖 小鹏汽车定位为AI汽车公司,强调AI技术在物理世界的应用价值。

🚀 引入强化学习与模型蒸馏技术,提升自动驾驶领域的竞争力。

📅2025年发布会将解答小鹏未来发展方向,推出新车型X9。

12、字节跳动布局AI智能眼镜,挑战下一代可穿戴设备市场

字节跳动正在积极研发一款AI智能眼镜,旨在将先进的人工智能功能与高质量影像捕捉相结合,提供创新的用户体验。该设备将集成字节跳动自研的“豆包”AI模型,增强智能交互能力,用户可通过语音指令等方式与眼镜互动。项目已进入实质性研发阶段,字节跳动与供应链伙伴展开沟通,推动产品的功能设计与上市计划。

【AiBase提要:】

🧠 字节跳动研发AI智能眼镜,融合先进AI功能与影像捕捉。

🔍 集成“豆包”AI模型,支持语音指令、实时翻译等智能交互。

📈 计划与供应链伙伴沟通,推动产品设计与上市,挑战Meta等竞争对手。

举报

  • 相关推荐
  • 迎“人工智能+”政策东风!2025中国智能产业大会&吴文俊人工智能创新大会即将落地常州

    在全球AI竞争加剧背景下,国务院印发《关于深入实施“人工智能+”行动的意见》,推动AI与经济社会深度融合。中国人工智能学会主办的“2025第十四届中国智能产业大会暨吴文俊人工智能创新大会”将于8月30-31日在常州举行,聚焦破解AI产业“卡脖子”难题。大会设置15场专题会议和3场特色活动,覆盖基础技术突破、核心应用落地、交叉学科融合等领域,为产学研各界搭建高

  • 北电数智亮相世界人工智能大会,“四链融合”推动AI产业落地

    2025世界人工智能大会“人工智能+”战略领军人才与创新发展论坛圆满落幕。论坛聚焦“人才领航智启未来”主题,汇聚中科院、社科院专家及中国联通、腾讯云等机构代表,围绕“人工智能+”行动分享经验,为AI高质量发展筑牢人才根基、激发创新动能。北电数智CMO杨震出席并发表演讲,分享AI行业落地实践,强调紧跟国家战略,推进产业、创新、人才、资本四链融合,打造面向不同场景的AI解决方案,全方位助力AI产业发展。

  • 寒武纪智能芯片赋能多模态大模型应用

    大模型快速发展推动人工智能技术迈向新阶段,从解决特定任务的弱人工智能向处理通用复杂任务的强人工智能演进。IDC报告显示,2024年中国大模型开发平台市场规模达16.9亿元,人工智能算力市场约190亿美元,预计2025年将达259亿美元。寒武纪等企业专注AI芯片研发,推出多款处理器及加速卡产品,支持大模型训练推理及多模态任务,并与产业链合作共同推进人工智能产业发展。

  • 微算法科技(NASDAQ:MLGO)基于人工智能优化构建混合ARIMA模型,提高比特币价格预测准确性

    随着数字资产市场兴起,比特币等加密货币价格预测成为焦点。传统模型难以准确捕捉其非线性波动,微算法科技引入AI技术优化ARIMA模型,结合LSTM网络构建混合模型,提升预测准确性。通过AI算法自动处理数据缺失、异常值检测及参数优化,实现更可靠的比特币价格预测,为投资者提供决策支持。

  • 海尔冰箱唯一获批“制冷家电人工智能技术山东省工程研究中心”

    海尔冰箱在人工智能领域取得新突破,主导建设的"制冷家电人工智能技术山东省工程研究中心"成为2025年山东省工程研究中心认定名单中唯一入选的冰箱品牌。该中心聚焦人工智能、物联网、大数据等技术方向,开发了全空间智慧保鲜舱冰箱等140多项行业首创产品,近三年获授权发明专利803件。海尔冰箱还推出行业首款接入DeepSeek的AI全空间保鲜冰箱,具备方言识别、降噪技术等功能,显著提升用户体验。市场数据显示,2023年1-7月海尔冰箱以47%市场份额稳居行业第一。通过AI技术赋能,海尔冰箱正引领行业向精准、智能保鲜时代跨越。

  • 下一个爆款在哪儿?2025英特尔人工智能创新应用大赛获奖名单揭晓

    8月16日,2025英特尔人工智能创新应用大赛总决赛在深圳落幕。40支优秀团队从2817支队伍中脱颖而出,围绕工业、教育、心理健康、游戏等领域展开对决。大赛展示了AI从云端走向边缘的趋势,依托酷睿Ultra处理器和低代码开发工具,推动AI应用本地化落地。获奖作品包括动力电池机器人协作拆卸系统和AI生成PPT服务,体现AI与产业需求的深度融合。英特尔与联想、惠普等合作伙伴共同为开发者提供全栈支持,加速AI技术普及和商业化进程。

  • AI日报:智谱AI发布AutoGLM 2.0;腾讯元宝接入腾讯视频;字节发布开源大语言模型 Seed-OSS

    本期AI日报聚焦多项AI技术突破:智谱发布革命性语音代理AutoGLM 2.0,实现全平台语音操控;腾讯元宝接入视频平台提升观影便捷性;字节跳动开源大模型Seed-OSS专注长文本处理;速卖通AI代理助力新品推广效率翻倍;微软测试Copilot智能文件搜索功能;Liquid AI推出低延迟视觉语言模型LFM2-VL;OpenAI月收入首破10亿美元;谷歌Pixel 10系列全面升级AI功能,包括情感识别和实时翻译;Pixel Buds Pro 2引入AI手势控制;ElevenLabs发布支持70+语言的文本转语音API。

  • ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

    ISC.AI2025人工智能安全论坛在北京召开,聚焦AI安全治理与创新实践。论坛汇集顶尖专家,探讨大模型安全评估与防护、智能体安全、AI治理等前沿议题。360集团张向征指出,随着Agent技术爆发式应用,AI安全已成为产业核心焦点。专家们强调需构建AI安全防护体系,应对大模型直接访问核心系统带来的全新挑战。中国电子院彭健提出企业合规建设需关注九大要素,清华大学苏航揭示智能体安全风险远超传统AI。华为云范建军倡导端到端大模型安全防护,中国信通院杨哲超呼吁构建协同治理框架。论坛为构建安全、普惠、负责任的人工智能未来贡献智慧。

  • 昆仑万维UniPic 2.0“小钢炮”模型炸场,一个模型搞定理解+生成+编辑

    大模型又迎来新一波的迭代周期。 近日,从Open AI发布GPT-5,到国内的昆仑万维、商汤、百川智能、智谱等都陆续发布了自己的新模型。其中昆仑万维更是一口气开启了技术周,连续5天每天发布一个新模型,而8月13日发布的,正是其本周发布的第三款模型——多模态统一模型UniPic2.0。 UniPic2.0主打的是,在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力

  • AI日报:字节视频模型Waver 1.0发布;百度AI搜索APP“梯子AI”发布;谷歌推全新Gemini 2.5 Flash图像编辑模型

    本文汇总了AI领域最新动态:谷歌推出Gemini 2.5 Flash图像编辑模型,字节发布Waver 1.0视频生成工具;百度“梯子AI”提供无广告搜索;文心快码新增终端编码功能;腾讯游戏VISVISE工具集提升动画制作效率;自动驾驶配送机器人RM5进军外卖行业;DeepSeek V3.1出现字符Bug已修复;谷歌翻译升级实时同传和AI陪练;全球首现AI勒索软件PromptLock威胁网络安全;Anthropic推出Chrome浏览器AI助手Claude。

今日大家都在搜的词: