首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:昆仑万维开源Skywork-OR1系列模型;讯飞星辰Agent开发平台全面支持MCP;字节跳动布局AI智能眼镜

2025-04-14 15:31 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、Kimi开源视觉语言模型 Kimi-VLKimi-VL-Thinking,多项基准超越 GPT-4o

Moonshot AI 最近开源了 Kimi-VL 和 Kimi-VL-Thinking 两款视觉语言模型,展现出卓越的多模态理解与推理能力。这些模型采用轻量级的 MoE 架构,参数仅有30亿,却在多个基准测试中超越了 GPT-4o。Kimi-VL 系列在数学推理、智能体操作和高分辨率图像处理等方面表现突出,支持超长上下文理解,展现出广泛的应用潜力。

image.png

【AiBase提要:】

🛠️ Kimi-VL 和 Kimi-VL-Thinking 采用轻量级 MoE 架构,参数仅30亿,运行效率高。

📊 在 MathVision 和 ScreenSpot-Pro 测试中,Kimi-VL 分别取得36.8% 和34.5% 的优异成绩,展示强大的推理能力。

📈 支持高达128K tokens 的上下文输入,适用于长文档和视频分析,展现出广泛的应用潜力。

详情链接:https://github.com/MoonshotAI/Kimi-VL https://huggingface.co/moonshotai/Kimi-VL-A3B-Instruct

2、科大讯飞旗下讯飞星辰Agent开发平台已全面支持MCP

科大讯飞近日宣布其讯飞星辰Agent开发平台全面支持MCP,旨在帮助开发者高效构建Agent应用。该平台不仅支持轻松配置和调用行业领先的MCP Server,还允许一键发布自定义MCP Server,实现真正的“即插即用”。首批支持的MCP Server覆盖多个行业,推动AI应用的中间层标准化。

image.png

【AiBase提要:】

🌟 开发者可以轻松配置和调用行业领先的MCP Server,支持一键发布自定义MCP Server。

🔧 首批支持20+行业精品MCP Server,涵盖AI能力、生活服务等多个领域。

🌐 讯飞星辰Agent开发平台支持零代码和低代码创建模式,赋能个人和企业快速开发大模型应用。

详情链接:https://mcp.xfyun.cn/

3、昆仑万维开源Skywork-OR1系列模型 数学代码能力出色

昆仑万维天工团队于4月13日推出了全新升级的Skywork-OR1系列模型,标志着在逻辑推理和复杂任务求解方面的重大突破。该系列包含三款高性能模型,分别针对数学和代码领域,展现出卓越的推理能力和性价比。Skywork-OR1-32B-Preview在竞赛编程任务中表现尤为突出,显示出其训练策略的先进性。

image.png

【AiBase提要:】

🔍 Skywork-OR1系列模型在逻辑理解与复杂任务求解方面实现了业界领先的推理性能。

💻 包括Skywork-OR1-Math-7B、Skywork-OR1-7B-Preview和Skywork-OR1-32B-Preview三款高性能模型,满足不同需求。

🏆 Skywork-OR1-32B-Preview在竞赛编程任务中表现突出,接近DeepSeek-R1的能力,展现出优越的性价比。

详情链接:https://github.com/SkyworkAI/Skywork-OR1

4、字节跳动推出Seed-Thinking-v1.5:推理AI竞赛中的新力量

字节跳动推出的新型大语言模型Seed-Thinking-v1.5在推理AI竞争中展现出强大的实力。该模型采用混合专家架构,能够在多项基准测试中超越行业巨头,尤其是在科学、技术、数学和工程领域。通过技术创新和高效的训练方法,Seed-Thinking-v1.5不仅提高了推理能力,还在非推理任务中表现出色。

QQ20250414-090120.png

【AiBase提要:】

🚀 字节跳动推出Seed-Thinking-v1.5,专注于STEM领域,采用混合专家架构。

🏆 在多项基准测试中表现优异,超越Google和OpenAI的产品。

🔍 采用先进的训练技术和强化学习框架,提升模型性能与效率。

5、商汤大装置SenseCore2.0全新升级 推出1亿元代金券计划

在2025商汤技术交流日上,商汤科技宣布其大装置SenseCore2.0全面升级,旨在为企业提供高效、灵活的全栈AI基础设施服务。此次升级响应了大模型产业的三大挑战,并通过技术创新显著提升了算力利用率和推理性能。此外,商汤科技投入1亿元专项代金券,助力各行业加速AI落地。

image.png

【AiBase提要:】

⚙️ SenseCore2.0全面升级,提升AI基础设施服务的性价比和灵活性。

🤝 商汤与松应科技战略合作,推动具身智能技术的发展,解决智能化落地难题。

💰 投入1亿元代金券,支持企业从咨询到模型训练的全流程AI服务。

6、Google AI Studio开放Veo2视频模型有限免费试用

Google AI Studio最近向部分用户开放了Veo2视频模型的有限免费试用,引发了广泛关注。Veo2作为最新一代AI视频生成工具,支持高达4K分辨率和真实的物理模拟,展现了其强大的技术实力。然而,试用权限受到严格限制,用户对冷却时间和后续使用的未知感到困惑。

image.png

【AiBase提要:】

🌟 Veo2视频模型由Google DeepMind开发,支持高达4K分辨率,展现出卓越的生成能力。

🕒 试用权限有限,用户反馈冷却时间不明确,可能影响体验。

🔒 Google对生成内容进行严格把控,确保用户隐私和安全。

7、上海AI实验室开源InternVL3系列多模态大型语言模型

OpenGVLab于4月11日发布了InternVL3系列模型,标志着多模态大型语言模型领域的新里程碑。该系列模型包含从1B到78B的多种尺寸,具备处理文字、图片、视频等多种信息的能力,性能显著提升。与前代产品相比,InternVL3在多模态感知和推理上有了显著进步,扩展了工具使用、工业图像分析等多个领域的能力。

image.png

【AiBase提要:】

🧠 InternVL3系列模型支持从1B到78B的多种尺寸,展现出卓越的多模态处理能力。

🔍 与InternVL2.5相比,InternVL3在多模态感知和推理能力上有显著提升,支持多图像和视频数据。

⚙️ 模型可通过LMDeploy的api_server部署为OpenAI兼容API,用户可轻松进行模型调用。

详情链接:https://modelscope.cn/collections/InternVL3-5d0bdc54b7d84e

8、AI“智商”大考变革!全新GAIA基准超越 ARC-AGI

随着人工智能技术的迅速发展,如何准确评估AI的智能水平成为行业关注的重点。传统的评估基准如MMLU虽然广泛使用,但其局限性逐渐显现,无法全面反映AI在实际应用中的能力。新推出的GAIA基准通过模拟真实世界的复杂问题,强调了AI在多步骤任务中的灵活性与专业化,标志着AI评估方法的重大转变。

image.png

【AiBase提要:】

🔍 新基准GAIA旨在评估AI在实际应用中的能力,涵盖多模态理解和复杂推理等关键技能。

📊 传统基准如MMLU的高分并不代表AI的真实能力,实际应用中的表现差异显著。

🚀 GAIA基准的初步结果显示,灵活性强的模型在复杂任务中表现优于其他知名模型。

详情链接:https://huggingface.co/gaia-benchmark

9、百元成本炼成开源视频模型Pusa:基于Mochi微调,低成本复现高质量

Pusa是一个基于Mochi微调的开源视频生成模型,具有低成本和完全开源的特点。仅需约100美元的训练成本,Pusa展现出较好的视频生成能力,支持多种生成任务。其开放的微调流程促进了社区的合作与发展,吸引更多研究者参与到视频模型的研究中。

image.png

【AiBase提要:】

💰 Pusa模型的训练成本仅为100美元,显著低于传统大型视频模型的数万甚至数十万美元的成本。

🔧 Pusa完全开源,提供完整的代码库和训练方法,支持研究者复现实验并进行创新。

🎬 基于Mochi的微调,Pusa支持多种视频生成任务,尽管当前分辨率为480p,但在运动保真度和提示遵循性方面表现出潜力。

详情链接:https://top.aibase.com/tool/pusa

10、字节跳动开源项目UNO:图片生成可以保持角色、物体一致性

字节跳动的开源项目UNO在AI图像生成领域取得了重要突破,解决了以往生成图像时角色或物体一致性的问题。通过创新的高一致性数据合成流程和模型设计,UNO能够确保无论是单主体还是多主体场景,生成的图像都能保持特征一致性。

image.png

【AiBase提要:】

🧠 UNO项目旨在解决AI图像生成中的角色一致性问题,避免“脸盲症”。

🔍 采用高一致性数据合成流程和创新模型设计,UNO提升了图像生成的可控性。

🎨 同时支持单主体和多主体场景,确保生成结果的高度一致性。

详情链接:https://huggingface.co/bytedance-research/UNO

11、小鹏汽车推新物理大模型,定位AI汽车公司

小鹏汽车创始人何小鹏在社交媒体上强调了公司作为AI汽车公司的定位,认为人工智能的最大价值在于改变物理世界。他透露小鹏在自动驾驶领域的创新技术,尤其是强化学习与模型蒸馏,使其在行业内具备独特竞争力。此外,小鹏正在训练一个超大规模的物理世界模型,标志着其在AI技术应用上的领先地位。

【AiBase提要:】

🤖 小鹏汽车定位为AI汽车公司,强调AI技术在物理世界的应用价值。

🚀 引入强化学习与模型蒸馏技术,提升自动驾驶领域的竞争力。

📅2025年发布会将解答小鹏未来发展方向,推出新车型X9。

12、字节跳动布局AI智能眼镜,挑战下一代可穿戴设备市场

字节跳动正在积极研发一款AI智能眼镜,旨在将先进的人工智能功能与高质量影像捕捉相结合,提供创新的用户体验。该设备将集成字节跳动自研的“豆包”AI模型,增强智能交互能力,用户可通过语音指令等方式与眼镜互动。项目已进入实质性研发阶段,字节跳动与供应链伙伴展开沟通,推动产品的功能设计与上市计划。

【AiBase提要:】

🧠 字节跳动研发AI智能眼镜,融合先进AI功能与影像捕捉。

🔍 集成“豆包”AI模型,支持语音指令、实时翻译等智能交互。

📈 计划与供应链伙伴沟通,推动产品设计与上市,挑战Meta等竞争对手。

举报

  • 相关推荐
  • 跨境支付的未来:人工智能、嵌入式金融和即时结算

    本文系统分析了人工智能、嵌入式金融与即时结算三大技术趋势如何重构跨境支付体系。人工智能通过智能填单、动态风控和预测性维护显著提升支付效率与安全性;嵌入式金融将支付功能无缝融入电商平台与供应链,实现“无跳转支付”;即时结算技术将跨境支付时间从数日缩短至秒级,并优化现金流。三大技术深度融合形成协同效应,推动跨境支付向更智能、高效、无缝�

  • AI日报:昆仑万维SkyReels V3模型上线;月之暗面推Kimi Linear模型;MiniMax Music 2.0 发布

    本期AI日报聚焦多领域创新:昆仑万维推出SkyReels V3模型,整合顶尖视频生成能力;月之暗面Kimi Linear模型处理长文本速度提升2.9倍;MiniMax Music 2.0实现专业级音乐创作;字节跳动启动豆包股权激励计划吸引AI人才;苹果iOS 27将迎AI重大升级,Siri更个性化;Dia浏览器融合Arc设计理念与AI技术;文心魔法漫画工具实现一键生成连载作品;谷歌Gemini Canvas新增PPT自动生成功能,由Gemini 2.5 Pro驱动,提升职场效率。

  • 人工智能落地“最后一公里”,戴尔工作站助力AI应用提速

    AI应用落地面临“最后一公里”部署难题:传统流程繁琐耗时,从模型开发到上线需数周。英特尔携手戴尔与零克云打造“工作站-AI PC-云端”协同生态,通过本地工作站进行小规模测试验证,降低试错成本与数据泄露风险,再通过“一键部署”快速扩展至云端规模化落地。这种“先本地验证、后云端放大”的路径显著提升开发效率,释放团队创造力,让有价值的AI想法快速照进现实。

  • 简知科技“简智AI大模型”通过国家生成式人工智能服务备案,助力兴趣教育迈向智能化新阶段

    广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案,标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑,该模型围绕用户兴趣成长周期设计,提供个性化学习支持:可为未明确兴趣方向的用户智能推荐内容,为入门用户规划学习路径,为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖,并通过社群互动增强学习动力。公司未来将持续优化模型能力,联合行业伙伴构建完整培养体系,推动兴趣教育向个性化、高质量方向发展。

  • Billus AI高交会全球首发多模态大模型 以AI Agent重构创意产业文明进化路径

    2025年11月15日,Billus AI在高交会首发多模态大模型Billus0.57EDIT及“超级员工智能体”初阶版,依托自研生存式大模型与AI Agent技术,打破创意领域垂直局限,构建覆盖文创、时尚、艺术等全场景智能创作生态。该模型通过自然语言指令直达创意成果,实现从平面图到施工图的全流程高效生成。同时,Billus AI同步打造“创意设计超级员工+产业链智能体”体系,探索生成式创意与供应链智能推荐的新商业路径,助力行业从“经验驱动”向“数据智能”跃迁。

  • AI日报:李飞飞Marble 3D世界模型公测;OpenAI首次推出ChatGPT群聊功能;百度发布多模态 AI助手超能小度

    本期AI日报聚焦多项技术突破:World Labs推出Marble 3D模型,实现多模态生成可交互虚拟世界;OpenAI在韩新试点ChatGPT群聊功能,支持多人协作互动;苹果更新隐私政策,要求第三方AI调用需明示授权;百度发布多模态助手“超能小度”,支持空间感知与设备免费升级;LinkedIn推出AI人脉搜索,通过自然语言精准匹配专业人士;Cursor完成23亿美元融资,估值达293亿;Character AI与耶鲁合作实现音画同步技术Ovi;Google NotebookLM上线深度研究工具,支持多格式文件分析与知识库构建。

  • AI日报:上海首例涉AI提示词著作权案宣判;Kimi K2 Thinking发布;中文图像编辑新王UniWorld-V2发布

    今日AI领域动态:上海首例AI提示词著作权案宣判,法院认定提示词不具独创性;月之暗面发布Kimi K2思考模型,实现自主多轮工具调用;UniWorld-V2图像编辑模型支持中文框选即改,性能超越GPT-Image;谷歌推出AI文件检测工具Magika 1.0,支持超200种格式;Sora安卓版首日下载量达47万次;我国发布全球首个AI海洋大模型“瞰海”,可精准预测10天内海洋变化;宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控;谷歌Gemini API推出文件搜索工具,简化私有RAG系统集成。

  • AI日报:月之暗面开源AI新框架Kosong;百度发布新模型ERNIE-4.5-VL;GPT-5.1“隐身”登场

    本期AI日报聚焦多项技术突破:月之暗面开源AI代理框架Kosong,支持异步编排与插件化设计;Replit推出AI集成功能,可一键调用300+模型;商汤发布空间智能模型SenseNova-SI,性能超越GPT-5;百度推出多模态模型ERNIE-4.5-VL,新增图像思考能力;谷歌地图全面AI化,集成Gemini实现智能交互;ChatTutor上线可视化教学系统,覆盖多学科实时推演;新版Google Finance引入AI深度搜索与财报追踪;OpenAI低调上线Polaris Alpha模型,支持256K上下文并更新知识库至2024年10月。

  • 厚植AI创新沃土!麒麟信安打造人工智能孵化器,赋能创业梦想

    10月28日,麒麟信安人工智能孵化器在长沙启动,旨在汇聚AI领域人才、技术与资本,构建开放协同的创新生态。该项目获湖南省多部门支持,已吸引60余个项目入围,组建了首批30余位专家导师团,并与多家顶尖机构共建联合体,通过政策扶持、资本对接等多维度赋能,培育优质AI项目在湘落地发展,助力区域打造人工智能产业创新高地。

  • 小米超级小爱AI大模型推出随心修图功能

    小米宣布超级小爱AI大模型推出随心修图功能,用户只需一句话即可轻松修出具有大片质感的照片。该功能有两种使用方式:在相册大图页面直接唤醒AI或通过应用上传照片并输入指令。使用需满足版本要求:超级小爱需v7.8.50及以上,相册编辑功能需v2.1及以上,相册本身需v4.3.0.30及以上。目前仅限Xiaomi HyperAI机型支持在相册大图页使用。超级小爱于2024年12月面向正式版用户开放升级,支持全局多模态交互和自然语音搜索,提升使用体验。

今日大家都在搜的词: