首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:昆仑万维开源SkyReels-V2;讯飞星火X1全新升级;扣子空间Coze Space内测

2025-04-21 15:51 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用

新鲜AI产品点击了解:https://top.aibase.com/

1、昆仑万维开源SkyReels-V2:无限时长电影生成模型

昆仑万维的SkyReels团队推出了SkyReels-V2,这是全球首个基于扩散强迫框架的无限时长电影生成模型。该模型通过结合多模态大语言模型、强化学习等技术,显著提升了视频生成的质量和效率。SkyReels-V2不仅在技术上取得突破,还拓展了应用场景,包括故事生成和图生视频等,展现了其在创意内容制作领域的广泛潜力。

image.png

【AiBase提要:】

🚀 SkyReels-V2是全球首个使用扩散强迫框架的无限时长电影生成模型,标志着视频生成技术的新阶段。

🎬 该模型在运动动态、视觉质量和视频时长协调方面表现出色,支持生成高运动质量和高一致性的视频。

📊 在性能评估中,SkyReels-V2在多个关键维度上优于对比模型,展现了其卓越的指令遵循和视频一致性。

详情链接:https://github.com/SkyworkAI/SkyReels-V2

2、讯飞星火X1全新升级:在AI领域力争与OpenAI对抗

科大讯飞于4月21日推出了其最新的人工智能模型——讯飞星火X1,旨在与OpenAI的o1和DeepSeek R1竞争。该模型在多个领域表现出色,尤其是在教育、医疗和司法等行业。尽管其模型参数较小,但整体效果与行业领先者相当。此外,讯飞星火X1的“快思考、慢思考”统一模型为用户提供了灵活的思考方式,降低了企业使用AI的门槛。

image.png

【AiBase提要:】

✨ 讯飞星火X1通过复杂场景数据提升了模型的泛化能力,适用于教育、医疗和司法等行业。

💡 尽管模型参数小于同类产品,但整体效果媲美行业领先者,展现出强大的竞争力。

🔧 新的模型定制优化工具链支持多种定制方案,简化了企业的AI应用部署流程。

3、宇树科技宣布全球首场人形机器人格斗大赛将于2025年震撼开战

宇树科技将在2025年举办全球首场人形机器人格斗大赛,展示尖端技术与机器人格斗的魅力。参赛的G1人形机器人经过高强度训练,展现出卓越的灵活性和强大的战斗能力,尤其是在被击倒后能迅速恢复战斗,令人印象深刻。这场赛事不仅是技术的盛会,更将推动人工智能和机器人技术的发展,吸引全球科技爱好者的关注。

image.png

【AiBase提要:】

🤖2025年5月至6月,宇树科技将在杭州举办全球首场人形机器人格斗大赛,展示前所未有的视觉盛宴。

💪 G1人形机器人经过高强度的算法训练与硬件调试,展现出卓越的灵活性和强劲的出拳能力。

📺 比赛将通过中央广播电视总台全网直播,观众将亲眼目睹机器人格斗的巅峰对决。

4、扣子空间Coze Space正式开启内测

字节跳动的全新AI协同办公平台“扣子空间”已进入内测阶段,旨在提升用户与AI Agent的协作效率。该平台具备自动分析用户需求、拆解任务、调用工具等多项创新功能,能够生成完整的结果报告。此外,平台引入了专家Agent生态,用户可选择不同领域的专家进行深度分析,帮助获取更多洞察。

image.png

【AiBase提要:】

🤖 扣子空间提供全方位服务,支持用户与AI Agent高效协作,自动分析需求并拆解任务。

📊 引入专家Agent生态,用户可选择专业领域的Agent进行深度分析和报告生成。

🔧 支持MCP扩展集成,首批支持多种工具,未来将允许用户发布自定义MCP。

5、谷歌发布 Gemma3QAT 模型:一张3090显卡也能轻松驾驭

谷歌近期推出了Gemma3系列的新版本,特别是经过量化感知训练(QAT)优化的Gemma327B模型,显著降低了内存需求,使得用户能够在消费级GPU上本地运行大型模型。QAT技术通过在训练过程中融入量化操作,减少了性能损失,提升了模型在小型设备上的运行效果。

image.png

【AiBase提要:】

💡 QAT优化的Gemma327B模型显存需求从54GB降低到14.1GB,用户可在消费级GPU上运行。

⚙️ 经过5000步QAT训练,模型困惑度下降54%,在小型设备上保持高效运行。

🌐 多个开发者工具如Ollama、LM Studio和MLX已支持Gemma3QAT模型,用户体验更佳。

6、Intel 开源 AI Playground,可用intel Arc 显卡使用各种AI模型

Intel 宣布将其生成式 AI 软件 AI Playground 正式开源,标志着在推动生成式 AI 技术普及和社区协作方面的重要一步。AI Playground 是一款专为 Intel Arc GPU 和集成显卡优化的工具,支持多种生成式 AI 模型,允许用户在本地生成 AI 图像并确保数据隐私。

image.png

【AiBase提要:】

🛠️ AI Playground 是一款功能强大的 AI 工具,支持多种生成式 AI 模型,包括图像扩散模型和大语言模型,确保本地数据隐私。

🌍 开源 AI Playground 以 MIT 许可协议发布,鼓励开发者自由下载、定制和贡献代码,降低了开发门槛,促进社区协作。

🚀 Intel 的开源举措被视为生成式 AI 领域的重要突破,预计将推动更多基于 Intel 硬件的 AI 解决方案的开发。

详情链接:https://github.com/intel/AI-Playground

7、Reachy2机器人发布:互动自然,售价7万美元

Hugging Face通过收购Pollen Robotics推出开源人形机器人Reachy2,标志着人形机器人与生成式AI结合的重要里程碑。Reachy2以其友好的外观、先进的传感器和开源特性,迅速成为全球顶尖实验室的关注焦点。该机器人不仅推动了机器人技术的主流化,也为AI和机器人研究提供了低成本的创新机会,展现了未来人形机器人市场的巨大潜力。

image.png

【AiBase提要:】

🤝 Reachy2是Hugging Face收购Pollen Robotics后推出的开源人形机器人,售价7万美元。

🛠️ 该机器人配备先进传感器和VR遥控操作,支持灵活编程与定制,促进机器人技术的民主化。

📈 市场预测到2050年人形机器人市场规模将达1.7万亿美元,Reachy2的开源模式为研究和教育提供了创新机会。

8、字节跳动研究开源 ChatTS-14B:原生理解并随着时间的推移进行推理

字节跳动研究团队推出了ChatTS-14B,这是一款专为时间序列数据设计的140亿参数大型语言模型,旨在通过自然语言接口降低时间序列分析的使用门槛。该模型的开源引发了广泛关注,标志着时间序列分析与生成式AI结合的重大进展。ChatTS-14B不仅提供了模型权重,还包括详细的使用文档和代码库,助力开发者在金融、医疗等领域的应用。

image.png

【AiBase提要:】

📊 ChatTS-14B是一个140亿参数的语言模型,专为时间序列数据理解和推理而设计。

🌐 开源的ChatTS-14B使得非专业用户也能通过自然语言轻松处理时间序列任务,降低了使用门槛。

🚀 该模型的发布标志着字节跳动在AI领域的战略性突破,推动了时间序列分析的广泛应用。

详情链接:https://huggingface.co/bytedance-research/ChatTS-14B

9、Figma 推 AI 革命:开发智能应用制作器与网站创建工具

Figma正积极布局人工智能领域,计划推出一款AI应用程序制作器和Figma Sites网站创建工具。这些新工具旨在通过自然语言和现有设计资源快速生成应用程序和网站,降低开发门槛,使非技术背景的设计师也能轻松构建功能性应用。Figma的这一系列创新不仅提升了设计与开发的智能化水平,还可能重新定义行业协作模式,尽管面临来自Webflow和Wix等平台的竞争。

image.png

【AiBase提要:】

🛠️ Figma推出AI应用程序制作器,支持多种输入形式,降低开发门槛。

🌐 Figma Sites工具将帮助用户直接从设计稿生成可用网站,扩展设计生态。

🤖 Figma借助Claude Sonnet模型提升智能化水平,可能重塑设计与开发的协作模式。

10、微软MarkItDown MCP,可把Word、Excel等转换成markdown格式

在数字化时代,微软推出的MarkItDown MCP(Model Context Protocol)为文档处理带来了革命性的变化。该工具支持多种文件格式如PDF、Word、PowerPoint等,能够高效地将其转换为Markdown格式,极大地方便了文本分析及大型语言模型的应用。

image.png

【AiBase提要:】

📄 **多格式支持**: 支持PDF、Word、PowerPoint等多种文件格式,满足不同场景的需求。

🔍 **智能文档结构保持**: 转换过程中,智能识别并保留文档的核心结构,确保信息完整无损。

⚙️ **插件扩展功能**: 支持第三方插件,用户可根据需求进行扩展,满足特定文档处理要求。

详情链接:https://github.com/microsoft/markitdown

举报

  • 相关推荐
  • 下一个爆款在哪儿?2025英特尔人工智能创新应用大赛获奖名单揭晓

    8月16日,2025英特尔人工智能创新应用大赛总决赛在深圳落幕。40支优秀团队从2817支队伍中脱颖而出,围绕工业、教育、心理健康、游戏等领域展开对决。大赛展示了AI从云端走向边缘的趋势,依托酷睿Ultra处理器和低代码开发工具,推动AI应用本地化落地。获奖作品包括动力电池机器人协作拆卸系统和AI生成PPT服务,体现AI与产业需求的深度融合。英特尔与联想、惠普等合作伙伴共同为开发者提供全栈支持,加速AI技术普及和商业化进程。

  • 海尔冰箱唯一获批“制冷家电人工智能技术山东省工程研究中心”

    海尔冰箱在人工智能领域取得新突破,主导建设的"制冷家电人工智能技术山东省工程研究中心"成为2025年山东省工程研究中心认定名单中唯一入选的冰箱品牌。该中心聚焦人工智能、物联网、大数据等技术方向,开发了全空间智慧保鲜舱冰箱等140多项行业首创产品,近三年获授权发明专利803件。海尔冰箱还推出行业首款接入DeepSeek的AI全空间保鲜冰箱,具备方言识别、降噪技术等功能,显著提升用户体验。市场数据显示,2023年1-7月海尔冰箱以47%市场份额稳居行业第一。通过AI技术赋能,海尔冰箱正引领行业向精准、智能保鲜时代跨越。

  • ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

    ISC.AI2025人工智能安全论坛在北京召开,聚焦AI安全治理与创新实践。论坛汇集顶尖专家,探讨大模型安全评估与防护、智能体安全、AI治理等前沿议题。360集团张向征指出,随着Agent技术爆发式应用,AI安全已成为产业核心焦点。专家们强调需构建AI安全防护体系,应对大模型直接访问核心系统带来的全新挑战。中国电子院彭健提出企业合规建设需关注九大要素,清华大学苏航揭示智能体安全风险远超传统AI。华为云范建军倡导端到端大模型安全防护,中国信通院杨哲超呼吁构建协同治理框架。论坛为构建安全、普惠、负责任的人工智能未来贡献智慧。

  • 昆仑万维技术周启幕:SkyReels模型重塑内容创作基建

    2025年8月11日,昆仑万维启动SkyWork+AI技术发布周,将连续五天发布五大领域AI模型:视频生成模型Skyreels、世界模型、生图一体化模型、智能体(Agent)模型和AI音乐创作模型Mureka。首日发布的Skyreels-A3是全球首个支持分钟级长视频生成的模型,通过四大技术创新解决直播电商等场景痛点,可实现180秒连贯视频生成、影视级运镜控制与自然动作交互。该模型采用多模态协同生成范式,突破传统视频生成技术误差累积限制,并通过Step蒸馏技术将推理步数压缩至4步,生成时间缩短至80秒。商业化方面,昆仑万维已形成"研发-产品变现-现金流反哺"闭环,2025年Q1经营性现金流净额增长58.3%,旗下DramaWave、Mureka等产品年化流水分别达1.2亿和1200万美元。此次技术周标志着中国AI企业首次跑通规模化盈利路径。

  • Razer(雷蛇)在新加坡设立AI CENTER OF EXCELLENCE,加速人工智能投资布局

    雷蛇宣布在新加坡设立全球AI卓越中心,并计划在欧洲和美国建立类似机构,推动游戏与开发者工具领域的创新。新加坡中心将招聘150名AI工程师,专注于下一代AI游戏技术研发。雷蛇还推出AI工具套件,包括Game Co-AI和QA Co-AI,帮助开发者提升游戏质量和开发效率。该战略布局正值全球游戏市场快速增长期,预计2033年AI游戏市场规模将达280亿美元。新加坡数字产业发展局表示,此举将巩固该国作为区域AI创新中心的地位。

  • AI日报:昆仑万维发布SkyReels-A3模型;百度搜索PC端全面上线AI搜索;Grok 4 AI模型永久免费开放

    AI日报栏目聚焦人工智能领域最新动态:1)昆仑万维发布SkyReels-A3模型,实现语音驱动数字人生成;2)xAI宣布Grok4模型永久免费开放;3)OpenAI发布GPT-5提示词指南;4)百度PC端上线AI搜索功能;5)微软Windows Co pilot接入GPT-5;6)百川智能开源医疗大模型Baichuan-M2性能超越GPT-oss120b;7)苹果iOS26将集成ChatGPT-5;8)谷歌推出3D视觉编辑框架BlenderFusion;9)轻量级TTS模型Kitten TTS参数仅1500万;10)MiniCPM-V

  • 昆仑万维UniPic 2.0“小钢炮”模型炸场,一个模型搞定理解+生成+编辑

    大模型又迎来新一波的迭代周期。 近日,从Open AI发布GPT-5,到国内的昆仑万维、商汤、百川智能、智谱等都陆续发布了自己的新模型。其中昆仑万维更是一口气开启了技术周,连续5天每天发布一个新模型,而8月13日发布的,正是其本周发布的第三款模型——多模态统一模型UniPic2.0。 UniPic2.0主打的是,在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力

  • AI日报:DeepSeek V3.1正式发布;企业微信5.0推出全新AI能力;快手 Klear-Reasoner 模型成功登顶

    AI日报栏目聚焦人工智能领域最新动态。DeepSeek V3.1发布,大幅增强长文档分析和代码理解能力;企业微信5.0集成智能搜索、总结和机器人功能;快手Klear-Reasoner模型数学推理准确率超90%;谷歌Docs新增AI语音朗读功能;Firecrawl完成1450万美元融资并推出V2版本API;Meta上线AI语音翻译功能;微软Excel集成Copilot实现一键数据分析;Claude桌面客户端推动AI编程可视化;苹果Xcode将原生集成Cl

  • 寒武纪智能芯片赋能多模态大模型应用

    大模型快速发展推动人工智能技术迈向新阶段,从解决特定任务的弱人工智能向处理通用复杂任务的强人工智能演进。IDC报告显示,2024年中国大模型开发平台市场规模达16.9亿元,人工智能算力市场约190亿美元,预计2025年将达259亿美元。寒武纪等企业专注AI芯片研发,推出多款处理器及加速卡产品,支持大模型训练推理及多模态任务,并与产业链合作共同推进人工智能产业发展。

  • AI日报:智谱视觉推理模型GLM-4.5V开源;达摩院开源三项具身智能核心技术;360智脑推出Light-IF系列模型

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱GLM-4.5V开源发布:全球100B级最佳视觉推理模型智谱宣布推出并开源了全球100B级效果最佳的开源视觉推理模型GLM-4.5V,这是该公司在通向通用人工智能(AGI)道路上的又一重要探

今日大家都在搜的词: