首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:阿里开源文生视频模型万相2.1;幻方量化回应DeepSeek-R2模型提前发布;百度“秒哒”开启用户邀测

2025-02-26 15:35 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、通义万相开源视频生成模型Wan2.1:8.2G显存即可生成480P视频

通义万相最新发布的Wan2.1模型专注于高质量视频生成,凭借其卓越的性能和创新技术,成为创作者和企业用户的首选工具。该模型在Vbench评测中取得了86.22%的高分,领先于其他视频生成模型,展现出显著的性能优势。Wan2.1通过高效的3D因果VAE模块和Diffusion Transformer架构,优化了视频生成和推理效率,为用户提供了灵活的开发和部署选择。

微信截图_20250226075714.png

【AiBase提要:】

🚀 Wan2.1模型在Vbench评测中以86.22%成绩位列第一,领先其他视频生成模型。

💡 采用3D因果VAE模块,实现256倍无损视频隐空间压缩,提高了视频重建速度。

🔧 支持多种主流框架,开发者可通过Gradio快速体验,简化推理与部署流程。

详情链接:https://github.com/Wan-Video

2、360智脑发布Tiny-R1-32B:5%参数逼近Deepseek-R1满血性能

360智脑团队与北京大学联合推出的Tiny-R1-32B-Preview模型,凭借仅5%的参数量,成功接近Deepseek-R1的性能,展现了小型模型在高效推理中的潜力。该模型在数学、编程和科学领域的评测中均表现优异,尤其在AIME2024评测中取得了78.1分,显示出其在多个任务上的均衡优化能力。研发团队承诺将开放完整的模型资源,推动技术的普惠发展。

微信截图_20250226080042.png

【AiBase提要:】

📊 Tiny-R1-32B-Preview模型以5%的参数量接近Deepseek-R1的性能,展现小模型的高效推理潜力。

💻 在数学、编程和科学领域,该模型在多个评测中表现优异,超越当前最佳开源70B模型。

🔗 研发团队承诺公开完整模型仓库,推动技术普惠,并已将模型上传至Hugging Face平台。

详情链接:https://huggingface.co/qihoo360/TinyR1-32B-Preview

3、DeepSeek开源周第3天:发布DeepGEMM,FP8GEMM库助力AI训练与推理

在开源周的第三天,中国人工智能公司DeepSeek推出了DeepGEMM,这是一款支持FP8通用矩阵乘法的开源库,旨在为密集型和混合专家模型提供支持。该库在NVIDIA Hopper GPU上实现了超过1350TFLOPS的FP8计算性能,且核心代码仅300行,展现出极高的效率与简洁性。

image.png

【AiBase提要:】

🚀 DeepGEMM是一个开源库,专为密集型和混合专家矩阵运算设计,支持FP8通用矩阵乘法。

💻 在NVIDIA Hopper GPU上,DeepGEMM可实现高达1350+ TFLOPS的FP8计算性能,展现出卓越的效率。

🌐 该库的发布不仅提升了DeepSeek模型的性能,也为全球开发者提供了一个高效、易用的矩阵运算工具。

详情链接:https://github.com/deepseek-ai/DeepGEMM

4、百度无代码开发工具“秒哒”开启用户邀测

百度于2月25日正式宣布其无代码开发工具“秒哒”已开启用户邀测,用户可通过收到的邀测邮件访问秒哒首页,体验H5页面开发和网站开发等功能。该工具于2024年11月12日在百度世界2024大会上发布,具备无代码编程、多智能体协作和多工具调用等特性。申请测试的企业用户数量已突破2万,百度后续将开放更多功能,用户可在百度智能云官网申请加入测试排队。

image.png

【AiBase提要:】

🚀 用户可通过邀测邮件访问秒哒,体验多种开发功能。

📈 申请测试的企业用户数量已突破2万,显示出市场的强烈需求。

🔧 秒哒具备无代码编程和多智能体协作等核心特性,提升开发效率。

详情链接:https://digital.cloud.baidu.com/mF/commonLandingPage/CTA/889605a4883041b98b16538350ea33f8?pushId=bBDCrkwdYZ6bP8TE44JbCM1

5、谷歌超低价AI模型Gemini2.0Flash-Lite正式上线

谷歌最近推出了Gemini2.0Flash-Lite,这是其AI模型系列中最具成本效益的选项,旨在为预算有限的开发者提供高性价比的解决方案。该模型在处理大规模文本输出任务时表现出色,定价策略极具竞争力,输入和输出tokens的费用远低于市场同类产品。虽然它不支持高级功能,但其在文本生成领域的高效性和实用性使其成为初创公司和小团队的理想选择。

image.png

【AiBase提要:】

💰 Gemini2.0Flash-Lite的输入tokens定价为每百万0.075美元,输出tokens为每百万0.30美元,具有极高的性价比。

📈 该模型在性能上优于Gemini1.5Flash,能够处理100万tokens的上下文窗口,适合高频任务。

📝 尽管不支持图像或音频输出,Gemini2.0Flash-Lite仍专注于文本生成,能够为约40,000张照片生成单行标题,成本不到1美元。

6、幻方量化回应DeepSeek-R2模型提前发布:以官方消息为准

近日,幻方量化针对DeepSeek新一代AI模型R2提前发布的传闻作出回应,强调一切以官方消息为准。幻方量化于2023年7月成立深度求索AI公司,并在今年1月发布了DeepSeek-R1模型。路透社报道称,DeepSeek正在加速推进R2模型的发布,计划提前至5月,且新模型在代码生成和多语言推理能力上有望实现提升。

【AiBase提要:】

🔍 幻方量化表示会以官方消息为准,回应DeepSeek-R2模型提前发布的传闻。

🚀 DeepSeek于2023年7月成立深度求索AI公司,并于1月成功发布DeepSeek-R1模型。

🌐 新一代DeepSeek-R2模型有望在代码生成和多语言推理能力上实现提升。

7、微软开源全新多模态 AI Agent “Magma”:可自动下单与行为预测

微软最近在官网上开源了名为“Magma”的多模态AI Agent基础模型。Magma能够跨越数字和物理世界,处理图像、视频和文本等多种数据类型,并具备心理预测功能,能够更准确地理解人物或物体的意图。这款AI的应用场景非常广泛,不仅可以帮助用户进行日常操作如自动下单和查询天气,还能控制实体机器人并提供实时帮助。Magma的推出标志着智能助手和机器人技术的重大进步,特别适合用于AI驱动的助手或机器人,提升其学习能力和实用性。

image.png

【AiBase提要:】

🌐 跨模态能力:Magma能够处理图像、视频和文本等多种数据类型,提升智能助手的功能。

🤖 智能应用:用户可通过Magma自动下单、查询天气,以及控制实体机器人。

📚 学习适应性:Magma帮助机器人学习新任务,并为虚拟助手生成操作指南,增强了其实用性。

详情链接:https://microsoft.github.io/Magma/

8、与DeepSeek和Claude竞争升级!OpenAI深度研究功能面向所有付费ChatGPT用户开放

OpenAI最近扩展了其深度研究功能,向所有ChatGPT Plus、Team、Education和Enterprise用户开放。这一功能被认为是自ChatGPT以来最具变革性的AI助手,能够进行复杂的研究任务并生成专业报告。与此同时,中国的DeepSeek通过开源新模型挑战OpenAI的商业模式,促使市场竞争加剧。

QQ_1740532688893.png

【AiBase提要:】

💻 OpenAI将深度研究功能扩展至多个用户层级,增强AI助手的研究能力。

🔍 中国DeepSeek通过开源新模型挑战OpenAI的订阅商业模式。

📈 深度研究在效率与局限性之间创造了新的商业机会,促使企业重塑信息处理流程。

9、PhotoDoodle AI 只需几个提示即可将您的照片变成异想天开的艺术作品

字节跳动与中国和新加坡大学研究团队联合推出的PhotoDoodle,利用Flux.1模型重新定义图像创作。该系统通过少量样本学习艺术风格,精准执行编辑指令,极大地提高了创意表达的可能性。核心技术包括位置编码克隆,确保新元素自然融入原始图像,同时研究团队正在探索更高效的单图像训练方法。

image.png

【AiBase提要:】

🖌️ PhotoDoodle基于Flux.1模型,能够从少量样本中学习艺术风格并执行编辑指令。

✨ 位置编码克隆技术使AI能记住每个像素位置,确保新元素自然融入背景。

📊 研究团队已发布包含六种艺术风格的数据集,并探索更高效的单图像训练方法。

详情链接:https://github.com/showlab/PhotoDoodle

10、OpenAI免费开放ChatGPT高级语音聊天模式

OpenAI于2月26日在X平台上宣布,ChatGPT的高级语音模式正式向用户免费开放。该模式基于GPT-4o mini模型,通过优化计算效率,性能已接近完整版GPT-4o。现在,macOS和Windows10、11系统的ChatGPT桌面应用程序都支持此模式,用户可以选择5种语音,并享受自定义提示和对话内容回顾功能。

QQ_1740552318910.png

【AiBase提要:】

🎤 高级语音模式基于GPT-4o mini模型,性能接近完整版GPT-4o。

💻 目前支持macOS及Windows10、11系统的ChatGPT桌面应用程序。

🚀 提供5种语音选择,支持自定义提示与对话内容回顾功能。

11、萌翻全网!AI“魔法”让校园地标秒变毛绒玩偶,创意特效火爆出圈!

最近,一款名为“快来惹毛我”的AI特效在社交媒体上引发热潮,能够将现实建筑转化为可爱的毛绒玩偶风格。该特效的简单操作和惊艳效果吸引了众多用户,尤其是在高校和文旅机构中广受欢迎。尽管生成效果存在随机性,但用户可以通过筛选不同风格的毛绒效果图片,获得更符合心意的最终效果。

image.png

【AiBase提要:】

🎉 这款AI特效“快来惹毛我”能将现实建筑转化为毛绒玩偶风格,效果可爱逼真。

📈 在社交平台上,该特效迅速走红,吸引大量用户参与并分享生成的视频。

🛠️ 用户可通过筛选不同风格的生成图片,确保最终效果更符合个人喜好。

12、支持联网搜索!OPPO ColorOS接入满血版DeepSeek-R1

今日,ColorOS官方宣布接入满血版DeepSeek-R1推理模型,覆盖40款OPPO/一加机型。新版本的小布助手功能显著提升,支持一键AI唤醒、语音对话、联网搜索及结果导出。OPPO通过本地化网络部署提升了系统流畅度,用户体验更佳。ColorOS设计总监强调小布助手与DeepSeek的强结合,展现了OPPO在技术创新方面的实力与决心。

【AiBase提要:】

🤖 小布助手接入DeepSeek-R1,功能显著提升,支持AI唤醒和语音对话。

🌐 OPPO进行了本地化网络部署,显著提升系统流畅度,用户体验更佳。

⚙️ ColorOS展现出独特的AI能力,避免用户繁琐的手动切换步骤。

举报

  • 相关推荐
  • 共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

    10月28日,AtomGit平台在北京国家会议中心举行升级发布会,正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞,强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源,打造开放中立的基础设施,计划于11月21日正式上线。华为、百度等企业代表分享了开源实践,多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

  • 人工智能巨头OpenAI拟上市 估值或高达1万亿美元

    OpenAI正积极推进上市计划,据知情人士透露,该公司可能最早于2026年下半年向证券监管机构提交上市申请,目标在2027年正式上市。 此次IPO的估值有望达到约1万亿美元,或将跻身全球规模最大的IPO之列。 在初步讨论中,OpenAI曾考虑通过上市筹集至少600亿美元资金,实际融资规模可能进一步扩大。

  • 卖家精灵加入中国人工智能产业发展联盟(AIIA),加速AI赋能跨境电商

    卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力,近日正式加入中国人工智能产业发展联盟(AIIA),成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可,未来将携手联盟推动AI技术研发与产业化,助力中国品牌全球化。依托八年积累的海量电商数据与算法体系,卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案,服务超百万跨境卖家,显著提升运营效率与决策精准度。

  • 厚植AI创新沃土!麒麟信安打造人工智能孵化器,赋能创业梦想

    10月28日,麒麟信安人工智能孵化器在长沙启动,旨在汇聚AI领域人才、技术与资本,构建开放协同的创新生态。该项目获湖南省多部门支持,已吸引60余个项目入围,组建了首批30余位专家导师团,并与多家顶尖机构共建联合体,通过政策扶持、资本对接等多维度赋能,培育优质AI项目在湘落地发展,助力区域打造人工智能产业创新高地。

  • 行业首个!海尔冰箱获ISO/IEC 42001人工智能管理体系认证

    2025年10月,海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业,标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程,确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品,推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术,为用户提供更安全、智能的健康饮食体验。

  • 人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

    科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲,强调高质量数据集是人工智能产业决胜关键。他指出,算力、算法和数据构成AI三大要素,而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施,通过集中管理、分散赋能模式,打通数据采集、治理到AI训练全链路,推动产业智能化升级。该平台已在制造、金融等领域落地,助力企业释放数据要素价值,实现弯道超车。

  • 格之格受邀出席“规范通用耗材采购需求标准 促进行业高质量发展”座谈会

    近日,北京举行“规范通用耗材采购需求标准+促进行业高质量发展”座谈会。会议聚焦建立通用耗材政府采购需求标准,推动采购从“合规”迈向“优质”。行业代表格之格分享了产品适配、服务保障及绿色回收等实践经验。与会专家指出,当前行业存在低价竞争、诚信缺失等问题,需通过完善标准、强化信用监管、引入多元评价指标等措施,构建公平透明的采购环境,引导产业链向高质量、绿色可持续方向发展。

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • 以品质驱动高质量发展!小熊电器入选2025佛山企业百强

    9月27日,2025年佛山市企业家大会召开,发布骨干企业调研及企业百强榜。小熊电器同时入选佛山企业100强、制造业100强及民企100强三大主榜,并跻身国际化及科技创新TOP30子榜。企业凭借高品质驱动发展,以用户需求为导向,通过持续研发创新、严格品控及智能制造,实现营收利润双增长,展现本土领军企业综合实力,印证“品质升级”推动高质量发展的长期价值。

  • 十方融海小智AI:以科技温度诠释“人工智能+”时代的人文关怀

    近日,小女孩“小十三”与十方融海研发的小智AI机器人深情告别的视频走红网络。这段1分17秒的对话不仅让无数网友泪目,更展现了AI技术的情感温度。十方融海团队迅速响应,跨越600公里为女孩送上定制版机器人作为生日礼物,并推出儿童心理陪伴计划。该事件体现了“人工智能+教育”的深刻内涵,彰显科技企业的人文关怀与社会担当,成为“技术向善”的生动实践。

今日大家都在搜的词: