首页 > 原创 > 关键词  > AI视频创作最新资讯  > 正文

AI日报:B站测试AI视频工具花生AI;腾讯发布多模态模型Large-Vision;昆仑万维开源Skywork UniPic 2.0

2025-08-13 15:52 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、B 站测试新 AI 视频创作工具 “花生 AI”,3 分钟可成片

B 站正在测试全新的 AI 视频创作工具 '花生 AI',该工具能够帮助用户快速生成视频内容,且成片质量较高。同时,B 站也在推进 AI 技术的应用,如自研大语言模型和多语言翻译功能。

image.png

【AiBase提要:】

🎥 花生 AI 可通过文案或音频快速生成视频成片。

🔄 用户可选择智能匹配素材或使用模板进行视频创作。

🌐 B 站已上线自研大语言模型,支持多语言实时翻译。

2、昆仑万维开源「Skywork UniPic 2.0」模型

昆仑万维集团在SkyWork AI技术发布周宣布开源「Skywork UniPic 2.0」模型,这一统一多模态模型通过生成和编辑模块的轻量化设计,以及多模态理解模型的联合训练,实现了高效、高质、统一的多模态生成能力。

image.png

【AiBase提要:】

🧠 Skywork UniPic 2.0是一个统一多模态模型,支持文本和图像输入,扩展了生图和编辑能力。

🚀 基于SD3.5-Medium架构,通过联合训练实现理解、生成和编辑一体化的能力。

💡 引入强化学习,采用渐进式双任务策略提升模型对复杂指令的理解与图像生成一致性。

详情链接:https://unipic-v2.github.io/

3、马斯克怒指苹果 “偏心” OpenAI,苹果回应不甘示弱!

马斯克指控苹果在App Store中偏袒OpenAI,苹果则回应称平台设计公平公正。双方矛盾升级,未来可能面临法律和市场上的较量。

image.png

【AiBase提要:】

🍎 马斯克指控苹果在App Store中偏袒OpenAI,影响其他AI公司发展

⚖️ 苹果强调App Store设计公平公正,确保开发者获得曝光机会

🔥 马斯克威胁对苹果采取法律行动,双方矛盾升级

4、腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率全场景输入

腾讯混元团队发布全新多模态理解模型——混元Large-Vision,该模型采用MoE架构,拥有52B参数规模,支持任意分辨率图像、视频和3D空间输入,同时提升了多语言场景的理解能力,为AI视觉理解服务提供了强大的技术基础。

0000.jpg

【AiBase提要:】

🖼️ 支持任意分辨率图像处理,无需复杂预处理操作。

🧠 采用MoE架构,实现性能与效率的平衡。

🌐 提升多语言场景理解能力,支持跨语言多模态应用。

5、官方否认 DeepSeek-R2 模型 8 月发布计划

DeepSeek 官方否认了关于其下一代大模型 DeepSeek-R2 在8月15日至30日之间发布的传言。尽管此前有消息称 R2 模型将在3月或5月发布,但均被官方否认。目前,DeepSeek 尚未公布 R2 模型的具体发布时间及技术细节。

【AiBase提要:】

📌 DeepSeek 官方否认了 R2 模型在8月发布的传言。

📌 R2 模型的发布时间和细节尚未正式公布。

📌 DeepSeek 团队仍在对模型进行性能提升,尚未准备好正式投用。

6、OpenAI推出超值ChatGPT Go套餐:仅399卢比,全球用户羡慕

OpenAI 推出的 ChatGPT Go 套餐以极低的价格(399印度卢比)为用户提供更多 AI 服务功能,包括更长的对话支持、文件上传和图像生成等,旨在降低使用门槛并吸引更多用户。

image.png

【AiBase提要:】

🤖 ChatGPT Go 套餐提供更丰富的对话次数和文件上传功能

🎨 用户可享受更强大的图像生成能力

📊 Go 套餐包含高级数据分析功能

7、AI新贵Perplexity豪掷345亿美元,正式报价收购谷歌Chrome

Perplexity提出以345亿美元现金收购谷歌Chrome浏览器,旨在应对谷歌的反垄断困境。其承诺保持Chromium开源并维持Chrome默认设置,同时展示了对市场和竞争格局的深刻理解。

【AiBase提要:】

💰 Perplexity以345亿美元现金报价收购Chrome,展现强大野心。

🔒 承诺保持Chromium开源及Chrome默认设置,减少监管顾虑。

🌐 Chrome占据68%市场份额,可能引发激烈竞购战。

8、Anthropic 的 Claude Sonnet 4 模型已支持高达 100 万个词元

Anthropic 推出的 Claude Sonnet 4 模型扩展了其上下文词元支持至100万,显著提升了开发灵活性。同时推出了新的定价方案,并与 Google Gemini 形成竞争压力。

image.png

【AiBase提要:】

🤖 Anthropic 的 Claude Sonnet 4 模型支持高达100万个上下文词元,提升开发灵活性。

💰 新的定价方案针对不同词元范围进行区分,开发者可通过批处理降低成本。

🔄 OpenAI 对长上下文需求持观望态度,但面临 Anthropic 和 Google Gemini 的竞争压力。

9、ChatGPT大更新!GPT-5模式自由切换,4o回归,体验更温暖

OpenAI对ChatGPT进行了重要升级,恢复了GPT-4o作为默认模型,并为GPT-5引入了多种模式选择。同时优化了AI的交互个性,使其更加温暖和用户友好,提升了整体使用体验。

【AiBase提要:】

✨ GPT-5支持三种模式切换,满足不同场景需求。

🔄 模型选择器优化,付费用户可灵活访问多种模型。

💬 AI交互个性升级,提升用户体验与自然度。

举报

  • 相关推荐
  • 从技术叙事走向商业化拐点,AI视频公司集体迎来价值重估?

    刚刚,快手发布2026年一季度财报。比起集团整体表现,市场的注意力更聚焦在可灵AI的经营数据。 财报显示,2026年第一季度,可灵AI营业收入超过人民币6.5亿元,同比增长超300%;2026年3月,其年化收入运行率(ARR)已接近5亿美元,较去年3月的1亿美元增长4倍,其商业化进程进一步加速。 几乎就在同一个时间窗口里,另外两件行业标志性事件同步发生。 一边是戛纳电影节上,

  • AI赋能企业见实效|知名AI培训机构红烁AI圆满完成京能信息AI技能应用培训项目

    红烬AI为北京京能信息技术公司成功交付为期3天2晚的“AI技能应用实战培训”,面向业务及技术骨干。培训以需求为导向,定制递进式课程,从零基础到独立产出可用工作成果,学员能力实现跨越。客户高度评价,认为培训不仅提升AI实操技能,更带来工作思维与协作模式的根本转变。这是红烬AI深耕企业AI赋能、服务央国企数智化转型的重要实践。

  • AI仿真人不如AI仿超市

    我真没空管你们这些水果蔬菜、厨房用品、酒水饮料的事了。 谁也没想到,在经历了邪恶猫狗的叙事浪潮后,AI短片的新风口是火车上的小推车——啤酒饮料矿泉水,花生瓜子八宝粥,前面的乘客把腿收一收!

  • 你还在靠感觉和AI“聊天”? 这个工具让你精准驱动 AI 深度产出

    AIBase推出「AI对话问题挖掘」工具,解决用户面对AI不知如何提问的困境。只需输入核心关键词,系统自动挖掘用户真实高频提问,提供带热度指数的问题推荐。该工具帮助内容创作者、SEO运营者、品牌营销团队和AI重度用户精准锁定内容方向,驱动AI输出深度内容。它构建了从关键词到问题挖掘、Prompt驱动再到理想内容产出的完整AI内容生产链,让内容创作从“碰运气”变为“有依据”,助力掌握GEO时代流量红利。

  • 跻身全球第一梯队!京东开源JoyAI-Echo框架:解决长视频生成三大难题

    今日,京东宣布推出JoyAI-Echo长音视频生成框架,号称解决行业长期头疼的长视频生成三大难题:角色易崩、声音乱变、生成缓慢。 目前,JoyAI-Echo代码与权重已全部开源,项目页和GitHub代码仓库均已上线,开发者和创作者可进行体验和二次开发。 京东表示,JoyAI-Echo的推出,标志着京东在长视频生成领域实现重大突破,进入全球第一梯队。 据了解,JoyAI-Echo内置跨模态音视频�

  • 2499元!华为AI眼镜发布:第一视角AI闪拍、视频通话

    华为发布AI眼镜方形钛银灰版,售价2499元,主打第一视角拍摄与智能交互。搭载1200万像素超感光摄像头和1/2.8英寸大底传感器,支持4K照片、2K视频及HDR+Vivid标准,0.7秒AI闪拍捕捉瞬间。内置自研AI芯片,支持智能问答、卡游识别及“看一眼支付”。轻触镜腿快捷键可快速操作,钛合金铰链佩戴舒适,IP54防水防尘,12小时综合续航。运行鸿蒙系统,可连接华为设备,外观可选方形、圆形镜框,支持定制近视镜片。6月1日10:08开售,赠换新守护权益和优惠配镜服务。

  • 企业如何出现在豆包等AI搜索里?厦门享联科技AI搜索优化推荐

    当用户向DeepSeek、豆包或通义千问提问时,你的品牌是否会被AI“推荐”?在生成式AI逐渐成为信息入口的今天,这个问题直接关系到企业的数字可见度。近日,享联科技旗下平台AIBase正式推出“GEO排名监控”工具(https://app.aibase.com/zh/geo),帮助企业系统化追踪在主流AI模型回答中的品牌曝光情况。

  • TCL首批接入微信AI生态,加速家电AI智能化进程

    微信于6月8日发布《关于开发者接入微信AI生态的指引》,TCL实业作为首批参与微信Agent内测的企业,已完成电视、空调等核心品类的接入测试。双方将依托微信AI Agent能力与TCL鸿鹄实验室技术,实现智能终端产品的自然交互体验,推动“AI+家电”融合应用。未来,双方将深化合作,拓展更多品类,构建开放智能的家电AI生态。

  • 语音驱动落地运营:小云AI店长,打破AI运营工具 “只会献策、不会干活” 行业困局

    在当前本地生活数字化浪潮中,实体商家面临AI运营工具功能单一、操作复杂、落地难等痛点。小云AI店长通过语音运营、全域研判和实操落地三大核心能力,以全场景语音交互降低使用门槛,整合多平台数据提供精准诊断,并实现运营方案一键自动化执行,大幅降低成本和操作难度,让中小实体店以低成本实现数字化精细运营。

  • 男子用AI写歌月入十几万:40秒就能生成一首歌

    近日,浙江杭州一名从业者借助AI音乐创作工具实现可观收益。该创作者只需上传一张图片,耗时40秒便能生成一首完整曲目,工具可驾驭各类曲风,生成作品的人声、唱腔还原度贴近真人演唱,普通听众很难区分演唱者是AI还是真人。 依托低成本批量制作AI歌曲,投放到音乐、短视频平台变现,月收入可达十几万元,AI生成音乐也逐渐在各大内容平台收获流量。 同时他提醒大

今日大家都在搜的词: