首页 > 原创 > 关键词  > AI视频创作最新资讯  > 正文

AI日报:B站测试AI视频工具花生AI;腾讯发布多模态模型Large-Vision;昆仑万维开源Skywork UniPic 2.0

2025-08-13 15:52 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、B 站测试新 AI 视频创作工具 “花生 AI”,3 分钟可成片

B 站正在测试全新的 AI 视频创作工具 '花生 AI',该工具能够帮助用户快速生成视频内容,且成片质量较高。同时,B 站也在推进 AI 技术的应用,如自研大语言模型和多语言翻译功能。

image.png

【AiBase提要:】

🎥 花生 AI 可通过文案或音频快速生成视频成片。

🔄 用户可选择智能匹配素材或使用模板进行视频创作。

🌐 B 站已上线自研大语言模型,支持多语言实时翻译。

2、昆仑万维开源「Skywork UniPic 2.0」模型

昆仑万维集团在SkyWork AI技术发布周宣布开源「Skywork UniPic 2.0」模型,这一统一多模态模型通过生成和编辑模块的轻量化设计,以及多模态理解模型的联合训练,实现了高效、高质、统一的多模态生成能力。

image.png

【AiBase提要:】

🧠 Skywork UniPic 2.0是一个统一多模态模型,支持文本和图像输入,扩展了生图和编辑能力。

🚀 基于SD3.5-Medium架构,通过联合训练实现理解、生成和编辑一体化的能力。

💡 引入强化学习,采用渐进式双任务策略提升模型对复杂指令的理解与图像生成一致性。

详情链接:https://unipic-v2.github.io/

3、马斯克怒指苹果 “偏心” OpenAI,苹果回应不甘示弱!

马斯克指控苹果在App Store中偏袒OpenAI,苹果则回应称平台设计公平公正。双方矛盾升级,未来可能面临法律和市场上的较量。

image.png

【AiBase提要:】

🍎 马斯克指控苹果在App Store中偏袒OpenAI,影响其他AI公司发展

⚖️ 苹果强调App Store设计公平公正,确保开发者获得曝光机会

🔥 马斯克威胁对苹果采取法律行动,双方矛盾升级

4、腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率全场景输入

腾讯混元团队发布全新多模态理解模型——混元Large-Vision,该模型采用MoE架构,拥有52B参数规模,支持任意分辨率图像、视频和3D空间输入,同时提升了多语言场景的理解能力,为AI视觉理解服务提供了强大的技术基础。

0000.jpg

【AiBase提要:】

🖼️ 支持任意分辨率图像处理,无需复杂预处理操作。

🧠 采用MoE架构,实现性能与效率的平衡。

🌐 提升多语言场景理解能力,支持跨语言多模态应用。

5、官方否认 DeepSeek-R2 模型 8 月发布计划

DeepSeek 官方否认了关于其下一代大模型 DeepSeek-R2 在8月15日至30日之间发布的传言。尽管此前有消息称 R2 模型将在3月或5月发布,但均被官方否认。目前,DeepSeek 尚未公布 R2 模型的具体发布时间及技术细节。

【AiBase提要:】

📌 DeepSeek 官方否认了 R2 模型在8月发布的传言。

📌 R2 模型的发布时间和细节尚未正式公布。

📌 DeepSeek 团队仍在对模型进行性能提升,尚未准备好正式投用。

6、OpenAI推出超值ChatGPT Go套餐:仅399卢比,全球用户羡慕

OpenAI 推出的 ChatGPT Go 套餐以极低的价格(399印度卢比)为用户提供更多 AI 服务功能,包括更长的对话支持、文件上传和图像生成等,旨在降低使用门槛并吸引更多用户。

image.png

【AiBase提要:】

🤖 ChatGPT Go 套餐提供更丰富的对话次数和文件上传功能

🎨 用户可享受更强大的图像生成能力

📊 Go 套餐包含高级数据分析功能

7、AI新贵Perplexity豪掷345亿美元,正式报价收购谷歌Chrome

Perplexity提出以345亿美元现金收购谷歌Chrome浏览器,旨在应对谷歌的反垄断困境。其承诺保持Chromium开源并维持Chrome默认设置,同时展示了对市场和竞争格局的深刻理解。

【AiBase提要:】

💰 Perplexity以345亿美元现金报价收购Chrome,展现强大野心。

🔒 承诺保持Chromium开源及Chrome默认设置,减少监管顾虑。

🌐 Chrome占据68%市场份额,可能引发激烈竞购战。

8、Anthropic 的 Claude Sonnet 4 模型已支持高达 100 万个词元

Anthropic 推出的 Claude Sonnet 4 模型扩展了其上下文词元支持至100万,显著提升了开发灵活性。同时推出了新的定价方案,并与 Google Gemini 形成竞争压力。

image.png

【AiBase提要:】

🤖 Anthropic 的 Claude Sonnet 4 模型支持高达100万个上下文词元,提升开发灵活性。

💰 新的定价方案针对不同词元范围进行区分,开发者可通过批处理降低成本。

🔄 OpenAI 对长上下文需求持观望态度,但面临 Anthropic 和 Google Gemini 的竞争压力。

9、ChatGPT大更新!GPT-5模式自由切换,4o回归,体验更温暖

OpenAI对ChatGPT进行了重要升级,恢复了GPT-4o作为默认模型,并为GPT-5引入了多种模式选择。同时优化了AI的交互个性,使其更加温暖和用户友好,提升了整体使用体验。

【AiBase提要:】

✨ GPT-5支持三种模式切换,满足不同场景需求。

🔄 模型选择器优化,付费用户可灵活访问多种模型。

💬 AI交互个性升级,提升用户体验与自然度。

举报

  • 相关推荐
  • 爱诗科技下注的AI视频,正在比它预期的更「快」落地

    「我们决定全力投入视频生成领域,因为我们坚信视频生成一旦能够落地,其产品化和商业化的潜力可能不亚于大语言模型。」爱诗科技创始人兼CEO王长虎在2025年6月的一场演讲中,这样解释为什么要在2023年就坚定地选择AI视频生成这个非共识赛道作为自己的创业方向。 短短两年后,视频大模型的产品化和商业化潜力已经如王长虎判断的那样,在快速落地,形成自己的创作生�

  • OceanBase发布首款AI数据库seekdb:三行代码构建AI应用 实现百亿级多模数据混合搜索

    今日,在2025 OceanBase年度发布会上,OceanBase发布并开源了其首款AI数据库OceanBase seekdb(简称seekdb)。 开发者仅需三行代码,即可快速构建知识库、智能体等AI应用,轻松应对百亿级多模数据检索,真正实现开箱即用”的AI数据基座。 该产品支持向量、全文、标量及空间地理数据的统一混合搜索,深度融合AI推理与数据处理,并兼容Hugging Face、LangChain等30余种主流AI框架。 这一�

  • AI日报:xAI推出Grok 4.1;OceanBase发布首款AI数据库seekdb;Kimi K2成功接入Perplexity

    本期AI日报聚焦多项技术突破:蚂蚁集团"灵光"AI助手实现30秒生成可编辑应用;xAI推出免费Grok 4.1模型显著提升质量与速度;Poe推出200人群聊功能支持多模型协作;OceanBase发布首款AI数据库seekdb实现混合搜索;国产模型Kimi K2接入Perplexity展现国际竞争力;谷歌DeepMind推出通用智能体SIMA2在3D游戏中任务完成率达62%;ElevenLabs升级为一站式内容生成平台;昆仑万维推出轻量级多模态智能体Skywork R1V4-Lite,用户拍照即可自动完成任务。

  • TabTab 登顶模力工场 AI 应用榜榜首, 把 AI 数据分析师装进口袋,关键结论更快抵达!

    TabTab是一款全链路AI数据分析助手,核心功能包括多源数据连接(支持文档、数据库、电商平台等)、自动化采集清洗、内置分析模型及可视化呈现。其优势在于通过多智能体系统实现自然语言交互,降低分析门槛,让非技术人员也能快速完成客户洞察、销售业绩等分析,显著提升效率。产品定位中立,致力于构建多元化AI效率提升生态。

  • Billus AI高交会全球首发多模态大模型 以AI Agent重构创意产业文明进化路径

    2025年11月15日,Billus AI在高交会首发多模态大模型Billus0.57EDIT及“超级员工智能体”初阶版,依托自研生存式大模型与AI Agent技术,打破创意领域垂直局限,构建覆盖文创、时尚、艺术等全场景智能创作生态。该模型通过自然语言指令直达创意成果,实现从平面图到施工图的全流程高效生成。同时,Billus AI同步打造“创意设计超级员工+产业链智能体”体系,探索生成式创意与供应链智能推荐的新商业路径,助力行业从“经验驱动”向“数据智能”跃迁。

  • 人工智能落地“最后一公里”,戴尔工作站助力AI应用提速

    AI应用落地面临“最后一公里”部署难题:传统流程繁琐耗时,从模型开发到上线需数周。英特尔携手戴尔与零克云打造“工作站-AI PC-云端”协同生态,通过本地工作站进行小规模测试验证,降低试错成本与数据泄露风险,再通过“一键部署”快速扩展至云端规模化落地。这种“先本地验证、后云端放大”的路径显著提升开发效率,释放团队创造力,让有价值的AI想法快速照进现实。

  • AI日报:HeyGen发布AI视频翻译引擎;科大讯飞推星火 X1.5;QQ浏览器推出AI+小窗

    本期AI日报聚焦多项技术突破:HeyGen推出精准唇形同步的视频翻译引擎;科大讯飞发布星火X1.5大模型,提升多语言处理能力;QQ浏览器新增AI助手浮窗;科大讯飞推出软硬一体方案,实现高噪声环境精准识别;谷歌Gemini 3 Pro预览版支持百万级上下文窗口;Comfy Cloud让Stable Diffusion实现零门槛创作;谷歌Gemini新增深度研究功能,可整合邮件生成智能报告;上海AgiBot机器人10分钟完成复杂制造任务,重塑生产效率。

  • 百度搜索AI API全面开放 绝大多数结果由AI生成

    11月13日,百度创始人李彦宏在2025百度世界大会上宣布,百度搜索已实现绝大多数结果由AI生成,首条结果富媒体覆盖率高达70%。他强调,百度正通过AI技术深度重构搜索结果页,从传统文字链接模式转向以图片、视频等富媒体内容为核心的AI应用。李彦宏指出,百度是全球搜索引擎中对AI化改造最激进的,正引领行业进入全新时代。他还表示,企业需善用AI方能立于不败之地,个人也需掌握AI技能以掌控未来。目前,百度已通过AI+API开放搜索能力,与三星、荣耀、vivo等主流厂商建立合作,共同探索AI搜索的无限可能。

  • AI吃播开始和真人吃播抢“饭碗”

    被咬开时发出清脆声响的玻璃水果、镶嵌着宝石的首饰盒、播放着音乐的水晶球,甚至还有毛绒玩具labubu和金条……各种你能想到或者想不到的,都正成为AI吃播的“食材”,被AI主播们塞入嘴里,轻松咀嚼。 这是一场风靡国内国外的热潮。在国外,Tiktok上一位叫leilanikovac的博主发了一条AI吃熔浆的视频,点赞数突破81.7万,另一位博主在三天内发了11条切水果的视频后,粉丝数

  • AI正在成为贝壳新的“承重墙”

    ​“金九银十” 曾是房地产行业传统的营销节点,伴随楼市深度调整,其热度已经逐渐回归平稳。 国家统计局数据显示,2025年1-9月,全国商品住宅销售额为55329亿元,同比下降7.6%。 在整体市场仍处于调整周期的大背景下,贝壳交出了一份稳中向好的答卷。三季度,贝壳总交易额(GTV)达7,367亿元,净收入同比增长2.1%至231亿元,净利润7.47亿元,经调整净利润12.86亿元。虽然

今日大家都在搜的词: