首页 > 原创 > 关键词  > 正文

AI日报:B站测试AI视频工具花生AI;腾讯发布多模态模型Large-Vision;昆仑万维开源Skywork UniPic 2.0

2025-08-13 15:52 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、B 站测试新 AI 视频创作工具 “花生 AI”,3 分钟可成片

B 站正在测试全新的 AI 视频创作工具 '花生 AI',该工具能够帮助用户快速生成视频内容,且成片质量较高。同时,B 站也在推进 AI 技术的应用,如自研大语言模型和多语言翻译功能。

image.png

【AiBase提要:】

🎥 花生 AI 可通过文案或音频快速生成视频成片。

🔄 用户可选择智能匹配素材或使用模板进行视频创作。

🌐 B 站已上线自研大语言模型,支持多语言实时翻译。

2、昆仑万维开源「Skywork UniPic 2.0」模型

昆仑万维集团在SkyWork AI技术发布周宣布开源「Skywork UniPic 2.0」模型,这一统一多模态模型通过生成和编辑模块的轻量化设计,以及多模态理解模型的联合训练,实现了高效、高质、统一的多模态生成能力。

image.png

【AiBase提要:】

🧠 Skywork UniPic 2.0是一个统一多模态模型,支持文本和图像输入,扩展了生图和编辑能力。

🚀 基于SD3.5-Medium架构,通过联合训练实现理解、生成和编辑一体化的能力。

💡 引入强化学习,采用渐进式双任务策略提升模型对复杂指令的理解与图像生成一致性。

详情链接:https://unipic-v2.github.io/

3、马斯克怒指苹果 “偏心” OpenAI,苹果回应不甘示弱!

马斯克指控苹果在App Store中偏袒OpenAI,苹果则回应称平台设计公平公正。双方矛盾升级,未来可能面临法律和市场上的较量。

image.png

【AiBase提要:】

🍎 马斯克指控苹果在App Store中偏袒OpenAI,影响其他AI公司发展

⚖️ 苹果强调App Store设计公平公正,确保开发者获得曝光机会

🔥 马斯克威胁对苹果采取法律行动,双方矛盾升级

4、腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率全场景输入

腾讯混元团队发布全新多模态理解模型——混元Large-Vision,该模型采用MoE架构,拥有52B参数规模,支持任意分辨率图像、视频和3D空间输入,同时提升了多语言场景的理解能力,为AI视觉理解服务提供了强大的技术基础。

0000.jpg

【AiBase提要:】

🖼️ 支持任意分辨率图像处理,无需复杂预处理操作。

🧠 采用MoE架构,实现性能与效率的平衡。

🌐 提升多语言场景理解能力,支持跨语言多模态应用。

5、官方否认 DeepSeek-R2 模型 8 月发布计划

DeepSeek 官方否认了关于其下一代大模型 DeepSeek-R2 在8月15日至30日之间发布的传言。尽管此前有消息称 R2 模型将在3月或5月发布,但均被官方否认。目前,DeepSeek 尚未公布 R2 模型的具体发布时间及技术细节。

【AiBase提要:】

📌 DeepSeek 官方否认了 R2 模型在8月发布的传言。

📌 R2 模型的发布时间和细节尚未正式公布。

📌 DeepSeek 团队仍在对模型进行性能提升,尚未准备好正式投用。

6、OpenAI推出超值ChatGPT Go套餐:仅399卢比,全球用户羡慕

OpenAI 推出的 ChatGPT Go 套餐以极低的价格(399印度卢比)为用户提供更多 AI 服务功能,包括更长的对话支持、文件上传和图像生成等,旨在降低使用门槛并吸引更多用户。

image.png

【AiBase提要:】

🤖 ChatGPT Go 套餐提供更丰富的对话次数和文件上传功能

🎨 用户可享受更强大的图像生成能力

📊 Go 套餐包含高级数据分析功能

7、AI新贵Perplexity豪掷345亿美元,正式报价收购谷歌Chrome

Perplexity提出以345亿美元现金收购谷歌Chrome浏览器,旨在应对谷歌的反垄断困境。其承诺保持Chromium开源并维持Chrome默认设置,同时展示了对市场和竞争格局的深刻理解。

【AiBase提要:】

💰 Perplexity以345亿美元现金报价收购Chrome,展现强大野心。

🔒 承诺保持Chromium开源及Chrome默认设置,减少监管顾虑。

🌐 Chrome占据68%市场份额,可能引发激烈竞购战。

8、Anthropic 的 Claude Sonnet 4 模型已支持高达 100 万个词元

Anthropic 推出的 Claude Sonnet 4 模型扩展了其上下文词元支持至100万,显著提升了开发灵活性。同时推出了新的定价方案,并与 Google Gemini 形成竞争压力。

image.png

【AiBase提要:】

🤖 Anthropic 的 Claude Sonnet 4 模型支持高达100万个上下文词元,提升开发灵活性。

💰 新的定价方案针对不同词元范围进行区分,开发者可通过批处理降低成本。

🔄 OpenAI 对长上下文需求持观望态度,但面临 Anthropic 和 Google Gemini 的竞争压力。

9、ChatGPT大更新!GPT-5模式自由切换,4o回归,体验更温暖

OpenAI对ChatGPT进行了重要升级,恢复了GPT-4o作为默认模型,并为GPT-5引入了多种模式选择。同时优化了AI的交互个性,使其更加温暖和用户友好,提升了整体使用体验。

【AiBase提要:】

✨ GPT-5支持三种模式切换,满足不同场景需求。

🔄 模型选择器优化,付费用户可灵活访问多种模型。

💬 AI交互个性升级,提升用户体验与自然度。

举报

  • 相关推荐
  • AI日报:昆仑万维发布SkyReels-A3模型;百度搜索PC端全面上线AI搜索;Grok 4 AI模型永久免费开放

    AI日报栏目聚焦人工智能领域最新动态:1)昆仑万维发布SkyReels-A3模型,实现语音驱动数字人生成;2)xAI宣布Grok4模型永久免费开放;3)OpenAI发布GPT-5提示词指南;4)百度PC端上线AI搜索功能;5)微软Windows Co pilot接入GPT-5;6)百川智能开源医疗大模型Baichuan-M2性能超越GPT-oss120b;7)苹果iOS26将集成ChatGPT-5;8)谷歌推出3D视觉编辑框架BlenderFusion;9)轻量级TTS模型Kitten TTS参数仅1500万;10)MiniCPM-V

  • AI日报:GPT-5-Auto现身Mac客户端;阿里开源WebAgent项目WebShaper;腾讯推X-Omni多模态模型

    【AI日报】今日AI领域重要动态:1)阿里开源WebAgent项目WebShaper,GAIA评测超越Claude4-Sonnet;2)Moonvalley推出草图转视频功能,支持手绘生成电影级视频;3)腾讯X-Omni模型实现图文理解重大突破;4)百度搜索测试AI应用中心入口;5)Midjourney+新增个性化推荐功能;6)GPT-5或于2025年夏季发布;7)Ollama推出桌面客户端;8)OWL团队开源多智能体协作工具Eigent;9)OpenAI年收入激增至120亿美元;10)英伟达H20芯片因安全风险被约谈;11)万兴科技天幕2.0模型国内排名第四,与华为云共建AI视频实验室。

  • AI日报:混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布

    【AI日报】汇总了最新AI领域动态:1)腾讯开源混元系列小尺寸模型,适用于消费级显卡;2)昆仑万维发布推理大模型MindLink,提升回答透明度;3)B站推出AI原声翻译功能,保留UP主音色;4)谷歌Gemini 2.5在数学奥赛夺金,展现强大推理能力;5)OpenAI展示GPT-5网络信息整合特性;6)苹果组建AI团队挑战ChatGPT;7)高德地图推出全球首个AI原生地图应用;8)Adobe推出AI图像合成工具Harmonize;9)NVIDIA发布革命性视频渲染技术;10)谷歌推出Android Studio免费AI编程助手;11)开源结构化信息提取工具LangExtract;12)Figma开发者模式升级提升设计转代码效率。

  • 昆仑万维技术周启幕:SkyReels模型重塑内容创作基建

    2025年8月11日,昆仑万维启动SkyWork+AI技术发布周,将连续五天发布五大领域AI模型:视频生成模型Skyreels、世界模型、生图一体化模型、智能体(Agent)模型和AI音乐创作模型Mureka。首日发布的Skyreels-A3是全球首个支持分钟级长视频生成的模型,通过四大技术创新解决直播电商等场景痛点,可实现180秒连贯视频生成、影视级运镜控制与自然动作交互。该模型采用多模态协同生成范式,突破传统视频生成技术误差累积限制,并通过Step蒸馏技术将推理步数压缩至4步,生成时间缩短至80秒。商业化方面,昆仑万维已形成"研发-产品变现-现金流反哺"闭环,2025年Q1经营性现金流净额增长58.3%,旗下DramaWave、Mureka等产品年化流水分别达1.2亿和1200万美元。此次技术周标志着中国AI企业首次跑通规模化盈利路径。

  • AI日报:GPT-5正式发布;百度将推文心5.0大模型;知网发布AIKBase V2.0多模态数据管理系统

    《AI日报》精选AI领域最新动态:1)OpenAI发布GPT-5模型,具备强大多模态能力但推理任务仍有局限;2)知网推出AIKBase V2.0多模态数据管理系统;3)Ideogram新增"角色"功能实现图像风格统一;4)Cursor发布CLI版本支持终端AI编程;5)百度即将推出全新推理模型和文心5.0大模型;6)dots.ocr推出1.7B参数多语言文档解析工具;7)特斯拉解散Dojo超算团队转向英伟达合作;8)谷歌Pixel 10引入AI相�

  • 苹果Vision Pro劲敌!vivo韩伯啸:vivo Vision发布会准备中

    vivo通信科技有限公司产品经理韩伯啸今天表示vivo Vision真的要来了,目前发布会已经在紧锣密鼓的准备中了,感兴趣的朋友,可以关注后续的官方公告。

  • AI日报:Kimi K2 高速版发布;美图WHEE上线视频超清功能;字节发布新模型Seed Diffusion Preview

    【AI日报】今日AI领域重要动态:1)美图WHEE推出"视频超清"功能,通过AI技术提升视频画质;2)Kimi K2高速版发布,输出速度提升至每秒40 Tokens;3)通义千问开源编程模型Qwen3-Coder-Flash,支持大规模上下文理解;4)Anthropic企业AI市场份额升至32%,超越OpenAI;5)字节跳动发布实验性扩散语言模型Seed Diffusion;6)马斯克将为Grok用户推出视频生成器Imagine和AI虚拟男友;7)Quora的Poe平台推出开发者API;8)Black Forest Labs开源图像生成模型FLUX.1-Krea;9)Augment推出CLI工具Auggie优化开发流程;10)清华开源AI语音模型MOSS-TTSD;11)Claude升级支持多格式文件上传。

  • vivo Vision官宣8月21日发布:佩戴舒适 设计超前

    就在刚刚,vivo正式官宣了自家新产品的发布时间。根据vivo官方公告,8月21日下午14点30分,备受期待的Vision将正式与大众见面。 vivo Vision被看作是类苹果Vision Pro的MR头显设备,从目前透露的信息来看,它在交互体验方面有着超前的设计。vivo产品经理韩伯啸提前剧透了不少关键细节,引发了众多科技爱好者的关注。 韩伯啸着重强调了vivo Vision的佩戴舒适性,他表示这款设备非�

  • 主流手机厂商第一款!曝vivo Vision本月正式发布

    vivo通信科技有限公司产品经理韩伯啸今天发文透露,vivo Vision发布会已经在紧锣密鼓的准备中了。 随后博主数码闲聊站爆料称,vivo Vision将在本月正式发布,这是主流手机厂商中第一个做出的类苹果Vision Pro MR头显设备。

  • AI日报:阿里新发布Qwen3-4B模型;小红书发布开源模型dots.vlm1;MiniMax Speech 2.5语音生成模型上线

    AI日报栏目聚焦人工智能领域最新动态:1)阿里发布Qwen3-4B轻量级模型,手机端可运行;2)小红书开源多模态大模型dots.vlm1,在图表推理方面表现突出;3)MiniMax推出语音生成模型Speech2.5,多语种表现提升;4)Midjourney推出HD视频模式,提升专业影像质量;5)Cursor1.4版本增强异步任务处理能力;6)谷歌否认AI搜索影响网站流量,但数据显示用户行为改变;7)MiniCPM-V4.0开源发布,号称"手机上的GPT-4V";8)AMD与高通宣布支持OpenAI的gpt-oss系列模型;9)腾讯开源WeKnora文档智能解析工具;11)疑似GPT-5信息在GitHub泄露;12)FlowSpeech实现书面语转口语的TTS技术突破。

今日大家都在搜的词: