欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、B 站测试新 AI 视频创作工具 “花生 AI”,3 分钟可成片
B 站正在测试全新的 AI 视频创作工具 '花生 AI',该工具能够帮助用户快速生成视频内容,且成片质量较高。同时,B 站也在推进 AI 技术的应用,如自研大语言模型和多语言翻译功能。
【AiBase提要:】
🎥 花生 AI 可通过文案或音频快速生成视频成片。
🔄 用户可选择智能匹配素材或使用模板进行视频创作。
🌐 B 站已上线自研大语言模型,支持多语言实时翻译。
2、昆仑万维开源「Skywork UniPic 2.0」模型
昆仑万维集团在SkyWork AI技术发布周宣布开源「Skywork UniPic 2.0」模型,这一统一多模态模型通过生成和编辑模块的轻量化设计,以及多模态理解模型的联合训练,实现了高效、高质、统一的多模态生成能力。
【AiBase提要:】
🧠 Skywork UniPic 2.0是一个统一多模态模型,支持文本和图像输入,扩展了生图和编辑能力。
🚀 基于SD3.5-Medium架构,通过联合训练实现理解、生成和编辑一体化的能力。
💡 引入强化学习,采用渐进式双任务策略提升模型对复杂指令的理解与图像生成一致性。
详情链接:https://unipic-v2.github.io/
3、马斯克怒指苹果 “偏心” OpenAI,苹果回应不甘示弱!
马斯克指控苹果在App Store中偏袒OpenAI,苹果则回应称平台设计公平公正。双方矛盾升级,未来可能面临法律和市场上的较量。
【AiBase提要:】
🍎 马斯克指控苹果在App Store中偏袒OpenAI,影响其他AI公司发展
⚖️ 苹果强调App Store设计公平公正,确保开发者获得曝光机会
🔥 马斯克威胁对苹果采取法律行动,双方矛盾升级
4、腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率全场景输入
腾讯混元团队发布全新多模态理解模型——混元Large-Vision,该模型采用MoE架构,拥有52B参数规模,支持任意分辨率图像、视频和3D空间输入,同时提升了多语言场景的理解能力,为AI视觉理解服务提供了强大的技术基础。
【AiBase提要:】
🖼️ 支持任意分辨率图像处理,无需复杂预处理操作。
🧠 采用MoE架构,实现性能与效率的平衡。
🌐 提升多语言场景理解能力,支持跨语言多模态应用。
5、官方否认 DeepSeek-R2 模型 8 月发布计划
DeepSeek 官方否认了关于其下一代大模型 DeepSeek-R2 在8月15日至30日之间发布的传言。尽管此前有消息称 R2 模型将在3月或5月发布,但均被官方否认。目前,DeepSeek 尚未公布 R2 模型的具体发布时间及技术细节。
【AiBase提要:】
📌 DeepSeek 官方否认了 R2 模型在8月发布的传言。
📌 R2 模型的发布时间和细节尚未正式公布。
📌 DeepSeek 团队仍在对模型进行性能提升,尚未准备好正式投用。
6、OpenAI推出超值ChatGPT Go套餐:仅399卢比,全球用户羡慕
OpenAI 推出的 ChatGPT Go 套餐以极低的价格(399印度卢比)为用户提供更多 AI 服务功能,包括更长的对话支持、文件上传和图像生成等,旨在降低使用门槛并吸引更多用户。
【AiBase提要:】
🤖 ChatGPT Go 套餐提供更丰富的对话次数和文件上传功能
🎨 用户可享受更强大的图像生成能力
📊 Go 套餐包含高级数据分析功能
7、AI新贵Perplexity豪掷345亿美元,正式报价收购谷歌Chrome
Perplexity提出以345亿美元现金收购谷歌Chrome浏览器,旨在应对谷歌的反垄断困境。其承诺保持Chromium开源并维持Chrome默认设置,同时展示了对市场和竞争格局的深刻理解。
【AiBase提要:】
💰 Perplexity以345亿美元现金报价收购Chrome,展现强大野心。
🔒 承诺保持Chromium开源及Chrome默认设置,减少监管顾虑。
🌐 Chrome占据68%市场份额,可能引发激烈竞购战。
8、Anthropic 的 Claude Sonnet 4 模型已支持高达 100 万个词元
Anthropic 推出的 Claude Sonnet 4 模型扩展了其上下文词元支持至100万,显著提升了开发灵活性。同时推出了新的定价方案,并与 Google Gemini 形成竞争压力。
【AiBase提要:】
🤖 Anthropic 的 Claude Sonnet 4 模型支持高达100万个上下文词元,提升开发灵活性。
💰 新的定价方案针对不同词元范围进行区分,开发者可通过批处理降低成本。
🔄 OpenAI 对长上下文需求持观望态度,但面临 Anthropic 和 Google Gemini 的竞争压力。
9、ChatGPT大更新!GPT-5模式自由切换,4o回归,体验更温暖
OpenAI对ChatGPT进行了重要升级,恢复了GPT-4o作为默认模型,并为GPT-5引入了多种模式选择。同时优化了AI的交互个性,使其更加温暖和用户友好,提升了整体使用体验。
【AiBase提要:】
✨ GPT-5支持三种模式切换,满足不同场景需求。
🔄 模型选择器优化,付费用户可灵活访问多种模型。
💬 AI交互个性升级,提升用户体验与自然度。
(举报)