今日AI：Gemini Pro1.5向所有人开放；Stable Diffusion核心团队集体离职；HeyGen5.0上线视频翻译功能；剪映内测视频翻译功能

2024-03-22 16:02 · 稿源：站长之家

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

QQ截图20240322161437.png

🤖📱💼AI应用

Gemini Pro1.5及其百万上下文功能现已向所有人开放

QQ截图20240322154001.png

【AiBase提要:】
⭐ Gemini Pro1.5加入视频模态的长上下文功能，AI可以处理更复杂的视频内容。
⭐ 博主体验Gemini Pro1.5后表示，描述准确且清晰，展示强大处理能力。
⭐ Gemini Pro1.5百万上下文功能的开放将推动AI领域发展，为用户带来更丰富体验。
体验地址:https://top.aibase.com/tool/google-ai-studio

Suno正式发布V3音乐生成模型所有人都可用

【AiBase提要:】
⭐ 音质得到显著提升，带来更清晰动听音频体验。
⭐ V3提供更丰富音乐风格选择，满足不同需求。
⭐ 用户指令响应显著改进，确保音乐结尾流畅自然。
官网地址:https://top.aibase.com/tool/suno-ai

剪映内测视频翻译功能仅限移动端体验

【AiBase提要:】
🚀剪映推出全新视频翻译功能，进一步巩固其领先地位。
📱内测仅限移动端体验，审批速度较快，可在短时间获得资格
🔒视频翻译功能仅支持用户本人视频，需声音认证。
内测申请地址:https://bytedance.larkoffice.com/share/base/form/shrcnq7rM9EEJytIW5LKyUpVaee

HeyGen发布5.0版本上线实时数字人聊天和视频翻译功能

QQ截图20240322100113.png

【AiBase提要:】
⭐全新用户界面设计，更容易找到想要使用的功能
⭐引入全新视频编辑工作室，编辑更加灵活
⭐上线实时数字人聊天功能，视频翻译等功能
产品入口:https://top.aibase.com/tool/heygen-5-0

零一万物API开放多模态中文图表体验超越GPT-4V

【AiBase提要:】
⭐️ 零一万物API正式开放，包含三款强大模型，支持通用聊天、多文档阅读理解等功能。
⭐️ 多模态模型Yi-VL-Plus中文图表体验超越GPT-4V，支持图表识别、信息提取、问答和推理。
⭐️ Yi-34B-Chat-200K模型开放，准确率高达99.8%，用于长文本理解、小说内容总结和论文要点提取。
地址:https://platform.lingyiwanwu.com/playground

视频转视频框架AnyV2V 可修改源视频主题、风格等

【AiBase提要：】

⭐️ 支持对源视频进行深度修改，加入文本提示、主题或风格

⭐️ 核心目标是简化视频编辑为两个步骤

⭐️ 整合各种图像编辑工具，实现新视频生成外观和动作与原视频保持一致

论文地址:https://arxiv.org/html/2403.14468v1#S6

MIT研究员推新AI图片生成框架DMD:AI 单步生成高质量图像速度快30倍

【AiBase提要:】
⭐️ MIT研究人员开发了比传统扩散模型快30倍的单步AI图像生成器，质量仍高。
⭐️ 新方法结合了教师 - 学生模型，通过匹配蒸馏实现单步图像生成。
⭐️ 框架加速了图像生成，潜在益处涉及设计工具、药物发现和3D建模等领域。
论文网址:https://arxiv.org/abs/2311.18828

微软NaturalSpeech语音合成推出第三代生成语音更自然了

【AiBase提要:】
⭐️ NaturalSpeech3采用属性分解扩散模型和数据/模型扩展，提高语音合成质量和自然度
⭐️ FACodec和属性分解扩散模型是NaturalSpeech3的关键技术
⭐️ NaturalSpeech3在语音质量、相似性、韵律和可懂度方面超越了现有TTS系统
论文:https://arxiv.org/abs/2403.03100
Demo 演示: https://speechresearch.github.io/naturalspeech3

📰🤖📢AI新鲜事

开源AI掌机01Light爆火，让远程操控电脑变得触手可及

【AiBase提要:】
⭐01Light能够识别屏幕内容学习用户习惯，提供个性化需求满足。
⭐ 用户按下按钮讲话，01Light思考回应需求，实现远程语音控制电脑操作。
⭐ 完全开源的01Light能提高工作效率，节省时间，随时随地操控电脑。
官网:https://top.aibase.com/tool/01-light
项目地址:https://github.com/OpenInterpreter/01

Stable Diffusion核心团队集体离职 AI巨头Stability AI面临财务危机

【AiBase提要:】
⭐️ Stable Diffusion核心团队集体离职，引发科技界广泛关注。
⭐️ Stability AI可能因财务困境挑战，团队领导离职名单中。
⭐️ Stable Diffusion项目开源成功，但给公司商业模式带来挑战。

百度5款大模型上新，更小更便宜!还可1分钟零代码打造Agent应用

【AiBase提要】
⭐ 做一个“英语作文批改小帮手”应用，只需在AppBuilder中输入应用名称或功能，平台即可生成应用。
⭐ 百度推出5款大模型，轻量化、性价比更高，适用于各种场景下的Agent应用。
⭐ 千帆AppBuilder升级，支持一键分发到多个主流渠道，加入新的基础组件如向量数据库VDB1.0。
产品入口：https://top.aibase.com/tool/baiduzhinengyunqianfanappbuilder

微软将以6.5亿美元收购Inflection AI 获得后者大模型的使用权

【AiBase提要:】
⭐ 微软同意支付6.5亿美元收购Inflection AI，获取大模型使用权。
⭐ 微软将雇佣Inflection AI大部分员工，包括联合创始人。
⭐ Inflection-2.5是Inflection最新人工智能模型，性能接近GPT-4。

中国首部AI全流程微短剧《中国神话》启播央视频AI频道上线

【AiBase提要:】
🎬 央视频推出全流程AI微短剧《中国神话》，六集展现经典神话故事。
📺 央视频AI频道正式上线，推动视听产业创新升级。
🤖 AI技术应用助力央视频推动中国传媒业发展。

月入25万，批量AI美女，收割中年男人的钱包

【AiBase提要:】
⭐ 中年男人愿意花钱，AI美女们抓住了这一商机。
⭐ AI美女主播以低单价产品吸引中老年男性用户，通过带货视频获利丰厚，受欢迎程度高。
⭐ AI带货产业链庞大，但也存在虚假宣传和维权问题。
案例:https://www.chinaz.com/2024/0322/1605183.shtml

————

今日Midjourney提示词：淘宝服装模特

2_1711094141451_ai2023_A_beautiful_Chinese_female_model_wearing_round_framed_gl_d73a8207-946d-4c83-9eb6-648463f7d7b5.png

图源备注：图片由AI生成，图片授权服务商Midjourney

A beautiful Chinese female model wearing round framed glasses， with a delicate Asian face， wearing a light gray linen short sleeved shirt and Short pants， Japanese style shirt ，hands in pockets， front view， and a beige background，full bodyshot， Studio lighting， soho， shot on Canon EOS5D Mark IV ，8k --ar3:4--v6.0

（举报）

今日AI：Gemini Pro1.5向所有人开放；Stable Diffusion核心团队集体离职；HeyGen5.0上线视频翻译功能；剪映内测视频翻译功能

荐AI日报：智谱发布Agent产品AutoGLM沉思；谷歌Gemini 2.5 Pro免费开放使用；ChatGPT原生图像生成功能向免费用户推出

微信聊天消息自动翻译功能上线支持18种语言

迄今最贵！谷歌Gemini 2.5 Pro API定价公布：每百万输入tokens超9元

谷歌首推Gemini 2.5 Flash：成本爆降600%

谷歌ai垄断？谷歌每月向三星支付“巨额费用”，让其预装Gemini

谷歌Gemini整合Veo 2视频生成模型，8秒720P视频轻松搞定

超过ChatGPT、Deepseek？谷歌发布 Gemini 2.5 Flash AI 模型

制胜游戏巅峰！技嘉 B760 GEN5 主板全面释放 PCIe 5.0 显卡强大性能

Meta AI眼镜“实时翻译”功能全面开放，不联网也能用！

「扣子空间」内测上线，和 Agent 一起开始你的工作

热文

Meta AI眼镜“实时翻译”功能全面开放，不联网也能用！

反垄断案中，谷歌披露 Gemini 月活达3.5亿，日流量为3500万

“你可能患了血癌……” 医生诊断错误，而 ChatGPT 是对的！

4chan 之“死”：互联网最狂野的角落逐渐消逝！

郭明錤：iPhone17有望全系配12GB内存！但，有个前提……

Adobe 发布 Firefly 系列产品，涵盖图片、视频、矢量等

REDMI Turbo 4 Pro外观首次公布配备金属边框

Anthropic警告：距离无人干涉的 “AI员工” 时代，只剩一年了！

Meta AI眼镜“实时翻译”功能全面开放，不联网也能用！

反垄断案中，谷歌披露 Gemini 月活达3.5亿，日流量为3500万

“礼貌用语”太费钱？奥特曼：让 OpenAI 损失了数千万美元

“你可能患了血癌……” 医生诊断错误，而 ChatGPT 是对的！

4chan 之“死”：互联网最狂野的角落逐渐消逝！

郭明錤：iPhone17有望全系配12GB内存！但，有个前提……

荣耀GT Pro首发骁龙8至尊领先版跑分最高破344万

Adobe 发布 Firefly 系列产品，涵盖图片、视频、矢量等

站长商机