AI日报：新壹视频大模型2.0发布；LivePortrait支持用图片控制动画；AI腹肌软件Gigabody爆火；免费无水印的AI视频生成工具Hotshot

2024-08-21 15:14 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、新壹视频大模型2.0发布:支持1080P60帧输出最高支持4K

新壹科技最新发布的新壹视频大模型2.0在AI视频创作领域取得重大突破，实现全流程自动化创作，降低视频创作门槛和成本。技术集成了先进的AI算法和深度学习技术，提供便捷的一键触发功能。同时具备自研剧本模型、情感化语音合成技术和自动生成背景音乐能力。

【AiBase提要:】
⚙️ 新壹视频大模型2.0实现全流程自动化创作，降低视频创作门槛和成本。
💡 技术集成了先进的AI算法和深度学习技术，提供便捷的一键触发功能。
🎬 新壹视频大模型2.0具备自研剧本模型、情感化语音合成技术和自动生成背景音乐能力。
详情链接:https://aigc.yizhentv.com/product/aiVideo

2、LivePortrait更新:支持图像驱动肖像动画和精细区域控制

LivePortrait的Gradio工具迎来了一系列激动人心的更新，用户现在可以使用自己的图像来驱动肖像动画，并且可以精细选择动画区域。新增的功能提升了动画制作的便捷性和创作自由度，同时保护隐私信息。LivePortrait的核心优势在于令人惊叹的表情转移技术，能创造栩栩如生的动态效果。

【AiBase提要:】
🚀 用户可以使用自己的图像驱动肖像动画，并精细选择动画区域。
🎭 新增相对运动功能保护隐私，但可能影响表情强度。
💡 LivePortrait能精确复制表情到另一个人身上，提供前所未有的创作自由度。
详情链接:https://top.aibase.com/tool/liveportrait

3、又一款AI视频工具强势登场!Hotshot可生成长达 10 秒视频，无水印

Hotshot是一款全新的文本转视频AI生成器，可以生成长达 10 秒、720p的视频，展现出强大潜力。用户可以免费体验该模型的早期预览版本，但每天限制生成两个无水印视频。创始团队在短短四个月内完成了模型训练，使用了 6 亿个视频片段和数千个GPU。未来预计AI生成的完整YouTube视频将普及，创作者将拥有更多控制权。

【AiBase提要:】
🌟 Hotshot推出的新文本转视频AI生成器已进入公开“早期预览”阶段，用户可免费体验。
🚀 该模型在短短四个月内使用 6 亿个视频片段和数千个GPU进行训练，展现出强大潜力。
🎥 创始人Sastry预测，未来一年内，AI生成的完整YouTube视频将会普及，创作者将拥有更多控制权。
详情链接:https://top.aibase.com/tool/hotshot

4、OpenAI推GPT-4o模型微调功能，每天免费赠送100万Token!

OpenAI公司推出了新的多模态大型模型GPT-4o，并允许第三方开发者进行微调，以满足不同应用需求。开发者可通过简单操作在微调仪表盘选择模型版本，免费获得每天100万Tokens用于微调。同时，OpenAI注重数据安全和隐私保护，确保微调后的模型不会滥用企业数据。

【AiBase提要:】
🌟 微调功能上线:开发者可根据需求调整GPT-4o模型行为
💰 免费Tokens大放送:每天赠送100万Tokens用于模型微调，吸引众多开发者参与
🔒 数据安全保障:OpenAI重视数据隐私和安全，确保微调模型不会用输入输出数据进行再训练。
详情链接:https://platform.openai.com/finetune

5、肌肉也能AI了！Gigabody让你秒变施瓦辛格，健身房老板慌了

Gigabody是一款AI软件，让用户可以通过上传健身照片，在短短 5 分钟内变身肌肉猛男或猛女，引发了社交平台上的增肌风暴。虚拟肌肉的热度超过真实肌肉，成为懒人们的福音。然而，成功率不高，需要反复尝试。AI滤镜的走红源于满足人们对创意表达和社交互动的需求。

【AiBase提要:】
🔥 一键增强肌肉， 5 分钟变身肌肉猛男/猛女，引发社交平台增肌风暴。
💪 免费榜第二，日下载量超过 15 万，虚拟肌肉热度高于真实肌肉。
💰 会员年费比健身房便宜，AI滤镜满足自拍展示需求，但成功率需反复尝试。
详情链接:https://top.aibase.com/tool/gigabody

6、AI即时图像编辑神器TurboEdit 一句话瞬间变发色、减龄、换装!

TurboEdit是一款基于文本的即时图像编辑工具，让用户通过简单的文本描述快速对图像进行编辑。编辑速度极快，支持即时反馈和交互式编辑，让用户实时看到编辑效果。无论是专业设计师还是普通用户，都能通过TurboEdit轻松实现创意构想。

【AiBase提要:】
✨ 只需一句话描述，即可快速对图像进行编辑，实现瞬间变发色、减龄、换装的效果。
💡 TurboEdit能在保持图像整体不变的前提下，只对指定部分进行修改，让用户随心所欲地调整图像的任何区域。
🚀 TurboEdit支持同时修改图像的多个属性，包括颜色、着装、造型等，让创意得以无限延伸。
详情链接:https://betterze.github.io/TurboEdit/

7、AI遗嘱来了！新世相联合中华遗嘱库出品，已有上万人参与

数字化时代下，人工智能进入遗嘱领域，通过AI技术帮助用户撰写个性化遗嘱，创新互动形式让人与AI共同创作，审视人生内心。

【AiBase提要:】
🤖 利用AI技术帮助用户撰写个性化遗嘱，吸引上万人参与。
📖 用户通过与AI对话共同创作遗嘱内容，体验互动共创的新方式。
💡 在与AI的问答过程中，用户可以深入思考和审视自己的人生和内心。
详情链接:https://top.aibase.com/tool/xinshixiangyizhuai

8、AI舞王Viggle:一键让马斯克和特朗普共舞，月访问量破680万

马斯克再次展现了他在互联网上的流量之王地位，通过Viggle AI工具发布的视频引爆全网，播放量迅速突破1.3亿。Viggle AI的模板化AI视频生成工具简单且强大，让普通用户也能制作专业水准的视频，月访问量已突破680万，彰显AI技术在日常生活中的应用里程碑。

【AiBase提要:】
🌟 Viggle AI通过简单上传照片和选择动作模板，让用户轻松生成流畅自然的舞蹈视频。
🚀 推出多角色控制功能Multi，让用户同时操控两个角色，激发网友创意，二次创作视频传播迅速。
💡 Viggle AI的模板化操作降低了创作门槛，让普通用户也能创作专业水准的视频，类似剪映和CapCut的成功之路。
产品入口：https://top.aibase.com/tool/viggle

9、为复杂视觉推理而生!微软发布Phi-3.5-vision

微软最新发布了Phi-3.5-vision，一款轻量级、多模态的开源AI模型，专为处理文本和视觉输入而设计。Phi-3.5-vision在资源受限环境中表现出色，支持128K上下文长度，适用于商业和研究领域。该模型具备广泛的图像理解、OCR、图表和表格解析等功能，在基准测试中展现出显著性能提升。

【AiBase提要:】
🔍 Phi-3.5-vision是轻量级、多模态的AI模型，适用于处理文本和视觉输入。
💡 该模型支持128K上下文长度，在内存或计算资源受限环境中表现优异。
🚀 Phi-3.5-vision具备图像理解、OCR、图表和表格解析等功能，展现出显著性能提升。
详情链接:https://huggingface.co/microsoft/Phi-3.5-vision-instruct

10、字节跳动自动语音识别模型Seed-ASR，各种口音和方言统统能听懂!

Seed-ASR是字节跳动推出的语音识别引擎，经过大量数据训练，具备出色的识别能力和上下文感知能力，能准确识别多种语言、方言和口音，为跨语言交流带来新可能。在各种场景下表现出色，提升用户体验，尤其在智能助手和语音搜索领域有突出表现。

【AiBase提要:】
🔍 Seed-ASR经过超过2000万小时的语音数据和90万小时的配对数据训练，能准确识别13种中国方言和7种外语，包括各种口音的英语。
🔑 Seed-ASR具有出色的上下文感知能力，结合历史对话记录和会议纪要，提升识别精度，尤其在特定场景下表现优异。
🎯 Seed-ASR能识别各种专业领域术语，包括医疗、科技、汽车和音乐，大幅提升智能助手和语音搜索的效率和准确性。
详情链接:https://bytedancespeech.github.io/seedasr_tech_report/

11、Llama3压缩版!Nvidia推小型语言模型Llama-3.1-Minitron4B 仅4亿参数

在科技公司追逐实现人工智能的时代，Nvidia推出Llama-3.1-Minitron4B，采用剪枝和蒸馏技术，性能高效，训练部署效率优秀。

【AiBase提要:】
🌟 Llama-3.1-Minitron4B 是Nvidia推出的小型语言模型，训练部署高效。
📈 使用的标记量减少40倍，性能明显提升。
🔓 宽度剪枝版本已在Hugging Face发布，方便商业使用和开发。
详情链接:https://developer.nvidia.com/blog/how-to-prune-and-distill-llama-3-1-8b-to-an-nvidia-llama-3-1-minitron-4b-model/

12、OpenAI与康泰纳仕达成多年内容合作

近日，OpenAI与康泰纳仕达成多年合作协议，共同探索在人工智能产品中展示康泰纳仕旗下品牌内容。这一合作标志着数字内容和人工智能领域的紧密合作，为用户带来更丰富的搜索体验和高质量报道。

【AiBase提要:】
🌟 OpenAI与康泰纳仕达成多年合作，内容将嵌入AI产品中。
📰 OpenAI获得大量出版商文本档案，用于训练大型语言模型。
⚖️ 部分媒体公司选择起诉OpenAI以维护权益。

13、高通骁龙7s Gen3发布

作为中端智能手机市场的新宠，高通骁龙7s Gen3带来了强大的AI功能，性能大幅提升，功耗降低，为用户带来更流畅、智能的手机体验。多个知名手机品牌计划推出搭载该处理器的新设备，预示着中端手机市场将迎来新的活力和机遇。

【AiBase提要:】
🌟 骁龙7s Gen3支持先进的AI语言模型，如Baichuan-7B和Llama2，提升了中端手机的AI能力。
⚡ CPU性能提升20%，GPU速度提升40%，AI性能提高30%，功耗降低12%。
📱 多个品牌如Realme、三星、夏普和小米将在未来几个月推出搭载骁龙7s Gen3的手机。

14、真我13Pro系列来袭:AI超清摄影，让模糊成为过去式

真我手机品牌推出全新真我13Pro系列，突破性能，带来惊喜的摄影功能。AI超清功能优化模糊照片，让每个精彩瞬间清晰可见。真我13Pro+搭载5000万像素LYT600潜望长焦镜头，支持多重变焦应对各种拍摄场景。配置高通骁龙7s Gen2处理器，大容量电池和80W快充技术，续航无忧。

【AiBase提要:】
📸 AI超清功能优化模糊照片，呈现清晰视觉效果。
🔍 真我13Pro+搭载5000万像素LYT600潜望长焦镜头，支持多重变焦。
📱 配置高通骁龙7s Gen2处理器，大容量电池和80W快充技术，续航无忧。

（举报）

相关推荐

关键词：

新壹视频

荐Sora App的AI视频社交，给了百度们新希望

Sora2发布两周后，百度的蒸汽机AI视频模型，和谷歌Veo3.1撞了档期。两家公司选择同期发布并非有多默契，而是Sora2带来的压迫感促使它们不得不加快脚步。奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”，不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃，还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。这无疑是扔在AI视�

文章搜索核心标签 AI视频模型
荐短视频加速跑入AI时代

「现在是西天取经的第996天，刚把师父从妖怪嘴里救出来，师父身上都还是热乎的，我们就马不停蹄开始出发了。」在抖音，都能看到《西游记》里师徒四人的取经vlog了。采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播，各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。尽管在专业影视

文章搜索核心标签 AI生成
一机在手，随心创作：佳能R50V满足你对Vlog、人像与美食视频的所有想象

佳能R50V微单相机专为视频创作者设计，兼具专业画质与便携性。机身仅重323克，支持6K超采4K视频，配备第二代全像素双核AF系统，可智能追踪人物、动物等多种主体。内置14种色彩滤镜与平滑皮肤功能，优化人像表现。创意拍摄模式支持慢快动作、电影宽银幕比例，竖拍优化与直播兼容性进一步提升创作效率，是Vlog、旅拍和街拍的理想工具。

vlog创作专业视频拍摄快速精准追焦
保洁阿姨拍“土味说车”视频出圈：一口地道的东北话

近日，哈尔滨一家雷克萨斯汽车经销店的保洁阿姨凭借一条“土味说车”视频在网络上迅速走红。“老板买车吗?这大轱辘你喜欢吗?黢黑式轮毂喜欢吗?”阿姨一口地道的东北话，搭配着并不十分娴熟的车辆专业术语，这种反差萌受到了众多网友的喜爱。这位出镜的保洁阿姨今年58

雷克萨斯土味说车保洁阿姨
爆火！58岁保洁阿姨拍“土味说车”视频出圈：这黢黑大轱辘你喜欢吗

老板买车吗”硬派大越野子”这大底盘子，还能伸进一个小腿呢”。近日，哈尔滨一雷克萨斯汽车经销店的保洁阿姨，因土味说车” 视频意外走红网络。这位阿姨今年58岁，自2019年起就在该门店从事保洁工作，视频里她用一口地道的东北话介绍车辆，还夹杂着黢黑的大轱辘”6 个桶子（6 个缸）3.5 的 T”双关轮子增压（双涡轮增压）” 等不娴熟却接地气的表述。阿姨说车

雷克萨斯土味说车保洁阿姨
逗哥配音团队：以硬核技术铺就AI创作未来，重塑短视频创作生态

逗哥配音平台凭借AI语音技术革新，为短视频创作者提供全方位赋能。平台集成上千款覆盖多年龄风格的真人声音资源，支持多语言合成，具备媲美真人的情感表达能力。其核心功能包括AI角色分配、5秒极速克隆及20项精细调节工具，结合去水印、字幕生成等实用功能，实现一站式创作。已获超百位大V推荐，用户量破千万，累计播放量达十万亿级，显著降低创作门槛，助力各领域内容生产。团队将持续优化技术，拓展功能生态。

AI配音内容创作语音合成
荐AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

本期AI日报聚焦多项技术突破：HeyGen推出精准唇形同步的视频翻译引擎；科大讯飞发布星火X1.5大模型，提升多语言处理能力；QQ浏览器新增AI助手浮窗；科大讯飞推出软硬一体方案，实现高噪声环境精准识别；谷歌Gemini 3 Pro预览版支持百万级上下文窗口；Comfy Cloud让Stable Diffusion实现零门槛创作；谷歌Gemini新增深度研究功能，可整合邮件生成智能报告；上海AgiBot机器人10分钟完成复杂制造任务，重塑生产效率。

AI视频翻译唇形同步跨语言本地化
荐做乐园，长视频拥抱线下的终极大考

如果说过去十年中国长视频平台的竞争重点一直在“内容规模”、“会员数”与“时长争夺”这些线上指标上，那么进入2024–2025年之后，这场竞争的重心，正在悄然转向“线下”。随着短视频、短剧对注意力的强势分流，用户的付费意愿、广告主的投放信心以及内容本身的价值空间都在被压缩，单纯依靠“剧好看”、“综艺够爆”已经无法支撑起平台增长的想象力。一个�

长视频平台线下乐园 IP体验
科大讯飞1024发布：讯飞翻译APP迭代焕新，同声传译+音视频翻译重构沟通体验

在2025科大讯飞全球1024开发者节期间，讯飞翻译APP迎来关键升级，重点强化同声传译功能。通过搭载全新语音同传大模型，实现翻译更准、响应更快；新增实时分享、记录留存、悬浮字幕等特性，支持跨场景高效应用。该产品已在东盟博览会等国际场合验证实用性，结合IDC报告八大维度第一的权威背书，彰显了AI翻译技术从研发到落地的全链条优势，为跨语言沟通提供简单如母语的体验。

科大讯飞 AI翻译大模型
荐AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度推上体体育大模型 2.0

本期AI日报聚焦多项技术突破：火山引擎发布豆包视频生成模型1.0pro+fast，速度提升3倍且价格下降72%；百度与上海体育大学推出“上体体育大模型2.0”，拓展AI在运动员训练等场景应用；谷歌Gemini新增一键生成PPT功能；美团发布LongCat-Video模型，支持5分钟连贯视频生成；xAI推出虚拟女友Mika引发热议；MiniMax开源高性能M2编码模型；OpenAI上线企业知识管理功能；另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万，展现年轻创业者的技术影响力。

AI 视频生成火山引擎

今日大家都在搜的词：

热文

3 天
7天

AI日报：新壹视频大模型2.0发布；LivePortrait支持用图片控制动画；AI腹肌软件Gigabody爆火；免费无水印的AI视频生成工具Hotshot

荐Sora App的AI视频社交，给了百度们新希望

荐短视频加速跑入AI时代

一机在手，随心创作：佳能R50V满足你对Vlog、人像与美食视频的所有想象

保洁阿姨拍“土味说车”视频出圈：一口地道的东北话

爆火！58岁保洁阿姨拍“土味说车”视频出圈：这黢黑大轱辘你喜欢吗

逗哥配音团队：以硬核技术铺就AI创作未来，重塑短视频创作生态

荐AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

荐做乐园，长视频拥抱线下的终极大考

科大讯飞1024发布：讯飞翻译APP迭代焕新，同声传译+音视频翻译重构沟通体验

荐AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度推上体体育大模型 2.0

今日大家都在搜的词：

热文

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

何小鹏回应机器人IRON里是真人质疑：感谢认可

站长商机