首页 > 业界 > 关键词  > 新壹视频最新资讯  > 正文

AI日报:新壹视频大模型2.0发布;LivePortrait支持用图片控制动画;AI腹肌软件Gigabody爆火;免费无水印的AI视频生成工具Hotshot

2024-08-21 15:14 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、新壹视频大模型2.0发布:支持1080P60帧输出 最高支持4K

新壹科技最新发布的新壹视频大模型2.0在AI视频创作领域取得重大突破,实现全流程自动化创作,降低视频创作门槛和成本。技术集成了先进的AI算法和深度学习技术,提供便捷的一键触发功能。同时具备自研剧本模型、情感化语音合成技术和自动生成背景音乐能力。

image.png

【AiBase提要:】

⚙️ 新壹视频大模型2.0实现全流程自动化创作,降低视频创作门槛和成本。

💡 技术集成了先进的AI算法和深度学习技术,提供便捷的一键触发功能。

🎬 新壹视频大模型2.0具备自研剧本模型、情感化语音合成技术和自动生成背景音乐能力。

详情链接:https://aigc.yizhentv.com/product/aiVideo

2、LivePortrait更新:支持图像驱动肖像动画和精细区域控制

LivePortrait的Gradio工具迎来了一系列激动人心的更新,用户现在可以使用自己的图像来驱动肖像动画,并且可以精细选择动画区域。新增的功能提升了动画制作的便捷性和创作自由度,同时保护隐私信息。LivePortrait的核心优势在于令人惊叹的表情转移技术,能创造栩栩如生的动态效果。

1.jpg

【AiBase提要:】

🚀 用户可以使用自己的图像驱动肖像动画,并精细选择动画区域。

🎭 新增相对运动功能保护隐私,但可能影响表情强度。

💡 LivePortrait能精确复制表情到另一个人身上,提供前所未有的创作自由度。

详情链接:https://top.aibase.com/tool/liveportrait

3、又一款AI视频工具强势登场!Hotshot可生成长达 10 秒视频,无水印

Hotshot是一款全新的文本转视频AI生成器,可以生成长达 10 秒、720p的视频,展现出强大潜力。用户可以免费体验该模型的早期预览版本,但每天限制生成两个无水印视频。创始团队在短短四个月内完成了模型训练,使用了 6 亿个视频片段和数千个GPU。未来预计AI生成的完整YouTube视频将普及,创作者将拥有更多控制权。

【AiBase提要:】

🌟 Hotshot推出的新文本转视频AI生成器已进入公开“早期预览”阶段,用户可免费体验。

🚀 该模型在短短四个月内使用 6 亿个视频片段和数千个GPU进行训练,展现出强大潜力。

🎥 创始人Sastry预测,未来一年内,AI生成的完整YouTube视频将会普及,创作者将拥有更多控制权。

详情链接:https://top.aibase.com/tool/hotshot

4、OpenAI推GPT-4o模型微调功能,每天免费赠送100万Token!

OpenAI公司推出了新的多模态大型模型GPT-4o,并允许第三方开发者进行微调,以满足不同应用需求。开发者可通过简单操作在微调仪表盘选择模型版本,免费获得每天100万Tokens用于微调。同时,OpenAI注重数据安全和隐私保护,确保微调后的模型不会滥用企业数据。

image.png

【AiBase提要:】

🌟 微调功能上线:开发者可根据需求调整GPT-4o模型行为

💰 免费Tokens大放送:每天赠送100万Tokens用于模型微调,吸引众多开发者参与

🔒 数据安全保障:OpenAI重视数据隐私和安全,确保微调模型不会用输入输出数据进行再训练。

详情链接:https://platform.openai.com/finetune

5、肌肉也能AI了!Gigabody让你秒变施瓦辛格,健身房老板慌了

Gigabody是一款AI软件,让用户可以通过上传健身照片,在短短 5 分钟内变身肌肉猛男或猛女,引发了社交平台上的增肌风暴。虚拟肌肉的热度超过真实肌肉,成为懒人们的福音。然而,成功率不高,需要反复尝试。AI滤镜的走红源于满足人们对创意表达和社交互动的需求。

image.png

【AiBase提要:】

🔥 一键增强肌肉, 5 分钟变身肌肉猛男/猛女,引发社交平台增肌风暴。

💪 免费榜第二,日下载量超过 15 万,虚拟肌肉热度高于真实肌肉。

💰 会员年费比健身房便宜,AI滤镜满足自拍展示需求,但成功率需反复尝试。

详情链接:https://top.aibase.com/tool/gigabody

6、AI即时图像编辑神器TurboEdit 一句话瞬间变发色、减龄、换装!

TurboEdit是一款基于文本的即时图像编辑工具,让用户通过简单的文本描述快速对图像进行编辑。编辑速度极快,支持即时反馈和交互式编辑,让用户实时看到编辑效果。无论是专业设计师还是普通用户,都能通过TurboEdit轻松实现创意构想。

【AiBase提要:】

✨ 只需一句话描述,即可快速对图像进行编辑,实现瞬间变发色、减龄、换装的效果。

💡 TurboEdit能在保持图像整体不变的前提下,只对指定部分进行修改,让用户随心所欲地调整图像的任何区域。

🚀 TurboEdit支持同时修改图像的多个属性,包括颜色、着装、造型等,让创意得以无限延伸。

详情链接:https://betterze.github.io/TurboEdit/

7、AI遗嘱来了!新世相联合中华遗嘱库出品,已有上万人参与

数字化时代下,人工智能进入遗嘱领域,通过AI技术帮助用户撰写个性化遗嘱,创新互动形式让人与AI共同创作,审视人生内心。

image.png

【AiBase提要:】

🤖 利用AI技术帮助用户撰写个性化遗嘱,吸引上万人参与。

📖 用户通过与AI对话共同创作遗嘱内容,体验互动共创的新方式。

💡 在与AI的问答过程中,用户可以深入思考和审视自己的人生和内心。

详情链接:https://top.aibase.com/tool/xinshixiangyizhuai

8、AI舞王Viggle:一键让马斯克和特朗普共舞,月访问量破680万

马斯克再次展现了他在互联网上的流量之王地位,通过Viggle AI工具发布的视频引爆全网,播放量迅速突破1.3亿。Viggle AI的模板化AI视频生成工具简单且强大,让普通用户也能制作专业水准的视频,月访问量已突破680万,彰显AI技术在日常生活中的应用里程碑。

image.png

【AiBase提要:】

🌟 Viggle AI通过简单上传照片和选择动作模板,让用户轻松生成流畅自然的舞蹈视频。

🚀 推出多角色控制功能Multi,让用户同时操控两个角色,激发网友创意,二次创作视频传播迅速。

💡 Viggle AI的模板化操作降低了创作门槛,让普通用户也能创作专业水准的视频,类似剪映和CapCut的成功之路。

产品入口:https://top.aibase.com/tool/viggle

9、为复杂视觉推理而生!微软发布Phi-3.5-vision

微软最新发布了Phi-3.5-vision,一款轻量级、多模态的开源AI模型,专为处理文本和视觉输入而设计。Phi-3.5-vision在资源受限环境中表现出色,支持128K上下文长度,适用于商业和研究领域。该模型具备广泛的图像理解、OCR、图表和表格解析等功能,在基准测试中展现出显著性能提升。

image.png

【AiBase提要:】

🔍 Phi-3.5-vision是轻量级、多模态的AI模型,适用于处理文本和视觉输入。

💡 该模型支持128K上下文长度,在内存或计算资源受限环境中表现优异。

🚀 Phi-3.5-vision具备图像理解、OCR、图表和表格解析等功能,展现出显著性能提升。

详情链接:https://huggingface.co/microsoft/Phi-3.5-vision-instruct

10、字节跳动自动语音识别模型Seed-ASR,各种口音和方言统统能听懂!

Seed-ASR是字节跳动推出的语音识别引擎,经过大量数据训练,具备出色的识别能力和上下文感知能力,能准确识别多种语言、方言和口音,为跨语言交流带来新可能。在各种场景下表现出色,提升用户体验,尤其在智能助手和语音搜索领域有突出表现。

【AiBase提要:】

🔍 Seed-ASR经过超过2000万小时的语音数据和90万小时的配对数据训练,能准确识别13种中国方言和7种外语,包括各种口音的英语。

🔑 Seed-ASR具有出色的上下文感知能力,结合历史对话记录和会议纪要,提升识别精度,尤其在特定场景下表现优异。

🎯 Seed-ASR能识别各种专业领域术语,包括医疗、科技、汽车和音乐,大幅提升智能助手和语音搜索的效率和准确性。

详情链接:https://bytedancespeech.github.io/seedasr_tech_report/

11、Llama3压缩版!Nvidia推小型语言模型Llama-3.1-Minitron4B 仅4亿参数

在科技公司追逐实现人工智能的时代,Nvidia推出Llama-3.1-Minitron4B,采用剪枝和蒸馏技术,性能高效,训练部署效率优秀。

image.png

【AiBase提要:】

🌟 Llama-3.1-Minitron4B 是Nvidia推出的小型语言模型,训练部署高效。

📈 使用的标记量减少40倍,性能明显提升。

🔓 宽度剪枝版本已在Hugging Face发布,方便商业使用和开发。

详情链接:https://developer.nvidia.com/blog/how-to-prune-and-distill-llama-3-1-8b-to-an-nvidia-llama-3-1-minitron-4b-model/

12、OpenAI与康泰纳仕达成多年内容合作

近日,OpenAI与康泰纳仕达成多年合作协议,共同探索在人工智能产品中展示康泰纳仕旗下品牌内容。这一合作标志着数字内容和人工智能领域的紧密合作,为用户带来更丰富的搜索体验和高质量报道。

【AiBase提要:】

🌟 OpenAI与康泰纳仕达成多年合作,内容将嵌入AI产品中。

📰 OpenAI获得大量出版商文本档案,用于训练大型语言模型。

⚖️ 部分媒体公司选择起诉OpenAI以维护权益。

13、高通骁龙7s Gen3发布

作为中端智能手机市场的新宠,高通骁龙7s Gen3带来了强大的AI功能,性能大幅提升,功耗降低,为用户带来更流畅、智能的手机体验。多个知名手机品牌计划推出搭载该处理器的新设备,预示着中端手机市场将迎来新的活力和机遇。

image.png

【AiBase提要:】

🌟 骁龙7s Gen3支持先进的AI语言模型,如Baichuan-7B和Llama2,提升了中端手机的AI能力。

⚡ CPU性能提升20%,GPU速度提升40%,AI性能提高30%,功耗降低12%。

📱 多个品牌如Realme、三星、夏普和小米将在未来几个月推出搭载骁龙7s Gen3的手机。

14、真我13Pro系列来袭:AI超清摄影,让模糊成为过去式

真我手机品牌推出全新真我13Pro系列,突破性能,带来惊喜的摄影功能。AI超清功能优化模糊照片,让每个精彩瞬间清晰可见。真我13Pro+搭载5000万像素LYT600潜望长焦镜头,支持多重变焦应对各种拍摄场景。配置高通骁龙7s Gen2处理器,大容量电池和80W快充技术,续航无忧。

image.png

【AiBase提要:】

📸 AI超清功能优化模糊照片,呈现清晰视觉效果。

🔍 真我13Pro+搭载5000万像素LYT600潜望长焦镜头,支持多重变焦。

📱 配置高通骁龙7s Gen2处理器,大容量电池和80W快充技术,续航无忧。

举报

  • 相关推荐
  • 对标Sora!谷歌发布AI视频生成器Veo 3:可同时生成视频和音效

    谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3,对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频,还能为人物对话、鸟鸣等场景自动匹配音效,实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户,月费249.99美元,并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是,谷歌在AI图像生成领域并非一帆风顺,此前Imagen 3曾因生成含历史错误的图像引发争议。

  • AI日报:GPT-4.1正式上线ChatGPT;阿里通义万相Wan2.1-VACE开源;可灵大模型视频生成量约占30%份额

    本文报道了AI领域最新动态:1)阿里通义万相开源视频编辑统一模型VACE;2)OpenAI发布GPT-4.1增强编码能力;3)Stability AI推出超轻量341M文字转语音模型;4)快手可灵视频生成模型占据30%市场份额;5)微软WizardLM团队整体加入腾讯混元大模型研发体系;6)腾讯宣布混元图像2.0将于5月16日发布;7)上海成立人工智能标识生态联盟;8)Lightricks发布13B参数视频生成模型LTX-Video;9)谷歌DeepMind推出AlphaEvolve优化AI训练速度;10)腾讯元宝浏览器插件上线Chrome平台。这些进展展示了AI技术在视频处理、大模型、语音合成等领域的快速发展。

  • 豆包视频生成模型Seedance 1.0 lite发布:“迅速生成影视级的视频

    火山引擎在FORCE LINK AI创新巡展上发布多款AI模型升级产品:1)Seedance 1.0 lite视频生成模型,支持5-10秒480P/720P视频生成,具备影视级画质和生成速度优势,适用于电商广告、影视创作等场景;2)豆包1.5视觉深度思考模型,仅20B参数但具备多模态理解能力,在60项基准测试中38项达SOTA水平;3)升级版豆包音乐模型,新增英文歌曲创作功能,并能根据视频内容自动适配BGM。目前这些模型已在火山方舟平台和豆包APP上线。

  • 持续霸榜!可灵2.0模型登顶全球视频生成大模型榜单

    快手旗下可灵AI 2.0模型在权威AI评测中表现优异,以1124分超越自研1.6版本,连续三个月蝉联全球图生视频领域冠军。4月15日发布的2.0大师版在视频质量、语义理解和画面美学等核心指标持续领先行业。数据显示,自2023年6月上线以来,可灵AI全球用户突破2200万,月活激增25倍,累计生成视频1.68亿个、图片3.44亿张。商业化方面,其单月流水已超千万元,并与伊利、vivo等头部品牌达成深度合作,展现出AI视频生成技术的广阔商业前景。

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • AI日报:通义千问3大模型全球爆火;即梦图片3.0智能参考全量上线;智谱AI企业级超级助手Agent CoCo上线

    【AI日报】今日AI领域重要动态:1.通义千问3大模型全球下载量超1250万,衍生模型13万+;2.即梦图片3.0上线,AI设计进入"零门槛"时代;3.智谱AI发布企业级超级助手Agent CoCo;4.百度推出金融行业大模型"千帆慧金";5.小红书开源首个大模型dots.llm1,含1420亿参数;6.Hugging Face开源LeRobot项目,降低机器人研发门槛;7.ChatGPT语音功能升级,支持更自然对话翻译;8.Google Gemini应用下载量超ChatGPT但活跃度不足;9.轻量级文档解析模型MonkeyOCR表现优异;10.Google Veo3推出高速视频生成模式;11.Google调整AI Studio政策,限制Gemini2.5Pro免费访问。

  • AI日报:谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • 超越OpenAI、拿下全球双料第一,“AI吴彦祖”背后大模型SOTA了!

    超越OpenAI! 国产大模型突袭,AI语音生成天花板被重新定义了。 MiniMax最新发布Speech-02,同时拿下Artificial Analysis Speech Arena和Hugging Face TTS Arena两项全球权威语音基准测评第一!

  • AI日报:ChatGPT支持MCP和会议记录功能;Cursor 1.0 版本重磅发布;Midjourney视频功能将在本月上线

    本期AI日报聚焦多项AI领域突破:1)OpenAI为ChatGPT新增企业数据连接和会议记录功能;2)Cursor 1.0发布集成BugBot等开发工具;3)Midjourney即将推出视频生成功能;4)秘塔AI搜索新增PPT导出功能;5)Manus推出文本生成视频工具挑战Sora;6)法国Mistral发布企业级编程助手;7)英伟达推出文档处理专用AI模型;8)腾讯公益引入大模型提升互动体验;9)Firecrawl推出网页抓取API工具;10)Bland AI实现超真实语音克隆;11)报告显示AI训练成本逼近百亿美元;12)开源设计工具Jaaz支持批量图像生成;13)《逆水寒》手游接入AI实现图片动效玩法。

  • GhibliTattoo发布AI纹身生成,吉卜力风格专属定制!

    这款工具专为吉卜力粉丝、纹身爱好者与创意设计师打造。通过文本提示或图片上传,即可生成高分辨率、透明背景的吉卜力风格纹身设计……