首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:可灵1.5模型升级!上线人脸模型;华为Mate 70系列将支持AI隔空传送;Runway新增视频扩展画面功能

2024-11-25 15:52 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、可灵AI平台1.5模型升级:上线人脸模型功能 新增「标准模式」

可灵 AI 平台最近升级至1.5版本,推出多项新功能,包括增强的高品质视频生成模式和新增的标准模式,后者支持快速生成720p 视频。新的人脸模型功能面向高级会员开放,用户可在训练后随时生成视频。

image.png

微信截图_20241125091339.png

【AiBase提要:】

🎨 高品质模式增强,用户可指定运动轨迹,添加静止区域,提供更精细的控制。

⚡ 新增标准模式,快速生成720p视频,创作时间大幅缩短,性价比高。

👤 人脸模型功能面向会员开放,解决人脸ID保持难题,支持随时调用生成视频。

2、Runway新增视频扩展画面功能“Expand Video”

Runway 近日推出 “Expand Video” 功能,用户可通过文本提示在原视频基础上生成额外视觉内容,并调整视频。该功能支持动态效果,如快速变焦和拉远镜头,使视频更加生动。此工具标着视频生成技术的又一进步,进一步丰富创作可能性。

【AiBase提要:】

🎥 新功能上线: RunwayML推出“Expand Video”,允许用户通过文本提示在原视频基础上扩展内容。

⚙️ 动态效果实现: 用户可以创造快速变焦和拉远镜头等动态效果,提升视频的视觉体验。

🚀 生成速度提升: 新一代Gen-3Alpha模型生成速度显著提高,满足用户快速创作的需求。

3、华为Mate70系列将支持AI隔空传送 余承东亲自演示

华为 Mate70系列即将发布,搭载 AI 隔空传送和魔法手势操作功能。用户可通过手势轻松传送内容,提升使用体验。此外,Mate70系列将首次搭载原生鸿蒙系统,标志着华为在移动操作系统领域的进展。

【AiBase提要:】

🤖 AI隔空传送:用户可通过简单手势将内容从Mate70手机传送至平板,操作便捷。

✋ 魔法手势操作:在不便用手时,用户可通过手势翻页等操作,增加灵活性。

🌐 原生鸿蒙系统:Mate70系列首次搭载原生鸿蒙系统,标志着中国在移动操作系统领域的进步。

4、Lightricks开源实时视频生成模型LTX-Video 生成一个视频只要4秒!

Lightricks 推出了名为 LTX Video 的开源视频生成模型,具有20亿参数。该模型可以以每秒24帧的速度生成高达5秒的视频,仅需4秒,性能显著。LTXV 与 ComfyUI 无缝集成,提升用户体验,促进创意产业的发展。

【AiBase提要:】

🚀 LTXV模型基于扩散变换器架构,拥有20亿参数,生成速度快于视频播放,4秒生成5秒视频。

💻 采用bfloat16精度,在主流显卡上高效运行,优化内存使用,确保视频质量。

🌍 LTXV与ComfyUI无缝集成,降低使用门槛,推动创意科技的民主化,为创作者提供无限可能。

详情链接:https://www.lightricks.com/ltxv

5、EchoMimicV2:输入图片、音频和手势视频即可生成“同款”数字人

EchoMimicV2是最新的动画生成技术,支持输入一张图、一段手势视频和一段音频,能够生成高质量的半身人类动画该技术通过 Audio-Pose Dynamic Harmonization 策略提升动画细节,简化生成过程,并引入头部局部注意力机制来解决数据稀缺问题。

【AiBase提要:】

✨ EchoMimicV2通过简化控制条件,实现高质量的半身人类动画生成。

🎨 采用 Audio-Pose Dynamic Harmonization 策略,提升动画细节与表现力。

📊 新基准评估方法显示,EchoMimicV2在效果上优于现有技术。

6、音频驱动生成面部视频技术JoyVASA

JoyVASA 是一种新兴的音频驱动图像动画技术,旨在提升视频质量和嘴形同步精度。其创新的两阶段设计使得生成更长的动画视频成为可能,同时支持人物和动物的动画化,展现出良好的多语言支持能力。

image.png

【AiBase提要:】

🎨 JoyVASA 技术通过解耦面部表情与三维模型,实现更长的动画视频生成。

🔊 该技术能够根据音频线索生成动作序列,具有人物与动物动画的双重能力。

🌐 JoyVASA 在中英文数据集上训练,具备多语言支持,为全球用户提供服务。

详情链接:https://jdh-algo.github.io/JoyVASA/

7、PicMenu:用AI将菜单可视化 随手一拍就能生成高质量菜单

PicMenu 是一款创新的 AI 菜单可视化工具,通过简单的拍照操作,将传统纸质菜单转化为生动直观的数字化展示。它为餐饮行业的数字化转型提供了全新解决方案,展现出极强的实用性和技术实力。

image.png

【AiBase提要:】

📸 PicMenu 能通过拍照自动识别并提取菜品信息,生成高质量的数字化菜单展示。

🌍 该工具采用多重 AI 技术栈,确保菜品信息提取和图像生成的高效性与准确性。

🔧 项目开源,开发者可通过 GitHub 获取源代码,便于个性化定制和部署。

详情链接:https://www.picmenu.co/

8、英伟达发布Edify3D生成模型2分钟即可生成高质量3D资产

NVIDIA 推出的 Edify3D 技术能够在两分钟内,根据文本描述或参考图像生成高质量的3D 模型,具备完整的 UV 贴图、4K 纹理和 PBR 材质。该技术结合了多视角扩散模型和基于 Transformer 的重建技术,显著提高了3D 资产的创作效率,支持多样化的应用场景。

【AiBase提要:】

🎨 Edify3D技术能在两分钟内生成高质量3D模型,支持完整UV贴图和4K纹理,适用于多种行业。

🔍 该技术结合了多视角扩散模型和Transformer重建技术,确保生成的模型具有精确的网格结构和高分辨率纹理。

🌐 Edify3D还支持根据文本提示生成复杂3D场景,提供了强大的艺术设计和3D建模支持。

详情链接:https://research.nvidia.com/labs/dir/edify-3d/

9、更聪明了!小米智能家庭屏系列产品推送大模型超级小爱

小米公司宣布对智能家庭屏系列产品进行大模型升级,增加超级问答和闲聊对话等新功能。此次升级覆盖六款设备,用户需通过小爱音箱 App 完成设置。升级后,音箱将支持文本创作,具备更全面的知识库,提升用户体验。

image.png

【AiBase提要:】

🔧 升级覆盖六款设备,包括Xiaomi智能家庭屏10和小米小爱触屏音箱Pro8等。

📱 用户需将音箱升级到最新版本,并在App中设置大模型功能。

🌐 新功能支持文本创作和实时搜索,用户可直接向音箱询问各种问题。

10、REDMI K80Pro搭载Xiaomi AISP2.0影像算法:融合四大模型

小米公司今日披露了REDMI K80系列手机的影像配置细节,标志着该系列在摄影能力上的全面提升。Xiaomi AISP2.0包含了融合光学大模型2.0、影调大模型2.0、色彩大模型2.0以及人像大模型2.0,这些技术的应用将进一步提升K80Pro的影像处理能力。

image.png

【AiBase提要:】

📷 REDMI K80系列搭载旗舰级高动态主摄和浮动长焦镜头,满足高质量摄影需求。

⚙️ K80Pro内置Xiaomi AISP2.0技术,支持150张全算法高画质快拍,提升拍摄体验。

💰 标准版与Pro版在主摄和体验上保持一致,但不含高成本浮动长焦镜头,提供更具性价比的选择。

11、胖东来发声明:警告多账号擅自利用AI生成于东来声音

胖东来商贸集团近日发布声明,警告多个账号未经授权使用其创始人于东来声音,并篡改视频内容。这些行为严重侵犯了公司的著作权和人格权,误导公众,影响品牌形象。胖东来表示将采取法律措施追究责任,以维护其合法权益和网络生态的正常秩序。

【AiBase提要:】

🔊 多个账号利用AI生成与于东来相似的声音,进行非法剪辑和篡改。

⚖️ 胖东来强调此行为侵犯著作权,并制造虚假信息,破坏网络生态。

🚫 公司要求相关账号立即停止侵权,并表示将采取法律行动。

12、2028年全球生成式AI芯片市场预计将达862.4亿美元

根据最新报告,生成式人工智能芯片市场正在经历快速增长,预计到2028年市场规模将达到862.4亿美元。这一增长反映了对计算能力的需求激增和云计算的普及。

【AiBase提要:】

🌟 市场规模预计到2028年将达862.4亿美元,年均增长率为27.9%。

💻 主要驱动因素包括计算能力需求增加、深度学习发展及云计算普及。

📈 高通推出新一代芯片,提升智能手机生成式AI能力,推动市场创新。

举报

  • 相关推荐
  • 快手可灵AI上线2.1系列模型:生成5秒视频不到1分钟

    快手旗下可灵AI发布2.1系列模型,包含720p标准版和1080p高品质版,在性价比、生成速度和质量三大维度实现突破。新模型生成5秒视频仅需20-35灵感值,与上代保持相同成本;1080p视频生成时间不到1分钟,快于行业同级产品2-3倍。模型在动态表现、物理模拟和语义理解方面均有优化,人物动作更真实自然。可灵AI自发布以来发展迅猛,全球用户突破2200万,月活增长25倍,累计生成1.68亿视频和3.44亿图片。商业化进程加速,2025年Q1营收超1.5亿元人民币,展现强劲市场潜力。

  • 曝华为Mate 80系列回归直屏:等深微曲屏时代终结

    博主定焦数码暗示,年末登场的华为Mate 80系列回归直屏,续航也非常猛。 当前在售的Mate 70系列有直屏和等深微曲屏两种形态,其中标准版采用直屏但不支持3D人脸识别,其他版本采用等深微曲屏并支持3D人脸识别。 展望Mate 80系列,这次华为将会采用直屏 3D人脸识别的方案,结合之前的爆料来看,等深微曲屏在旗舰产品线上陆续退场,这个红极一时的旗舰级屏幕形态将会迅速

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • AI日报: ChatGPT免费开放记忆功能;华为WATCH 5智能手表接入双大模型;Claude Pro升级重磅功能

    本期AI日报主要报道了多项AI领域重要进展:1)OpenAI向所有ChatGPT用户免费开放记忆功能;2)蚂蚁集团推出"AI健康管家",服务4000万用户;3)Anthropic与DeepLearning.AI合作推出免费MCP课程;4)谷歌DeepMind开发无需3D模型即可生成逼真运动视频的新技术;5)Exa与OpenRouter合作为400+大模型提供实时网络搜索功能;6)中国知网推出CNKI AI学术研究助手;7)Anthropic推出Claude Explains博客项目;8)Claude Pro新增研究模式和远程MCP整合功能;9)Fish Audio发布基于200万小时数据训练的OpenAudio S1语音模型;10)OpenAI升级Codex编程工具;11)华为WATCH5接入盘古和DeepSeek双大模型。

  • AI日报:谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • AI日报:ChatGPT支持MCP和会议记录功能;Cursor 1.0 版本重磅发布;Midjourney视频功能将在本月上线

    本期AI日报聚焦多项AI领域突破:1)OpenAI为ChatGPT新增企业数据连接和会议记录功能;2)Cursor 1.0发布集成BugBot等开发工具;3)Midjourney即将推出视频生成功能;4)秘塔AI搜索新增PPT导出功能;5)Manus推出文本生成视频工具挑战Sora;6)法国Mistral发布企业级编程助手;7)英伟达推出文档处理专用AI模型;8)腾讯公益引入大模型提升互动体验;9)Firecrawl推出网页抓取API工具;10)Bland AI实现超真实语音克隆;11)报告显示AI训练成本逼近百亿美元;12)开源设计工具Jaaz支持批量图像生成;13)《逆水寒》手游接入AI实现图片动效玩法。

  • AI日报:DeepSeek开源新版R1-0528;字节发布图像Agent小云雀AI;可灵2.1重磅上线

    本期AI日报聚焦多项AI领域突破:1)DeepSeek发布R1-0528模型,支持128K上下文且性能媲美GPT-4;2)字节推出"小云雀AI"图像创作工具;3)可画2.1版本价格降65%性能提升;4)Opera发布全球首款AI浏览器Neon;5)Meta推出多模态空间理解模型;6)北大团队研发ZeroSearch框架降低大模型训练成本88%;7)字节推出AI视频剪辑应用"剪小映";8)MotionPro实现40ms/帧精准视频控制;9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人;10)OpenAI重组架构为IPO铺路;11)像素蛋糕"方糖大模型"获国内首个影像行业备案;12)Paper2Poster实现论文自动转海报;13)Resemble AI开源TTS模型性能比肩ElevenLabs;14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。

  • 鸿蒙最强三折叠!华为Mate XTs下半年登场

    博主数码闲聊站爆料,华为将在下半年推出Mate XT小迭代三折叠以及Mate X7大迭代双折叠。 他还爆料,明年将带来Pura X阔折叠迭代新品,Mate XT大迭代、折叠平板正在评估中。

  • AI日报:昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

    本文介绍了AI领域最新动态:1)昆仑万维推出全球首款AI+Agent架构的Office智能体应用;2)研究显示ChatGPT能提升K12学生成绩近87%;3)谷歌视频生成工具Veo3扩展至更多地区;4)谷歌发布三款Gemma模型变体,覆盖医疗、手语翻译和海豚语言研究;5)VideoTutor实现一句话生成定制教学视频;6)字节跳动开源多模态模型BAGEL;7)Rork支持无代码开发iOS/Android应用;8)AingDesk降低AI助手开发门槛;9)Claude4登陆亚马逊Bedrock平台;10)Youware通过MCP协议提升网页生成能力。这些创新展示了AI技术在各领域的快速发展和应用潜力。