首页 > 业界 > 关键词  > AI视频最新资讯  > 正文

AI日报:Adobe推出Firefly AI视频模型;Kimi推出多功能语音通话模式;智谱CogView3-Plus模型开源

2024-10-15 15:48 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、Kimi推出多功能语音通话模式 支持更换声音语速调节

Kimi人工智能助手最近推出了备受期待的语音通话功能,为用户带来了丰富的互动体验。新功能集多样化应用和个性化体验于一身,提升交流效率,满足个性化需求。针对特定场景深化了功能应用,如英语陪练和模拟面试,为学习和职场提供创新解决方案。引入声音克隆技术增添趣味性,持续关注用户反馈,优化扩展语音服务应用范围。

image.png

【AiBase提要:】

🌟 Kimi 助手更新语音通话功能,提升用户互动体验。

🎤 支持实时字幕和可调节声音,交互更自然。

🤖 引入声音克隆技术,增加趣味性和应用场景。

2、智谱CogView3-Plus模型开源 文生图技术迎来新纪元

智谱技术团队发布了CogView3及其升级版CogView3-Plus-3B,标志着AI辅助艺术创作迈入新阶段。CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。CogView3-Plus引入DiT框架和文本-图像联合注意力机制,提升性能、降低成本。开源仓库已开放,推动AI图像生成领域快速发展,文生图技术应用前景广阔。

image.png

【AiBase提要:】

🚀 CogView3及CogView3-Plus-3B开源,标志AI辅助艺术创作新阶段。

💡 CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。

💻 CogView3-Plus引入DiT框架和文本-图像联合注意力机制,提升性能、降低成本。

详情链接:https://top.aibase.com/tool/cogview3Plus

3、Adobe推出Firefly AI视频模型,Photoshop新增多个AI功能

Adobe在最新的MAX大会上推出了Firefly AI视频模型和多个增强版Photoshop工具,为用户带来了令人振奋的AI新功能。Firefly视频模型让用户通过文本提示创建或修改视频内容,为创作者们提供了全新的创作空间。同时,Photoshop新增的AI工具如移除工具和生成填充功能,让用户更轻松地编辑图像。Adobe承诺只使用授权内容训练模型,并推出内容凭证增加透明度。

【AiBase提要:】

📹 Firefly AI视频模型让用户通过文本创建和修改视频内容,为创作者们提供全新创作空间。

🖼️ Photoshop新增多项AI工具,如移除工具和生成填充,帮助用户更轻松地编辑图像。

🔍 Adobe承诺只使用授权内容训练模型,并推出内容凭证增加透明度。

详情链接:https://blog.adobe.com/en/publish/2024/09/11/bringing-gen-ai-to-video-adobe-firefly-video-model-coming-soon

4、ChatGPT大变身:新界面引入搜索功能

OpenAI近期对ChatGPT进行了重大更新,将其从单纯的对话助手转变为综合性信息平台。界面更新包括新增的Canvas功能和移动提示框位置,使用户体验更加便捷。引入的SearchGPT功能让用户可以访问实时网络数据,并与知名出版商合作确保信息可靠性。

image.png

【AiBase提要:】

🔍 新界面设计:新增Canvas功能和移动提示框位置,提升用户体验。

🌐 引入SearchGPT功能:按 / 键激活,访问实时网络数据,附有内联引用和链接。

💡 使用便捷:直观操作,提问后几秒内提供带有来源的答案,支持追问深入探讨话题。

5、火山引擎发布大模型训练视频预处理方案

火山引擎在近期的视频云技术大会上发布了大模型训练视频预处理方案,这一技术已成功应用于豆包视频生成模型,标志着AI视频生成技术的重大进展。

【AiBase提要:】

🔑 AIGC和多模态技术深刻改变用户体验

🔑 火山引擎探索AI大模型与视频技术融合,提供全方位解决方案

🔑 火山引擎开发的预处理方案优化算法和工程层面,提高模型训练效率

6、Midjourney即将推出在线编辑器,V7版本和个性化功能在路上

Midjourney最近公布了一系列令人兴奋的更新和即将推出的新功能,展示了公司在AI图像生成领域的快速发展和创新。团队正积极推进多个项目,注重提升质量和开发核心功能,而不是急于发布新产品。

image.png

【AiBase提要:】

🚀 Midjourney即将推出新的在线编辑器,用户可以导入图片并利用深度图和图像修复功能进行编辑。

💡 团队正在优化用户界面,以区分新功能与现有图片功能,并讨论首次发布时包含哪些功能。

🔧 Midjourney正在开发新工具,使用户更容易管理和切换多个个性化配置,引入更精细的风格个性化系统。

7、微软正打造 AI 伴侣,可以“看见” 和 “记住” 用户一切行为

最近,微软正致力于开发一种能实时观察用户行为的 AI 伴侣,旨在建立深厚的互动关系。这反映出人类对于倾诉、理解和陪伴的基本需求。同时,Windows 的新功能 Recall 可深入挖掘用户的数字历史,重现过去的点滴经历。Zoom 推出 AI 克隆功能,让用户派遣数字版自己参加会议,提高工作效率。

【AiBase提要:】

🌟 微软正在开发一种能实时观察用户行为的 AI 伴侣,旨在建立深厚的互动关系。

📂 Windows 的新功能 Recall 能深入挖掘用户的数字历史,重现过去的点滴经历。

💬 Zoom 推出 AI 克隆功能,让用户派遣数字版自己参加会议,提高工作效率。

8、微软AI副总裁跳槽OpenAI 将致力于AGI研究

微软AI副总裁塞巴斯蒂安・布贝克离开微软加盟OpenAI,将致力于人工通用智能(AGI)的研究。这一转变标志着布贝克的职业转折,也为OpenAI的发展增添了强有力的支持。

【AiBase提要:】

🧠 布贝克离开微软,加盟OpenAI,专注于AGI研究。

🤝 微软与OpenAI关系复杂,既是投资者又是竞争对手,双方希望继续合作。

🚀 布贝克的加入将推动OpenAI在小型语言模型和AGI研究方面取得突破

9、惊艳!AI模型DIAMOND可模拟《反恐精英》,单张RTX3090就能运行

研究人员开发的AI模型DIAMOND能够模拟《反恐精英:全球攻势》游戏,运行在Nvidia RTX3090显卡上,每秒10帧的速度。尽管存在一些缺陷,但未来有望通过增加数据和计算能力来改善模型性能。

image.png

【AiBase提要:】

🎮 DIAMOND模型能模拟CS:GO游戏,运行速度达每秒10帧。

📊 仅使用87小时游戏数据训练,仍能模拟复杂游戏场景。

🐛 存在缺陷,如无限跳跃和路径偏离导致模拟崩溃,但未来有改善潜力。

详情链接:https://diamond-wm.github.io/

10、英伟达Blackwell GPU需求暴涨,未来12个月供应量完全售罄

英伟达最新一代Blackwell GPU引发了前所未有的需求,CEO黄仁勋透露未来12个月供应量已售罄,市场对高性能计算的渴望再次得到证实。

【AiBase提要:】

💡Blackwell GPU需求爆发,未来12个月内完全售罄。

🔍主要客户包括AWS、谷歌等大型科技公司,推动市场增长。

📈NVIDIA预计2024年将出货数十亿美元的Blackwell GPU,数据中心收入显著增长。

11、Nvidia股价再创历史新高,市值逼近3.4万亿美元

Nvidia本周股价再创历史新高,市值逼近3.4万亿美元,投资者备受振奋。CEO黄仁勋的个人财富已超1215亿美元,新一代Blackwell芯片需求火爆。Nvidia稳固主导AI芯片市场,市值仅次于苹果,展现强大实力。

【AiBase提要:】

🚀 Nvidia股价创下138.07美元新高,年内涨幅近180%。

📊 公司在AI芯片市场占有率高达70%至95%,市值达3.4万亿美元。

💡 CEO黄仁勋表示新一代Blackwell芯片需求“疯狂”,已售罄至明年。

举报

  • 相关推荐
  • 爱诗科技下注的AI视频,正在比它预期的更「快」落地

    「我们决定全力投入视频生成领域,因为我们坚信视频生成一旦能够落地,其产品化和商业化的潜力可能不亚于大语言模型。」爱诗科技创始人兼CEO王长虎在2025年6月的一场演讲中,这样解释为什么要在2023年就坚定地选择AI视频生成这个非共识赛道作为自己的创业方向。 短短两年后,视频大模型的产品化和商业化潜力已经如王长虎判断的那样,在快速落地,形成自己的创作生�

  • 长视频,要MCN化?

    过去十多年,长视频平台习惯用头部综艺与大剧撬动增长:内容够强,自然破圈,声量带动会员与广告。 这套“内容中心逻辑”曾行之有效。 但短视频重写了注意力分配。用户不再愿意投入整段时间追一个叙事,三十秒的情绪刺激就足以满足娱乐需求。内容生命周期被压缩,哪怕是重金制作,也可能上线当周见顶、难以延展。 在这种环境下,平台不得不寻找新的增长方式。�

  • AI日报:HeyGen发布AI视频翻译引擎;科大讯飞推星火 X1.5;QQ浏览器推出AI+小窗

    本期AI日报聚焦多项技术突破:HeyGen推出精准唇形同步的视频翻译引擎;科大讯飞发布星火X1.5大模型,提升多语言处理能力;QQ浏览器新增AI助手浮窗;科大讯飞推出软硬一体方案,实现高噪声环境精准识别;谷歌Gemini 3 Pro预览版支持百万级上下文窗口;Comfy Cloud让Stable Diffusion实现零门槛创作;谷歌Gemini新增深度研究功能,可整合邮件生成智能报告;上海AgiBot机器人10分钟完成复杂制造任务,重塑生产效率。

  • 短视频加速跑入AI时代

    「现在是西天取经的第996天,刚把师父从妖怪嘴里救出来,师父身上都还是热乎的,我们就马不停蹄开始出发了。」在抖音,都能看到《西游记》里师徒四人的取经vlog了。 采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播,各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。 尽管在专业影视

  • 冷美人退赛后冲上热搜第一:本人1分钟视频报价50元

    微博话题冷美人退赛”冲上热搜榜第一名,引发关注。 据媒体报道,湖南张家界七星山景区荒野求生挑战赛热门选手冷美人”因体检未通过遗憾退赛。 知情人士称,幸好当时旁边有人把她扶住了,然后送往医院,冷美人”醒过来第一句话就是这是哪?要去哪里”,她感到非常遗憾,说着不甘心”,还说给你们添麻烦了”。 据悉,冷美人”本名叫杨朝芹,来自云南,在这次�

  • Sora App的AI视频社交,给了百度们新希望

    Sora2发布两周后,百度的蒸汽机AI视频模型,和谷歌Veo3.1撞了档期。 两家公司选择同期发布并非有多默契,而是Sora2带来的压迫感促使它们不得不加快脚步。 奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”,不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。 这无疑是扔在AI视�

  • 专业创作者之选:佳能R50V在视频、Vlog与直播领域的全能表现

    佳能R50V相机专为视频创作者设计,集专业视频制作、Vlog记录与高质量直播于一体。支持6K超采样4K视频录制,配备10-bit 4:2:2色彩与Canon Log3,保障画质细腻且后期空间大。机身仅323克,便携性强,优化自拍与竖拍操作,内置美颜与智能对焦功能。直播时可通过USB直连电脑,实现4K 60P高清输出。它融合专业性能与易用性,是应对多种创作需求的理想选择。

  • 拍照视频,无需妥协:佳能R50V以全能双修定义创作新标准

    佳能R50V以“全能双修”定位成为市场焦点,在视频与摄影两大核心维度表现均衡专业。搭载2420万像素APS-C画幅CMOS与DIGIC X处理器,支持6K超采4K录制及专业格式,配备10bit色深。机身仅重323克,新增竖拍优化与14种滤镜,支持USB一线连播。具备1/8000秒快门与第二代全像素双核AF系统,可精准识别多类主体。配合RF-S电动变焦镜头实现广角自拍,覆盖Vlog、直播、人像等多场景,以约6000元定价降低专业创作门槛,成为内容创作者的热门选择。

  • 一机在手,随心创作:佳能R50V满足你对Vlog、人像与美食视频的所有想象

    佳能R50V微单相机专为视频创作者设计,兼具专业画质与便携性。机身仅重323克,支持6K超采4K视频,配备第二代全像素双核AF系统,可智能追踪人物、动物等多种主体。内置14种色彩滤镜与平滑皮肤功能,优化人像表现。创意拍摄模式支持慢快动作、电影宽银幕比例,竖拍优化与直播兼容性进一步提升创作效率,是Vlog、旅拍和街拍的理想工具。

  • 剪辑快人一步!索尼ICE-Cloud助力婚礼视频团队高效高质交付

    北京二十四格文化有限公司(24Frames)成立于2004年,专注极致纪实影像美学,深耕婚礼电影、商业宣传、纪录片、综艺及艺人合作等领域。团队以真实事件与情感为核心,融合高级审美与技艺,打造富有共情力的影片,助力品牌传递深度价值。面对跨地域协作与高清素材传输等挑战,公司通过索尼与分秒帧联合推出的ICE-Cloud云平台优化流程,实现拍摄至交付的高效协同,显著�

今日大家都在搜的词: