首页 > 业界 > 关键词  > AI视频最新资讯  > 正文

AI日报:Adobe推出Firefly AI视频模型;Kimi推出多功能语音通话模式;智谱CogView3-Plus模型开源

2024-10-15 15:48 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、Kimi推出多功能语音通话模式 支持更换声音语速调节

Kimi人工智能助手最近推出了备受期待的语音通话功能,为用户带来了丰富的互动体验。新功能集多样化应用和个性化体验于一身,提升交流效率,满足个性化需求。针对特定场景深化了功能应用,如英语陪练和模拟面试,为学习和职场提供创新解决方案。引入声音克隆技术增添趣味性,持续关注用户反馈,优化扩展语音服务应用范围。

image.png

【AiBase提要:】

🌟 Kimi 助手更新语音通话功能,提升用户互动体验。

🎤 支持实时字幕和可调节声音,交互更自然。

🤖 引入声音克隆技术,增加趣味性和应用场景。

2、智谱CogView3-Plus模型开源 文生图技术迎来新纪元

智谱技术团队发布了CogView3及其升级版CogView3-Plus-3B,标志着AI辅助艺术创作迈入新阶段。CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。CogView3-Plus引入DiT框架和文本-图像联合注意力机制,提升性能、降低成本。开源仓库已开放,推动AI图像生成领域快速发展,文生图技术应用前景广阔。

image.png

【AiBase提要:】

🚀 CogView3及CogView3-Plus-3B开源,标志AI辅助艺术创作新阶段。

💡 CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。

💻 CogView3-Plus引入DiT框架和文本-图像联合注意力机制,提升性能、降低成本。

详情链接:https://top.aibase.com/tool/cogview3Plus

3、Adobe推出Firefly AI视频模型,Photoshop新增多个AI功能

Adobe在最新的MAX大会上推出了Firefly AI视频模型和多个增强版Photoshop工具,为用户带来了令人振奋的AI新功能。Firefly视频模型让用户通过文本提示创建或修改视频内容,为创作者们提供了全新的创作空间。同时,Photoshop新增的AI工具如移除工具和生成填充功能,让用户更轻松地编辑图像。Adobe承诺只使用授权内容训练模型,并推出内容凭证增加透明度。

【AiBase提要:】

📹 Firefly AI视频模型让用户通过文本创建和修改视频内容,为创作者们提供全新创作空间。

🖼️ Photoshop新增多项AI工具,如移除工具和生成填充,帮助用户更轻松地编辑图像。

🔍 Adobe承诺只使用授权内容训练模型,并推出内容凭证增加透明度。

详情链接:https://blog.adobe.com/en/publish/2024/09/11/bringing-gen-ai-to-video-adobe-firefly-video-model-coming-soon

4、ChatGPT大变身:新界面引入搜索功能

OpenAI近期对ChatGPT进行了重大更新,将其从单纯的对话助手转变为综合性信息平台。界面更新包括新增的Canvas功能和移动提示框位置,使用户体验更加便捷。引入的SearchGPT功能让用户可以访问实时网络数据,并与知名出版商合作确保信息可靠性。

image.png

【AiBase提要:】

🔍 新界面设计:新增Canvas功能和移动提示框位置,提升用户体验。

🌐 引入SearchGPT功能:按 / 键激活,访问实时网络数据,附有内联引用和链接。

💡 使用便捷:直观操作,提问后几秒内提供带有来源的答案,支持追问深入探讨话题。

5、火山引擎发布大模型训练视频预处理方案

火山引擎在近期的视频云技术大会上发布了大模型训练视频预处理方案,这一技术已成功应用于豆包视频生成模型,标志着AI视频生成技术的重大进展。

【AiBase提要:】

🔑 AIGC和多模态技术深刻改变用户体验

🔑 火山引擎探索AI大模型与视频技术融合,提供全方位解决方案

🔑 火山引擎开发的预处理方案优化算法和工程层面,提高模型训练效率

6、Midjourney即将推出在线编辑器,V7版本和个性化功能在路上

Midjourney最近公布了一系列令人兴奋的更新和即将推出的新功能,展示了公司在AI图像生成领域的快速发展和创新。团队正积极推进多个项目,注重提升质量和开发核心功能,而不是急于发布新产品。

image.png

【AiBase提要:】

🚀 Midjourney即将推出新的在线编辑器,用户可以导入图片并利用深度图和图像修复功能进行编辑。

💡 团队正在优化用户界面,以区分新功能与现有图片功能,并讨论首次发布时包含哪些功能。

🔧 Midjourney正在开发新工具,使用户更容易管理和切换多个个性化配置,引入更精细的风格个性化系统。

7、微软正打造 AI 伴侣,可以“看见” 和 “记住” 用户一切行为

最近,微软正致力于开发一种能实时观察用户行为的 AI 伴侣,旨在建立深厚的互动关系。这反映出人类对于倾诉、理解和陪伴的基本需求。同时,Windows 的新功能 Recall 可深入挖掘用户的数字历史,重现过去的点滴经历。Zoom 推出 AI 克隆功能,让用户派遣数字版自己参加会议,提高工作效率。

【AiBase提要:】

🌟 微软正在开发一种能实时观察用户行为的 AI 伴侣,旨在建立深厚的互动关系。

📂 Windows 的新功能 Recall 能深入挖掘用户的数字历史,重现过去的点滴经历。

💬 Zoom 推出 AI 克隆功能,让用户派遣数字版自己参加会议,提高工作效率。

8、微软AI副总裁跳槽OpenAI 将致力于AGI研究

微软AI副总裁塞巴斯蒂安・布贝克离开微软加盟OpenAI,将致力于人工通用智能(AGI)的研究。这一转变标志着布贝克的职业转折,也为OpenAI的发展增添了强有力的支持。

【AiBase提要:】

🧠 布贝克离开微软,加盟OpenAI,专注于AGI研究。

🤝 微软与OpenAI关系复杂,既是投资者又是竞争对手,双方希望继续合作。

🚀 布贝克的加入将推动OpenAI在小型语言模型和AGI研究方面取得突破

9、惊艳!AI模型DIAMOND可模拟《反恐精英》,单张RTX3090就能运行

研究人员开发的AI模型DIAMOND能够模拟《反恐精英:全球攻势》游戏,运行在Nvidia RTX3090显卡上,每秒10帧的速度。尽管存在一些缺陷,但未来有望通过增加数据和计算能力来改善模型性能。

image.png

【AiBase提要:】

🎮 DIAMOND模型能模拟CS:GO游戏,运行速度达每秒10帧。

📊 仅使用87小时游戏数据训练,仍能模拟复杂游戏场景。

🐛 存在缺陷,如无限跳跃和路径偏离导致模拟崩溃,但未来有改善潜力。

详情链接:https://diamond-wm.github.io/

10、英伟达Blackwell GPU需求暴涨,未来12个月供应量完全售罄

英伟达最新一代Blackwell GPU引发了前所未有的需求,CEO黄仁勋透露未来12个月供应量已售罄,市场对高性能计算的渴望再次得到证实。

【AiBase提要:】

💡Blackwell GPU需求爆发,未来12个月内完全售罄。

🔍主要客户包括AWS、谷歌等大型科技公司,推动市场增长。

📈NVIDIA预计2024年将出货数十亿美元的Blackwell GPU,数据中心收入显著增长。

11、Nvidia股价再创历史新高,市值逼近3.4万亿美元

Nvidia本周股价再创历史新高,市值逼近3.4万亿美元,投资者备受振奋。CEO黄仁勋的个人财富已超1215亿美元,新一代Blackwell芯片需求火爆。Nvidia稳固主导AI芯片市场,市值仅次于苹果,展现强大实力。

【AiBase提要:】

🚀 Nvidia股价创下138.07美元新高,年内涨幅近180%。

📊 公司在AI芯片市场占有率高达70%至95%,市值达3.4万亿美元。

💡 CEO黄仁勋表示新一代Blackwell芯片需求“疯狂”,已售罄至明年。

举报

  • 相关推荐
  • 爱诗科技,一家AI视频创业公司的生存哲学

    “你还是回去吧,大模型在中国没有机会。” 2023年刚创业,爱诗科技创始人兼CEO王长虎收到了天使投资人朱啸虎的“劝退”。 但两年时间过去,两个节点颠覆了投资人对AI视频生成赛道的固有印象。先是

  • 天网杯纳米AI视频创作赛圆满落幕,ISC.AI学苑推动“教育AI+”新范式

    9月23日,第三届“天网杯”网络安全大赛在天津落幕,吸引全国顶尖战队角逐,同期举办纳米AI视频创作赛。赛事聚焦个人信息保护、防诈 骗等网络安全议题,通过“以赛促学”模式提升学生防护意识与AI应用能力。ISC.AI学苑作为平台支持,依托“纳米AI”技术降低创作门槛,推动“安全+AI”人才培养。大赛评选出24个奖项,并联合多所高校深化合作,促进AI技术在教育场景的落

  • AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

    近日AI领域迎来多项重要更新:阿里夸克发布AI创作平台“造点”,整合通义万相Wan2.5与Midjourney V7,支持音画同步视频生成;Wan2.5-Preview实现多模态输入与电影级视频同步生成,提升视觉创作能力;可灵AI推出视频生成模型2.5Turbo并降价30%,降低使用门槛;阿里通义推出Qwen3-ASR-Toolkit,实现小时级音视频转录;谷歌相册AI编辑功能扩展至安卓用户,支持语音修图;谷歌Mixboard工具助力创意设计,生成情绪板;Qwen发布Qwen3-Max模型,在代码生成与智能体能力表现突出;Figma推出MCP服务器,实现设计到代码的一键转换,提升开发效率。

  • 店长连续工作超8小时 因闭眼2秒视频遭解雇 法院判了

    9月26日,广州市中级人民法院、广州市人力资源和社会保障局、广州市总工会联合发布了新一批劳动争议典型案例。 其中,有一则案例引发广泛关注:一位零售店店长竟因闭眼休息、上厕所等看似平常的行为被公司解雇。 2021年3月,余某入职某零售公司,担任该公司位于某商场门店的店长一职,全面负责门店的日常管理工作。 然而,2024年9月26日,某零售公司却以余某工作�

  • 从撕吧到丝瓜,短视频模仿秀进化史

    “火之前还觉得挺快乐的,老师还有同学都特别和蔼可亲的。但火了之后就感觉,人都突然变了。就同学什么的,都觉得你像个怪物一样。” 在抖音人物故事《生活闪亮时2025》“美错如是”里,18岁的钟美美回到母校,回想2020年的那场爆火,依旧胆战心惊。 互联网与现实就是那么割裂,并行着两个时代的道德体系。硬糖君小学写作文,爱用“光阴似箭,日月如梭”凑字数。

  • 视频拍照不妥协!佳能R50V 4K 视频 + 2420万像素直出,2025 不用二选一

    2025年短视频创作进入专业化时代,佳能R50V作为全新EOS V系列首款机型,以“视频强优化,拍照不妥协”为核心优势。其支持6K超采样4K 30P、4K 60P及全高清120P慢动作,竖屏适配移动端生态,USB直连实现4K 60P直播,并具备2小时持续录制能力。拍照方面搭载2420万像素APS-C传感器,支持15张/秒高速连拍,机身仅323克轻巧便携。R50V兼顾专业视频输出与高质量拍照,满足创作者多场景需求,实现一机双修。

  • 海尔冰箱联合央视频发起囤鲜挑战

    9月21日,海尔冰箱联合央视视频发起“一台冰箱装下中国百味”挑战。活动首站成都,现场展示科学收纳格局与磁控全空间保鲜科技,实现食材分类精准储存,杜绝串味。挑战难点在于食材种类繁多、保鲜要求苛刻,海尔麦浪冰箱凭借576L大容量、M5分储格局及阻氧干湿分储技术,成功保持各类食材新鲜口感。在火锅宴现场,所有食材经涮煮检验,获一致好评。该冰箱搭载获国家科技进步奖的磁控保鲜科技,满足超3500种食材储鲜需求,为9月26日新品发布会预热。

  • 当视频播客陷入“形式之争”,成就UP主才是真正的增量

    随着B站推出“视频播客出圈计划”,抖音、小红书等平台相继加码,名人效应与资源倾斜不断助推着这一内容形态站上风口。与此同时,质疑也随之而来,“播客视频化是否只是一个伪命题?”“到底是视频播客化还是播客视频化?”等议论愈演愈烈。 而在这些争论之外,一个更值得思考的议题正在浮现:当公众在讨论视频播客的概念是否成立时,行业能否借此机会跳出形式之�

  • B站想用「视频播客」吸引更多优质创作者

    近两个月,「视频播客」作为一种新的内容形态火了起来。不止一个平台入局,不止一个创作者参与。鲁豫与易立竞的对谈,罗永浩与李想、何小鹏的对谈,不仅在B站获得百万播放,切片内容还在全网传播。最近,甚至有人建议罗永浩邀请贾国龙录一期《罗永浩的十字路口》。 但「视频播客」与音频播客的区别是什么、与其他视频内容有何不同、市场空间和商业化前景如何�

  • 一条视频收入近百万,这位00后拍出了男孩们的青春遗憾

    “原来爱情真得可以演出来。” 最近,抖音作者“《龙龙历险记》”(下文简称“龙龙”)的自制爱情电影《你回头,明天见》火了。截至发稿前,《你回头,明天见》不仅抖音累计播放量超1亿,还破了抖音的付费视频纪录,一条视频超135万人付费,累计收入近百万元。 《你回头,明天见》讲述了男主“龙龙”在昆明街头偶遇女主“王婕吐了”(下文简称“王婕”)后,一

今日大家都在搜的词: