首页 > 业界 > 关键词  > AI视频最新资讯  > 正文

AI日报:Adobe推出Firefly AI视频模型;Kimi推出多功能语音通话模式;智谱CogView3-Plus模型开源

2024-10-15 15:48 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、Kimi推出多功能语音通话模式 支持更换声音语速调节

Kimi人工智能助手最近推出了备受期待的语音通话功能,为用户带来了丰富的互动体验。新功能集多样化应用和个性化体验于一身,提升交流效率,满足个性化需求。针对特定场景深化了功能应用,如英语陪练和模拟面试,为学习和职场提供创新解决方案。引入声音克隆技术增添趣味性,持续关注用户反馈,优化扩展语音服务应用范围。

image.png

【AiBase提要:】

🌟 Kimi 助手更新语音通话功能,提升用户互动体验。

🎤 支持实时字幕和可调节声音,交互更自然。

🤖 引入声音克隆技术,增加趣味性和应用场景。

2、智谱CogView3-Plus模型开源 文生图技术迎来新纪元

智谱技术团队发布了CogView3及其升级版CogView3-Plus-3B,标志着AI辅助艺术创作迈入新阶段。CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。CogView3-Plus引入DiT框架和文本-图像联合注意力机制,提升性能、降低成本。开源仓库已开放,推动AI图像生成领域快速发展,文生图技术应用前景广阔。

image.png

【AiBase提要:】

🚀 CogView3及CogView3-Plus-3B开源,标志AI辅助艺术创作新阶段。

💡 CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。

💻 CogView3-Plus引入DiT框架和文本-图像联合注意力机制,提升性能、降低成本。

详情链接:https://top.aibase.com/tool/cogview3Plus

3、Adobe推出Firefly AI视频模型,Photoshop新增多个AI功能

Adobe在最新的MAX大会上推出了Firefly AI视频模型和多个增强版Photoshop工具,为用户带来了令人振奋的AI新功能。Firefly视频模型让用户通过文本提示创建或修改视频内容,为创作者们提供了全新的创作空间。同时,Photoshop新增的AI工具如移除工具和生成填充功能,让用户更轻松地编辑图像。Adobe承诺只使用授权内容训练模型,并推出内容凭证增加透明度。

【AiBase提要:】

📹 Firefly AI视频模型让用户通过文本创建和修改视频内容,为创作者们提供全新创作空间。

🖼️ Photoshop新增多项AI工具,如移除工具和生成填充,帮助用户更轻松地编辑图像。

🔍 Adobe承诺只使用授权内容训练模型,并推出内容凭证增加透明度。

详情链接:https://blog.adobe.com/en/publish/2024/09/11/bringing-gen-ai-to-video-adobe-firefly-video-model-coming-soon

4、ChatGPT大变身:新界面引入搜索功能

OpenAI近期对ChatGPT进行了重大更新,将其从单纯的对话助手转变为综合性信息平台。界面更新包括新增的Canvas功能和移动提示框位置,使用户体验更加便捷。引入的SearchGPT功能让用户可以访问实时网络数据,并与知名出版商合作确保信息可靠性。

image.png

【AiBase提要:】

🔍 新界面设计:新增Canvas功能和移动提示框位置,提升用户体验。

🌐 引入SearchGPT功能:按 / 键激活,访问实时网络数据,附有内联引用和链接。

💡 使用便捷:直观操作,提问后几秒内提供带有来源的答案,支持追问深入探讨话题。

5、火山引擎发布大模型训练视频预处理方案

火山引擎在近期的视频云技术大会上发布了大模型训练视频预处理方案,这一技术已成功应用于豆包视频生成模型,标志着AI视频生成技术的重大进展。

【AiBase提要:】

🔑 AIGC和多模态技术深刻改变用户体验

🔑 火山引擎探索AI大模型与视频技术融合,提供全方位解决方案

🔑 火山引擎开发的预处理方案优化算法和工程层面,提高模型训练效率

6、Midjourney即将推出在线编辑器,V7版本和个性化功能在路上

Midjourney最近公布了一系列令人兴奋的更新和即将推出的新功能,展示了公司在AI图像生成领域的快速发展和创新。团队正积极推进多个项目,注重提升质量和开发核心功能,而不是急于发布新产品。

image.png

【AiBase提要:】

🚀 Midjourney即将推出新的在线编辑器,用户可以导入图片并利用深度图和图像修复功能进行编辑。

💡 团队正在优化用户界面,以区分新功能与现有图片功能,并讨论首次发布时包含哪些功能。

🔧 Midjourney正在开发新工具,使用户更容易管理和切换多个个性化配置,引入更精细的风格个性化系统。

7、微软正打造 AI 伴侣,可以“看见” 和 “记住” 用户一切行为

最近,微软正致力于开发一种能实时观察用户行为的 AI 伴侣,旨在建立深厚的互动关系。这反映出人类对于倾诉、理解和陪伴的基本需求。同时,Windows 的新功能 Recall 可深入挖掘用户的数字历史,重现过去的点滴经历。Zoom 推出 AI 克隆功能,让用户派遣数字版自己参加会议,提高工作效率。

【AiBase提要:】

🌟 微软正在开发一种能实时观察用户行为的 AI 伴侣,旨在建立深厚的互动关系。

📂 Windows 的新功能 Recall 能深入挖掘用户的数字历史,重现过去的点滴经历。

💬 Zoom 推出 AI 克隆功能,让用户派遣数字版自己参加会议,提高工作效率。

8、微软AI副总裁跳槽OpenAI 将致力于AGI研究

微软AI副总裁塞巴斯蒂安・布贝克离开微软加盟OpenAI,将致力于人工通用智能(AGI)的研究。这一转变标志着布贝克的职业转折,也为OpenAI的发展增添了强有力的支持。

【AiBase提要:】

🧠 布贝克离开微软,加盟OpenAI,专注于AGI研究。

🤝 微软与OpenAI关系复杂,既是投资者又是竞争对手,双方希望继续合作。

🚀 布贝克的加入将推动OpenAI在小型语言模型和AGI研究方面取得突破

9、惊艳!AI模型DIAMOND可模拟《反恐精英》,单张RTX3090就能运行

研究人员开发的AI模型DIAMOND能够模拟《反恐精英:全球攻势》游戏,运行在Nvidia RTX3090显卡上,每秒10帧的速度。尽管存在一些缺陷,但未来有望通过增加数据和计算能力来改善模型性能。

image.png

【AiBase提要:】

🎮 DIAMOND模型能模拟CS:GO游戏,运行速度达每秒10帧。

📊 仅使用87小时游戏数据训练,仍能模拟复杂游戏场景。

🐛 存在缺陷,如无限跳跃和路径偏离导致模拟崩溃,但未来有改善潜力。

详情链接:https://diamond-wm.github.io/

10、英伟达Blackwell GPU需求暴涨,未来12个月供应量完全售罄

英伟达最新一代Blackwell GPU引发了前所未有的需求,CEO黄仁勋透露未来12个月供应量已售罄,市场对高性能计算的渴望再次得到证实。

【AiBase提要:】

💡Blackwell GPU需求爆发,未来12个月内完全售罄。

🔍主要客户包括AWS、谷歌等大型科技公司,推动市场增长。

📈NVIDIA预计2024年将出货数十亿美元的Blackwell GPU,数据中心收入显著增长。

11、Nvidia股价再创历史新高,市值逼近3.4万亿美元

Nvidia本周股价再创历史新高,市值逼近3.4万亿美元,投资者备受振奋。CEO黄仁勋的个人财富已超1215亿美元,新一代Blackwell芯片需求火爆。Nvidia稳固主导AI芯片市场,市值仅次于苹果,展现强大实力。

【AiBase提要:】

🚀 Nvidia股价创下138.07美元新高,年内涨幅近180%。

📊 公司在AI芯片市场占有率高达70%至95%,市值达3.4万亿美元。

💡 CEO黄仁勋表示新一代Blackwell芯片需求“疯狂”,已售罄至明年。

举报

  • 相关推荐
  • 告别反复横跳,我用一张画布给AI视频创作配上了一条“流水线”

    ​今年的世界人工智能大会(WAIC),可能是史上最热闹的一届。 不仅展馆规模创下新高,超过800家企业带来了3000多项展品,线下参观人数也远超去年。而如果你也在现场,穿梭在拥挤的人潮中,你会发现有一个展台前总是被围得水泄不通,其中还夹杂着大量专程赶来的海外观众。 这个展台就是可灵 AI。 这一次,之所以会被这些专业目光团团围住,并非是可灵 AI 的又一次�

  • 抖音、视频号出手整顿团播,要变天了?

    ​严打低俗内容、严禁宣扬大额打赏......抖音和视频号的团播新规来了。 近日,两大平台接连出手整顿团播,对违规行为进行公示,并称将视违规程度分别予以相应处罚,最高处以封禁账号、清退等。 团播的精品化、专业化浪潮不可逆,这也是各大平台整顿团播背后释放的重要信号。 除了对内容提出越来越高的要求之外,团播的火热也推动了许多新玩法、新模式的诞生。�

  • 撞脸大S走红女生删除露脸视频:别烦我

    近日一名24岁女孩在网上分享自拍照,其外表酷似大S引发广泛关注,不少网友留言称太像了”。 对于走红网络,该女生表示,很感谢大家的喜欢,我就是一个很普通的学生,这次旅程很开心,所以发了一些旅游的照片,这些照片可能有的瞬间或者角度有点像大S,但是我真的从来没想过要模仿她,我很喜欢她,也不会消费她。 我对我自己很满意,所以不会整容,以前没有以后

  • 苹果脑控实机视频首曝 渐冻症患者意念操控iPad

    今年5月,苹果公布全新辅助功能,其中包括脑机接口(BCI),针对行动不便用户,iOS、iPadOS和visionOS将新增支持脑机接口的切换控制协议。 苹果表示,这项突破性技术无需物理操作即可实现设备控制,这意味着iPhone、iPad、Apple Vision Pro将支持意念控制。 日前,苹果脑控实机视频首次曝光,合作方Synchron开发的Stentrode设备通过颈静脉微创植入大脑血管表面,让意念操控变为现实

  • 撞脸大S走红女生删除露脸视频 修改简介为:别烦我

    近日,重庆医科大学一名24岁女医学生因长相酷似已故艺人徐熙媛(大S)在网络引发热议。7月18日,该女生在社交平台发布青海旅行照,其中黑马河日出抓拍中的侧脸轮廓、祁连山草原回眸一笑的温婉气质,与大S经典影视形象高度相似,相关视频11天内涨粉2.8万,单条动态点赞突破10万。 值得注意的是,此时距离大S于2025年2月2日因流感并发肺炎离世刚过半年,其丈夫具俊晔仍

  • 2025比较好用的AI工具推荐:从文案到视频,AIbase AI工具导航站一站式搞定

    本文推荐多款高效AI工具:1.办公助手ChatGPT处理邮件报告等文本工作;Notion AI智能管理知识库。2.设计工具Midjourney通过文字生成创意图片;Canva提供零基础专业设计。3.写作助手Claude擅长长文分析与总结;Grammarly提升英文写作质量。4.视频工具HeyGen快速制作数字人视频;Runway ML实现高级视频编辑。建议使用AI导航平台精准匹配需求,避免信息过载,让AI真正成为效率倍增器而非创造力的替代品。

  • 男子因拥有“世界上最长的下巴”走红 拍视频月入6位数

    近日,日本一男子因拥有世界上最长的下巴”走红网络。 据介绍,该男子幼年时与其他人无异样,外貌平平无奇,但从5岁开始,他的下巴就开始慢慢变尖,脸型也长成了长脸。 小时候,因为他的下巴,同学们不少欺负嘲笑他,并且给他取了很多外号。 对此,他也不少往医院跑,起初医生以为他是因为遗传因素造成的,但查了族谱发现没有一个有此病例的。 之后,医生又�

  • 李想:很多人让我学习雷军 考虑也开个视频号

    如今不少汽车高管纷纷开通短视频账号,走向台前与用户交流互动,理想汽车创始人李想也要加入了。 今天,随着理想i8媒体动态品鉴内容的陆续释放,李想透露,已收到公司内外诸多建议,希望他能学习雷军走到台前,通过视频账号与用户面对面”交流,目前正在认真考虑这一建议。 据了解,目前蔚来汽车的李斌和小鹏汽车的何小鹏均已开通个人抖音号。

  • AI日报:Kimi K2 高速版发布;美图WHEE上线视频超清功能;字节发布新模型Seed Diffusion Preview

    【AI日报】今日AI领域重要动态:1)美图WHEE推出"视频超清"功能,通过AI技术提升视频画质;2)Kimi K2高速版发布,输出速度提升至每秒40 Tokens;3)通义千问开源编程模型Qwen3-Coder-Flash,支持大规模上下文理解;4)Anthropic企业AI市场份额升至32%,超越OpenAI;5)字节跳动发布实验性扩散语言模型Seed Diffusion;6)马斯克将为Grok用户推出视频生成器Imagine和AI虚拟男友;7)Quora的Poe平台推出开发者API;8)Black Forest Labs开源图像生成模型FLUX.1-Krea;9)Augment推出CLI工具Auggie优化开发流程;10)清华开源AI语音模型MOSS-TTSD;11)Claude升级支持多格式文件上传。

  • 苹果官方闹乌龙 账号误传三星宣传视频

    7月30日,苹果官方微博账号在介绍家长控制功能时,意外配上了竞争对手三星Galaxy Z Flip7的宣传视频,引发网友热议。该微博虽被迅速删除,但已被广泛传播。有猜测认为这可能源于两家公司在中国市场共用同一家广告代理公司,导致工作人员操作失误。当前苹果正聚焦首款折叠屏iPhone研发,分析师预测该机型或于2026年9月发布,届时将与三星等品牌展开激烈竞争。此次乌龙事件为即将到来的折叠屏手机大战增添戏剧性色彩。(140字)

热文

  • 3 天
  • 7天