首页 > 业界 > 关键词  > Coze最新资讯  > 正文

AI日报:Coze海外版支持GPT-4o;星火大模型今年7月将达GPT-4水平;Domo AI上线对口型视频功能;Animatediff魔法视频外网爆火

2024-05-23 14:58 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、字节Coze海外版支持GPT-4o

字节Coze海外版成功集成了OpenAI推出的最新AI助手GPT-4o,为用户带来更智能、更强大的聊天体验。用户可以通过Coze平台轻松构建功能强大的AI聊天机器人,并在日常交流中使用,为用户提供更加个性化、智能化的服务体验。GPT-4o的推出将为Coze用户带来诸多便利,无论是进行日常聊天交流还是寻求帮助与建议,都能得到更智能、更快速的回应。

image.png

【AiBase提要:】

⭐️ GPT-4o加入Coze海外版,为用户提供强大的AI聊天功能。

⭐️ 用户可以轻松构建功能强大的AI聊天机器人,并在Coze上使用。

⭐️ GPT-4o的加入将为Coze用户带来更智能、更便捷的聊天体验。

产品入口:https://top.aibase.com/tool/coze

2、TikTok推出新的AI套件TikTok Symphony

TikTok推出的新AI套件TikTok Symphony为品牌提供了强大的AI工具,助力广告创作和优化。这一举措将帮助广告商提升销售表现,但也面临着未来在美国的不确定性。

image.png

【AiBase提要:】

⭐ TikTok推出名为Symphony Creative Studio的AI视频生成器,为广告商提供定制化视频内容。

⭐ 引入Symphony Assistant AI助手,帮助广告商生成脚本和提供实践建议,增强广告活动效果。

⭐ 推出Symphony Ads Manager Integration工具,自动修复和优化现有视频,提升品牌创意表现。

3、科大讯飞刘庆峰:星火大模型今年6、7月就能赶上GPT-4目前水平

在澳门举办的BEYOND国际科技创新博览会上,科大讯飞董事长刘庆峰对中美在通用大模型底座上的竞争态势发表了独到见解,展示了科大讯飞在人工智能领域的强大实力和追赶态势。

【AiBase提要:】

✨ 科大讯飞董事长刘庆峰相信中美在通用大模型领域的差距只是暂时的动态追赶,承诺不会落后。

⚡ 科大讯飞的星火大模型V4.0版本预计在今年6、7月左右将达到GPT-4的水平,展现出迅速缩小差距的实力。

💡 科大讯飞加入百模价格战,推出免费开放API,加速人工智能领域的发展步伐,提升市场竞争力。

4、ambientGPT:开源多模态MacOS基础模型操作界面

AmbientGPT是一项创新技术,能够运行GPT-4和本地基础模型,直接了解屏幕环境,消除上传上下文的麻烦,提供更便利、高效的用户体验。它突破了基础模型局限于浏览器的限制,为智能模型应用领域带来创新和便利。

image.png

【AiBase提要:】

⭐ AmbientGPT能运行GPT-4和本地基础模型,直接了解屏幕环境,消除上传上下文麻烦。

⭐ 屏幕上下文作为查询一部分进行推断,用户无需再次上传上下文。

⭐ 使用AmbientGPT需ARM64MacBook和兼容OpenAI API密钥,以运行GPT-4o和本地模型。

详情链接:https://top.aibase.com/tool/ambientgpt

5、Domo AI 上线唇形同步功能:提升面部对话视频转换效果

Domo AI 最新推出的唇形同步功能为用户带来更自然流畅的面部对话视频转换效果,标志着其在视频转换技术上的又一次突破。这一功能能精确同步人物说话时的唇部动作,使转换后的视频更加真实和生动。同时,Domo AI 之前推出的照片转动态视频功能也展现了其在计算机视觉和深度学习方面的技术优势。

image.png

【AiBase提要:】

👄 唇形同步功能上线,使面部对话视频转换更流畅自然。

📸 照片转动态视频技术,将静态照片人物替换到动态视频中,动作表情自然。

🚀 Domo AI 技术优势:高精度识别、自然融合处理、用户友好操作。

详情链接:https://top.aibase.com/tool/domoai

6、禁止AI施法!博主用Animatediff制作“特异功能手” 视频Raddit爆火

这篇文章介绍了一段由推特博主Aleksej Lotkov制作的“AI魔法”视频,在视频中展示了手部特异功能的视觉效果。作者使用Animatediff加Stable Diffusion中的Inpainting功能绘制了这段视频,展示了手部随周围环境变化的变色龙效果。整段视频流畅丝滑,展示了AI技术在视觉特效方面的应用。

image.png

【AiBase提要:】

🎥 国外博主用AI施法,手和变色龙一样,碰到啥变啥

🤖 视频使用Animatediff加Stable Diffusion中的Inpainting制作,创作耗时2. 5 天

📈 作者已经共享了工作流,感兴趣的可以自行体验

工作流地址:https://drive.google.com/file/d/1yLlAH6slLcdcOR6aTNdlcgo1F-B4H4SL/view

视频点此查看:https://www.chinaz.com/2024/0523/1618549.shtml

7、巴黎矿业大学和以色列理工学院联合推出创新视频模型Slicedit

Slicedit是一款创新的视频模型,能够在不改变视频背景的情况下对视频中的主要对象进行修改,为业余人员提供了快速完成视频内容修改的方法,类似于视频版的Photoshop。该技术可能对视频编辑领域产生重大影响,使得视频编辑变得更加容易和可访问,为内容创作者提供了更多创新的可能性。

image.png

【AiBase提要:】

⚙️ Slicedit模型能够在不改变视频背景的情况下对视频中的主要对象进行修改,类似于视频版的Photoshop。

🔍 Slicedit通过空间时间切片和扩展注意力等关键技术克服了视频编辑中的难题,保持背景稳定完整。

🛠️ 研究人员计划很快开源Slicedit模型,使更多开发人员可以构建自己的视频编辑器,为视频编辑领域带来更多创新可能性。

详情链接:https://arxiv.org/pdf/2405.12211

8、OpenAI与News Corp达成合作

OpenAI与News Corp达成合作,将极大丰富OpenAI的生成式AI产品,合作估值可能达到5年2.5亿美元,旨在提供用户更为全面和可靠的数字体验,积极应对虚假信息和新闻标准的侵蚀。

【AiBase提要:】

⭐ OpenAI获得对News Corp旗下主要新闻和信息出版物的访问权限,将丰富其AI产品。

⭐ 合作估值可能达到5年2.5亿美元,OpenAI将获得来自News Corp广泛投资组合的新闻内容。

⭐ 合作旨在提供用户更为全面和可靠的数字体验,积极应对虚假信息和新闻标准的侵蚀。

9、谷歌官方发布Android生态系统重大更新

谷歌官方宣布Android生态系统即将推出一系列重大更新,涵盖隐私保护、安全性、娱乐体验和设备互联互通等多个方面。这些更新将为用户带来更安全、方便和娱乐性的移动体验,提升Android系统在隐私、安全和用户体验方面的标准。

image.png

【AiBase提要:】

🔒 新增私人空间功能,增强隐私保护。

🔐 引入防盗锁定功能,保护个人数据安全。

🛡️ Google Play Protect实时防诈骗应用保护,提高手机安全性。

详情链接:https://blog.google/products/android/android-15-google-io-2024/

10、李彦宏:AI应用可以推动基础模型创新

李彦宏在法国巴黎举办的“欧洲科技创新展览会”上指出,中国在人工智能领域与西方最大区别在于应用。他强调超级应用的重要性,提及百度的文心一言应用已累积2亿用户。李彦宏表示长期以来一直是人工智能的信仰者,对AGI时代的到来持乐观态度。

【AiBase提要:】

🚀 中国人工智能领域与西方最大区别在于应用驱动发展。

💡 超级应用的重要性,可能是聊天机器人等形态。

💻 百度的文心大模型4.0在中文能力上已超过GPT-4。

11、Nvidia每年设计新的AI芯片以满足市场需求

Nvidia加速推出新的AI芯片,实现每年设计节奏,具有向后兼容性和可运行相同软件的特点。汽车行业成为Nvidia数据中心内最大的垂直企业,消费互联网公司仍是强劲增长领域。

【AiBase提要:】

💰 Nvidia每年设计新的AI芯片,加速其他类型芯片的开发。

💻 新一代AI芯片具有向后兼容性,可运行相同软件。

🚗 汽车行业成为Nvidia数据中心内最大垂直企业,消费互联网公司持续增长。

12、德国翻译公司 DeepL 获得3亿美元投资,估值达20亿美元

DeepL 是一家德国 AI 翻译初创公司,最近获得了3亿美元的投资,使其估值达到20亿美元。公司以强大的 AI 技术赢得了超过10万付费客户,2022年被认为是其发展最具转型意义的一年。

image.png

【AiBase提要:】

⭐ DeepL 以其 AI 技术赢得逾10万付费客户

⭐ 2022年是 DeepL 发展最具转型意义的一年

⭐ DeepL 提供免费的在线翻译服务,支持32种语言,同时也提供付费翻译软件给企业用户使用

举报

  • 相关推荐
  • 大家在看
  • Mistly:自动记录和分析产品反馈,快速构建更好的产品。

    Mistly是一个AI产品管理工具,能够自动从Slack频道、Zoom通话等地方记录产品反馈,并通过AI技术提供深入的洞察。它可以帮助团队快速了解用户需求,提取功能请求和bug报告,从而加速产品迭代和改进。Mistly还提供每周反馈总结和发布更新通知功能,使客户感到被重视,增强产品与用户之间的联系。

  • Omi:智能合同和文档管理平台

    Omi是一个集中化的平台,提供对财务、合同和供应商的全面监督和管理。它简化了采购流程,实现了财务控制,并通过自动化和实时数据提供决策支持,帮助企业提高效率、节约成本,并确保合规性。

  • iPadOS 18:,带来全新的工作方式和个性化体验。

    iPadOS 18是苹果公司为iPad设备推出的最新操作系统,它通过Apple Pencil、应用程序体验和个性化定制等新功能,进一步增强了iPad的生产力和创造力。该系统利用Apple Intelligence技术,根据用户的个人上下文提供最有帮助和相关的智能服务。

  • 雅意信息抽取大模型:基于大规模数据的高质量信息抽取模型

    雅意信息抽取大模型(YAYI-UIE)由中科闻歌算法团队研发,是一款在百万级人工构造的高质量信息抽取数据上进行指令微调的模型。它能够统一训练信息抽取任务,包括命名实体识别(NER)、关系抽取(RE)和事件抽取(EE),覆盖了通用、安全、金融、生物、医疗、商业等多个场景的结构化抽取。该模型的开源旨在促进中文预训练大模型开源社区的发展,并通过开源共建雅意大模型生态。

  • macOS Sequoia:Mac体验新高度,智能化与生产力的飞跃。

    macOS Sequoia是苹果公司推出的下一代桌面操作系统,它通过iPhone镜像、Safari浏览器的更新、苹果智能技术以及一系列新游戏,为Mac带来了全新的工作方式和变革性的智能特性。它利用了苹果芯片和神经引擎的强大能力,提供了深度集成的个人智能系统,注重隐私保护,并简化了日常任务。

  • iOS 18:iPhone个性化、功能强大、智能化的新高度。

    iOS 18是苹果公司推出的最新操作系统,它通过全新的个性化选项、前所未有的照片应用重设计、强大的连接方式更新以及苹果智能(Apple Intelligence)个人智能系统,为iPhone带来更深层次的个性化体验和智能化功能。

  • Invisibility:您的个人助手,集成到您的操作系统中。

    Invisibility 是一款集成到操作系统中的个人助手应用程序,它通过简单的键盘快捷键,允许用户快速与AI进行交互,提高工作效率。该应用提供了一个平台,结合了所有最新的高级模型,用户无需为多个工具或订阅付费。Invisibility 的设计理念在于简化用户与技术的互动,提供流畅的体验,无需在不同的标签和应用程序之间切换。

  • TeamCreate AI:AI助手,快速构建理想团队

    TeamCreate AI是一个在线平台,提供AI助手来帮助企业在销售、市场、财务、产品和更多领域快速构建团队。这些AI助手是无代码且可定制的,可以快速适应并执行特定任务,帮助企业在没有财务限制和繁琐招聘流程的情况下迅速扩展。

  • Midjourney Personalization:个性化图像生成工具

    Midjourney是一个独立的研究实验室,专注于探索新的思想媒介和扩展人类想象力。它是一个自筹资金的小团队,专注于设计、人类基础设施和人工智能。Midjourney Personalization通过用户对图像对的评分来学习用户的偏好,并根据这些偏好生成个性化的图像。

  • YaFSDP:高效的分布式数据并行框架,专为大型语言模型设计。

    YaFSDP是一个分布式数据并行框架,专为与transformer类神经网络结构良好协作而设计。它在预训练大型语言模型(Large Language Models, LLMs)时比传统的FSDP快20%,并且在高内存压力条件下表现更佳。YaFSDP旨在减少通信和内存操作的开销。

  • Onboard:客户管理的AI邮件平台

    Onboard AI Email Platform是一个专为客户管理设计的AI邮件平台。它集成了先进的AI技术,帮助企业精准地将邮件发送到每个客户的主收件箱,提高邮件的到达率和客户的互动率。该平台通过AI技术对客户进行细分,自动生成个性化内容,并创建AI生成的落地页来驱动客户采取行动。

  • SmartEReply:智能提升您的LinkedIn™互动

    SmartEReply是一个AI驱动的助手,旨在增强您的LinkedIn™互动,通过个性化评论、优化帖子和轻松管理私信来提升您的网络机会。它通过AI生成的内容建议,帮助您快速创建更具吸引力和优化的内容。

  • Freepik Designer:在线设计编辑器,无需设计技能。

    Freepik Designer是一个在线设计编辑器,允许用户无需专业设计技能或软件即可创建或编辑设计作品。它提供了大量的可编辑模板,支持AI工具和功能,如AI写作助手、背景移除、AI翻译器等,以简化工作流程。Freepik Designer由Freepik Company S.L.开发,总部位于阳光明媚的马拉加。

  • Source.Plus:AI训练数据的搜索、整理和丰富工具

    Source.Plus是一个专业的AI训练数据搜索平台,它允许用户通过高级搜索操作符来精确地搜索、筛选和整理所需的数据集。它支持多种数据来源,包括Wikimedia Commons、NMNH - Botany Dept.等,提供广泛的图像和文档资源。平台还具备文件上传功能,使用户能够进一步自定义和丰富自己的数据集。Source.Plus的主要优点包括其强大的搜索能力、数据来源的多样性以及对AI训练数据的特别优化。

  • Awesome-ChatTTS:ChatTTS项目的入门指南和资源汇总。

    Awesome-ChatTTS是一个开源项目,旨在为ChatTTS项目提供常见问题解答和相关资源汇总,帮助用户快速入门并解决在使用过程中可能遇到的问题。该项目不仅整理了详细的安装指南和参数说明,还提供了多种音色种子的示例,以及视频教程等辅助材料。

  • DenseAV:一种自监督的视听特征对齐模型。

    DenseAV是一种新颖的双编码器定位架构,通过观看视频学习高分辨率、语义有意义的视听对齐特征。它能够无需明确定位监督即可发现单词的“意义”和声音的“位置”,并且自动发现并区分这两种关联类型。DenseAV的定位能力来自于一种新的多头特征聚合操作符,它直接比较密集的图像和音频表示进行对比学习。此外,DenseAV在语义分割任务上显著超越了先前的艺术水平,并且在使用参数少于一半的情况下,在跨模态检索上超越了ImageBind。

  • ChatTTS-Forge:基于ChatTTS模型的文本到语音转换项目

    ChatTTS-Forge是一个围绕TTS生成模型ChatTTS开发的项目,实现了API服务器和基于Gradio的WebUI,能够提供全面的API服务,支持生成1000字以上的长文本,保持一致性,并通过内置32种不同风格进行风格管理。

  • WorldDreamer:视频生成的前沿模型

    WorldDreamer是一个创新的视频生成模型,它通过预测遮蔽的视觉令牌来理解并模拟世界动态。它在图像到视频合成、文本到视频生成、视频修复、视频风格化以及动作到视频生成等多个方面表现出色。该模型借鉴了大型语言模型的成功经验,将世界建模视为一个无监督的视觉序列建模挑战,通过将视觉输入映射到离散的令牌并预测被遮蔽的令牌来实现。

  • VividDream:从单一图像或文本生成可探索的3D场景

    VividDream是一项创新技术,能够从单一输入图像或文本提示生成具有环境动态的可探索4D场景。它首先将输入图像扩展为静态3D点云,然后使用视频扩散模型生成动画视频集合,并通过优化4D场景表示来实现一致性运动和沉浸式场景探索。这项技术为生成基于多样真实图像和文本提示的引人入胜的4D体验提供了可能。

  • LlamaGen:自回归模型在可扩展图像生成领域的新突破

    LlamaGen是一个新的图像生成模型家族,它将大型语言模型的原始下一个token预测范式应用于视觉生成领域。该模型通过适当的扩展,无需对视觉信号的归纳偏差即可实现最先进的图像生成性能。LlamaGen重新审视了图像分词器的设计空间、图像生成模型的可扩展性属性以及它们的训练数据质量。

今日大家都在搜的词:

热文

  • 3 天
  • 7天