首页 > 业界 > 关键词  > Coze最新资讯  > 正文

AI日报:Coze海外版支持GPT-4o;星火大模型今年7月将达GPT-4水平;Domo AI上线对口型视频功能;Animatediff魔法视频外网爆火

2024-05-23 14:58 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、字节Coze海外版支持GPT-4o

字节Coze海外版成功集成了OpenAI推出的最新AI助手GPT-4o,为用户带来更智能、更强大的聊天体验。用户可以通过Coze平台轻松构建功能强大的AI聊天机器人,并在日常交流中使用,为用户提供更加个性化、智能化的服务体验。GPT-4o的推出将为Coze用户带来诸多便利,无论是进行日常聊天交流还是寻求帮助与建议,都能得到更智能、更快速的回应。

image.png

【AiBase提要:】

⭐️ GPT-4o加入Coze海外版,为用户提供强大的AI聊天功能。

⭐️ 用户可以轻松构建功能强大的AI聊天机器人,并在Coze上使用。

⭐️ GPT-4o的加入将为Coze用户带来更智能、更便捷的聊天体验。

产品入口:https://top.aibase.com/tool/coze

2、TikTok推出新的AI套件TikTok Symphony

TikTok推出的新AI套件TikTok Symphony为品牌提供了强大的AI工具,助力广告创作和优化。这一举措将帮助广告商提升销售表现,但也面临着未来在美国的不确定性。

image.png

【AiBase提要:】

⭐ TikTok推出名为Symphony Creative Studio的AI视频生成器,为广告商提供定制化视频内容。

⭐ 引入Symphony Assistant AI助手,帮助广告商生成脚本和提供实践建议,增强广告活动效果。

⭐ 推出Symphony Ads Manager Integration工具,自动修复和优化现有视频,提升品牌创意表现。

3、科大讯飞刘庆峰:星火大模型今年6、7月就能赶上GPT-4目前水平

在澳门举办的BEYOND国际科技创新博览会上,科大讯飞董事长刘庆峰对中美在通用大模型底座上的竞争态势发表了独到见解,展示了科大讯飞在人工智能领域的强大实力和追赶态势。

【AiBase提要:】

✨ 科大讯飞董事长刘庆峰相信中美在通用大模型领域的差距只是暂时的动态追赶,承诺不会落后。

⚡ 科大讯飞的星火大模型V4.0版本预计在今年6、7月左右将达到GPT-4的水平,展现出迅速缩小差距的实力。

💡 科大讯飞加入百模价格战,推出免费开放API,加速人工智能领域的发展步伐,提升市场竞争力。

4、ambientGPT:开源多模态MacOS基础模型操作界面

AmbientGPT是一项创新技术,能够运行GPT-4和本地基础模型,直接了解屏幕环境,消除上传上下文的麻烦,提供更便利、高效的用户体验。它突破了基础模型局限于浏览器的限制,为智能模型应用领域带来创新和便利。

image.png

【AiBase提要:】

⭐ AmbientGPT能运行GPT-4和本地基础模型,直接了解屏幕环境,消除上传上下文麻烦。

⭐ 屏幕上下文作为查询一部分进行推断,用户无需再次上传上下文。

⭐ 使用AmbientGPT需ARM64MacBook和兼容OpenAI API密钥,以运行GPT-4o和本地模型。

详情链接:https://top.aibase.com/tool/ambientgpt

5、Domo AI 上线唇形同步功能:提升面部对话视频转换效果

Domo AI 最新推出的唇形同步功能为用户带来更自然流畅的面部对话视频转换效果,标志着其在视频转换技术上的又一次突破。这一功能能精确同步人物说话时的唇部动作,使转换后的视频更加真实和生动。同时,Domo AI 之前推出的照片转动态视频功能也展现了其在计算机视觉和深度学习方面的技术优势。

image.png

【AiBase提要:】

👄 唇形同步功能上线,使面部对话视频转换更流畅自然。

📸 照片转动态视频技术,将静态照片人物替换到动态视频中,动作表情自然。

🚀 Domo AI 技术优势:高精度识别、自然融合处理、用户友好操作。

详情链接:https://top.aibase.com/tool/domoai

6、禁止AI施法!博主用Animatediff制作“特异功能手” 视频Raddit爆火

这篇文章介绍了一段由推特博主Aleksej Lotkov制作的“AI魔法”视频,在视频中展示了手部特异功能的视觉效果。作者使用Animatediff加Stable Diffusion中的Inpainting功能绘制了这段视频,展示了手部随周围环境变化的变色龙效果。整段视频流畅丝滑,展示了AI技术在视觉特效方面的应用。

image.png

【AiBase提要:】

🎥 国外博主用AI施法,手和变色龙一样,碰到啥变啥

🤖 视频使用Animatediff加Stable Diffusion中的Inpainting制作,创作耗时2. 5 天

📈 作者已经共享了工作流,感兴趣的可以自行体验

工作流地址:https://drive.google.com/file/d/1yLlAH6slLcdcOR6aTNdlcgo1F-B4H4SL/view

视频点此查看:https://www.chinaz.com/2024/0523/1618549.shtml

7、巴黎矿业大学和以色列理工学院联合推出创新视频模型Slicedit

Slicedit是一款创新的视频模型,能够在不改变视频背景的情况下对视频中的主要对象进行修改,为业余人员提供了快速完成视频内容修改的方法,类似于视频版的Photoshop。该技术可能对视频编辑领域产生重大影响,使得视频编辑变得更加容易和可访问,为内容创作者提供了更多创新的可能性。

image.png

【AiBase提要:】

⚙️ Slicedit模型能够在不改变视频背景的情况下对视频中的主要对象进行修改,类似于视频版的Photoshop。

🔍 Slicedit通过空间时间切片和扩展注意力等关键技术克服了视频编辑中的难题,保持背景稳定完整。

🛠️ 研究人员计划很快开源Slicedit模型,使更多开发人员可以构建自己的视频编辑器,为视频编辑领域带来更多创新可能性。

详情链接:https://arxiv.org/pdf/2405.12211

8、OpenAI与News Corp达成合作

OpenAI与News Corp达成合作,将极大丰富OpenAI的生成式AI产品,合作估值可能达到5年2.5亿美元,旨在提供用户更为全面和可靠的数字体验,积极应对虚假信息和新闻标准的侵蚀。

【AiBase提要:】

⭐ OpenAI获得对News Corp旗下主要新闻和信息出版物的访问权限,将丰富其AI产品。

⭐ 合作估值可能达到5年2.5亿美元,OpenAI将获得来自News Corp广泛投资组合的新闻内容。

⭐ 合作旨在提供用户更为全面和可靠的数字体验,积极应对虚假信息和新闻标准的侵蚀。

9、谷歌官方发布Android生态系统重大更新

谷歌官方宣布Android生态系统即将推出一系列重大更新,涵盖隐私保护、安全性、娱乐体验和设备互联互通等多个方面。这些更新将为用户带来更安全、方便和娱乐性的移动体验,提升Android系统在隐私、安全和用户体验方面的标准。

image.png

【AiBase提要:】

🔒 新增私人空间功能,增强隐私保护。

🔐 引入防盗锁定功能,保护个人数据安全。

🛡️ Google Play Protect实时防诈骗应用保护,提高手机安全性。

详情链接:https://blog.google/products/android/android-15-google-io-2024/

10、李彦宏:AI应用可以推动基础模型创新

李彦宏在法国巴黎举办的“欧洲科技创新展览会”上指出,中国在人工智能领域与西方最大区别在于应用。他强调超级应用的重要性,提及百度的文心一言应用已累积2亿用户。李彦宏表示长期以来一直是人工智能的信仰者,对AGI时代的到来持乐观态度。

【AiBase提要:】

🚀 中国人工智能领域与西方最大区别在于应用驱动发展。

💡 超级应用的重要性,可能是聊天机器人等形态。

💻 百度的文心大模型4.0在中文能力上已超过GPT-4。

11、Nvidia每年设计新的AI芯片以满足市场需求

Nvidia加速推出新的AI芯片,实现每年设计节奏,具有向后兼容性和可运行相同软件的特点。汽车行业成为Nvidia数据中心内最大的垂直企业,消费互联网公司仍是强劲增长领域。

【AiBase提要:】

💰 Nvidia每年设计新的AI芯片,加速其他类型芯片的开发。

💻 新一代AI芯片具有向后兼容性,可运行相同软件。

🚗 汽车行业成为Nvidia数据中心内最大垂直企业,消费互联网公司持续增长。

12、德国翻译公司 DeepL 获得3亿美元投资,估值达20亿美元

DeepL 是一家德国 AI 翻译初创公司,最近获得了3亿美元的投资,使其估值达到20亿美元。公司以强大的 AI 技术赢得了超过10万付费客户,2022年被认为是其发展最具转型意义的一年。

image.png

【AiBase提要:】

⭐ DeepL 以其 AI 技术赢得逾10万付费客户

⭐ 2022年是 DeepL 发展最具转型意义的一年

⭐ DeepL 提供免费的在线翻译服务,支持32种语言,同时也提供付费翻译软件给企业用户使用

举报

  • 相关推荐
  • AI日报:阿里夸克“C计划”曝光;Veo3.1将增加视频“精确编辑”功能;Anthropic推出Claude Code网页版

    今日AI领域动态:阿里夸克启动"C计划"布局对话式AI应用,剑指字节"豆包";Anthropic推出Claude Code网页版,支持浏览器直接编码;谷歌Veo新增视频"精确编辑"功能,提升创作效率;Fish Audio升级S1语音克隆模型,10秒即可复刻真人声音;AWS美东故障影响ChatGPT等多项服务;DeepSeek-OCR推出"视觉记忆压缩"机制破解AI记忆瓶颈;Adobe推出AI Foundry服务,支持企业定制品牌AI模型;Anthropic发布Claude for Life Sciences,加速生命科学研究。

  • 斩获G-Mark优良设计奖,RingConn智能戒指凭创新设计与技术实力获国际认可

    中国智能戒指品牌RingConn凭借突破性设计、精准健康监测及卓越用户体验,荣获2025年G-Mark优良设计奖,实现年内连夺iF、IDEA、G-Mark三大国际顶级设计奖项的佳绩。产品以2克超轻机身融合医疗级技术,首创睡眠呼吸暂停监测功能,通过指尖光电容积脉搏波信号实现无感佩戴下的精准健康管理。其人性化设计兼顾12天超长续航与时尚佩戴体验,彰显中国智能穿戴设备在技术创新与实用美学融合领域的国际领先地位。

  • 霍涛推动开放战略落地,白山云接入快手KAT-Coder赋能开发者

    白山云科技与快手StreamLake合作,在其“白山智算”平台上线闭源编程大模型KAT-Coder。该模型在SWE-Bench测试中解决率达73.4%,性能媲美全球顶尖模型,支持端到端代码生成。白山云通过“顶尖模型能力+全球边缘算力”整合,为开发者提供低于300ms超低延时代码生成服务,仅需一行代码即可调用,大幅降低AI开发门槛。此次合作是白山云完善AI工具链布局的关键一步,未来将持续深化开放协作,优化模型与边缘算力服务模式。

  • OPPO ColorOS 16发布:Find X9等机型将全球首发

    10月15日,OPPO正式发布ColorOS 16系统,由Find X9系列、一加15、一加Ace6及OPPO Pad5等机型首发。系统在流畅度、AI功能和生态互联实现重大突破:三大引擎提升流畅度,系统重载流畅度提升37%,功耗降低13%;新增一键闪记、智能场景识别等便捷功能;小布助手升级,提供个性化推荐;AI实景对话支持声纹识别;生态互联打通与Apple Watch壁垒,实现跨设备信息显示与操作迁移,全面提升用户体验。

  • elexcon官宣定档|深圳国际电子展 2026年8月25-27日福田启幕

    第23届Elexcon深圳国际电子展暨嵌入式展将于2026年8月25-27日在深圳举办。展会以"链接全球电子与嵌入式生态圈"为主题,聚焦电子元器件、嵌入式系统、AI硬件及存储等创新技术。在电子产业面临供应链波动与重构的背景下,展会将汇聚500余家优质供应商及3万余名工程师,通过五大同期活动推动产业对接。往届展会满意度超85%,平台将持续助力企业把握AI、汽车电子、工�

  • 正浩EcoFlow荣登《时代》杂志2025年度“最佳发明”榜单,OCEAN Pro获评绿色能源类创新典范

    《时代》杂志公布2025年度最佳发明榜单,正浩EcoFlow旗舰家庭储能系统OCEAN+Pro入选绿色能源类榜单。该系统通过AI驱动的智能能源管理,实现家庭高效储电与清洁电力调度,支持停电供电与高峰用电优化。这是正浩第三次获此殊荣,其北美洲业务总裁表示奖项印证了品牌在清洁能源创新领域的持续引领力。同时该企业今年还入选《时代》"全球顶尖绿色科技企业250强",凸显行业领导地位。

  • ColorOS 16正式版升级计划公布:OPPO Find X8系列率先尝鲜

    据ColorOS官微消息,OPPO全新系统ColorOS 16正式版升级适配计划今日公布,OPPO Find X8系列、一加13系列会在本月率先升级ColorOS 16正式版,具体如下。 2025年10月30日 OPPO Find N5、OPPO Find N5卫星通信版、OPPO Find X8 Ultra、OPPO Find X8 Ultra卫星通信版、OPPO Find X8s 、OPPO Find X8s、OPPO Find X8 Pro、OPPO Find X8 Pro卫星通信版、OPPO Find X8、一加13、一加13T。 2025年11月

  • Checkout.com正式推出Flow Remember Me: 一键支付,全球通用

    Checkout.com推出嵌入式支付产品Flow的"记住我"功能,消费者仅需存储一次银行卡信息即可在全球商户网络实现跨平台快捷支付。测试数据显示,该功能最高可缩短70%付款时间并提升7%支付成功率。同时公司升级AI分析套件、支付优化工具及收单网络,并与Visa、Mastercard和Google达成AI智能体合作,助力商户在数字支付领域保持领先地位。

  • 只有0.9B的PaddleOCR-VL,却是现在最强的OCR模型。

    ​这几天,OCR这个词,绝对是整个AI圈最火的词。因为DeepSeek-OCR,甚至让OCR这个赛道文艺复兴,又给直接带火了。 整个Hugging Face的趋势版里,前4有3个OCR,甚至Qwen3-VL-8B也能干OCR的活,说一句全员OCR真的不过分。 然后在我上一篇讲DeepSeek-OCR文章的评论区里,有很多朋友都在把DeepSeek-OCR跟PaddleOCR-VL做对比,也有很多人都在问,能不能再解读一下百度那个OCR模型(也就是PaddleOCR-VL

  • 新王加冕,神装加持!AGON爱攻见证Legacy问鼎CAC 2025

    10月19日,CAC2025反恐精英亚洲邀请赛落幕,Legacy战队以3:2战胜3DMAX,夺得百万美元冠军。比赛历经五局激战,双方展现顶尖战术与顽强意志。Legacy凭借团队协作首夺国际大赛桂冠,巴西选手latto荣膺MVP。官方合作伙伴AGON爱攻为赛事提供定制显示器CS24A,以610Hz超高刷新率等技术助力选手发挥,并打造沉浸式互动展区,通过粉丝签名会、主题周边等活动连接选手与观众,推动电竞全民化发展。

今日大家都在搜的词: