首页 > 业界 > 关键词  > 苹果最新资讯  > 正文

AI日报:GPT-4o加持!苹果全线产品进入生成式AI时代;腾讯支持生成多人视频;ChatGPT语音功能升级

2024-06-11 14:32 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、苹果WWDC放出深水炸弹 GPT-4o加持Siri 全家桶都上生成式AI

苹果在2024年的全球开发者大会WWDC上宣布了全线产品进入生成式AI时代,推出了全新个性化智能系统Apple Intelligence。更新核心是结合生成式AI模型和用户资料的智能服务,深度集成在iOS18、iPadOS18和macOS Sequoia中。Siri变革,具备更丰富语言理解能力和跨应用执行操作。系统集成ChatGPT提供图像和文档理解功能,新增写作工具和Image Playground等功能。

image.png

【AiBase提要:】

🍎 Apple Intelligence整合生成式AI模型和用户资料,提供实用智能服务,深度集成在iOS18、iPadOS18和macOS Sequoia中。

🤖 Siri变革,拥有更丰富语言理解能力,支持跨应用执行操作,用户可通过打字与Siri交流。

📸 系统集成ChatGPT提供图像和文档理解功能,新增写作工具和Image Playground,用户可创建动画、插图或素描风格的图像。

详情:https://www.chinaz.com/2024/0611/1622511.shtml

2、苹果与谷歌 Gemini 模型合作

苹果宣布与谷歌的 Gemini 模型合作,开放第三方模型接入,为用户提供更多选择。Siri 将整合 ChatGPT,用户可在不离开 Siri 的情况下进行会话,并保持隐私控制。苹果更新开发工具包,首次接入 OpenAI 的 ChatGPT,同时发布一系列新特性和更新。

【AiBase提要:】

🍎 苹果与谷歌 Gemini 模型合作,开放第三方模型接入,拓展人工智能生态系统。

🤖 Siri整合ChatGPT,用户可在Siri内进行会话,保持隐私控制。

🚀 苹果更新开发工具包,首次接入OpenAI的ChatGPT,发布iOS18新特性和VisionOS2。

3、iOS18 相册APP大改版:新增AI消除 智能筛查缩小搜索范围

苹果在最新发布的iOS18 系统中,对短信功能进行了全面革新。用户不仅可以为短信内容添加下划线和删除线能应用一系列动态文字效果,让每一条信息都充满个性。

【AiBase提要:】

⭐️ 苹果与OpenAI达成合作协议,iOS18 将引入ChatGPT功能。

🤖 GPT- 4 生成的叙述见解对未来股票表现具有信息性。

💬 iPadOS18 系统不仅支持iOS18 上各种自定义功能之外支持自定义应用内的常用功能栏。

iOS18 升级适配机型点此查看:https://www.chinaz.com/2024/0611/1622488.shtml

4、腾讯推全新图生视频模型Follow-Your-Pose-v2

这篇文章介绍了腾讯混元团队联合中山大学、香港科技大学推出的全新图生视频模型"Follow-Your-Pose-v2",实现了多人视频动作生成、强泛化能力和正确处理人物遮挡等亮点。该模型在视频生成领域具有重要意义,应用前景广阔。

image.png

【AiBase提要:】

🌟 支持多人视频动作生成,实现多人视频动作的生成,推理耗时更少

🔥 强泛化能力,无论年龄、服装、人种、背景杂乱程度或动作复杂性如何,都能生成高质量视频

💡 正确处理人物遮挡,能生成具有正确前后关系的遮挡画面

项目页:https://top.aibase.com/tool/follow-your-pose

论文地址:https://arxiv.org/pdf/2406.03035

5、MotionFollower:在不改变视频背景的情况复刻人物动作

MotionFollower是一项创新技术,能够将一个视频中的运动复制到另一个视频中的人物上,保持人物外观不变。这项技术应用广泛,可用于电影制作、广告创作、游戏开发等领域。

【AiBase提要:】

⚙️ MotionFollower是创新技术,将视频中的运动复制到另一个人物上,保持外观不变。

🌐 应用场景广泛,可用于电影、广告、游戏等领域。

🎥 MotionFollower处理大范围相机运动视频,实现高质量运动信息转移。

详情链接:https://top.aibase.com/tool/motionfollower

6、Adobe修订服务条款,明确不会用客户作品进行AI训练

Adobe宣布重新修订服务条款,澄清不会用客户作品进行AI训练,目的是赢回用户的信任。这一变化是在一周前的用户强烈抗议后宣布的。

【AiBase提要:】

🛡️ Adobe 修订服务条款,澄清不会用客户作品进行 AI 训练

💬 Adobe 总裁承认应及早澄清服务条款,表示将更加透明

🖼️ 创作者对 Adobe 的担忧仍存,公司努力赢回信任

7、OpenAI升级ChatGPT语音功能 使其能够以不同角色的声音说话

OpenAI最新更新了ChatGPT的语音功能,允许用户与聊天机器人交互使用各种AI生成的声音和声音风格。新功能让用户指示AI聊天机器人使用任何语音实时做出响应,提升了互动性和可访问性。

image.png

【AiBase提要:】

🔊 ChatGPT现有四种预设声音,可实时优化声音风格。

🗣️ 用户可以要求AI为故事中的角色配音,生成独特声音,如狮子的轰隆隆声。

🔜 OpenAI将在未来几周内推出新的语音功能,提供给所有ChatGPT用户,高级订阅者可优先使用。

8、秒杀Instant3D!上交大推新框架Bootstrap3D 显著提升3D生成能力

上海交大和香港中文大学的研究团队推出了名为Bootstrap3D的新框架,通过结合微调的3D感知多模态大模型,能自动生成高质量多视角图片数据,显著提升3D生成模型的能力。框架的合成数据集已全面开源,供研究人员和开发者免费使用。该框架的关键特点包括数据构建Pipeline、文本提示生成、图像生成、多视图合成、质量筛选和描述重写等。研究团队还提出了训练timestep重安排(TTR)策略,优化去噪过程的不同阶段,解决多视图扩散模型训练中的问题。实验结果表明,使用TTR策略的多视图扩散模型在图像-文本对齐、图像质量和视图一致性方面表现优异,有效提升了多视图生成的效果。

【AiBase提要:】

🔑 数据构建Pipeline: 自动生成多视角图像数据和详细描述文本,是框架的核心创新之一。

🔑 文本提示生成: 使用大语言模型生成创意和多样化的文本提示,为图像生成提供素材。

🔑 多视图合成: 将单视图图像扩展为多视角图像,确保不同视角下的一致性。

详情链接:https://top.aibase.com/tool/bootstrap3d

9、谷歌推出AGREE框架增强大型语言模型生成内容准确性

谷歌研究院推出AGREE框架,旨在增强大型语言模型生成内容和引用的准确性。该框架通过检索相关段落来提高回答准确性,并为用户提供验证信息真实性的途径。核心技术包括训练阶段微调和测试时自适应。实验结果显示AGREE在提升内容回答准确性和引用性方面表现突出。

image.png

【AiBase提要:】

🔍 AGREE框架旨在增强大型语言模型生成内容和引用的准确性

🎯 核心技术包括训练阶段微调和测试时自适应

💡 实验结果显示AGREE在提升内容回答准确性和引用性方面表现突出

详情链接:https://arxiv.org/pdf/2311.09533

10、粉笔将于 8 月推出自研AI智能老师

粉笔集团将于 2024 年 8 月推出自研AI智能老师,成为其线上平台提供的AI学习工具之一,首先应用于国家或省级招录类及资格证考试系统班。

【AIBase提要:】

⭐️ 粉笔集团将于 2024 年 8 月推出自研AI智能老师。

⭐️ AI智能老师将成为粉笔线上平台提供的AI学习工具之一。

⭐️ 首先应用于国家或省级招录类及资格证考试系统班。

举报

  • 相关推荐
  • 神州数码 x 嘉岳数智:以生成式AI打造绿色低碳行业的“懂碳帝”

    在"双碳"战略推动下,绿色转型成为产业升级和企业发展的重要方向。神州数码与嘉岳数智科技合作,探索AI技术在碳评估智能化领域的应用,解决传统碳评估面临的数据分散、专业性强等痛点。通过构建EPAG专家流程增强生成框架、Agent场景分类机制和自动化评估学习流程,显著提升专业术语理解准确率至95%以上,大幅减少人工编辑工作量。双方打造的智能评估产品已进入预发布阶段,为生成式AI在垂直行业落地树立标杆,助力企业实现绿色低碳转型目标。

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • ChatGPT们重塑了对话框,钉钉今天要重塑表格

    ​自从1979年,丹·布里克林(Dan Bricklin)和鲍勃·弗兰克斯顿(Bob Frankston)在苹果当时划时代的 Apple II 电脑上做出了第一张可以自动计算和更新的电子表格 VisiCalc 后,表格就成为了计算机用数据方式理解人类世界的基座。不过,在更多的时候,没人这样讨论它。横横竖竖几个格子,表格无处不在,它看起来太普通了。 然而计算机诸多繁荣的根基,都建立在一张张表格之上,无�

  • ppt自动生成工具最好用的3个

    文章介绍了当前AI生成PPT工具的发展现状,重点推荐了"秒出PPT"这一专业平台。该平台具有三大特色功能:1)智能对话式生成,支持中途修改需求;2)提供三种编辑模式(纯文本、纯设计和文本+设计);3)支持导入文档自动排版,提供"保持原文"和"AI智能修改"两种模式。平台还拥有丰富的模板库,支持在线更换颜色、字体等设计元素。虽然需要购买会员,但相比市面上质量参差不齐的同类产品,该工具在交互体验和功能完整性上表现突出。

  • A日报:B站升级动漫视频生成模型AniSora V3;字节开源4D视频生成框架EX-4D;DeepSWE开源AI Agent系统强势登顶

    AI日报栏目汇总了近期AI领域的重要进展:1)字节跳动开源EX-4D框架,可将单目视频转换为多视角4D视频;2)B站开源动漫视频生成模型AniSora V3,支持多种风格;3)DeepSWE+开源基于Qwen3-32B的AI Agent系统;4)字节开源3亿参数图像编辑模型VINCIE-3B;5)Stability AI推出移动端音频生成模型Stable Audio Open Small;6)谷歌发布免费教育AI工具套件Gemini for Education;7)Topview推出革命性AI数字人带货技术Avatar

  • AI日报:腾讯元宝升级一句话搜索图片视频;微信支付MCP上线;谷歌在全球推出 Veo 3

    【AI日报】今日AI领域重要动态:1)腾讯元宝升级,支持一句话搜索呈现图文视频;2)微信支付MCP上线,AI与支付结合开启商业新纪元;3)谷歌Veo3视频生成模型向Pro/Ultra会员开放,新增"照片生成视频"功能;4)开源DeepSeek R1增强版推理效率提升200%;5)美图WHEE推出"一句话修图"功能;6)芯片公司Ambiq申请美国IPO,受益生成式AI需求;7)昆仑万维开源奖励模型Skywork-Reward-V2;8)Kyutai发布超低延迟开源语音合成技术;9)Figma拟以200亿美元估值登陆纽交所;10)字节跳动开源Trae-Agent智能开发工具。

  • AI日报:阿里通义开源音频生成模型ThinkSound;谷歌Veo3支态图片生成视频;昆仑万维发布 Skywork-R1V 3.0

    【AI日报】今日AI领域重要动态:1)阿里开源支持链式推理的音频生成模型ThinkSound,实现高保真空间音频生成;2)谷歌Veo3升级,支持静态图片生成生动视频;3)Hugging Face发布30亿参数小模型SmolLM3,性能优于Llama-3.2-3B;4)阿里开源网络智能体WebSailor,展现强大推理和检索能力;5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5;6)Vidu Q1支持最多七张参考图像生成一致性视频;7)苹果�

  • 最好用的AI生成PPT工具全球横评:谁才是用户效率与专业的首选?

    文章对比评测了5款主流AI驱动的PPT生成工具,重点从生成速度、内容逻辑、模板质量、国际化体验等维度进行分析。PPT.AI综合表现最佳,其极速响应、强大逻辑架构、海量国际模板库和无缝全球化体验尤为突出,特别适合跨境专业人士;Gamma以交互体验和设计感见长;Presentations.AI生成速度最快;ChatPPT对中文用户最友好;iSlide则依托强大设计资源库更适合团队协作。总体而言,P

  • 全球优质AI语音大模型盘点:Whisper、Gemini Speech

    本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括:OpenAI Whisper(多语言识别与翻译)、Google Gemini(情感化语音生成)、Meta AudioCraft(音乐创作与风格转换)。国内讯飞星火(方言识别)、阿里通义(电商客服)、百度文心(车载场景)表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署

  • 墨刀AI生成原型图,产品设计快人一步

    国内原型设计平台墨刀发布"AI生成原型图2.0"功能,30秒即可生成可编辑原型图,大幅提升产品设计效率。该功能通过AI技术解决传统原型设计周期长、效率低、修改繁琐等痛点,支持文字描述或图片上传自动生成高保真原型图,并可二次编辑优化。这一创新不仅标志着墨刀AI能力的全面升级,更代表产品设计方式的一次革新,显著加快产品迭代速度。未来,AI原型设计有望成为行业标配,助力企业更快响应市场需求,提升产品竞争力。