AI日报：iOS 18.1开发者测试版上线；Vidu视频生成模型上线；Gen-3 Alpha上线图生视频

2024-07-30 14:46 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

1、苹果 iOS 18.1 开发者测试版上线

苹果公司推出的iOS 18.1开发者测试版带来了令人兴奋的新功能，包括AI通话录音与转录功能，为用户提供了便捷的通话记录和转写服务。这一更新将电话通话录音变得更加简单和智能化，为用户提供了更好的通讯体验。

【AiBase提要:】
📞 用户可以轻松记录电话通话内容，并自动生成转写文本存储在备忘录中。
📝 新功能还包括自然语言搜索和邮件摘要，以及更新后的Siri设计。
🤖 AI版本的Siri升级可能需要等到2025年，但我们对未来版本充满期待。

2、注册即用！Vidu视频生成实测，动漫效果比可灵惊艳

Vidu是一款免费视频生成工具，相比其他产品具有更快的生成速度和更高的逼真度。用户注册即可获得80积分，操作简便，支持多种视频制作需求。Vidu引入了角色一致性和动漫风格功能，操作界面简单易用。

【AiBase提要:】
✨ 快速生成: Vidu实现了业界最快的推理速度，生成视频速度是业内最快水平的两倍。
🎨 高逼真度: Vidu能生成生动逼真的画面，支持动漫风格视频生成，画风丰富多样。
🔧 文本到视频直接转换: Vidu作品连续生成，没有插帧痕迹，适用于多种应用场景。
产品入口:https://top.aibase.com/tool/viduguanwang
详细内容点此了解：https://www.chinaz.com/ainews/10669.shtml

3、Runway宣布Gen-3 Alpha上线图生视频功能

Runway公司推出了新功能，让用户可以将任何图像用作视频生成的第一帧，提升了艺术控制力和生成的一致性。用户只需上传图片和文本提示，即可快速生成高质量视频。然而，公司也面临数据抓取和训练的争议，可能影响其未来发展。

【AiBase提要:】
✨ 用户可以用任何图像作为视频生成的第一帧，提升了艺术控制力。
⚙️ 生成视频速度快，质量高，让每个人都能享受好莱坞级别的视频制作体验。
🛡️ 公司考虑到安全问题，自动检测不雅图片，防止违法行为。
详情链接:https://top.aibase.com/tool/runwayml

4、美图设计室团队版正式上线集成AI商品图、AI模特等功能

美图设计室团队版正式上线，不仅是一款设计工具，更是设计加协作工具，旨在提升团队影像工作效率，让每个成员参与设计过程。团队版已在网页端上线，用户可体验。

【AiBase提要:】
💡 制作团队物料、多人协作设计、管理成员与资产三项核心能力
✨ 商用模板素材、批量设计、视觉规范统一简化团队物料制作
🔄 资源共享、文件权限控制、团队模板复用实现资源高效流转
详情链接:https://top.aibase.com/tool/meitushejishituanduiban

5、值得买科技与大模型公司MiniMax建立合作关系

值得买科技与大模型公司MiniMax合作，将MiniMax的大模型产品海螺AI整合进值得买的消费大模型增强工具集，提供用户快速比价和购买操作。这次合作丰富了值得买科技的AI生态系统，推动与大模型行业伙伴的共建共赢。

【AiBase提要:】
🤝 值得买科技与MiniMax合作，海螺AI整合进消费大模型工具集，提供快速比价和购买操作。
🔍 海螺AI是基于MiniMax大模型abab6.5开发的多模态智能产品，支持文本、音频和图像交流。
💡 海螺AI利用值得买科技消费数据和内容库，在购物场景中提供商品识别和全网比价服务，帮助用户做出快速购买决策。

6、视觉中国与爱诗科技达成战略合作推动AI视频大模型发展和应用

视觉中国与爱诗科技达成战略合作，共同推动AI视频大模型的发展和应用。这一合作将结合双方技术和资源优势，持续升级迭代视频大模型，提升AI视觉内容生成效率和质量。

【AiBase提要:】
🤝 双方合作推动AI视频大模型发展和应用
💡 爱诗科技致力于打造全球领先的AI视频生成大模型及应用
🚀 PixVerse是全球用户量最大的AI视频生成产品之一，应用广泛于影视、广告和动漫制作

7、NVIDIA联手Hugging Face推高效推理服务，AI 模型的Token 处理效率提升五倍

我对这篇文章感到兴奋，因为NVIDIA与Hugging Face合作推出了推理即服务，大大提升了AI模型的Token处理效率。这项服务让开发者能更快原型设计、部署开源AI模型，尤其支持强大的LLM模型。同时，NVIDIA的NIM技术优化了模型性能，加速了AI应用的响应速度和稳定性。

【AiBase提要:】
🌟 推理即服务提升AI模型Token处理效率五倍
🚀 快速部署强大LLM模型，优化开发过程
💡 NVIDIA DGX Cloud平台为生成式AI提供加速基础设施，简化生产流程

8、图像识别再进化！Meta推新一代SAM 2 支持实时视频追踪

Meta AI推出新一代的Segment Anything Model（SAM2），实现了在视频和图像中实时识别和跟踪特定对象的突破。SAM2具有快速精准的对象分割能力，可轻松处理静态图像和动态视频。其实时互动特性为视频编辑和互动媒体内容制作带来广泛应用前景。

【AiBase提要:】
🚀 SAM2具有快速精准的对象分割能力，可在静态图像和动态视频中轻松应对。
🎯 SAM2实时追踪对象的能力使其在视频编辑和互动媒体内容制作领域具有广泛应用前景。
💡 SAM2具有零样本泛化能力，能准确识别和分割未经训练的对象或场景。
详情链接:https://ai.meta.com/blog/segment-anything-2/

9、尴尬！Meta 的 AI 安全系统被 “空格”攻击轻松绕过

最近，Meta推出的Prompt-Guard-86M机器学习模型旨在检测和应对提示注入攻击，却自身暴露被攻击风险。攻击成功率接近100%，提醒企业在使用AI技术需谨慎。

【AiBase提要:】
🔍 Meta的Prompt-Guard-86M存在安全漏洞，容易受到提示注入攻击。
💡 通过在字母之间添加空格，可以让系统忽略安全指令，攻击成功率接近100%。
⚠️ 企业在使用AI技术时需谨慎，安全性问题仍需重视。

10、Getty的商业AI图像生成器升级：6秒出图

Getty Images推出的AI图像生成器经过重大升级，现在能在六秒内生成四幅图像，速度提升至之前的两倍。新模型支持长达250字的提示输入，生成高质量的4K图像，同时提供多种AI修改功能，增强创意实现的灵活性。

【AiBase提要:】
🌟 新的AI图像生成器在六秒内生成四幅图像，速度提升至之前的两倍。
🖼️ 支持长达250字的提示输入和高质量的4K图像生成。
⚙️ 用户可进行多种AI修改功能，提升创意实现的灵活性。

11、京东发布言犀智能体平台、智能编程助手JoyCoder等八大产品

在2024年京东云峰会上，京东云展示了其在大模型技术领域的最新进展，发布了包括京东云企业大模型服务、言犀智能体平台、智能编程助手JoyCoder、言犀数字人3.0在内的八大产品，展现了京东云在大模型应用方面的领先地位和对行业实践的深入探索。

【AiBase提要:】
⭐ 京东云在大模型技术领域展示最新进展，发布八大产品，体现领先地位和深入探索。
⭐ 京东供应链是大模型应用超级孵化器，将技术转化为产品为客户提供服务。
⭐ 京东云大模型产品支持企业打造专属大模型，提供低门槛、高性价比的开发服务。

12、美国商务部支持开放AI模型，呼吁加强风险监控

本文报道了美国商务部支持开放AI模型的立场，强调开放模型促进小企业竞争，同时呼吁加强对开放模型的风险监控，确保其安全性。文章还提到了国内外监管机构正在考虑可能对开放模型施加更多要求的情况。

【AiBase提要:】
🌟 开放模型促进小企业竞争，政府不应轻易限制访问。
🔍 政府呼吁加强对开放模型的风险监控，确保其安全性。
📅 国内外监管机构正在考虑新规，可能对开放模型施加更多要求。

（举报）

相关推荐

关键词：

iOS18.1

苹果iOS 26首个开发者测试版发布 UI迎史上最大升级

据了解，iOS26采用全新LiquidGlass（液态玻璃）设计语言，这是自iOS 7以来最大的设计更新。 Liquid Glass能折射光线并通过镜面高光动态响应用户的动作，可配合用户调用选项或切换界面等操作，与设备的圆角巧妙呼应。新设计涵盖主屏和锁屏，比以往更个性、更生动，Liquid Glass还为App图标和小组件带来新的自定义选项，包括精美简约外观。

苹果WWDC2025 iOS26发布新操作系统
荐AI日报：QQ浏览器升级为AI浏览器；OpenAI全新编程智能体Codex；B站团队推动漫视频生成模型AniSora

本文介绍了AI领域多项最新进展：1)B站团队推出开源动漫视频生成模型AniSora，支持多种风格创作；2)OpenAI发布编程智能体Codex，提升开发效率；3)Google测试AI问答功能AI Mode；4)ChatGPT将整合MCP协议，支持第三方AI服务对接；5)阿里推出ZeroSearch框架，减少对搜索引擎的依赖；6)Stability AI与Arm合作推出手机端音频生成AI；7)Qwen发布WorldPM系列大模型；8)GPT-5将整合多款产品功能；9)ListenHub上线AI播客生成工具；10)QQ浏览器升级为AI浏览器；11)数学建模AI助手MathModelAgent面世；12)GenSpark推出全球首个智能下载代理；13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

AI日报动漫视频生成 AniSora
荐AI日报：DeepSeek开源新版R1-0528；字节发布图像Agent小云雀AI；可灵2.1重磅上线

本期AI日报聚焦多项AI领域突破：1)DeepSeek发布R1-0528模型，支持128K上下文且性能媲美GPT-4；2)字节推出"小云雀AI"图像创作工具；3)可画2.1版本价格降65%性能提升；4)Opera发布全球首款AI浏览器Neon；5)Meta推出多模态空间理解模型；6)北大团队研发ZeroSearch框架降低大模型训练成本88%；7)字节推出AI视频剪辑应用"剪小映"；8)MotionPro实现40ms/帧精准视频控制；9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人；10)OpenAI重组架构为IPO铺路；11)像素蛋糕"方糖大模型"获国内首个影像行业备案；12)Paper2Poster实现论文自动转海报；13)Resemble AI开源TTS模型性能比肩ElevenLabs；14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。

人工智能 AI产品技术趋势
对标Sora！谷歌发布AI视频生成器Veo 3：可同时生成视频和音效

谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3，对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频，还能为人物对话、鸟鸣等场景自动匹配音效，实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户，月费249.99美元，并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是，谷歌在AI图像生成领域并非一帆风顺，此前Imagen 3曾因生成含历史错误的图像引发争议。

谷歌视频生成模型 Veo
荐AI日报：通义千问3大模型全球爆火；即梦图片3.0智能参考全量上线；智谱AI企业级超级助手Agent CoCo上线

【AI日报】今日AI领域重要动态：1.通义千问3大模型全球下载量超1250万，衍生模型13万+；2.即梦图片3.0上线，AI设计进入"零门槛"时代；3.智谱AI发布企业级超级助手Agent CoCo；4.百度推出金融行业大模型"千帆慧金"；5.小红书开源首个大模型dots.llm1，含1420亿参数；6.Hugging Face开源LeRobot项目，降低机器人研发门槛；7.ChatGPT语音功能升级，支持更自然对话翻译；8.Google Gemini应用下载量超ChatGPT但活跃度不足；9.轻量级文档解析模型MonkeyOCR表现优异；10.Google Veo3推出高速视频生成模式；11.Google调整AI Studio政策，限制Gemini2.5Pro免费访问。

AI日报通义千问 AI产品应用
荐AI日报：ChatGPT支持MCP和会议记录功能；Cursor 1.0 版本重磅发布；Midjourney视频功能将在本月上线

本期AI日报聚焦多项AI领域突破：1）OpenAI为ChatGPT新增企业数据连接和会议记录功能；2）Cursor 1.0发布集成BugBot等开发工具；3）Midjourney即将推出视频生成功能；4）秘塔AI搜索新增PPT导出功能；5）Manus推出文本生成视频工具挑战Sora；6）法国Mistral发布企业级编程助手；7）英伟达推出文档处理专用AI模型；8）腾讯公益引入大模型提升互动体验；9）Firecrawl推出网页抓取API工具；10）Bland AI实现超真实语音克隆；11）报告显示AI训练成本逼近百亿美元；12）开源设计工具Jaaz支持批量图像生成；13）《逆水寒》手游接入AI实现图片动效玩法。

OpenAI ChatGPT 人工智能
荐AI日报：美团AI编程工具NoCode将上线；火山引擎发布MCP Servers；腾讯混元上线游戏视觉生成平台

本文汇总了近期AI领域的重要动态：1)美团将推出对话式编程工具"NoCode"；2)火山引擎发布大模型生态平台MCP Servers；3)B站开源动画视频生成模型Index-AniSora；4)字节跳动升级AI耳机Ola Friend的英语学习功能；5)GitHub推出AI编程助手自动修复代码漏洞；6)腾讯混元上线游戏视觉生成平台；7)微软将VS Code转型为开源AI编辑器；8)Windows 11原生支持MCP协议；9)Anthropic发布AI代理开发指南；10)谷歌推出编程AI代理Jules；11)NotebookLM推出iOS版；12)Genspark创3600万美元ARR纪录；13)Bright Data发布开源MCP服务器；14)马斯克宣布Grok模型将登陆Azure平台。这些进展展示了AI技术在编程、内容生成、操作系统等领域的快速发展和应用创新。

人工智能 AI产品编程工具
荐AI日报：豆包大模型1.6发布；OpenAI推o3-pro模型、o3价格暴降80%；Figma官方MCP重磅上线

【AI日报】今日AI领域重要动态：1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro，性能显著提升；2)OpenAI推出o3-pro模型，专注可靠性但响应较慢；3)Figma推出Dev Mode MCP服务，实现设计到代码一键转换；4)Krea AI发布图像生成模型Krea1，解决传统AI绘图问题；5)火山引擎豆包日调用量突破16.4万亿次；6)法国Mistral发布推理模型Magistral；7)苹果系统整合ChatGPT图像生成功能；8)OpenAI大幅下调o3价格80%并推出o3-pro；9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15；10)阿里开源MaskSearch框架，提升AI解决复杂问题能力。

人工智能 AI产品视频生成
荐AI日报：昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

本文介绍了AI领域最新动态：1)昆仑万维推出全球首款AI+Agent架构的Office智能体应用；2)研究显示ChatGPT能提升K12学生成绩近87%；3)谷歌视频生成工具Veo3扩展至更多地区；4)谷歌发布三款Gemma模型变体，覆盖医疗、手语翻译和海豚语言研究；5)VideoTutor实现一句话生成定制教学视频；6)字节跳动开源多模态模型BAGEL；7)Rork支持无代码开发iOS/Android应用；8)AingDesk降低AI助手开发门槛；9)Claude4登陆亚马逊Bedrock平台；10)Youware通过MCP协议提升网页生成能力。这些创新展示了AI技术在各领域的快速发展和应用潜力。

人工智能移动办公 AI应用
荐AI日报：Anthropic推最强编码AI模型Claude4；苹果计划推AI智能眼镜；QQ浏览器上线首个高考Agent

【AI日报】今日AI领域重要动态：1)Anthropic发布Claude4系列AI模型，编程能力超越竞争对手；2)苹果计划2026年推出集成AI技术的智能眼镜；3)字节跳动与清华合作推出时序多模态大模型ChatTS；4)3DTown框架实现单张照片生成逼真3D场景；5)OpenAI秘密开发无屏幕AI设备；6)商汤科技推出儿童AI下棋机器人；7)微软记事本新增AI写作功能；8)深圳设立70亿元基金支持AI硬件初创企业；9)谷歌发布3D视频通信平台Beam；10)阿联酋推出"星际之门"计划，免费提供ChatGPT服务；11)法国Mistral推出开源模型Devstral；12)Anthropic API新增四大功能；13)美国众议院通过法案限制各州监管AI；14)QQ浏览器推出高考AI助手。

Claude4 人工智能 AI模型

热文

3 天
7天

AI日报：iOS 18.1开发者测试版上线；Vidu视频生成模型上线；Gen-3 Alpha上线图生视频

苹果iOS 26首个开发者测试版发布 UI迎史上最大升级

荐AI日报：QQ浏览器升级为AI浏览器；OpenAI全新编程智能体Codex；B站团队推动漫视频生成模型AniSora

荐AI日报：DeepSeek开源新版R1-0528；字节发布图像Agent小云雀AI；可灵2.1重磅上线

对标Sora！谷歌发布AI视频生成器Veo 3：可同时生成视频和音效

荐AI日报：通义千问3大模型全球爆火；即梦图片3.0智能参考全量上线；智谱AI企业级超级助手Agent CoCo上线

荐AI日报：ChatGPT支持MCP和会议记录功能；Cursor 1.0 版本重磅发布；Midjourney视频功能将在本月上线

荐AI日报：美团AI编程工具NoCode将上线；火山引擎发布MCP Servers；腾讯混元上线游戏视觉生成平台

荐AI日报：豆包大模型1.6发布；OpenAI推o3-pro模型、o3价格暴降80%；Figma官方MCP重磅上线

荐AI日报：昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

荐AI日报：Anthropic推最强编码AI模型Claude4；苹果计划推AI智能眼镜；QQ浏览器上线首个高考Agent

热文

点击已死？“AI引用”才是流量未来，SEO正在被SAO、AEO取代

李世石：AI不会“解读”……直觉依然属于人类！

前OpenAI研究员：有时，ChatGPT为了“自救”，会选择牺牲用户

iOS26的这五大“新功能”，我在安卓机上已经用了好几年！

从心脏、到血管……3D打印开启“器官替换”时代

无缝且安全的密钥导入、导出功能将登陆苹果系统

站长商机