首页 > 业界 > 关键词  > iOS18.1最新资讯  > 正文

AI日报:iOS 18.1开发者测试版上线;Vidu视频生成模型上线;Gen-3 Alpha上线图生视频

2024-07-30 14:46 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、苹果 iOS 18.1 开发者测试版上线

苹果公司推出的iOS 18.1开发者测试版带来了令人兴奋的新功能,包括AI通话录音与转录功能,为用户提供了便捷的通话记录和转写服务。这一更新将电话通话录音变得更加简单和智能化,为用户提供了更好的通讯体验。

image.png

【AiBase提要:】

📞 用户可以轻松记录电话通话内容,并自动生成转写文本存储在备忘录中。

📝 新功能还包括自然语言搜索和邮件摘要,以及更新后的Siri设计。

🤖 AI版本的Siri升级可能需要等到2025年,但我们对未来版本充满期待。

2、注册即用!Vidu视频生成实测,动漫效果比可灵惊艳

Vidu是一款免费视频生成工具,相比其他产品具有更快的生成速度和更高的逼真度。用户注册即可获得80积分,操作简便,支持多种视频制作需求。Vidu引入了角色一致性和动漫风格功能,操作界面简单易用。

【AiBase提要:】

✨ 快速生成: Vidu实现了业界最快的推理速度,生成视频速度是业内最快水平的两倍。

🎨 高逼真度: Vidu能生成生动逼真的画面,支持动漫风格视频生成,画风丰富多样。

🔧 文本到视频直接转换: Vidu作品连续生成,没有插帧痕迹,适用于多种应用场景。

产品入口:https://top.aibase.com/tool/viduguanwang

详细内容点此了解:https://www.chinaz.com/ainews/10669.shtml

3、Runway宣布Gen-3 Alpha上线图生视频功能

Runway公司推出了新功能,让用户可以将任何图像用作视频生成的第一帧,提升了艺术控制力和生成的一致性。用户只需上传图片和文本提示,即可快速生成高质量视频。然而,公司也面临数据抓取和训练的争议,可能影响其未来发展。

【AiBase提要:】

✨ 用户可以用任何图像作为视频生成的第一帧,提升了艺术控制力。

⚙️ 生成视频速度快,质量高,让每个人都能享受好莱坞级别的视频制作体验。

🛡️ 公司考虑到安全问题,自动检测不雅图片,防止违法行为。

详情链接:https://top.aibase.com/tool/runwayml

4、美图设计室团队版正式上线 集成AI商品图、AI模特等功能

美图设计室团队版正式上线,不仅是一款设计工具,更是设计加协作工具,旨在提升团队影像工作效率,让每个成员参与设计过程。团队版已在网页端上线,用户可体验。

image.png

【AiBase提要:】

💡 制作团队物料、多人协作设计、管理成员与资产三项核心能力

✨ 商用模板素材、批量设计、视觉规范统一简化团队物料制作

🔄 资源共享、文件权限控制、团队模板复用实现资源高效流转

详情链接:https://top.aibase.com/tool/meitushejishituanduiban

5、值得买科技与大模型公司MiniMax建立合作关系

值得买科技与大模型公司MiniMax合作,将MiniMax的大模型产品海螺AI整合进值得买的消费大模型增强工具集,提供用户快速比价和购买操作。这次合作丰富了值得买科技的AI生态系统,推动与大模型行业伙伴的共建共赢。

【AiBase提要:】

🤝 值得买科技与MiniMax合作,海螺AI整合进消费大模型工具集,提供快速比价和购买操作。

🔍 海螺AI是基于MiniMax大模型abab6.5开发的多模态智能产品,支持文本、音频和图像交流。

💡 海螺AI利用值得买科技消费数据和内容库,在购物场景中提供商品识别和全网比价服务,帮助用户做出快速购买决策。

6、视觉中国与爱诗科技达成战略合作 推动AI视频大模型发展和应用

视觉中国与爱诗科技达成战略合作,共同推动AI视频大模型的发展和应用。这一合作将结合双方技术和资源优势,持续升级迭代视频大模型,提升AI视觉内容生成效率和质量。

【AiBase提要:】

🤝 双方合作推动AI视频大模型发展和应用

💡 爱诗科技致力于打造全球领先的AI视频生成大模型及应用

🚀 PixVerse是全球用户量最大的AI视频生成产品之一,应用广泛于影视、广告和动漫制作

7、NVIDIA联手Hugging Face推高效推理服务,AI 模型的Token 处理效率提升五倍

我对这篇文章感到兴奋,因为NVIDIA与Hugging Face合作推出了推理即服务,大大提升了AI模型的Token处理效率。这项服务让开发者能更快原型设计、部署开源AI模型,尤其支持强大的LLM模型。同时,NVIDIA的NIM技术优化了模型性能,加速了AI应用的响应速度和稳定性。

【AiBase提要:】

🌟 推理即服务提升AI模型Token处理效率五倍

🚀 快速部署强大LLM模型,优化开发过程

💡 NVIDIA DGX Cloud平台为生成式AI提供加速基础设施,简化生产流程

8、图像识别再进化!Meta推新一代SAM 2 支持实时视频追踪

Meta AI推出新一代的Segment Anything Model(SAM2),实现了在视频和图像中实时识别和跟踪特定对象的突破。SAM2具有快速精准的对象分割能力,可轻松处理静态图像和动态视频。其实时互动特性为视频编辑和互动媒体内容制作带来广泛应用前景。

【AiBase提要:】

🚀 SAM2具有快速精准的对象分割能力,可在静态图像和动态视频中轻松应对。

🎯 SAM2实时追踪对象的能力使其在视频编辑和互动媒体内容制作领域具有广泛应用前景。

💡 SAM2具有零样本泛化能力,能准确识别和分割未经训练的对象或场景。

详情链接:https://ai.meta.com/blog/segment-anything-2/

9、尴尬!Meta 的 AI 安全系统被 “空格”攻击轻松绕过

最近,Meta推出的Prompt-Guard-86M机器学习模型旨在检测和应对提示注入攻击,却自身暴露被攻击风险。攻击成功率接近100%,提醒企业在使用AI技术需谨慎。

【AiBase提要:】

🔍 Meta的Prompt-Guard-86M存在安全漏洞,容易受到提示注入攻击。

💡 通过在字母之间添加空格,可以让系统忽略安全指令,攻击成功率接近100%

⚠️ 企业在使用AI技术时需谨慎,安全性问题仍需重视。

10、Getty的商业AI图像生成器升级:6秒出图

Getty Images推出的AI图像生成器经过重大升级,现在能在六秒内生成四幅图像,速度提升至之前的两倍。新模型支持长达250字的提示输入,生成高质量的4K图像,同时提供多种AI修改功能,增强创意实现的灵活性。

【AiBase提要:】

🌟 新的AI图像生成器在六秒内生成四幅图像,速度提升至之前的两倍。

🖼️ 支持长达250字的提示输入和高质量的4K图像生成。

⚙️ 用户可进行多种AI修改功能,提升创意实现的灵活性。

11、京东发布言犀智能体平台、智能编程助手JoyCoder等八大产品

在2024年京东云峰会上,京东云展示了其在大模型技术领域的最新进展,发布了包括京东云企业大模型服务、言犀智能体平台、智能编程助手JoyCoder、言犀数字人3.0在内的八大产品,展现了京东云在大模型应用方面的领先地位和对行业实践的深入探索。

image.png

【AiBase提要:】

⭐ 京东云在大模型技术领域展示最新进展,发布八大产品,体现领先地位和深入探索。

⭐ 京东供应链是大模型应用超级孵化器,将技术转化为产品为客户提供服务。

⭐ 京东云大模型产品支持企业打造专属大模型,提供低门槛、高性价比的开发服务。

12、美国商务部支持开放AI模型,呼吁加强风险监控

本文报道了美国商务部支持开放AI模型的立场,强调开放模型促进小企业竞争,同时呼吁加强对开放模型的风险监控,确保其安全性。文章还提到了国内外监管机构正在考虑可能对开放模型施加更多要求的情况。

【AiBase提要:】

🌟 开放模型促进小企业竞争,政府不应轻易限制访问。

🔍 政府呼吁加强对开放模型的风险监控,确保其安全性。

📅 国内外监管机构正在考虑新规,可能对开放模型施加更多要求。

举报

  • 相关推荐
  • 大家在看
  • Pixtral-12B-2409:多模态12B参数模型,结合视觉编码器处理图像和文本。

    Pixtral-12B-2409是由Mistral AI团队开发的多模态模型,包含12B参数的多模态解码器和400M参数的视觉编码器。该模型在多模态任务中表现出色,支持不同尺寸的图像,并在文本基准测试中保持最前沿的性能。它适用于需要处理图像和文本数据的高级应用,如图像描述生成、视觉问答等。

  • Pixtral 12B:首个多模态 Mistral 模型,支持图像和文本的混合任务处理。

    Pixtral 12B 是 Mistral AI 团队开发的一款多模态 AI 模型,它能够理解自然图像和文档,具备出色的多模态任务处理能力,同时在文本基准测试中也保持了最先进的性能。该模型支持多种图像尺寸和宽高比,能够在长上下文窗口中处理任意数量的图像,是 Mistral Nemo 12B 的升级版,专为多模态推理而设计,不牺牲关键文本处理能力。

  • World Labs:构建大型世界模型,感知、生成和与3D世界互动

    World Labs 是一家专注于空间智能的公司,致力于构建大型世界模型(Large World Models),以感知、生成和与3D世界进行互动。公司由AI领域的知名科学家、教授、学者和行业领导者共同创立,包括斯坦福大学的Fei-Fei Li教授、密歇根大学的Justin Johnson教授等。他们通过创新的技术和方法,如神经辐射场(NeRF)技术,推动了3D场景重建和新视角合成的发展。World Labs 得到了包括Marc Benioff、Jim Breyer等知名投资者的支持,其技术在AI领域具有重要的应用价值和商业潜力。

  • g1:使用开源模型Llama-3.1 70b在Groq上创建类似o1的推理链

    g1是一个实验性的项目,旨在通过使用Llama-3.1 70b模型在Groq硬件上创建类似于OpenAI的o1模型的推理链。这个项目展示了仅通过提示技术,就可以显著提高现有开源模型在逻辑问题解决上的能力,而无需进行复杂的训练。g1通过可视化的推理步骤,帮助模型在逻辑问题上实现更准确的推理,这对于提高人工智能的逻辑推理能力具有重要意义。

  • Dream Machine API:创意智能平台,用于构建魔法般的AI产品

    Dream Machine API是一个创意智能平台,它提供了一系列先进的视频生成模型,通过直观的API和开源SDKs,用户可以构建和扩展创意AI产品。该平台拥有文本到视频、图像到视频、关键帧控制、扩展、循环和相机控制等功能,旨在通过创意智能与人类合作,帮助他们创造更好的内容。Dream Machine API的推出,旨在推动视觉探索和创造的丰富性,让更多的想法得以尝试,构建更好的叙事,并让那些以前无法做到的人讲述多样化的故事。

  • AI问我:一站式AI工具导航平台,探索人工智能的无限可能。

    AI问我是一个集合了多种人工智能工具的导航平台,它为用户展示了从AI写作、设计、编程到娱乐和教育等多个领域的AI工具。该平台通过提供丰富的AI工具列表,帮助用户快速找到适合自己需求的AI解决方案,无论是提高工作效率、创造艺术作品还是进行学术研究,都能在这里找到合适的工具。AI问我的背景信息显示,它旨在为用户提供一个安全、便捷、内容广泛的AI工具搜索和使用环境。

  • 百度AI助手:智能对话平台,提供多领域AI服务。

    百度AI助手是一个集成了多种智能体的在线服务平台,它通过人工智能技术为用户提供包括医疗、教育、娱乐等多领域的智能对话服务。该平台利用大数据分析和机器学习算法,能够理解用户的需求并提供个性化的回答。百度AI助手的主要优点包括快速响应、高准确性和广泛的服务范围。它的背后是百度强大的人工智能技术支撑,旨在为用户提供便捷、高效的智能服务体验。目前,该平台对所有用户免费开放。

  • Shangchen Zhou:专注于计算机视觉和机器学习领域的研究与创新的博客网站

    Shangchen Zhou 是一位在计算机视觉和机器学习领域有着深厚研究背景的博士生,他的工作主要集中在视觉内容增强、编辑和生成AI(2D和3D)上。他的研究成果广泛应用于图像和视频的超分辨率、去模糊、低光照增强等领域,为提升视觉内容的质量和用户体验做出了重要贡献。

  • MiniMax:引领AI视频、音乐、文本创作新潮流

    MiniMax模型矩阵是一套集成了多种AI大模型的产品,包括视频生成、音乐生成、文本生成和语音合成等,旨在通过先进的人工智能技术推动内容创作的革新。这些模型不仅能够提供高分辨率和高帧率的视频生成,还能创作各种风格的音乐,生成高质量的文本内容,以及提供超拟人音色的语音合成。MiniMax模型矩阵代表了AI在内容创作领域的前沿技术,具有高效、创新和多样化的特点,能够满足不同用户在创作上的需求。

  • Magickimg AI 贴纸生成器:快速创建个性化AI贴纸,让沟通更生动有趣。

    Magickimg AI贴纸生成器是一个利用人工智能技术,根据用户输入的提示词快速生成个性化贴纸的在线工具。它主要面向需要为社交媒体、聊天应用等增添个性化元素的用户。产品背景基于深度学习技术,通过用户友好的界面,提供简单快捷的操作体验。产品的主要优点包括快速生成、易于操作、高质量输出以及安全可靠的服务。

  • 讯飞虚拟人:全栈式虚拟人多场景应用服务

    讯飞虚拟人利用最新的AI虚拟形象技术,结合语音识别、语义理解、语音合成、NLP、星火大模型等AI核心技术,提供虚拟人形象资产构建、AI驱动、多模态交互的多场景虚拟人产品服务。一站式虚拟人音视频内容生产,AIGC助力创作灵活高效;在虚拟'AI演播室'中输入文本或录音,一键完成音、视频作品的输出,3分钟内渲染出稿。

  • 智谱AI大模型开放平台:几行代码接入大模型

    智谱AI大模型开放平台是一个提供多种AI模型服务的平台,支持开发者和企业快速接入大模型API,构建变革性AI体验。平台提供GLM-4系列大模型,包括免费模型GLM-4-Flash、全自研最新版本GLM-4-Plus、支持200万上下文的GLM-4-Long等。此外,还提供多模态大模型,如视觉能力GLM-4V-Plus、文生图CogView-3-Plus、文生视频CogVideoX。平台面向开发者提供模型API、Alltools API、批处理API等服务,面向企业服务提供医疗健康、汽车、游戏娱乐、文旅、智能终端、智能制造、消费等行业解决方案。

  • 24h搜书:一站式免费电子书搜索和下载平台

    24h搜书是一个提供各类电子书资源的在线平台,用户可以通过书名、作者、出版社或ISBN编号进行搜索,找到所需的电子书资源并进行下载,内置AI辅助功能的电子书搜索引擎和下载工具。该平台支持多种语言版本的书籍,包括中文、英文、日文等,满足不同用户的需求。24h搜书以其便捷的搜索功能和丰富的电子书资源库,成为电子书爱好者和学习者的优选平台。

  • Hello!GPT:AI繪本創作系統,激發孩子的創意與想像力。

    Hello!GPT是一套专为小学生设计的AI绘本创作系统,通过集成的AI引擎,帮助学生生成适合的故事文案,并根据想法自动绘制出画家级别的图片。它能够自动生成电子绘本,不仅可作为学习工具,还可出版发行,参加比赛。产品通过AI智能绘图、文案生成等技术,为孩子们提供了一个创意无限、操作简单的创作平台,旨在提升他们的语言表达、创意思维和绘画技巧。

  • C知道:专业程序员AI问答工具

    C知道是由CSDN和外部合作伙伴联合研发的生成式AI产品,专注于为程序员提供问答、对话、文件分析、代码生成等服务,旨在提高工作学习效率。它通过先进的人工智能技术,能够理解并回答与编程相关的问题,支持多种编程语言和框架,是程序员日常开发和学习过程中的得力助手。

  • Miniflow:轻松创建AI工作流程,提升效率。

    Miniflow是一个AI工作流程自动化平台,它允许用户无需编写代码即可轻松创建和自动化各种AI工具的工作流程。该平台通过直观的拖放界面,提供了大量内置的工作流节点和模板,旨在简化任务,提高生产力。Miniflow适合希望简化工作流程、提高效率的用户,无论是技术用户还是非技术用户。目前产品仍在开发中,预计2024年推出。

  • Zhou Yi Easy Fortune:提供个性化的风水和占卜服务

    Zhou Yi Easy Fortune周易简易占卜是一个结合了中国传统文化和现代互联网技术的网站,它通过用户提供的出生信息和问题,运用周易的智慧来提供个性化的风水和占卜服务。该产品以周易为背景,结合现代算法,为用户提供一个简单易用的占卜平台,帮助用户在日常生活中寻找指导和启示。

  • StoryTribe:在线故事板制作工具,无需绘画技能。

    StoryTribe是一个在线故事板制作工具,它为UX设计师、营销人员和内容创作者提供定制化的故事板和插图。用户无需具备绘画技能即可轻松创建故事板,支持多种角色组合和场景道具,提供高质量的插画,适合专业和学术使用。StoryTribe旨在支持多元文化、种族和身体条件,其角色设计反映了现实生活中的人物比例,便于与真实照片背景结合,增强视觉叙事的沉浸感。

  • Flux AI 图像生成器:利用尖端AI技术,将创意转化为高质量图像。

    Flux AI 图像生成器是由Black Forest Labs开发的,基于革命性的Flux系列模型,提供尖端的文本到图像技术。该产品通过其120亿参数的模型,能够精确解读复杂的文本提示,创造出多样化、高保真的图像。Flux AI 图像生成器不仅适用于个人艺术创作,也可用于商业应用,如品牌视觉、社交媒体内容等。它提供三种不同的版本以满足不同用户的需求:Flux Pro、Flux Dev和Flux Schnell。

  • Google Illuminate:将内容转化为引人入胜的AI生成音频讨论。

    Illuminate是Google一个实验性技术,利用人工智能将选定的论文内容转化为两个AI生成的声音进行讨论的音频。这项技术特别适合计算机科学领域的学术论文,能够根据用户的学习偏好进行内容适应。它通过将复杂的学术内容转化为易于理解的音频讨论,帮助用户更有效地学习和理解论文中的关键点。

今日大家都在搜的词: