首页 > 业界 > 关键词  > iOS18最新资讯  > 正文

AI日报:确认!iOS18将用上ChatGPT;Suno又将推王炸级功能;谷歌AI搜索遭遇滑铁卢;Stable Assistant 可用SD3生成图片;

2024-05-27 16:16 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、苹果已与 OpenAI 正式达成协议 iOS18将用上 ChatGPT

【AiBase 提要:】

⭐️ 苹果与 OpenAI 达成合作协议,iOS18将引入 ChatGPT 功能。

⭐️ 多元化合作策略确保苹果在 AI 领域领先地位。

⭐️ 新版 Siri 预计具备更强大语言处理能力,提供更智能交互体验。

详情:https://www.chinaz.com/2024/0527/1619265.shtml

2、尴尬!谷歌手动删除搜索中奇怪的 AI 回答

【AiBase提要:】

🤖 谷歌的 AI Overview 产品在推出时出现了一些怪异回答,导致谷歌需要手动禁用特定搜索的 AI Overviews。

🔍 一些用户在社交媒体上发布了各种有趣的回答,但很快就被删除。

🛑 这个失误显示了 AI 领域竞争的艰难性,以及在 AI 技术完善之前进行优化的风险。

3、最低9美元/月!Stability AI推Stable Assistant 可用SD3生成图片

image.png

【AiBase提要:】

🤖 Stable Assistant 搭载了Stability AI 的文本和图像生成技术。

💬 它支持使用SD3生成图片、通过文字编辑图片、生成式填充图片、提升分辨率、生成视频、去除背景等。

🖼️ Stable Assistant 还提供了图像服务,可以将你的想法转化为令人惊叹的图像

产品入口:https://top.aibase.com/tool/stable-assistant

4、Suno将推出全新功能 可将任何声音转换为音乐作品

【AiBase提要:】

🎶 Suno将推新功能,可根据敲击节奏自动捕捉并与之“和弦”

🎵 比如敲击浇水壶的声音可以转化为好听的摇滚音乐

🎤 此前,Suno宣布他们在最新一轮融资中筹集了1.25亿美元

产品入口:https://top.aibase.com/tool/suno-ai

5、海艺上线Comfyui工作流云端服务 提供通用模板

QQ截图20240524165433.jpg

【AiBase提要:】

💡 海艺定制Comfyui工作流云端服务,确保用户体验更加流畅高效。

💡 提供通用模版,用户可在此基础上改进工作流,简化创建流程。

💡 平台具有强大的社区属性,用户可以在社区中找到许多其他用户发布的新建模板。

6、昆仑万维:天工AI每日活跃用户DAU超过100万

【AiBase提要:】

⭐️ 天工AI每日活跃用户突破百万,展示用户热情。

⭐️ 昆仑万维在AI领域技术和产品得到市场认可。

⭐️ 天工AI提供AI搜索、AI PPT等多样化服务,满足用户需求。

产品入口:https://top.aibase.com/tool/tiangongaizhinengti

7、Flawless推唇形同步配音工具TrueSync 支持多语言配音

【AiBase提要:】

1. Flawless推出唇形同步配音工具TrueSync,支持多语言配音。

2. TrueSync能够确保影片配音在任何语言中的唇形同步,提高电影的全球吸引力。

3. Flawless AI的产品包括TrueSync和DeepEditor,可以节省成本和时间,提高电影制作效率和效果。

产品入口:https://top.aibase.com/tool/flawless-ai

8、GPT-4被证实有人类心智!网友:连AI都可以看出他在嘲讽你了

【AiBase提要:】

🚀 GPT-4在理解他人心理状态方面与人类相当,甚至在某些测试中超过人类。

🔍 研究包含5个测试项目,GPT-4在反讽、暗示和奇怪故事测试中表现突出。

🤖 GPT-4采取保守策略,在不确定情况下不像人类那样消除不确定性。

详情:https://www.chinaz.com/2024/0527/1619307.shtml

9、你乱糟糟的桌面有救了!LlamaFS:基于Llama3的自动整理小助手

image.png

【AiBase提要:】

📂 LlamaFS是自动文件整理系统,能自动重命名和分类文件。

🔍 支持图片和音频文件,还有隐身模式保护隐私。

🖥️ 提供批处理和实时监控两种模式,界面简洁易用。

项目地址:https://top.aibase.com/tool/llama-fs

10、人类发起AI选美比赛,还让AI做评委,结果被网友骂惨了!

图片

【AiBase提要:】

🎭 英国Fanvue平台举办世界首个AI选美大赛,结果却迟迟未公布。

👑 选美大赛评委包括两位AI网红,引发公众对AI选美的新兴趣。

🤖 尽管选美在现实中饱受争议,AI选美却试图以新形式吸引关注。

详情:https://www.chinaz.com/2024/0527/1619375.shtml

11、模型YOLOv10升级:物体识别更快更准

image.png

【AiBase提要:】

🚀 YOLOv10是新升级的实时物体识别模型,比上一代参数减少25%,识别速度提升。

🔍 取消了非最大抑制(NMS),推理延迟大幅减少46%。

🛠️ 采用新的模型设计策略,同时优化了效率和准确性。

产品入口:https://top.aibase.com/tool/yolov10-

12、马斯克xAI完成60亿美元B轮融资 将发布多个技术更新和产品

【AiBase提要:】

⭐ 马斯克xAI完成60亿美元B轮融资。

⭐ xAI将宣布多个令人激动的技术更新和产品。

⭐ 资金将用于推出产品、建设基础设施和加速技术研发。

13、研究称GPT-4选股准确率高达60%,被质疑数据污染

【AiBase提要】

🤖 GPT-4在选股方面的准确率高达60%,超越了人类股票分析师和专业模型。

🤖有人质疑GPT-4的准确性是否受到训练数据污染的影响。

🤖GPT-4生成的叙述见解对未来股票表现具有信息性。

举报

  • 相关推荐
  • 大家在看
  • JASCO:音乐生成模型,结合文本和音频条件进行控制。

    JASCO是一个结合了符号和基于音频的条件的文本到音乐生成模型,它能够根据全局文本描述和细粒度的局部控制生成高质量的音乐样本。JASCO基于流匹配建模范式和一种新颖的条件方法,允许音乐生成同时受到局部(例如和弦)和全局(文本描述)的控制。通过信息瓶颈层和时间模糊来提取与特定控制相关的信息,允许在同一个文本到音乐模型中结合符号和基于音频的条件。

  • prism-alignment:探索大型语言模型的偏好和价值观对齐。

    prism-alignment 是一个由 HannahRoseKirk 创建的数据集,专注于研究大型语言模型(LLMs)的偏好和价值观对齐问题。数据集通过调查问卷和与语言模型的多轮对话,收集了来自不同国家和文化背景的参与者对模型回答的评分和反馈。这些数据对于理解和改进人工智能的价值观对齐至关重要。

  • LoRA Studio:探索多样化的AI模型。

    LoRA Studio 是一个在线平台,提供多种AI模型供用户探索和使用。这些模型涵盖了从动漫风格到抽象艺术的不同领域,可以用于生成艺术作品、设计元素等。平台的主要优点包括模型多样性、用户友好的界面以及创意的无限可能性。

  • Unstract:无代码LLM平台,用于结构化非结构化文档。

    Unstract是一个无代码的LLM(大型语言模型)平台,它允许用户通过简单的无代码方法启动APIs和ETL管道来处理非结构化文档。它支持从多种云文件/对象存储系统中读取复杂文档,并将结构化数据写入流行的数据仓库和数据库。Unstract利用大型语言模型的能力,超越了传统的RPA(机器人流程自动化),实现了机器到机器的自动化。

  • Woy AI:2024年顶级AI工具目录

    Woy.ai是一个AI工具目录,提供2024年最新的AI工具列表。它为技术爱好者、开发者和企业提供了一个平台,以发现和利用人工智能的最新进展。

  • Sparkpage:AI驱动的新型网页,重构信息互动。

    Sparkpage 是由 Genspark 推出的革命性网页形式,致力于通过 AI 技术改善用户在线获取信息的方式。它通过内容蒸馏和整合,提供无商业影响和编辑偏见的丰富、可靠信息。内置的 AI 助手能够动态响应用户查询,提供个性化的见解和信息。

  • Helix Free User Persona Generator:生成用户画像,助力市场洞察

    Helix是一个专注于用户画像生成的在线工具,能够帮助企业或个人快速理解目标受众的特征和需求。它通过分析用户数据,生成详细的用户画像,帮助产品或服务更好地定位市场和用户。

  • Promoted:提升市场搜索、推荐和原生广告的排名

    Promoted是一个专注于市场搜索、推荐和原生广告排名的解决方案,通过先进的机器学习技术和大型语言模型搜索相关性AI技术,显著提升转化率和广告质量。它为市场平台提供了统一的搜索、推荐和广告服务,帮助企业实现更好的匹配和更高的收益。

  • Index-1.9B-Pure:轻量级大语言模型,专注于文本生成。

    Index-1.9B-Pure是Index系列模型中的轻量版本,专为文本生成而设计。它在2.8T的中英文语料上进行了预训练,与同等级模型相比,在多个评测基准上表现领先。该模型特别过滤了所有指令相关数据,以验证指令对benchmark的影响,适用于需要高质量文本生成的领域。

  • Index-1.9B-Character:19亿参数规模的角色扮演模型,支持few shots角色定制。

    Index-1.9B-Character是由Index团队自主研发的大型语言模型,专注于角色扮演领域,拥有19亿参数规模。该模型支持用户通过上传角色对话语料实现快速的角色定制,具备较高的角色一致性、对话能力和角色扮演吸引力。在CharacterEval权威benchmark评估中,整体均分排名第九,表现优于同量级模型。

  • Index-1.9B-Chat:基于19亿参数的对话生成模型

    Index-1.9B-Chat是一个基于19亿参数的对话生成模型,它通过SFT和DPO对齐技术,结合RAG实现fewshots角色扮演定制,具有较高的对话趣味性和定制性。该模型在2.8T中英文为主的语料上预训练,并且在多个评测基准上表现领先。

  • Llama3-70B-SteerLM-RM:70亿参数的多方面奖励模型

    Llama3-70B-SteerLM-RM是一个70亿参数的语言模型,用作属性预测模型,一个多方面的奖励模型,它在多个方面对模型响应进行评分,而不是传统奖励模型中的单一分数。该模型使用HelpSteer2数据集训练,并通过NVIDIA NeMo-Aligner进行训练,这是一个可扩展的工具包,用于高效和高效的模型对齐。

  • ComfyUI.org:开源AI工具,推动AI民主化。

    ComfyUI是一个开源AI模型,致力于推动AI工具的民主化和开源化。它由一个团队创建和维护,旨在为AI社区提供易于使用、安全和可靠的工具。ComfyUI支持通过各种工具,如节点管理器、节点注册表、命令行界面、自动化测试和公共文档来支持其生态系统。团队相信开源模型将在长期内胜过封闭模型,并致力于通过社区驱动的方式推动AI工具的发展。

  • Hedra:创造实验室,打造下一代人类叙事产品

    Hedra是一个创新的创造实验室,专注于将基础模型转化为产品,以驱动下一代的人类叙事技术。它提供了一个平台,让用户能够创造具有表达力和可控性的人物角色视频,并构建能够捕捉想象力的虚拟世界。Hedra的使命是通过提供完整的创意控制,让用户想象世界、角色和故事。

  • L4GM:4D重建模型,快速生成动画对象

    L4GM是一个4D大型重建模型,能够从单视图视频输入中快速生成动画对象。它采用了一种新颖的数据集,包含多视图视频,这些视频展示了Objaverse中渲染的动画对象。该数据集包含44K种不同的对象和110K个动画,从48个视角渲染,生成了12M个视频,总共包含300M帧。L4GM基于预训练的3D大型重建模型LGM构建,该模型能够从多视图图像输入中输出3D高斯椭球。L4GM输出每帧的3D高斯Splatting表示,然后将其上采样到更高的帧率以实现时间平滑。此外,L4GM还添加了时间自注意力层,以帮助学习时间上的一致性,并使用每个时间步的多视图渲染损失来训练模型。

  • Grazias:自动化收集和分享客户反馈。

    Grazias是一个免费的在线工具,用于自动化收集客户的推荐信,并集中管理这些推荐信,同时可以方便地在任何地方分享。它提供了一系列功能,包括简单的表单收集、自定义表单、自动跟进邮件以及详细的分析和图表,帮助企业更好地管理和利用客户反馈。

  • Olvy AI:客户反馈的智能管理助手

    Olvy AI是一个先进的客户反馈管理平台,它通过AI技术整合来自不同渠道的客户声音,包括调查、访谈、评论、支持票据和销售电话等,帮助企业快速获取洞察力。它通过自动化和智能化的方式,将客户反馈转化为可操作的见解,帮助企业做出更明智、更快速的决策。Olvy AI的主要优点包括提高团队生产力、节省时间、提供精准的数据驱动见解,以及保持与用户需求的紧密联系。

  • Aware:智能孕期社区应用

    Aware.ai Pregnancy App是一个为孕妇设计的智能社区应用,通过AI技术为孕妇提供个性化的社区推荐和资源。它通过匹配孕妇的背景和孕期目标,帮助她们找到合适的社区和资源,分享孕期故事和经验,并通过一对一连接获得其他孕妇的见解和建议。

  • VidAU:AI驱动的视频和音频生成平台,简化内容创作。

    VidAU AI Video & Audio Creator是一个AI驱动的视频和音频生成平台,它通过简化从构思到制作的整个内容创作过程,使得用户能够轻松创建引人入胜的视频。平台提供多种AI工具,包括视频更换、视频翻译、字幕翻译和去除、AI虚拟形象发言人以及文本转音频等功能,帮助用户提升视频内容的质量和吸引力。VidAU支持120多种语言的视频翻译,覆盖150多个国家,能够节省90%以上的视频制作时间。

  • The Prompt Report:系统性调研生成式AI的提示技术

    The Prompt Report 是一份系统性调研报告,专注于生成式人工智能(GenAI)的提示技术。它通过结合人类和机器的努力,从多个数据库中处理了4797条记录,提取出1565篇相关论文。报告提供了58种基于文本的技术,并补充了多模态和多语言技术的广泛集合。其目标是提供一个易于理解和实施的提示技术目录,并回顾了作为提示扩展的代理,包括评估输出和设计有助于安全性和安全性的提示的方法。此外,报告还应用提示技术在两个案例研究中进行了实践。

今日大家都在搜的词: