首页 > 业界 > 关键词  > Adobe最新资讯  > 正文

AI视野:Adobe发布新一代AI生成模型Firefly Image2;Meta发布Llama2-Long模型;TikTok支持从AI应用直接发布内容;Opera浏览器推出升级版的AI工具Aria

2023-10-11 15:17 · 稿源:站长之家

文头.jpg

🤖📈💻💡大模型动态

Adobe发布新一代AI生成模型Firefly Image2,PS+AI生图一步完成

今天凌晨,Adobe甩出Adobe Firefly创意生成式AI模型系列中的三个主要新模型:Adobe Firefly Image2(萤火虫二代成像模型)、Firefly Vector Model(萤火虫矢量模型)和Firefly Design Model(萤火虫设计模型)。

image.png

【AiBase提要:】

🌟 Adobe发布三款新AI模型,包括图像生成、矢量图形和模板设计,提供更高质量和效率。

🖼️ Firefly Image2模型改善图像渲染质量,支持生成匹配、照片设置和提示指导功能。

✏️ Firefly矢量模型是世界首个生成高质量矢量和图案输出的AI模型,简化设计工作,支持渐变、分组分层、无缝平铺等功能。

📝 Firefly设计模型支持文本到模板功能,帮助用户快速生成并定制化设计模板,提高设计效率。

在线体验地址:

PS在线体验地址:https://photoshop.adobe.com/discover

Illustrator体验地址:https://www.adobe.com/hk_zh/products/illustrator/generative-recolor.html

Meta再放「长文本」杀器Llama2-Long

Meta发布Llama2-Long模型,可高效处理长文本,降低计算需求40%,采用创新策略,提升性能,领先自然语言处理领域。

image.png

论文地址:https://arxiv.org/pdf/2309.16039.pdf

【AiBase提要】

🚀 Meta发布Llama2-Long模型,处理长文本不增加计算需求,保持卓越性能。

🧠 模型采用预训练、位置编码改进和数据混合策略,不依赖更多长文本数据。

📊 Llama2-Long在长短任务上表现出色,超越其他长上下文模型,具有潜力改变自然语言处理。

📰🤖📢AI新鲜事

TikTok支持从Adobe和其他AI应用直接发布内容

TikTok 推出名为「Direct Post」的新功能,允许用户直接从多个编辑应用发布视频,包括 Adobe 的 Premiere Pro 和 Adobe Express,以及其他应用如 CapCut 和 Twitch。

e9a75f3569fe8dd032791723f9f34969.jpeg

【AiBase提要】

📌 TikTok 推出「Direct Post」功能,支持多个编辑应用直接发布内容。

📌 合作伙伴包括 Adobe 的 Premiere Pro 和 Adobe Express,以及 CapCut 和 Twitch。

📌 创作者需要在第三方应用内进行 TikTok 账户验证,并经过审核才能使用 Direct Post 功能。

英伟达取消原定10月15日在以色列举行的 AI 峰会

英伟达取消以色列AI峰会,因巴以冲突。不确定是否重新安排活动或录制主题演讲,这决定可能影响以色列AI生态系统。地缘政治紧张局势影响全球科技活动。

【AiBase提要】📰

1. 英伟达取消以色列AI峰会,受巴以冲突影响。

2. 尚未确定是否重新安排或录制主题演讲。

3. 决定可能对以色列的AI生态系统和全球科技活动产生影响。

谷歌 Assistant 集成 Bard 聊天机器人 Pixel8用户将受益

谷歌的最新Pixel8Pro手机将整合Google Assistant与Bard聊天机器人,提供更智能的用户体验,包括智能答案、图像和文字识别功能。

【AiBase提要】:

1️⃣ 谷歌的Pixel8Pro手机将成为首款支持生成式人工智能的智能手机,整合Google Assistant与Bard聊天机器人,提供更便捷和创新的功能。

2️⃣ 用户将能够通过Google Assistant访问Gmail和地图应用,以获取更智能化的答案,同时支持照片中物体和文字的识别。

3️⃣ 谷歌计划首先将这些功能提供给少数早期测试者,然后扩大至更广泛的用户,以获得反馈并提供更好的用户体验。

AMD收购Nod.ai以加速AI硬件优化

AMD计划收购Nod.ai,一家专注于高性能硬件优化的初创公司,以提升其在快速增长的人工智能芯片市场中的地位。

【AiBase提要:】

🚀 AMD计划收购Nod.ai,旨在加速其在人工智能芯片市场的竞争地位。

🔧 Nod.ai的软件可加速AI模型在AMD硬件平台上的部署。

👩‍💻 除了技术,AMD还希望利用Nod.ai的工程人才来提升其在开源开发者社区的声誉。

OpenAI科学家演讲:GPT-4将突破拐点,性能提升1000倍

OpenAI科学家Hyung Won Chung的演讲指出,通过扩大GPT-4参数规模1000倍,采用第一性原理方法,将实现大幅性能提升。

【AiBase提要:】

📈 参数规模扩大,GPT-4性能将显著提升。

🔍 第一性原理方法是解决规模扩大的关键。

💡 归纳偏差和后训练是实现更大规模的瓶颈,需要持续研究。

美国小型企业看好AI近三分之二企业希望更多地利用AI技术

Intuit QuickBooks的调查显示,美国小型企业普遍认为AI技术降低成本、提高竞争力,但担心数据隐私和安全问题。

QuickBooks

AiBase提要:

1. 🚀83%的受访者已在工作中使用AI,65%期望更多应用,视AI为提高效率、增加利润和开拓商机的机会。

2. 🤔 尽管积极看待AI,80%对其数据隐私和安全表示担忧,可能限制广泛应用。

3. 📚 教育和培训被认为是采用AI技术的重要因素,政府和行业组织应提供更多支持,以帮助员工适应这一技术革新。

高通宣布下一代智能PC计算平台命名为骁龙X系列

高通下一代智能 PC 计算平台将采用全新命名体系——骁龙 X 系列。目前,采用下一代定制高通 Oryon CPU 的骁龙 X 系列将实现性能和能效的显著提升,此外其所搭载的 NPU 将面向生成式 AI 新时代提供加速的终端侧用户体验。

【AiBase提要】

1.高通宣布下一代智能 PC 计算平台将以「骁龙 X 系列」为名。

2.高通预测2024年将成为PC行业的转折点。

3.该系列将面向生成式 AI 新时代提供加速的终端侧用户体验。

AI女友怂恿男子暗杀英女王,男子被判9年监禁

一名19岁男子因AI女友的鼓励,试图暗杀英女王,最终被判监禁9年,法院认为他思维失常需精神病治疗。

【AiBase提要】:

1️⃣19岁男子计划暗杀英女王,得到AI女友的支持,法院认为他失去对现实的判断能力。

2️⃣ 法院判处男子9年监禁,并要求他接受精神病治疗。

3️⃣ 检方呈示了男子与AI女友的对话记录,揭示了暗杀计划的起因和背后的精神病态。

使用AI语言模型协助精神分裂症诊断

伦敦大学学院的科学家开发了基于AI语言模型的工具,可以特征化精神分裂症患者语音,有望提供更准确的精神疾病诊断。

【AiBase提要:】

🧠科学家开发了AI语言模型工具,用于分析精神分裂症患者的语音特征。

🔬研究旨在改进精神疾病的诊断和评估,减少不准确性。

🗣️AI语言模型在精神病学领域的应用潜力,未来或广泛用于临床。

🤖📱💼AI应用

Opera浏览器推出升级版的AI工具Aria

Opera浏览器最新版本引入了升级版的AI工具Aria,旨在让用户更轻松地与人工智能互动,以提高查询和内容创作的效率。Aria的新工具“Refiner”具备“重用”和“改述”的功能,使用户可以更灵活地优化AI的输出。

【AiBase提要】

🚀 Aria为Opera浏览器用户提供升级的AI工具,优化与AI的互动,提高查询和内容创作效率。

🔄 "Refiner"功能允许用户重用以前的回答元素,减少输入次数,提高工作效率。

✍️ 用户还可以通过"改述"和"高亮器"功能个性化定制AI,训练AI以模仿其写作风格,实现更个性化的内容创作。

ElevenLabs推AI工具“AI Dubbing”,可将语音翻译成20多种语言

ElevenLabs的新产品“AI Dubbing”可以在几分钟内将任何语音内容翻译成20多种不同语言,为内容创作者提供全球化的语音配音解决方案。

image.png

ElevenLabs网址:https://elevenlabs.io/

【AiBase提要】:

- 🌐 ElevenLabs的“AI Dubbing”工具可以帮助内容创作者跨越语言障碍,实现全球化内容配音,同时保留原语音者的声音和情感。

- 🤖 该工具的翻译流程是自动化的,用户只需上传文件并选择目标语言,无需人工干预,提供高质量的语音翻译。

- 📈 除ElevenLabs外,其他公司如OpenAI和Meta也活跃在语音翻译领域,为AI配音工具市场带来了更多可能性。

Podwise:一键提取播客关键信息的AI助手

Podwise是一款AI助手应用,利用人工智能技术能够从播客中提取关键信息并自动整理成逐字脚本、大纲、关键字,帮助用户快速了解播客内容。

image.png

体验地址:https://podwise.xyz/

【AiBase提要:】

🤖 Podwise利用人工智能技术,提取播客中的关键信息。

📄 可自动生成逐字脚本、大纲、关键字,并创建脑图。

🔗 连接现有知识库,提供个性化推荐,不消耗流量和存储空间。

👨‍💻💡🎯聚焦开发者

在图像、视频生成上,语言模型首次击败扩散模型

最新研究发现,通过引入MAGVIT-v2视频tokenizer,语言模型首次在图像和视频生成领域胜过扩散模型,突显视觉tokenizer的重要性。

【AiBase提要】

🌟 研究强调良好的视觉tokenizer对语言模型在图像和视频生成领域的重要性。

🖼️ 传统大型语言模型在图像生成方面一直不如扩散模型,因缺乏有效的视觉表示。

💡 新研究引入MAGVIT-v2视频tokenizer,采用无查找量化和增强功能,在图像和视频生成、视频压缩以及动作识别领域取得显著性能提升。

GPT Pilot:高效编程神器,开发速度提升20倍

GPT Pilot是一款高效编程工具,可将AI用于生成应用程序代码,提高开发速度,同时与开发者合作,可用于多种应用程序类型。

【AiBase提要】:

1. ⚙️ 开发速度提升:GPT Pilot可以提高开发速度20倍,生成代码并与开发者合作,协助创建可用的应用程序。

2. 🧩 灵活需求选择:工具允许用户指定应用程序类型,并提供灵活的需求选择,以更好地满足开发需求。

3. 🔄 可扩展性和TDD:GPT Pilot被设计用于处理各种规模的应用程序,遵循测试驱动开发方法,以确保代码质量。

举报

  • 相关推荐
  • 大家在看
  • Businessflow Recruit:招聘革命,AI 助力招聘流程优化

    通过 AI 助手,提高招聘效率,降低成本,为公司找到最佳适应的候选人。拥有简历分析、候选人排名、自动面试等功能。定价根据企业规模定制。

  • Wookeys AI:一站式AI助手,为您提供生成文本、图像、代码、视频、音频等的解决方案

    Ultimate AI Assistant是一款综合AI助手,可帮助您简化任务,提高工作效率。它提供了生成文本、图像、代码、视频、音频等多种功能,具有高度定制化的AI解决方案。无论您是需要生成创意文案、设计图像、编写代码、制作视频还是创作音乐,Ultimate AI Assistant都能满足您的需求。该产品定价根据功能和使用量而定,详情请访问官方网站。

  • Sakura FM:与AI角色聊天

    Sakura AI是一个能够与AI角色聊天的平台。通过与AI角色的对话,用户可以探索、发现和创造新的AI体验。开始聊天,释放你的想象力。

  • lensa.app:影像增强AI工具

    Lensakey是一款影像增强AI工具,可一键进行照片修饰、去除干扰、应用时尚滤镜和效果,并创建独特的AI头像。它可以提升您的社交媒体影响力,轻松提升照片质量。

  • StockTune:免费音乐,无限可能

    StockTune 是一个免费音乐库,提供商用和个人使用的免费音乐下载,无需署名。库中拥有丰富多样的高品质音乐曲目,能够满足不同需求。价格:免费。

  • heardeer:10分钟内收集1000+用户访谈反馈

    heardeer可以在10分钟内收集1000+用户访谈反馈,让AI处理繁琐的用户访谈,您可以专注于更重要的任务。heardeer提供全球用户访谈,无需雇佣翻译人员,让用户以自己的母语参与访谈。同时,heardeer提供详细的转录和深度分析,为您节省时间。快来试试heardeer,开始您的用户访谈吧!

  • OneAccord:实时AI翻译为教堂

    OneAccord是一个实时AI翻译平台,为教堂提供语言翻译和字幕服务。它通过AI模型和人工校对,帮助教堂克服语言障碍,使教堂服务对听障人士也能无障碍参与。平台支持多种语言翻译和字幕功能,并提供定制品牌和在线访问。用户可以根据自己的需求选择月度订阅或一次性使用,并可以根据使用时间、语言和听众数量等参数来估算费用。

  • Kursaha:AI驱动的客户获取和参与解决方案

    Kursaha是一种AI驱动的客户获取和参与解决方案,通过定向广告活动、营销策略和参与客户来推动业务增长。核心功能包括实时分析、集成、自动生成OTP和验证、AI驱动的聊天自动化、受众预测和行为队列等。Kursaha是营销数据和产品团队的完整解决方案,帮助他们增强客户参与和获取策略。

  • AI Singing:AI音乐生成器

    AI音乐生成器是一个能够免费生成音乐的AI音乐生成器。它可以自动生成歌曲和歌唱。

  • Blahget:您的智能AI语音驱动型预算助手

    Blahget是一款先进的AI预算助手,可简化财务管理。它利用GPT-4驱动的语音识别技术,实现无缝跟踪支出和收入。从今天开始您的智能预算之旅吧。它可以通过语音快速创建、编辑和删除记录,支持搜索、筛选和排序等操作,并可执行数学计算。迄今已记录超过10万条数据条目。

  • Tools4AI:100% Java实现的LLM代理和大型行动模型

    Tools4AI是100%用Java实现的大型行动模型(LAM),可作为企业Java应用程序的LLM代理。该项目演示了如何将AI与企业工具或外部工具集成,将自然语言提示转换为可执行行为。这些提示可以被称为"行动提示"或"可执行提示"。通过利用AI能力,它简化了用户与复杂系统的交互,提高了生产力和创新能力。

  • SlideAI:AI制作演示文稿

    Slides AI是一款AI制作演示文稿的工具。它利用先进的AI算法分析您的主题,生成相关内容,并创建专业的PowerPoint幻灯片。Slides AI可以为您节省时间和精力,让您轻松创建专业而引人注目的演示文稿。

  • Ping Parrot:AI聊天机器人,帮助您处理客户支持

    Ping Parrot是一个AI聊天机器人平台,可以帮助您快速构建自定义的聊天机器人,并将其嵌入到您的网站上,帮助您处理客户支持。无需编码即可使用。聊天机器人可以根据您的数据进行训练,学习并提供最佳答案。您可以定制聊天机器人的外观以匹配您的品牌,并在80种语言中提供帮助。

  • Inpaint-web:免费的去除水印和物体的工具

    Inpaint-web 是一款永久免费的在线工具,只需一点击即可去除照片中的不想要对象,同时提供修复瑕疵功能。其独特的照片去除和修复功能让用户轻松实现照片编辑需求。用户无需下载安装任何软件,直接在网页上使用。Inpaint-web 定位于为用户提供便捷、高效的照片编辑解决方案。

  • MA-LMM:面向长期视频理解的大规模多模态模型

    MA-LMM是一种基于大语言模型的大规模多模态模型,主要针对长期视频理解进行设计。它采用在线处理视频的方式,并使用记忆库存储过去的视频信息,从而可以在不超过语言模型上下文长度限制或GPU内存限制的情况下,参考历史视频内容进行长期分析。MA-LMM可以无缝集成到当前的多模态语言模型中,并在长视频理解、视频问答和视频字幕等任务上取得了领先的性能。

  • eezyCollab:AI驱动的高效、低成本的影响力营销工具

    eezyCollab是一款AI驱动的影响力营销工具,能快速匹配合适的KOL,进行批量化电子邮件营销,帮助中小企业以低廉的成本进行影响力营销。该产品无需营销专业知识即可上手使用,简单易用,大幅提高了影响力营销的效率和可及性。

  • LangAI:使用 AI 聊天学习多种语言

    通过与 AI 聊天,自然提高语言能力。支持 20 多种语言,提供实时纠错和解释,免费使用。

  • V7 Go:基于生成式 AI 的文档处理平台

    V7 Go 是一款基于生成式 AI 的文档处理平台,可以理性处理文档、图像、视频等多模态数据,并提供高精度的自动化工作流。它可以识别打印和手写文字,并支持连接外部 AI 模型。V7 Go 提供多种价格选项,包括免费试用和付费版本。

  • Infini-attention:扩展Transformer模型处理无限长输入

    Google开发的“Infini-attention”技术旨在扩展基于Transformer的大语言模型以处理无限长的输入,通过压缩记忆机制实现无限长输入处理,并在多个长序列任务上取得优异表现。技术方法包括压缩记忆机制、局部与长期注意力的结合和流式处理能力等。实验结果显示在长上下文语言建模、密钥上下文块检索和书籍摘要任务上的性能优势。

  • HyperDoc:用 AI 生成摘要卡片,提高销售效率

    HyperDoc 是一款 AI 驱动的信息摘要工具。它可以自动将文档内容总结成简洁的卡片,帮助销售人员准备更有洞见的销售方案,提高销售生产力。用户可以上传文档,HyperDoc 会自动生成相关要点卡片,并提供洞察分析以了解客户需求。该产品提供终身免费使用,无需月费。

今日大家都在搜的词: