首页 > 业界 > 关键词  > DALL·E3最新资讯  > 正文

AI视野:DALL·E3模型向ChatGPT开放;Midjourney发布图像放大功能;百家号内测“AI助手”;vivo将在新手机系统搭载大模型

2023-10-20 15:02 · 稿源:站长之家

🤖📈💻💡大模型动态

DALL·E3模型已向 ChatGPT Plus 和 企业版 用户开放

今日,OpenAI官方宣布,DALL·E3现已向所有 ChatGPT Plus 和 企业版 用户开放。DALL·E3是OpenAI研发的最强大的图像生成模型。它通过训练先进的图像字幕生成器,然后让DALL·E3在生成图像时关注用户提供的提示,从而能够可靠地渲染复杂细节和响应各种宽高比的提示。

微信截图_20231020082838.png

【AiBase提要】

📢 OpenAI官方宣布DALL·E3向ChatGPT Plus和企业版用户开放。

📢DALL·E3是强大的图像生成模型,通过文本提示生成多种类型图像。

📢安全措施和用户反馈将持续改进。

阿里达摩院发布遥感AI大模型

阿里达摩院发布业内首个遥感AI大模型,可识别农田、农作物、建筑等,提升遥感应用的分析效率,并在低显存显卡上提供免费使用。

【AiBase提要】:

🚀 阿里达摩院发布遥感AI大模型,可识别农田、农作物、建筑,提高遥感应用效率。

🎯 该模型实现图像分割任务统一,快速提取各种遥感地物分类,准确率提升25%。

🛠️ 模型提供API调用服务,可定制不同遥感AI解译功能。

科大讯飞将发布讯飞星火认知大模型V3.0和医疗大模型

科大讯飞将于10月24日发布讯飞星火认知大模型V3.0和医疗大模型,同时宣布公司实现了正向的经营性现金流。

【AiBase提要】

🚀 科大讯飞计划在10月24日发布讯飞星火认知大模型V3.0和医疗大模型。

💰 公司报告显示,经营性现金流连续两个季度保持正向,尽管投资领域扩大影响了当期利润。

📈 公司强调这些投资将有助于长期可持续发展,构建核心技术自主能力,迈向通用人工智能时代。

智源研究院开源10亿参数三维视觉通用模型Uni3D

智源研究院发布了10亿参数的Uni3D三维视觉通用模型,取得技术突破,可处理点云数据,展示强大通用视觉能力。

【AiBase提要:】

🔍 Uni3D是10亿参数的三维视觉通用模型,取得全方位技术突破。

📄 模型借鉴二维视觉模型设计,采用Transformer架构,多模态对齐训练,展现强大的三维视觉能力。

🌐 Uni3D的开源发布为未来三维计算机视觉研究和应用奠定了坚实基础。

🤖📱💼AI应用

百度百家号内测“百家号AI助手” 提升创作者创作效率

百度旗下百家号宣布,百家号AI助手正在内测中,旨在用技术大幅提升创作者的创作效率。目前百家号AI助手已开启内测,创作者已可报名参加。

测试报名链接:https://iwenjuan.baidu.com/?code=79o2il

【AiBase提要:】

🚀 百度百家号内测“百家号AI助手”旨在提升创作者创作效率,包括热点推荐和文章生成功能。

💬 创作者可直接与AI助手对话,让AI生成文章或图文,加速内容创作。

📈 这一功能将有望改善自媒体创作者的工作流程,提供更多创作灵感。

Midjourney发布图像放大功能,可将生成的图像放大4倍

Midjourney发布了图像放大功能,允许用户将生成的图像放大多达4倍,提高图像质量,尤其对Topaz照片放大用户有重要意义。

image.png

【AiBase提要】

🚀 Midjourney发布图像放大功能,允许用户将生成的图像放大多达4倍,提高图像质量。

📷 新功能适用于新生成的图像和旧照片,提供更高分辨率和图像细节。

💡 用户需注意4倍放大需要更多计算资源,但这一功能为用户提供了更多工具来改进和优化图像。

Google推出免费AI工具NotebookLM 实现文档智能处理

Google免费推出NotebookLM,一款AI工具,能快速总结文档、回答问题、激发创意,为文档处理带来革命性变革。

【AiBase提要】

✅ 免费使用:NotebookLM提供基本功能免费,为用户省钱。

✅ 多格式兼容:支持Google Docs、PDFs等文档格式,提高用户便利性。

✅ 文档处理革新:自动摘要、问答、创意生成等功能,促进高效文档处理。

恒生电子金融大模型LightGPT升级 推出金融智能助手光子

恒生发布金融大模型LightGPT的最新升级,同时推出金融智能助手光子,加强金融领域的智能应用。

体验地址:https://www.hundsun.com/lightgpt

【AiBase提要】

🌐 恒生金融技术大会宣布金融大模型LightGPT的升级,提升模型效果、安全性和推理速度,并实现华为昇腾系列的适配。

🔌 金融智能助手光子解决大模型与实际应用之间的连接问题,可重塑或嵌入应用,提供各类金融特色插件。

📈 恒生的子公司带来智能投研平台WarrenQ的新产品升级,提供AI写作、语音速记等功能,助力金融行业数智化转型。

Topaz Labs发布高清修复软件Photo AI V2降噪算法显著提升

Topaz Labs发布的Photo AI V2软件通过强大的降噪、锐化算法和智能调整光线、颜色平衡功能,为图像增强提供显著改进。

image.png

体验地址:https://www.topazlabs.com/topaz-photo-ai

【AiBase提要】:

📈 Photo AI V2软件提供了强大的降噪和锐化算法。

🎨 软件采用智能化分析,能改善低分辨率图像、去除噪音,以及调整曝光和颜色平衡。

🔌 可与第三方软件如Lightroom和Photoshop集成,为图像处理提供更多灵活性。

Adobe发布Photoshop和Premiere新版,加入多项AI功能

Adobe公司发布了Photoshop Elements和Premiere Elements2024版,新增多项强大人工智能工具,提升照片和视频编辑生产力。

【AiBase提要:】

🌟 Adobe发布Photoshop Elements和Premiere Elements2024版,引入新的人工智能工具,包括图像对象和背景编辑,肤色增强等功能。

🌟 Premiere Elements中,Adobe的AI将自动生成引人注目的视频剪辑,侧重于动作和高质量镜头。

🌟 除AI更新外,两个平台还新增一些标准功能,如颜色预设、音频效果以及编辑教程。

📰🤖📢AI新鲜事

苹果计划在2024年底为iOS和iPadOS推出生成式AI功能

苹果计划在2024年底推出生成式AI技术,但是否能如期实现尚不确定,因其需要考虑隐私和竞争对手的发展。

【AiBase提要:】

🍏 苹果计划在2024年底引入生成式AI技术。

🤔 技术可能包括云端AI和边缘AI,但时间表尚不确定。

🔒 苹果强调谨慎考虑用户隐私和竞争对手的竞争情况。

OpenAI官方API接口早间出现异常 现已恢复

10月20日早间,OpenAI官方API接口出现异常,导致部分应用和插件无法正常使用,包括热门对话机器人ChatGPT。

【AiBase提要】:

🚀10月20日早间,OpenAI官方API接口出现异常,影响了部分应用和插件的正常使用。

🤖 包括热门对话机器人ChatGPT在内的一些服务也受到了影响,用户无法正常使用。

🔧 OpenAI已经注意到问题并正在努力修复,微软Azure平台上的OpenAI服务如ChatGPT暂时不受影响,目前API接口已修复。

vivo宣布将在新系统OriginOS4中搭载大模型

vivo官宣将在新系统OriginOS4中搭载大模型,提供更丰富的AI功能,开启手机端大模型应用新时代。

【AiBase提要:】

📱 vivo宣布在新系统OriginOS4中搭载大模型,引领手机端AI应用的新潮流。

💡 新系统将包含5个大模型,满足不同任务需求,以语音助手形式提供智能助理服务。

💼 大模型将应用于生成任务、复杂任务调度和意图理解,拓展手机智能功能的应用阶段。

IBM最新AI类脑芯片运算速度比商用芯片快22倍

位于加利福尼亚州圣何塞的IBM研究人员开发了一款类脑芯片,能加速人工智能发展,通过解决冯·诺依曼瓶颈,实现更快速和更能效的图像识别。

AiBase提要:

🚀 IBM在圣何塞研发出速度快、高效的类脑芯片,解决冯·诺依曼瓶颈。

🧠 该芯片可大幅提高能效,在图像识别等任务上表现出色。

🔋 尽管不适合大型语言模型,但在速度关键应用中非常有用,如自动驾驶。

智谱AI完成超25亿元融资

今日,人工智能公司智谱AI宣布完成超过25亿元人民币的新一轮融资。本轮融资由社保基金中关村自主创新基金(君联资本为基金管理人)、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉和高瓴等机构及部分老股东参与。

智谱AI融资超过25亿元,将用于基座大模型研发,已成功开源千亿级对话模型ChatGLM的单卡版。

AiBase提要:

1. 💰 智谱AI完成25亿元融资,用于基座大模型研发。

2. 🚀 公司已成功开源千亿级对话模型ChatGLM的单卡版。

3. 🤖 智谱AI致力于引领国内AI技术前沿,构建AI应用生态。

作家联合起诉微软等公司大模型侵权

包括前阿肯色州州长 Mike Huckabee 和畅销的基督教作家 Lysa TerKeurst 在内的一组作家已在纽约联邦法院提起诉讼,指控 Meta、微软和彭博在未经许可的情况下使用他们的作品来训练人工智能系统。

【AiBase提要】:

一组作家,包括Mike Huckabee和Lysa TerKeurst,控告Meta、微软和彭博侵犯版权,指称这些公司使用盗版书籍来训练AI模型。

诉讼指控这些公司使用名为「Books3」的数据集,其中包含数千本盗版书,用于训练语言模型。

作家要求法庭给予他们未经许可使用他们的作品的金钱赔偿,并制止对他们作品的滥用。

Anthropic将Claude AI扩展到更多国家,加拿大暂不在列

Anthropic公司将Claude2大型语言模型引入95个国家,但加拿大不在支持列表中,可能因加拿大政府严格的人工智能监管而导致。

AiBase提要:

🌐 Anthropic公司扩展Claude2到95个国家,但加拿大不在支持列表中。

🌐加拿大政府对人工智能监管较为严格,可能影响AI公司进入该市场。

📆 Anthropic公司正努力将Claude2引入加拿大,尽管缺乏确切的时间表。

👨‍💻💡🎯聚焦开发者

MIT、斯坦福推主动提问框架GATE 让大模型主动提问

最新研究发现,传统的提示工程在AI领域正逐渐被一种新型机器学习框架所替代,这一框架名为GATE(Generative active task elicitation)。GATE允许大型模型主动向人类提问,以更好地理解用户的偏好,从而不再依赖用户提供的提示信息。

image.png

论文地址:https://arxiv.org/pdf/2310.11589.pdf

【AiBase提要】

🆕 传统的提示工程在AI领域正逐渐被新型机器学习框架GATE取代,允许大型模型主动提问以更好理解用户偏好,提高性能,尤其在医疗和法律领域有广泛应用潜力。

❓ 争议:有关提示工程的未来仍存在争议,是否会完全消失还有待讨论。

🧪 实验结果表明,GATE在多任务上比传统方法更出色,有望为AI领域带来新方法。

ReMax算法提高大型模型RLHF效率,应对RTX4090限制

ReMax算法是专门为RLHF任务设计的算法,能显著减少计算开销,提高大型模型性能,应对RTX4090的资源限制。

image.png

项目地址:https://github.com/liziniu/ReMax

论文链接:https://arxiv.org/abs/2310.10505

【AiBase提要】

🧠 ReMax算法是专门为RLHF任务设计,采用快速模拟、确定性转移和轨迹级奖励,减少计算开销。

🚀 相对于通用RL算法PPO,ReMax具有实现简易、节省内存、提高训练速度等优势。

🌐 这一算法有望在大型模型发展中发挥关键作用,应对硬件资源限制。

举报

  • 相关推荐
  • 大家在看
  • helpmee.ai:AI辅助的电脑帮助,让老年人轻松掌握技术。

    helpmee.ai是一个利用AI技术为老年人提供电脑使用指导的网站。通过耐心的语音对话和屏幕共享,AI伴侣逐步引导老年人完成任何计算机任务,确保他们能够自信且独立地在数字世界中导航,支持50多种语言,全天候服务。该服务使用OpenAI的最新GPT-4o模型,提供无与伦比的准确性和理解力。

  • video-subtitle-master:批量生成视频字幕并支持多语言翻译的客户端工具

    video-subtitle-master 是一个基于之前开源项目 VideoSubtitleGenerator 开发的客户端工具,它允许用户批量为视频生成字幕,并支持将字幕翻译成不同的语言。这个工具特别适合需要对视频内容进行本地化处理的个人或团队,无论是为了教育、娱乐还是商业目的。它集成了多种翻译服务,如百度翻译、火山引擎翻译等,并优化了对 Apple Silicon 的支持,提供了快速的生成速度。

  • EngineerDraft:实时字幕生成工具

    BeMyEars 是一款实时字幕生成工具,利用本地设备完成语音识别,为听障人士和需要字幕的用户提供极致体验。其主要优点包括多语言支持、多源输入、隐私保护等。

  • 大设:AI 智能绘画平台,让文本和图片成为艺术作品。

    大设是基于 Stable Diffusion 的免费 AI 绘画网站,提供一键生成高清精绘大图、SDXL 模型教程、AI 提示词工具。背景包括清华大学研发,定位为 AI 智能绘画平台。

  • Supaclip:将视频快速转化为知识库。

    Supaclip是一个旨在帮助用户将视频内容转化为知识库的在线工具。它通过提供视频摘要、AI助手、字幕和时间戳等功能,帮助用户快速理解和导航视频内容。产品适用于内容创作者、学生、播客主持人和研究人员等,通过这些功能,用户可以增加视频的有机覆盖率、从讲座中获取最大价值、提供节目笔记、通过聊天机器人进行互动以及从访谈视频和纪录片中提取关键见解和引用。

  • Context Data:一站式企业级数据平台,专为生成式AI应用设计

    Context Data是一个为生成式AI应用设计的数据处理和转换平台,旨在帮助AI团队构建数据基础设施,以便他们专注于构建AI逻辑。它提供了无需设置基础设施、跨多个源转换数据、连接多个模型、加载数据到主要向量数据库、查询私有向量数据、定时管道以及构建数据和ETL管道等功能。Context Data强调数据隐私控制,避免了将数据上传到OpenAI等外部模型,简化了构建AI就绪数据平台的压力和复杂性。

  • World of Gami:AI驱动的Trello替代品,让团队任务保持最新。

    World of Gami是一个利用AI技术简化任务管理的网站,它将日常任务转化为令人兴奋的挑战,使项目管理不仅是必需的,而且是团队工作流程中令人愉悦和有益的一部分。通过将传统任务列表或看板转变为生动和竞争性的游戏,每个用户可以创建自己的'船',使用Scrum方法进行冲刺,并竞争'冲刺皇冠',这不仅使项目管理更加有趣,而且培养了团队精神和成就感。

  • Dola AI:您的个人 AI 日历助手,简化日程安排,释放时间。

    Dola 是一款通过消息应用进行日程安排的 AI 助手,它与 Google 日历、Apple 日历和 Caldav 兼容,能够通过自然语言快速安排日程,提高效率,同时支持语音、图片和文本输入。Dola 旨在帮助用户节省时间,专注于他们喜欢的事情。

  • Remind AI:使用先进的AI技术,轻松捕捉您的数字活动并作为记忆使用。

    reMind是一款利用AI技术帮助用户捕捉和利用数字活动作为记忆的产品。它通过先进的人工智能技术,让用户能够轻松地记录和回顾自己的工作和活动,从而提高生产力。

  • BrowseBuddy:AI购物助手,提升电商购物体验

    BrowseBuddy是一款AI驱动的聊天机器人,旨在通过提供个性化的帮助来增强在线购物体验。它利用自然语言处理技术来理解客户查询,提供量身定制的产品推荐和支持。BrowseBuddy通过智能产品匹配、实时解决方案、多语言支持等技术,为电商企业提供了一种提升客户满意度和销售效率的解决方案。

  • Depthforge:AI驱动的3D图像生成应用

    Depthforge是一款利用Apple Vision Pro技术,通过文本提示生成沉浸式3D图像的应用。它易于使用,能够让用户通过简单的文本输入来创造独特的高质量3D图像,体验全新的3D图像生成世界。

  • AudiowaveAI:将任何文本转换为有声读物质量的声音。

    AudiowaveAI是一款利用人工智能技术将文本转换成高质量音频的应用程序。它与传统的文本到语音技术不同,提供了更加自然、富有情感的语音输出,让听众在学习和享受内容时获得更好的听觉体验。产品背景信息包括它是由全球创新公司和自由职业者信赖的产品,其主要优点在于其引人入胜的声音、自然的声音效果以及令人愉悦的听觉享受。产品定位为教育工具,旨在帮助用户在移动中学习,享受夏日阳光。

  • Usermaven:简单而强大的网站和产品分析工具

    Usermaven是一个简单易用且功能强大的网站和产品分析工具,专为市场营销人员和产品专业人士设计。它通过自动捕获所有事件来提供精确的追踪,无需依赖开发人员,从而简化了数据分析过程。Usermaven还提供了隐私友好的解决方案,支持GDPR和CCPA合规性,并且可以无cookie运行,保护用户隐私。

  • StarSearch:git历史查询助手,贡献者分析工具

    StarSearch是一个专注于git历史和贡献者分析的在线工具,它能够帮助用户快速获取有关贡献者活动的信息,识别关键贡献者,以及基于工作内容找到特定领域的专家。该工具对于开源项目维护者、开发者和团队领导者来说极为重要,因为它可以提高项目管理效率,优化团队协作,并促进技术社区的交流与合作。StarSearch是我们基于人工智能的功能,可以深入了解贡献者的历史和活动,带来透明度和对开源项目的全新深度认知。

  • AIGCRank.cn:AI 排行榜

    AIGCRank.cn 是一个提供 AI 产品排行榜的网站,主要收集和整理国内外各类 AI 产品的相关信息,并通过排行榜形式展示给用户。该网站旨在帮助用户了解和选择最优秀的 AI 产品,以满足其需求。

  • ReVideo:视频重制,精确控制内容与运动

    ReVideo是一个创新的视频编辑技术,它允许用户在特定区域进行精确的视频编辑,通过指定内容和运动来实现。这项技术通过修改第一帧来实现内容编辑,而基于轨迹的运动控制提供了直观的用户交互体验。ReVideo解决了内容和运动控制之间耦合和训练不平衡的新任务。通过开发三阶段训练策略,逐步从粗到细解耦这两方面,并提出一种时空自适应融合模块,以在不同的采样步骤和空间位置整合内容和运动控制。

  • TryOnDiffusion:一款基于扩散模型的服装试穿技术

    TryOnDiffusion是一种创新的图像合成技术,它通过两个UNets(Parallel-UNet)的结合,实现了在单一网络中同时保持服装细节和适应显著的身体姿势及形状变化。这项技术在保持服装细节的同时,能够适应不同的身体姿势和形状,解决了以往方法在细节保持和姿势适应上的不足,达到了业界领先的性能。

  • AIGCRank大语言模型API价格对比:汇总和比较全球主要AI模型提供商的价格信息

    AIGCRank大语言模型API价格对比是一个专门汇总和比较全球主要AI模型提供商的价格信息的工具。它为用户提供最新的大语言模型(LLM)的价格数据,包括一些免费的AI大模型API。通过这个平台,用户可以轻松查找和比较OpenAI、Claude、Mixtral、Kimi、星火大模型、通义千问、文心一语、Llama 3、GPT-4、AWS和Google等国内外主要API提供商的最新价格,确保找到最适合自己项目的模型定价。

  • Pandora:通用世界模型,支持自然语言动作和视频状态

    Pandora是一个向通用世界模型迈进的模型,它能够通过生成视频来模拟世界状态,并允许使用自然语言在任何时间控制视频内容。Pandora与以往的文本到视频模型不同,它允许在视频生成过程中随时接受自由文本动作输入,从而实现视频的即时控制。这种即时控制能力实现了世界模型支持交互式内容生成和增强的健壮推理和规划的承诺。Pandora能够跨多个领域生成视频,如室内/室外、自然/城市、人类/机器人、2D/3D等场景。此外,Pandora还允许通过高质量的数据进行指令调整,使得模型能够在一个领域学习动作并在另一个未见过的领域中使用。Pandora模型还通过自回归模型生成更长的视频,其生成的视频长度可以超过训练视频的长度。尽管Pandora作为通用世界模型的初步步骤仍有限制,例如在生成一致性视频、模拟复杂场景、理解常识和物理法则以及遵循指令/动作方面可能会失败,但它在视频生成和自然语言控制方面展示了巨大的潜力。

  • Dev Home:Windows开发者的一站式控制中心

    Dev Home是微软为Windows开发者推出的一款桌面客户端,旨在提供一个集中的控制中心,帮助开发者监控项目、设置开发环境、连接开发者账户和工具,并创建专用的存储空间。它通过自定义的仪表板小部件,使开发者能够监控工作流程、跟踪开发项目、编码任务、Azure DevOps查询、GitHub问题、拉取请求、可用SSH连接以及系统的CPU、GPU、内存和网络性能。Dev Home 0.14 预览版更新集成了 PowerToys 模块,以及基于 AI 的 Quickstart Playground 功能。

今日大家都在搜的词: