首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

AI视野:OpenAI员工集体辞职逼宫董事会;Runway正式发布运动画笔功能;animatediff-webui即将开源;北大开源Video-LLaVA大模型

2023-11-21 15:08 · 稿源:站长之家

📰🤖📢AI新鲜事

超过500名OpenAI员工集体辞职逼宫董事会

OpenAI数百名员工集体威胁辞职,指责董事会解职Altman处理不当,要求董事会辞职,或将跟随Altman加入微软。

【AiBase提要:】

😠 超过500名员工批评OpenAI董事会解职Altman不当,缺乏有效监督,威胁集体辞职。

🤝 员工信中警告,除非董事会辞职并重新任命Altman和前总裁Brockman,否则将跟随Altman加入微软。

💔 内部分歧凸显,Altman忠实追随者威胁辞职,微软保证OpenAI员工职位。

Runway正式发布运动画笔和Gen-2风格预设

Runway近日发布了一系列新功能和更新,其中包括运动画笔(Motion Brush)、Gen-2风格预设、更新的相机控制以及图像模型的改进。这些更新目前已正式上线,对所有用户开放使用。

image.png

【AiBase提要:】

🚀 创新工具发布: Runway推出运动画笔和Gen-2风格预设,为用户提供可控制的新视频生成方式。

💡 视频生成游戏规则改变: 行业专家表示,Gen-2的发布将彻底改变视频生成的游戏规则,运动画笔的加入省去了繁琐的编辑流程,提高了创作效率。

🌐 行业变革引领者: Runway在技术创新和用户体验方面展现卓越能力,发布的新功能不仅是技术突破,也是对用户体验的全面升级。

Discord宣布将于12月1日起关闭其人工智能聊天机器人Clyde

Discord宣布关闭实验性人工智能聊天机器人Clyde,原计划将其作为聊天和社区应用的基本部分,但具体原因尚未明确。

【AiBase提要:】

🤖 Clyde停用计划: Discord将于12月1日停用实验性人工智能聊天机器人Clyde,用户将无法在私聊、群聊或服务器中调用。

🔍 AI聊天机器人实验: Clyde是Discord的实验项目,使用OpenAI的模型进行测试,但具体停止服务原因未明确。

🚀 Discord的AI发展: Discord除了Clyde外,仍在尝试各种AI功能,包括生成会话摘要的AI,并努力将平台定位为AI开发者的家园。

微软调整AI图像生成工具以应对迪士尼版权问题

微软为防止迪士尼标志侵权,调整人工智能图像生成工具,禁止输入「迪士尼」,引发知识产权争议。

【AiBase提要:】

🚫 微软采取行动,阻止「迪士尼」输入到图像生成器,回应社交媒体趋势,避免侵犯迪士尼版权。

⚖️ 知识产权法律公司表示,复制迪士尼标志可能侵犯商标权,引发对 AI 处理标志的担忧。

🌐 存在疑问:迪士尼内容是否用于训练 AI 程序?微软调整政策,显示迪士尼文本和标志为混乱状态。

DeepMind推出OPRO技术,优化ChatGPT提示

Google DeepMind最新推出的OPRO技术利用大型语言模型(LLM)作为优化器,通过自然语言描述问题指导LLM生成和改进,特别适用于梯度难以获取的提示优化问题。该技术已在线性回归和数学优化问题上测试,展示了在优化LLM如ChatGPT和PaLM上的潜在效果。

【AiBase提要:】

🧠 OPRO是由Google DeepMind开发的技术,利用LLM作为自身提示的优化器,通过自然语言描述问题指导生成和改进,解决梯度难以获取的提示优化问题。

🔄 OPRO通过在元提示中包含任务的自然语言描述和示例,以自然语言方式解决问题,评估候选解决方案的结果,循环迭代直到找到最佳提示,可在数学优化问题上应用。

🌐 DeepMind测试了OPRO在线性回归和“旅行推销员问题”等数学问题上,展示了其在优化LLM如ChatGPT和PaLM上的潜在效果。

亚马逊推出全新免费AI培训课程

亚马逊宣布推出“AI Ready”计划,旨在到2025年免费培训全球200万人Generative AI职业所需技能,包含在线课程、奖学金计划和与Code.org的合作。

【AiBase提要:】

🎓 全球培训计划: 亚马逊计划通过"AI Ready"到2025年为200万人提供生成式AI职业所需技能的免费培训。

💻 免费课程与奖学金: 提供专业人士和初学者的免费Generative AI培训课程,以及面向高中和大学学生的奖学金计划。

💰 投资Udacity奖学金: 亚马逊将投资1200万美元提供5万个Udacity奖学金,支持全球高中和大学学生获取Generative AI技能,同时与Code.org合作在计算机科学教育周推出“Hour of Code”活动。

密歇根州议会采用新的 AI 技术来检测枪支

密歇根州议会将在议会大楼安装名为ZeroEyes的人工智能技术,通过分析监控录像识别枪支,提供额外安全保障。一旦有人在摄像头前拿出枪支,警报将发送到监控中心,由分析师进行审查和发送警报。

【AiBase提要:】

🔍 密歇根州议会引入ZeroEyes人工智能技术,通过监控录像识别枪支,增强议会安全。

🔍 技术特点在于只识别枪支本身,无论携带者身份,提供全面安全警报服务。

🔍 安装该技术是为应对过去几年发生的枪支进入议会大楼事件,以进一步确保公共安全。

OnePlus为用户推出人工智能驱动的音乐创作平台

一加最新推出人工智能音乐创作平台,为用户提供创意空间,标志着其从智能手机制造商转型为创新科技领域领导者

【AiBase提要:】

🎵 创新平台推出: 一加公司推出人工智能音乐创作平台,扩展服务范围,让用户通过简单界面借助人工智能技术轻松创作个性化音乐作品。

🛠️ 强大功能支持: 新平台提供智能合成、音频处理和编曲功能,使非专业用户能轻松制作高质量音乐,同时提供丰富音频素材库。

🌐 创造力无限空间: 一加创始人表示,通过引入人工智能音乐创作平台,公司致力于让创造力成为每个人都能享受的体验,不仅局限于专业音乐人。

长虹推出基于大模型的智慧家电 AI 平台“长虹云帆”

长虹云帆是全球首个基于大模型的智慧家电AI平台,通过生成式人工智能应用于电视终端,实现电视的智能化和智能家居的全新阶段。

【AiBase提要:】

🌐 长虹云帆是全球首个大模型智慧家电AI平台。

💡 云帆具备简单易用、多维感知、多任务管理等五大能力,满足个性化需求。

📺 云帆已应用于长虹的8K系列、ARTIST星箔系列和288Hz超羽速系列电视。

🤖📱💼AI应用

vivo千询AI助手开放下载 基于蓝心大模型打造

vivo在开发者大会上发布了“蓝心千询”机器人,基于蓝心大模型,可向所有手机品牌开放使用,支持自然语言对话、知识回答、文学创作、图片生成、程序编写,并提供AI灵感功能。

微信截图_20231120174804.png

【AiBase提要:】

🤖 开放使用: vivo发布基于蓝心大模型的“蓝心千询”机器人,向所有手机品牌开放下载和使用。

🔍 多功能应用: 该机器人支持自然语言对话、知识回答、文学创作、图片生成、程序编写等多项功能。

✨ AI灵感功能: “蓝心千询”具备AI灵感功能,为用户提供社交媒体文案创作、PPT大纲、中英互译、生活妙招等创作灵感。

WhatsApp推出Llama2驱动的AI聊天机器人测试版

在追求提升用户体验的过程中,WhatsApp正测试推出Llama2驱动的人工智能聊天机器人,为用户带来更便捷的通讯体验。Meta公司采用先进的Llama2语言模型,与Microsoft Bing合作,为其AI聊天机器人做最后的完善工作。最新的WhatsApp测试版中出现了一个新的快捷方式,使用户能够通过AI聊天机器人执行各项任务。

【AiBase提要:】

🚀 AI技术支持: WhatsApp测试Llama2驱动的AI聊天机器人,提升通讯体验。

🌐 Meta与Microsoft合作: Meta公司采用Llama2语言模型,与Microsoft Bing合作完善AI聊天机器人。

⚙️ 便捷操作方式: WhatsApp测试版中新增快捷方式,用户可通过AI聊天机器人执行任务。

Powder利用AI为游戏主播自动剪辑

法国初创公司Powder最近发布了一款基于人工智能的视频剪辑工具,通过训练40多个游戏专用的AI模型,能够自动检测游戏直播中的重要时刻,如取胜、击杀,大大简化游戏主播的后期编辑工作。

QQ截图20231121093639.jpg

【AiBase提要:】

🎮 AI自动剪辑: Powder利用AI训练了40多个游戏专用的模型,能自动提取游戏直播中的精彩片段,减轻主播后期编辑负担。

🔊 音频分析与功能扩展: 除了检测取胜、击杀等瞬间,Powder计划增加检测主播尖叫的功能,并推出语音转文字技术,提供更多剪辑可能性。

⏰ 剪辑时间大幅减少: Powder声称其AI助手每周可为游戏主播节省多达10小时的剪辑时间,成为内容创作者的“圣杯”。

👨‍💻💡🎯聚焦开发者

gpt crawler:从URL爬取网站生成结构化知识,创建定制GPT

gpt crawler是一强大工具,能全面爬取网站内容,生成结构化知识,为定制GPT提供支持。用户可通过灵活配置爬虫、定制化知识文件生成,轻松上传至OpenAI,支持Docker容器化执行,促进个性化ChatGPT开发。

image.png

项目地址:https://github.com/BuilderIO/gpt-crawler

【AiBase提要:】

🌐 灵活配置爬虫: 用户可通过编辑config.ts文件自定义爬虫,适应不同网站结构和需求。

🧠 定制化知识文件生成: gpt-crawler生成包含知识数据的文件,为用户提供定制GPT的基础知识。

🚀 轻松上传到OpenAI: 生成的知识文件可方便上传至OpenAI,用于创建自定义GPT或助手。

animatediff-webui即将开源 简化配置,提升易用性

animatediff-webui即将开源,基于animatediff-cli-prompt-travel,旨在简化配置,提升用户体验,提供更细致、灵活的关键词控制,成为简单而功能强大的动画生成工具。

image.png

【AiBase提要】:

🚀 创新工程开源: animatediff-webui基于animatediff-cli-prompt-travel,致力于简化繁琐配置,提高用户体验。

🎨 灵活关键词控制: 新一代animatediff-webui通过controlnet和提示词信息,实现更细致、灵活的关键词控制,不再局限于全画面的应用。

🤖 易用性与灵活性兼顾: animatediff-webui的开源不仅提高易用性,还注重提升生成视频的灵活性,满足用户个性化和定制化需求。

🤖📈💻💡大模型动态

Music ControlNet可精确控制音乐中的时间变化

Music ControlNet是基于扩散技术的音乐生成模型,通过多时变控制、扩散技术和部分指定控制,提供精准的音乐时间变化控制,在性能和灵活性上表现出色。

image.png

项目地址:https://musiccontrolnet.github.io/web/

【AiBase提要:】

🎶 多时变控制: Music ControlNet通过扩散技术实现对音乐谱图的条件生成,提供旋律、动态和节奏等多个时变控制,使创作者更精细操控音乐。

🌐 扩散技术优势: 采用扩散技术微调训练音频控制信息,提高生成音乐的质量和逼真度,相较于其他模型具备更短训练时间和更少参数。

🕒 部分指定控制新策略: 引入新策略,允许创作者在时间上部分指定控制,为音乐创作提供更大自由度和创造性。

北大开源Video-LLaVA大模型,搞笑视频笑点秒懂

AI视频大模型Video-LLaVA由北大团队开源,成功解决了视觉-语言理解中同时处理图像和视频的难题,实现笑点理解。模型在13个基准测试上表现出色,无需配对数据训练,且通过预先对齐视觉输入,提高了对视频问答任务的性能。

image.png

【AiBase提要】:

🎥 模型介绍: 北大团队开源Video-LLaVA大模型,通过对齐视觉输入,实现笑点理解,无需配对数据训练。

🤖 性能优越: 在13个基准测试上,Video-LLaVA在视频问答任务上超过了5.8%至18.6%。

🔗 开源资源: 详细信息和代码可在GitHub(https://github.com/PKU-YuanGroup/Video-LLaVA)获取。

举报

  • 相关推荐
  • 大家在看
  • 万彩商图:快速更换商品图片背景,提升商品展示效果。

    万彩商图是一个在线设计工具,专注于帮助用户快速更换商品图片的背景,以提升商品的视觉效果和吸引力。它利用AI技术实现一键式操作,简化了传统图片编辑的复杂流程,使非专业用户也能轻松制作出专业的商品展示图。

  • AIEmoji:快速找到适合你情感的Emoji表情。

    AIEmoji是一个基于人工智能技术的Emoji搜索网站,它允许用户通过自然语言描述来搜索和找到匹配的Emoji表情。这项技术简化了Emoji的搜索过程,提高了用户在社交、写作和其他需要表情符号的场合的效率和表达能力。

  • Brev.ai:AI音乐生成器,几秒钟创作高质量音乐。

    Brev.ai是一款利用人工智能技术,根据用户输入的文本描述快速生成独特音乐作品的在线音乐创作工具。它基于Suno V3.5技术,支持多种音乐风格和流派,适用于视频、播客、游戏配乐等多场景。Brev.ai的主要优点包括高效率、成本效益高、易于使用,以及能够提供高质量的音乐输出。

  • 知了zKnown:致力于信息降噪 / 阅读提效的个人知识助手

    知了 zKnown 是一款 AI-Native 构建的个人知识助手,专注于信息降噪和阅读提效。它通过多端同步、多渠道总结、长文本支持等功能,帮助用户高效地管理和整理信息。产品的主要优点包括:- 多端同步:用户可以在移动app、桌面客户端、网页版、小程序等多个平台同步使用。- 多渠道总结:支持微信公众号、知乎、简书、36Kr、少数派等多个渠道的文章总结。- 长文本支持:最长支持总结3万字的文章内容。- 摘要导出:用户可以将摘要保存到 Notion、Flomo 等平台。- 产品背景:知了 zKnown 致力于通过 AI 技术提升用户的阅读和信息管理效率,适合需要高效处理大量信息的用户。

  • MBox AI Meet:实时转录与会议总结的谷歌会议扩展

    MBox AI Meet是一款免费Chrome扩展,专为Google Meet设计,提供实时转录和自动生成会议总结的功能。它利用AI技术帮助用户在会议中专注于讨论,而无需担心记笔记。该工具通过实时转录捕捉会议的每一个细节,并在会议结束后自动生成总结,确保用户不会错过任何重要信息。MBox AI Meet的隐私优先策略确保会议安全,不存储任何音频或视频内容。此外,该扩展还计划在未来更新中增加更多AI功能,如发言人识别、实时AI助手等。

  • Klee:本地安全AI,保障数据隐私。

    Klee是一款macOS原生的AI助手应用程序,专注于本地处理数据,确保数据安全和隐私。它使用先进的AI技术,如RAG(检索增强生成)和开源大型语言模型,如Llama 3和Mistral,为用户提供高效、智能的笔记、搜索和知识管理功能。Klee的主要优点包括本地运行以保护隐私、支持团队协作、免费使用以及优化的macOS体验。

  • Kipps.AI:快速构建AI助手,提升业务效率

    Kipps.AI 是一个在线平台,允许用户在短短两分钟内构建自己的AI助手,并将其集成到业务中。该平台支持多种数据源,如PDF、Notion、网站链接和文本,用户只需提供这些数据,Kipps.AI 会处理其余部分。它还与常用的工具如GoDaddy、Wordpress、Drupal、Squarespace、Magento和Wix等进行集成,使得用户可以轻松地将AI助手集成到现有的业务流程中。

  • CrossPrism for MacOS:图像识别、标注和关键词生成工具

    CrossPrism for MacOS 是一款专为摄影师设计的图像识别、标注和关键词生成工具。它利用多核 CPU、GPU 和神经引擎,能够识别物种、生成标题和描述,并支持模型训练的可定制性。用户可以在本地自动标注无限量的原始照片,确保所有照片安全地存储在 Mac 上,无需担心云服务中断、数据锁定或文件传输问题。其20多个专家模型可以对从鸟类到地标的各种内容进行分类,并提供新的视角来整理目录和重新发现旧照片。此外,它还支持视频处理、Lightroom 插件、图像质量评估等功能,使其成为一个强大的筛选工具。

  • ZETIC.ai:构建零成本的设备端AI。

    ZETIC.ai提供了一种革命性的设备端AI解决方案,使用NPU技术帮助企业减少对GPU服务器和AI云服务的依赖,从而显著降低成本。它支持任何操作系统、任何处理器和任何目标设备,确保AI模型在转换过程中不损失任何核心功能,同时实现最优性能和最大能效。此外,它还增强了数据安全性,因为数据在设备内部处理,避免了外部泄露的风险。

  • Kerqu.Ai:一站式AI内容生成器,助力跨境电商提升效率。

    Kerqu.Ai是一个为跨境电商卖家提供一站式AI解决方案的平台,整合了先进的AI技术,帮助用户节约成本、提升品牌影响力和销售转化率。产品通过AI技术实现模特换场景、AI图片创作、批量抠图、图片变高清等功能,同时提供一键撰写文案、优化文案和多语言翻译服务,满足多站点经营需求。

  • ReviewHawk:通过分析用户评论,降低用户流失率。

    ReviewHawk是一个专注于分析应用商店评论的工具,旨在帮助企业降低用户流失率,获取用户反馈,从而改善产品。它通过数据驱动的决策和用户满意度分析,帮助企业了解用户真正想要的功能,从而提升用户留存率和产品满意度。

  • Airtable Cobuilder:快速创建与管理数据的应用程序

    Airtable Cobuilder 是一款强大的应用程序构建工具,旨在通过简单的拖放界面和AI辅助功能,帮助用户快速创建和管理数据。它允许用户连接和简化他们最关键的数据,通过可视化数据、自定义视图和集成其他业务工具,提高团队协作和数据管理的效率。该工具特别适合需要高度定制化和灵活性的业务应用场景。

  • Alertfor:追踪网络信息,及时获取答案变化

    Alertfor 是一个在线平台,通过其专有的AQTA (Ask Question Track Answer) 流程,允许用户提交复杂问题,并在网页上寻找最相关的答案。它通过持续追踪提供连续的更新,确保用户能够获得准确且及时的信息。

  • Unskool:家长支持工具,助力家庭教育

    Unskool是一个由家长为家长制作的辅助工具,旨在简化家庭教育过程。它通过去除繁琐的行政工作,让家长能够专注于创造一个丰富的学习环境,让家长和孩子都能茁壮成长。Unskool提供了跟踪、记录和灵感激发的功能,并通过人工智能生成定制的、按需的课程计划,帮助家长更高效地进行家庭教育。

  • AI Generated Diagram:智能生成图表工具

    AI Generated Diagram 是一款利用人工智能技术生成图表的工具。它通过用户输入的提示(prompts)来创建图表,支持多种布局类型,如水平布局(Horizontal)。用户可以通过编辑、配置等操作来调整图表的细节,并支持导出为SVG格式或导出数据。该工具不仅提高了设计图表的效率,还通过AI技术提升了图表的美观度和准确性。

  • Free AI Image Extender:使用人工智能扩展图像边界

    AI Image Extender 是一款利用人工智能技术扩展图像边界的工具,通过生成新内容与现有图像无缝融合,增强图像的视觉延展性。该产品通过先进的AI算法,能够智能识别图像内容并生成自然过渡的扩展区域,适用于需要图像扩展或背景生成的各种场景。

  • Capacities:一个为你的思维打造工作室的APP

    Capacities是一个旨在改善人们思考方式和工作流程的应用程序。它通过使用对象而非传统文件和文件夹来组织信息,帮助用户更直观地理解和连接复杂的信息结构。该应用支持网络化笔记,使用户能够自然地构建信息网络,激发新的创意。Capacities还提供AI助手,帮助用户与笔记中的对象动态互动,并提高写作质量。此外,该应用注重数据安全和隐私保护,符合GDPR标准,数据存储在欧盟的加密服务器上。

  • CLASI:高质量、类人同声传译系统

    CLASI是一个由字节跳动研究团队开发的高质量、类人同声传译系统。它通过新颖的数据驱动读写策略平衡翻译质量和延迟,采用多模态检索模块来增强特定领域术语的翻译,利用大型语言模型(LLMs)生成容错翻译,考虑输入音频、历史上下文和检索信息。在真实世界场景中,CLASI在中英和英中翻译方向上分别达到了81.3%和78.0%的有效信息比例(VIP),远超其他系统。

  • image-matting:AI抠图项目,使用开源模型实现图像抠图。

    image-matting 是一个基于开源模型 briaai/RMBG-1.4 的AI抠图项目。该项目旨在通过学习AI技术、GUI开发、前端学习以及i18n国际化等技术,实现本地模型算法的图像抠图功能。它支持单张和批量抠图,用户可以通过拖拽和粘贴的方式快速进行图像处理。项目还提供了打包后的运行文件下载链接,方便用户使用。

  • OnlyPans:AI定制周晚餐计划

    OnlyPans是一个利用人工智能技术为用户提供定制化晚餐计划的应用程序。它通过与用户的简短聊天来了解用户的预算、口味偏好、语言习惯、饮食限制以及日常生活的忙碌程度,然后快速生成符合用户需求的晚餐计划。随着用户使用时间的增长,OnlyPans会不断学习和优化,提供更加个性化的服务。此外,OnlyPans还提供智能购物清单功能,帮助用户避免食品浪费和不必要的紧急购物。OnlyPans注重用户隐私保护,承诺不会出售用户的任何信息。

今日大家都在搜的词: