AI视野：OpenAI员工集体辞职逼宫董事会；Runway正式发布运动画笔功能；animatediff-webui即将开源；北大开源Video-LLaVA大模型

2023-11-21 15:08 · 稿源：站长之家

📰🤖📢AI新鲜事

超过500名OpenAI员工集体辞职逼宫董事会

OpenAI数百名员工集体威胁辞职，指责董事会解职Altman处理不当，要求董事会辞职，或将跟随Altman加入微软。

【AiBase提要:】
😠 超过500名员工批评OpenAI董事会解职Altman不当，缺乏有效监督，威胁集体辞职。
🤝 员工信中警告，除非董事会辞职并重新任命Altman和前总裁Brockman，否则将跟随Altman加入微软。
💔 内部分歧凸显，Altman忠实追随者威胁辞职，微软保证OpenAI员工职位。

Runway正式发布运动画笔和Gen-2风格预设

Runway近日发布了一系列新功能和更新，其中包括运动画笔（Motion Brush）、Gen-2风格预设、更新的相机控制以及图像模型的改进。这些更新目前已正式上线，对所有用户开放使用。

【AiBase提要:】
🚀 创新工具发布: Runway推出运动画笔和Gen-2风格预设，为用户提供可控制的新视频生成方式。
💡 视频生成游戏规则改变: 行业专家表示，Gen-2的发布将彻底改变视频生成的游戏规则，运动画笔的加入省去了繁琐的编辑流程，提高了创作效率。
🌐 行业变革引领者: Runway在技术创新和用户体验方面展现卓越能力，发布的新功能不仅是技术突破，也是对用户体验的全面升级。

Discord宣布将于12月1日起关闭其人工智能聊天机器人Clyde

Discord宣布关闭实验性人工智能聊天机器人Clyde，原计划将其作为聊天和社区应用的基本部分，但具体原因尚未明确。

【AiBase提要:】
🤖 Clyde停用计划: Discord将于12月1日停用实验性人工智能聊天机器人Clyde，用户将无法在私聊、群聊或服务器中调用。
🔍 AI聊天机器人实验: Clyde是Discord的实验项目，使用OpenAI的模型进行测试，但具体停止服务原因未明确。
🚀 Discord的AI发展: Discord除了Clyde外，仍在尝试各种AI功能，包括生成会话摘要的AI，并努力将平台定位为AI开发者的家园。

微软调整AI图像生成工具以应对迪士尼版权问题

微软为防止迪士尼标志侵权，调整人工智能图像生成工具，禁止输入「迪士尼」，引发知识产权争议。

【AiBase提要:】
🚫 微软采取行动，阻止「迪士尼」输入到图像生成器，回应社交媒体趋势，避免侵犯迪士尼版权。
⚖️ 知识产权法律公司表示，复制迪士尼标志可能侵犯商标权，引发对 AI 处理标志的担忧。
🌐 存在疑问:迪士尼内容是否用于训练 AI 程序?微软调整政策，显示迪士尼文本和标志为混乱状态。

DeepMind推出OPRO技术，优化ChatGPT提示

Google DeepMind最新推出的OPRO技术利用大型语言模型（LLM）作为优化器，通过自然语言描述问题指导LLM生成和改进，特别适用于梯度难以获取的提示优化问题。该技术已在线性回归和数学优化问题上测试，展示了在优化LLM如ChatGPT和PaLM上的潜在效果。

【AiBase提要:】
🧠 OPRO是由Google DeepMind开发的技术，利用LLM作为自身提示的优化器，通过自然语言描述问题指导生成和改进，解决梯度难以获取的提示优化问题。
🔄 OPRO通过在元提示中包含任务的自然语言描述和示例，以自然语言方式解决问题，评估候选解决方案的结果，循环迭代直到找到最佳提示，可在数学优化问题上应用。
🌐 DeepMind测试了OPRO在线性回归和“旅行推销员问题”等数学问题上，展示了其在优化LLM如ChatGPT和PaLM上的潜在效果。

亚马逊推出全新免费AI培训课程

亚马逊宣布推出“AI Ready”计划，旨在到2025年免费培训全球200万人Generative AI职业所需技能，包含在线课程、奖学金计划和与Code.org的合作。

【AiBase提要:】
🎓 全球培训计划: 亚马逊计划通过"AI Ready"到2025年为200万人提供生成式AI职业所需技能的免费培训。
💻 免费课程与奖学金: 提供专业人士和初学者的免费Generative AI培训课程，以及面向高中和大学学生的奖学金计划。
💰 投资Udacity奖学金: 亚马逊将投资1200万美元提供5万个Udacity奖学金，支持全球高中和大学学生获取Generative AI技能，同时与Code.org合作在计算机科学教育周推出“Hour of Code”活动。

密歇根州议会采用新的 AI 技术来检测枪支

密歇根州议会将在议会大楼安装名为ZeroEyes的人工智能技术，通过分析监控录像识别枪支，提供额外安全保障。一旦有人在摄像头前拿出枪支，警报将发送到监控中心，由分析师进行审查和发送警报。

【AiBase提要:】
🔍 密歇根州议会引入ZeroEyes人工智能技术，通过监控录像识别枪支，增强议会安全。
🔍 技术特点在于只识别枪支本身，无论携带者身份，提供全面安全警报服务。
🔍 安装该技术是为应对过去几年发生的枪支进入议会大楼事件，以进一步确保公共安全。

OnePlus为用户推出人工智能驱动的音乐创作平台

一加最新推出人工智能音乐创作平台，为用户提供创意空间，标志着其从智能手机制造商转型为创新科技领域领导者。

【AiBase提要:】
🎵 创新平台推出: 一加公司推出人工智能音乐创作平台，扩展服务范围，让用户通过简单界面借助人工智能技术轻松创作个性化音乐作品。
🛠️ 强大功能支持: 新平台提供智能合成、音频处理和编曲功能，使非专业用户能轻松制作高质量音乐，同时提供丰富音频素材库。
🌐 创造力无限空间: 一加创始人表示，通过引入人工智能音乐创作平台，公司致力于让创造力成为每个人都能享受的体验，不仅局限于专业音乐人。

长虹推出基于大模型的智慧家电 AI 平台“长虹云帆”

长虹云帆是全球首个基于大模型的智慧家电AI平台，通过生成式人工智能应用于电视终端，实现电视的智能化和智能家居的全新阶段。

【AiBase提要:】
🌐 长虹云帆是全球首个大模型智慧家电AI平台。
💡 云帆具备简单易用、多维感知、多任务管理等五大能力，满足个性化需求。
📺 云帆已应用于长虹的8K系列、ARTIST星箔系列和288Hz超羽速系列电视。

🤖📱💼AI应用

vivo千询AI助手开放下载基于蓝心大模型打造

vivo在开发者大会上发布了“蓝心千询”机器人，基于蓝心大模型，可向所有手机品牌开放使用，支持自然语言对话、知识回答、文学创作、图片生成、程序编写，并提供AI灵感功能。

微信截图_20231120174804.png

【AiBase提要:】
🤖 开放使用: vivo发布基于蓝心大模型的“蓝心千询”机器人，向所有手机品牌开放下载和使用。
🔍 多功能应用: 该机器人支持自然语言对话、知识回答、文学创作、图片生成、程序编写等多项功能。
✨ AI灵感功能: “蓝心千询”具备AI灵感功能，为用户提供社交媒体文案创作、PPT大纲、中英互译、生活妙招等创作灵感。

WhatsApp推出Llama2驱动的AI聊天机器人测试版

在追求提升用户体验的过程中，WhatsApp正测试推出Llama2驱动的人工智能聊天机器人，为用户带来更便捷的通讯体验。Meta公司采用先进的Llama2语言模型，与Microsoft Bing合作，为其AI聊天机器人做最后的完善工作。最新的WhatsApp测试版中出现了一个新的快捷方式，使用户能够通过AI聊天机器人执行各项任务。

【AiBase提要:】
🚀 AI技术支持: WhatsApp测试Llama2驱动的AI聊天机器人，提升通讯体验。
🌐 Meta与Microsoft合作: Meta公司采用Llama2语言模型，与Microsoft Bing合作完善AI聊天机器人。
⚙️ 便捷操作方式: WhatsApp测试版中新增快捷方式，用户可通过AI聊天机器人执行任务。

Powder利用AI为游戏主播自动剪辑

法国初创公司Powder最近发布了一款基于人工智能的视频剪辑工具，通过训练40多个游戏专用的AI模型，能够自动检测游戏直播中的重要时刻，如取胜、击杀，大大简化游戏主播的后期编辑工作。

QQ截图20231121093639.jpg

【AiBase提要:】
🎮 AI自动剪辑: Powder利用AI训练了40多个游戏专用的模型，能自动提取游戏直播中的精彩片段，减轻主播后期编辑负担。
🔊 音频分析与功能扩展: 除了检测取胜、击杀等瞬间，Powder计划增加检测主播尖叫的功能，并推出语音转文字技术，提供更多剪辑可能性。
⏰ 剪辑时间大幅减少: Powder声称其AI助手每周可为游戏主播节省多达10小时的剪辑时间，成为内容创作者的“圣杯”。

👨‍💻💡🎯聚焦开发者

gpt crawler:从URL爬取网站生成结构化知识，创建定制GPT

gpt crawler是一强大工具，能全面爬取网站内容，生成结构化知识，为定制GPT提供支持。用户可通过灵活配置爬虫、定制化知识文件生成，轻松上传至OpenAI，支持Docker容器化执行，促进个性化ChatGPT开发。

项目地址:https://github.com/BuilderIO/gpt-crawler

【AiBase提要:】
🌐 灵活配置爬虫: 用户可通过编辑config.ts文件自定义爬虫，适应不同网站结构和需求。
🧠 定制化知识文件生成: gpt-crawler生成包含知识数据的文件，为用户提供定制GPT的基础知识。
🚀 轻松上传到OpenAI: 生成的知识文件可方便上传至OpenAI，用于创建自定义GPT或助手。

animatediff-webui即将开源简化配置，提升易用性

animatediff-webui即将开源，基于animatediff-cli-prompt-travel，旨在简化配置，提升用户体验，提供更细致、灵活的关键词控制，成为简单而功能强大的动画生成工具。

【AiBase提要】:
🚀 创新工程开源: animatediff-webui基于animatediff-cli-prompt-travel，致力于简化繁琐配置，提高用户体验。
🎨 灵活关键词控制: 新一代animatediff-webui通过controlnet和提示词信息，实现更细致、灵活的关键词控制，不再局限于全画面的应用。
🤖 易用性与灵活性兼顾: animatediff-webui的开源不仅提高易用性，还注重提升生成视频的灵活性，满足用户个性化和定制化需求。

🤖📈💻💡大模型动态

Music ControlNet可精确控制音乐中的时间变化

Music ControlNet是基于扩散技术的音乐生成模型，通过多时变控制、扩散技术和部分指定控制，提供精准的音乐时间变化控制，在性能和灵活性上表现出色。

项目地址:https://musiccontrolnet.github.io/web/

【AiBase提要:】
🎶 多时变控制: Music ControlNet通过扩散技术实现对音乐谱图的条件生成，提供旋律、动态和节奏等多个时变控制，使创作者更精细操控音乐。
🌐 扩散技术优势: 采用扩散技术微调训练音频控制信息，提高生成音乐的质量和逼真度，相较于其他模型具备更短训练时间和更少参数。
🕒 部分指定控制新策略: 引入新策略，允许创作者在时间上部分指定控制，为音乐创作提供更大自由度和创造性。

北大开源Video-LLaVA大模型，搞笑视频笑点秒懂

AI视频大模型Video-LLaVA由北大团队开源，成功解决了视觉-语言理解中同时处理图像和视频的难题，实现笑点理解。模型在13个基准测试上表现出色，无需配对数据训练，且通过预先对齐视觉输入，提高了对视频问答任务的性能。

【AiBase提要】:
🎥 模型介绍: 北大团队开源Video-LLaVA大模型，通过对齐视觉输入，实现笑点理解，无需配对数据训练。
🤖 性能优越: 在13个基准测试上，Video-LLaVA在视频问答任务上超过了5.8%至18.6%。
🔗 开源资源: 详细信息和代码可在GitHub（https://github.com/PKU-YuanGroup/Video-LLaVA）获取。

（举报）

相关推荐
大家在看

关键词：

OpenAI

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
荐AI日报：Runway的Gen-3 Alpha正式开放使用；百度文心大模型4.0 Turbo限时免费；英伟达发布直播神器；爆火Character AI惨遭阉割

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、Runway的Gen-3Alpha所有人都能用了！尽管面临困难，CharacterAI仍然在用户中具有吸引力。

Runway
荐AI日报：对标GPT-4o！开源大模型Moshi登场；Google Pixel 9新增多个AI功能；ElevenLabs发布消音神器VOICE ISOLATOR

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、对标GPT-4o！任天堂将谨慎对待生成式人工智能的使用，依靠团队内部的创造力和经验。

Moshi
荐突发！Runway的Gen-3向所有人开放，媲美Sora！

7月2日凌晨，著名生成式AI平台Runway在官网宣布，其文生视频模型Gen-3Alpha向所有用户开放使用。上周日Runway只向部分用户提供了Gen-3的使用权限，「AIGC开放社区」也为大家解读了10个非常有代表性的视频案例。Runway的Gen-2以及其他产品仍然是免费的，并表示，Gen-3会提供运动画笔、相机控制、导演模式等高级功能，帮助用户制作更精良的视频。

Runway Gen-3
荐AI日报：性能超GPT-4o！Meta4050亿参数开源模型Llama3.1遭泄漏；Stability AI开源音频生成模型Stable Audio Open

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、震惊AI界！14、微软研究院推AI框架E5-V:用文本对的单模态训练简化多模态学习降低成本微软研究院与北京航空航天大学联合推出的E5-V框架通过单模态训练简化多模态学习，降低成本，在多个任务中展现出优异性能，代表了多模态学习的重大进步。

Llama3.1
荐开源=最强大模型！Llama3.1发布，405B超越闭源GPT-4o，扎克伯格：分水岭时刻

LIama3.1正式发布，登上大模型王座!在150多个基准测试集中，405B版本的表现追平甚至超越了现有SOTA模型GPT-4o和Claude3.5Sonnet。最强开源模型即最强模型。我希望你能加入我们的旅程，将人工智能的好处带给世界上的每个人。

Llama3.1
荐我测了12个小时的RunwayGen3，发现这就是AI视频的No.1

众多AI视频创作者翘首以盼的Runway的Gen3，终于面向部分超级合作者开放了。我的好基友@闲人一坤也是第一时间拿到了内测资格，我就直接把号要来了。

RunwayGen3
荐AI日报：Runway Gen 3可生成3D巨幅字幕效果；Google Vids 上线测试；百度网盘推宝宝AI长相预测；Luma AI推首尾帧视频生成

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、炸裂！MMTryon不仅可试穿单件服装支持组合换装，无需分割，通过文本指令即可实现高质量虚拟换装。

Runway
荐AI日报：百度文心4.0免费开放；AI lab开源超强多模态大模型；对标GPT-4o！商汤发布日日新5o

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、百度文心智能体平台免费开放文心4.0版本百度文心智能体平台最新推出的文心大模型4.0版本免费开放给公众使用，极大地扩展了平台的功能和应用范围。这一投资有望降低电影�

文心一言4.0
荐可灵通用！runway Gen-3发布保姆级教程深度解析文本提示词技巧

在AIGC领域，文本提示词的艺术至关重要。Runway的Gen-3Alpha模型的发布，带来了一场关于如何精准操控生成式AI的革命。添加有关环境的更多细节可能会对广角镜头大有裨益。

可灵 runway AI会员教程
荐力压70B Llama 3，Gemma 2成最强开源模型，大佬质疑用榜单prompt微调引全网热议

导读:时隔4个月上新的Gemma2模型在LMSYSChatbotArena的排行上，以27B的参数击败了许多更大规模的模型，甚至超过了70B的Llama-3-Instruct，成为开源模型的性能第一!谷歌出手，果然非同凡响。Gemma2上周刚刚发布，就在LMSYS竞技场上取得了亮眼的成绩。」看来在基准测试领域，重复的历史总在不断上演那个金句也总是适用——「当一个衡量标准成为目标时，它就不再是一个好的衡量标准了

Gemma2模型 LMSYS Chatbot

万彩商图:快速更换商品图片背景，提升商品展示效果。

万彩商图是一个在线设计工具，专注于帮助用户快速更换商品图片的背景，以提升商品的视觉效果和吸引力。它利用AI技术实现一键式操作，简化了传统图片编辑的复杂流程，使非专业用户也能轻松制作出专业的商品展示图。

AI作图图片编辑一键更换

AIEmoji:快速找到适合你情感的Emoji表情。

AIEmoji是一个基于人工智能技术的Emoji搜索网站，它允许用户通过自然语言描述来搜索和找到匹配的Emoji表情。这项技术简化了Emoji的搜索过程，提高了用户在社交、写作和其他需要表情符号的场合的效率和表达能力。

Emoji 自然语言处理表情搜索

Brev.ai:AI音乐生成器，几秒钟创作高质量音乐。

Brev.ai是一款利用人工智能技术，根据用户输入的文本描述快速生成独特音乐作品的在线音乐创作工具。它基于Suno V3.5技术，支持多种音乐风格和流派，适用于视频、播客、游戏配乐等多场景。Brev.ai的主要优点包括高效率、成本效益高、易于使用，以及能够提供高质量的音乐输出。

AI音乐生成文本转音乐在线音乐创作

知了zKnown:致力于信息降噪 / 阅读提效的个人知识助手

知了 zKnown 是一款 AI-Native 构建的个人知识助手，专注于信息降噪和阅读提效。它通过多端同步、多渠道总结、长文本支持等功能，帮助用户高效地管理和整理信息。产品的主要优点包括：- 多端同步：用户可以在移动app、桌面客户端、网页版、小程序等多个平台同步使用。- 多渠道总结：支持微信公众号、知乎、简书、36Kr、少数派等多个渠道的文章总结。- 长文本支持：最长支持总结3万字的文章内容。- 摘要导出：用户可以将摘要保存到 Notion、Flomo 等平台。- 产品背景：知了 zKnown 致力于通过 AI 技术提升用户的阅读和信息管理效率，适合需要高效处理大量信息的用户。

信息管理阅读提效 AI助手

MBox AI Meet:实时转录与会议总结的谷歌会议扩展

MBox AI Meet是一款免费Chrome扩展，专为Google Meet设计，提供实时转录和自动生成会议总结的功能。它利用AI技术帮助用户在会议中专注于讨论，而无需担心记笔记。该工具通过实时转录捕捉会议的每一个细节，并在会议结束后自动生成总结，确保用户不会错过任何重要信息。MBox AI Meet的隐私优先策略确保会议安全，不存储任何音频或视频内容。此外，该扩展还计划在未来更新中增加更多AI功能，如发言人识别、实时AI助手等。

AI 会议管理实时转录

Klee:本地安全AI，保障数据隐私。

Klee是一款macOS原生的AI助手应用程序，专注于本地处理数据，确保数据安全和隐私。它使用先进的AI技术，如RAG（检索增强生成）和开源大型语言模型，如Llama 3和Mistral，为用户提供高效、智能的笔记、搜索和知识管理功能。Klee的主要优点包括本地运行以保护隐私、支持团队协作、免费使用以及优化的macOS体验。

AI助手 macOS原生数据隐私

Kipps.AI:快速构建AI助手，提升业务效率

Kipps.AI 是一个在线平台，允许用户在短短两分钟内构建自己的AI助手，并将其集成到业务中。该平台支持多种数据源，如PDF、Notion、网站链接和文本，用户只需提供这些数据，Kipps.AI 会处理其余部分。它还与常用的工具如GoDaddy、Wordpress、Drupal、Squarespace、Magento和Wix等进行集成，使得用户可以轻松地将AI助手集成到现有的业务流程中。

AI助手自动化数据处理

CrossPrism for MacOS:图像识别、标注和关键词生成工具

CrossPrism for MacOS 是一款专为摄影师设计的图像识别、标注和关键词生成工具。它利用多核 CPU、GPU 和神经引擎，能够识别物种、生成标题和描述，并支持模型训练的可定制性。用户可以在本地自动标注无限量的原始照片，确保所有照片安全地存储在 Mac 上，无需担心云服务中断、数据锁定或文件传输问题。其20多个专家模型可以对从鸟类到地标的各种内容进行分类，并提供新的视角来整理目录和重新发现旧照片。此外，它还支持视频处理、Lightroom 插件、图像质量评估等功能，使其成为一个强大的筛选工具。

AI视野：OpenAI员工集体辞职逼宫董事会；Runway正式发布运动画笔功能；animatediff-webui即将开源；北大开源Video-LLaVA大模型

今日大家都在搜的词：

热文

站长商机