首页 > 原创 > 关键词  > OpenAI最新资讯  > 正文

AI日报:OpenAI全量上线视频聊天功能;Anthropic最快模型Claude 3.5 Haiku全面开放;巨人网络推游戏大模型千影 QianYing

2024-12-13 15:28 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、OpenAI 推出屏幕共享视频聊天功能,ChatGPT整了个“圣诞老人模式”

OpenAI最近在其高级语音模式中新增了视频聊天和屏幕共享功能,允许用户在移动应用中与ChatGPT进行实时互动。此功能目前对ChatGPT Teams、Plus和Pro用户开放,预计明年1月将扩展至企业版和教育版用户。虽然欧盟及部分国家的用户无法使用,但新功能的推出标志着ChatGPT在交互性和实用性上的重大进步。

image.png

【AiBase提要:】

🎥 新增视频聊天功能,ChatGPT可实时响应用户所见内容。

🖥️ 屏幕共享功能上线,用户可在手机上请求ChatGPT提供帮助。

🎅 “圣诞老人模式”上线,用户可以与模仿圣诞老人声音的ChatGPT互动。

2、给力!Anthropic最快模型Claude3.5Haiku现已全面开放

Anthropic公司发布了其最新的Claude3.5Haiku模型,现已向所有用户开放。该模型因其高效性和出色的基准测试表现受到广泛关注,特别适合实时任务和大数据集处理。尽管存在一些功能限制,如不支持网页浏览和图像生成,但其在聊天机器人上的多功能性和与Claude Artifacts的集成提升了用户体验。

image.png

【AiBase提要:】

🌟 Claude3.5Haiku现已全面开放,支持图片和文件分析功能。

💰 免费版本受消息限额限制,用户可选择20美元的Claude Pro订阅以获得更多权限。

📈 该模型在多项基准测试中表现优异,适合实时任务和大数据集处理。

3、上海AI实验室推大模型“指纹识别”方法REEF,打击“套壳”行为

在AI时代,保护大型语言模型(LLM)的知识产权显得尤为重要。上海人工智能实验室提出的REEF方法,通过特征表示进行模型指纹识别,能够有效识别“套壳”模型,而不影响模型性能。REEF的鲁棒性和理论保证使其在面对各种微调和改造时依然有效,为打击未经授权使用提供了新的手段。

image.png

【AiBase提要:】

🔍 REEF是一种基于特征表示的模型指纹识别方法,不依赖特定层的表示,具有较强的鲁棒性。

💡 该方法通过比较模型在相同样本上的特征表示的中心核对齐(CKA)相似度,识别潜在的“套壳”模型。

📈 实验结果显示,REEF在识别“套壳”模型方面优于现有方法,为保护LLM知识产权提供了新的工具。

详情链接:https://arxiv.org/pdf/2410.14273

4、Runway Act one平替!HelloMeme让表情包视频制作更轻松!

HelloMeme是一款创新工具,旨在简化表情包视频的制作过程。它通过优化注意力机制,使模型能够更精准地捕捉表情和动作细节。HelloMeme的三大组成部分协同工作,提升了视频的生动性和清晰度,同时保持了与SD1.5模型的兼容性。

image.png

【AiBase提要:】

🎥 HelloMeme通过优化注意力机制,增强了表情包视频的制作能力,简化了过程。

🤖 它由HMReferenceNet、HMControlNet和HMDenoisingNet三部分组成,协同工作生成高质量视频。

💡 HelloMeme与SD1.5模型兼容,保留原模型功能的同时赋予新能力,提升视频质量。

详情链接:https://songkey.github.io/hellomeme/

5、Meta推出全新水印工具Video Seal 打击AI生成深度伪造视频!

Meta公司推出的Meta Video Seal工具,旨在为AI生成的视频添加几乎不可察觉的水印,以应对深度伪造技术带来的挑战。该工具不仅开源,还能与现有软件无缝集成,增强视频的原创性保护。

【AiBase提要:】

🔍 Meta推出的Meta Video Seal工具可以为AI生成的视频添加水印,抵抗编辑和压缩。

📊 该工具已开源,旨在与现有软件集成,并希望推动行业内的水印技术发展。

🏆 Meta还将推出公开排行榜以比较不同水印方法,促进行业合作与交流。

6、OpenAI CFO透露:新一代 AI 模型开发将耗资数十亿,成本激增!

OpenAI首席财务官在纽约透露,未来构建更高级的人工智能模型的费用将持续大幅增长,预计达到数十亿美元。这一趋势反映了技术进步与市场需求的双重压力,促使公司加大对AI技术的投资。

【AiBase提要:】

💰 OpenAI预计新一代AI模型开发费用将持续激增,达到数十亿美元。

📈 公司正在加大对先进AI系统的投资,未来服务价格可能会上涨。

🎥 新推出的AI视频生成器Sora引发积极反响,为内容创作者提供更多可能性。

7、谷歌、三星联手“掀桌”!全新混合现实头显、AI眼镜曝光,剑指苹果 Vision Pro

谷歌与三星联合推出的新一代混合现实头显和智能AI眼镜,充分展示了在混合现实领域的雄心。这两款设备不仅硬件升级显著,还深度整合了谷歌最新的Gemini AI模型,具备理解用户意图和长期记忆能力,提供个性化服务。支持多种自然交互方式,使用户体验更为流畅。

image.png

【AiBase提要:】

🛠️ 新设备支持VR和AR功能,深度应用AI技术,提供个性化服务。

🗣️ 创新交互方式,支持手势、语音和眼动,提升用户体验。

📱 基于Android XR操作系统,现有应用无缝适配,降低开发者门槛。

详情链接:https://android-developers.googleblog.com/2024/12/introducing-android-xr-sdk-developer-preview.html

8、谷歌“王牌” TPU Trillium 开放使用!性能暴涨,AI 模型训练效率再创新高

谷歌最新发布的Trillium TPU现已面向Google Cloud客户开放,其显著提升的性能和效率为AI模型训练带来了新的突破。通过优化的硬件和软件架构,Trillium TPU在训练和推理性能上均实现了显著提升,极大地推动了AI解决方案的开发与应用。

image.png

【AiBase提要:】

⚡ Trillium TPU的训练性能提高4倍,推理吞吐量提高3倍,能源效率提升67%。

💡 Trillium TPU支持大规模AI训练,能够有效分配工作负载,显著加快训练速度。

💰 每美元训练性能提高2.5倍,推理性能提高1.4倍,提供了卓越的性价比。

详情链接:https://cloud.google.com/blog/products/compute/trillium-tpu-is-ga

9、Twelve Labs 正在开发能够分析和搜索视频的人工智能

在数字媒体时代,视频内容的增长速度令人瞩目,但传统的搜索和分析方法却无法满足需求。十二实验室通过人工智能技术,彻底改变了视频理解的方式,能够深入分析视频中的动作、物体和声音,提供更精准的搜索能力。

image.png

【AiBase提要:】

🔍 十二实验室的AI模型能够深入理解视频内容,超越传统的关键词搜索。

🤖 该公司专注于视频理解,提供定制化的视频分析工具,适用于多种场景。

🌍 十二实验室在技术创新的同时,注重伦理,确保AI模型的公正性和包容性。

10、xAI与OpenAI薪资对比:马斯克与奥特曼的人才争夺战

随着人工智能行业的快速发展,xAI与OpenAI之间的人才竞争愈演愈烈。马斯克指控OpenAI通过高薪吸引人才,导致竞争对手面临困境。分析显示,OpenAI在薪资上明显高于行业标准,而xAI的薪酬也具竞争力。【AiBase提要:】

💰 xAI与OpenAI在薪资上的差距显著,OpenAI的薪资超出行业标准87%。

👥 马斯克与奥特曼之间的竞争加剧,xAI已招聘多名前OpenAI员工。

⚖️ 马斯克指控OpenAI反竞争行为,双方在人才争夺中斗智斗勇。

11、OpenAI前算法负责人创立新公司,进军智能陪伴机器人领域

据媒体报道,OpenAI的前资深算法负责人江旭成立新公司“亮源新创”,专注于具身智能陪伴机器人的研发。作为GPT-4的重要贡献者,江旭在OpenAI的职业生涯中参与了多个关键项目,并于2023年离职后成立了该公司。

【AiBase提要:】

🤝 亮源新创专注于具身智能陪伴机器人的研发,旨在提升用户的生活质量。

🌍 公司在深圳和新加坡设有办公室,正在积极招聘人才以推动项目进展。

🧠 亮源新创的机器人将具备感知、学习及与环境交互的能力,适用于多个领域。

12.巨人网络发布 “千影 QianYing” 有声游戏生成大模型

巨人网络在2024年度中国游戏产业年会上发布了 “千影 QianYing” 有声游戏生成大模型,包含 YingGame 和 YingSound 两个核心模型,展示了通过文字描述生成游戏内容的能力。该模型仍在技术打磨中,同时启动了 “千影共创计划”,旨在促进 “游戏 + AI” 领域的发展。

【AiBase 提要:】

🎮 巨人网络发布 “千影 QianYing” 有声游戏生成大模型,推进游戏与 AI 结合。

🔊 模型包含 YingGame 和 YingSound,支持有声可交互游戏视频生成。

🤝 启动 “千影共创计划”,加速游戏创作的技术应用与合作。

举报

  • 相关推荐
  • 刚刚,OpenAI通用智能体ChatGPT Agent正式登场

    ​Agent AI 时代,比我们想象中来得要早一些。 北京时间周五凌晨,OpenAI 突然开启了新产品直播。 本次发布的是全新的 ChatGPT Agent,它实现了通用智能体(Agent)能力的关键升级。

  • OpenAI发布ChatGPT Agent智能体:支持写代码、做PPT、分析金融

    OpenAI推出ChatGPT智能体,整合网页交互、数据搜索与多模态协作功能,可完成代码生成、PPT制作、金融分析等复杂任务。该智能体融合Operator的网页自动化操作、Deep Research的数据分析能力及优化后的GPT-4对话引擎三大核心模块。目前面向付费用户开放,Pro版近乎无限使用,其他版本每月限50次任务。OpenAI承认其仍存在金融建模需人工验证、非英语文本解析准确率低等技术局限,并

  • A日报:Kimi开放平台上线Kimi Playground;OpenAI重磅发布ChatGPT Agent;Suno推人声替换功能

    【AI日报】汇总了近期AI领域重要进展:1)月之暗面推出Kimi Playground平台,实现从对话助手到智能助理的转变;2)OpenAI发布ChatGPT Agent,支持自主执行浏览、购物等任务;3)Suno发布v4.5+版本,新增人声替换等音乐创作功能;4)谷歌Veo3视频生成模型上线,支持文本转视频;5)全球首个直播流扩散模型MirageLSD发布,实现实时视频转换;6)VSCode编程助手Traycer提升大型代码库处理效率;7)ART框架支持Python一键训练AI Agent;8)NVIDIA语音识别模型Canary-Qwen-2.5B词错率创新低;9)Mistral AI推出Le Chat挑战ChatGPT;10)百度小度上线首个支持物理交互的MCP Server;11)Lightricks的LTXV模型实现60秒高质量视频生成;12)开源模型LTX-Video13B支持30倍速高清视频生成。

  • AI日报:12306 MCP Server上线;百度推AI搜索助手Tizzy.ai;ChatGPT录音模式面向Plus用户开放

    【AI日报】今日AI领域重要动态:1)百度推出无广告智能搜索助手Tizzy.ai,整合影视资源与深度思考功能;2)12306开源火车票查询引擎上线,采用FastAPI架构实现秒级响应;3)ChatGPT向Plus用户全面开放录音功能,支持实时记录与内容总结;4)开源SaaS模板FireGEO助力快速构建现代化Web应用;5)国产工具ReadMeX可一键生成高质量GitHub文档;6)百度AI助手新增视频通话功能,支持方言识别;7)Jacky

  • ChatGPT们重塑了对话框,钉钉今天要重塑表格

    ​自从1979年,丹·布里克林(Dan Bricklin)和鲍勃·弗兰克斯顿(Bob Frankston)在苹果当时划时代的 Apple II 电脑上做出了第一张可以自动计算和更新的电子表格 VisiCalc 后,表格就成为了计算机用数据方式理解人类世界的基座。不过,在更多的时候,没人这样讨论它。横横竖竖几个格子,表格无处不在,它看起来太普通了。 然而计算机诸多繁荣的根基,都建立在一张张表格之上,无�

  • 手机eSIM开放前兆!vivo WATCH 5全面恢复移动/联通eSIM

    种种迹象表明,国内的eSIM真要开放了。 前不久,OPPO Watch X2系列中国移动eSIM一号双终端业务正式上线,现在vivo也来了。 vivo官微今天发文宣布,vivo WATCH 5 eSIM版已全面恢复开通移动eSIM一号双终端,联通eSIM一号双终端、独立终端。

  • 不止霸榜618!灵宇宙WAIC首秀新功能:拍玩具“活”过来,这才是AI万物有灵

    灵宇宙AI学伴小方机在2025世界人工智能大会(WAIC)上展示创新成果。这款专为3-15岁儿童设计的智能终端,凭借多模态交互方案成为展会人气产品。其核心亮点包括:1. "魔法唤醒学院"新功能,让玩具化身可对话角色,实现虚实融合;2. 内置一键通话和实时定位功能,解决家长安全焦虑;3. 基于哈佛Project Zero思维模型,通过"观察-提问-推理-拓展"引导孩子系统化学习。产品采用轻量化设计,整合火山、商汤等AI技术,支持图像识别、语音交互和角色扮演。区别于传统教育硬件,它通过LingOS系统实现"万物有灵"的沉浸式体验,让物理世界中的物体都能与孩子互动。创始人顾嘉唯表示,这不仅是学习工具,更是孩子的第一个AI伙伴,代表下一代智能终端的演进方向。

  • 七牛云上线Agent和MCP托管服务

    七牛云AI大模型推理平台推出Agent与MCP托管服务,通过标准化接口实现LLM与多工具协同。MCP协议统一了应用程序与云端服务调用方式,LLM+MCP成为AI Agent生态核心。平台提供一站式模型推理和工具调用服务,支持复杂Agent应用开发,具备三大优势:1)统一接入管理多种工具和模型;2)集中托管敏感密钥确保安全;3)简化本地环境配置。开发者可通过Token API直接调用托管MCP工具,或使用SSE协议接入外部工具。典型应用场景包括:聚合多工具调用、灵活编排服务、安全密钥管理等。该服务显著降低AI应用开发门槛,加速智能化应用构建。

  • Matrixport CEO John 出席 Foresight 2024 年度峰会,表示Matrixport将持续拥抱合规,提供专业资管服务

    Matrixport CEO John Ge在"Foresight2024"峰会上表示,合规化是加密行业主旋律。他指出当前加密市场缺乏新流量入场,资产管理趋向主流资产集中化,BTC、ETH等占比很高。随着加密ETF通过,合规属性增强,跨圈资管开始复苏。Matrixport将持续拥抱合规,为更多用户提供专业资管服务,帮助用户获取理性收益。公司成立于2019年,是亚洲最大的一站式加密金融服务平台,致力于构建�

  • AI日报:扣子空间网页设计功能上线;阿里Wan 2.2即将上线;​OpenAI即将发布 GPT-5

    【AI日报】今日AI领域重要动态:1)Coze推出网页AI设计功能,5分钟生成网页;2)通义千问发布Qwen-MT翻译模型,支持92种语言;3)ChatGPT全面推出Agent功能;4)阿里云Wan2.2视频生成AI即将上线;5)Anthropic推出审计Agent提升AI对齐测试;6)OpenAI计划8月发布GPT-5;7)谷歌发布无代码AI应用开发工具Opal;8)南洋理工与上海AI Lab推出PhysX-3D项目,为3D模型添加物理属性;9)快手开源KAT-V1大模型,40B版本性能接近DeepSeek-R1;10)讯飞星火X1升级版上线,在多语言和语音处理方面显著提升。(140字)