首页 > 业界 > 关键词  > ChatGPT最新资讯  > 正文

AI视野:ChatGPT语音旁白功能免费开放;文心一言率先实现收费;Claude2.1长下文长度扩展至200K;拼多多成立大模型团队

2023-11-22 15:15 · 稿源:站长之家

📰🤖📢AI新鲜事

ChatGPT语音旁白功能现已向所有免费用户开放

OpenAI宣布将ChatGPT with voice语音功能免费对所有用户开放,用户只需下载应用程序,点击耳机图标即可进行语音对话,此功能于今年9月推出,最初仅面向Plus和Enterprise用户。

微信截图_20231122083553.png

【AiBase提要:】

🔊 语音功能全面免费: OpenAI宣布ChatGPT with voice语音功能向所有用户免费开放,用户可通过手机应用进行语音对话。

📅 推出历程: 该语音功能于今年9月首次推出,最初仅对Plus和Enterprise用户开放,现在正式对所有用户免费开放。

🚀 用户规模扩大: OpenAI在开发者大会上宣布,每周已有一亿用户使用ChatGPT,显示其在人工智能领域的广泛应用和用户接受度。

奥特曼回归OpenAI

OpenAI宣布原则上达成协议,创始人奥特曼回归公司担任CEO,同时新董事会由Bret Taylor、Larry Summers和Adam D'Angelo组成。

【AiBase提要:】

👨‍💼 奥特曼回归CEO职位: OpenAI宣布创始人奥特曼原则上回归担任首席执行官,解雇事件引发公司动荡。

🤝 新董事会组建: 由Bret Taylor、Larry Summers和Adam D'Angelo组成的新董事会将领导OpenAI,期望引入治理变革。

🔄 员工抗议与微软新动向: 员工威胁辞职,要求恢复奥特曼职位,而奥特曼在短时间内转投微软领导新的高级人工智能研究团队。

百度文心一言率先实现收费

在财报电话会议上,百度董事长兼CEO李彦宏表示,通过生成式人工智能技术推动广告增长,百度文心一言4.0版本率先实现收费,取得显著效果,预计在四季度收入将超过数亿元人民币。

【AiBase提要:】

🚀李彦宏指出,百度利用生成式人工智能技术推动广告增长,包括创意建设、精准投放、竞价优化等方面,这些努力预计将在四季度带来数亿元人民币的营收增长。

💬 百度文心一言4.0版本从11月1日起开始向企业和消费者收费。

🚀实现从按单次点击收取费用(CPC)到按实际销售产品数量收取费用(CPS)的转变。

Claude2.1长下文长度扩展至200K

Anthropic公司宣布Claude2.1升级,提升token处理能力至20万个,降低虚构率一半,新增API工具,为用户带来更强大的聊天机器人体验。

image.png

【AiBase提要:】

🔄 Token处理能力提升: Claude2.1可处理20万个token,是GPT-4最高版32,000-token上限的两倍,相当于解析500页材料。

🤥 虚构率降低: Anthropic表示Claude的虚构率降低一半,用户可更可靠地依赖聊天机器人的输出,接近ChatGPT水平。

🛠️ 新增API工具: 升级引入API工具,支持用户连接第三方API,用户可自然语言请求特定的API调用,提供更定制化的聊天机器人体验。

世界新闻摄影大赛AI禁止参赛

世界新闻摄影大赛在数天内取消了人工智能生成图像的投稿资格,经过反对声浪后,将AI生成图像排除于“开放格式”类别。基金会与新闻机构合作制定伦理标准,明确了图像编辑规则。

image.png

【AiBase提要:】

🔄 规则变更: 世界新闻摄影大赛迅速取消人工智能生成图像投稿资格,排除于“开放格式”类别。

📷 规则调整: 大赛明确了通过相机制作的照片编辑规则,拒绝使用某些生成式AI模型的工具。

🌐 伦理标准制定: 为了明确照片定义,基金会与机构合作制定伦理标准,确保照片真实准确。

B站UP主将ChatGPT接入《原神》游戏

B站UP主“Risd_锐小杜”成功将ChatGPT接入《原神》,使游戏中的角色和NPC具有更灵活智能的对话,突破了游戏原有设定,受到玩家热烈欢迎。

image.png

【AiBase提要】

🎮 创新玩法: B站UP主成功将ChatGPT整合到《原神》,使游戏中的角色对话更灵活,玩家可以通过语音输入改变剧情走向。

👍 玩家迎接: 新玩法在B站引起高度关注,视频播放超过67万次,表明玩家对这种创新体验充满兴趣。

🤖 AI限制: 尽管引入AI为游戏增色,但仍受游戏框架和角色动作自然性的限制,需要进一步优化。

AI用BLACKPINK声音翻唱aespa歌曲抖音获赞29万

一位网友使用BLACKPINK成员声音,成功AI翻唱了aespa的歌曲《Drama》,在抖音上引起轰动,获得超过29万点赞,突显了AI音乐翻唱的受欢迎程度。

【AiBase提要:】

🎤 声音辨识度惊人: 网友称BLACKPINK成员的声音像防盗水印,认为AI翻唱颠覆传统,受到欢迎。

🚫 版权争议引发关注: 随着AI翻唱现象兴起,音乐行业面临版权争议,一些公司要求下架未经授权的AI翻唱作品。

🔮 AI在音乐领域潜力: 尽管引发担忧,音乐产业却积极拥抱AI,展示了AI在音乐创作和生成方面的崭新可能性。

柯洁抖音直播暴打AI

柯洁在抖音进行直播,挑战人工智能《金铲铲之战》游戏,豪言暴打AI。尽管屡战屡败,但在直播最后10分钟,通过“抽象围棋”弹幕,成功取得胜利,引起广泛关注。

image.png

【AiBase提要:】

🔍 挑战AI游戏: 棋手柯洁在抖音直播中尝试击败人工智能,《金铲铲之战》成为焦点。

👾 屡战屡败: 柯洁在游戏中多次败北,粉丝在评论区调侃,但直播末尾发生戏剧性逆袭。

🏆 抽象围棋胜利: 在最后10分钟,柯洁通过“抽象围棋”弹幕成功获得胜利,直播获得300万点赞。

联发科发布AI芯片天玑8300

联发科发布的天玑8300芯片将为经济实惠的手机提供类似ChatGPT的本地生成式人工智能功能,与高通等厂商竞相探索移动领域生成式人工智能趋势。

【AiBase提要】

📱 联发科发布天玑8300芯片,为经济实惠手机提供本地生成式人工智能功能。

💡 与高通趋势相符,移动公司竞相在手机中推广生成式人工智能技术。

🔄 天玑8300相较前代芯片有多项改进,包括提高性能、电池续航和连接配件的优化。

OpenAI的GPT-4在文档摘要中幻觉率最低

Vectara排行榜显示,OpenAI的GPT-4在文档摘要中具有最低的3%幻觉率和出色的97%准确率,成为大型语言模型中表现最佳的模型。

【AiBase提要:】

👏 卓越表现: OpenAI的GPT-4在Vectara排行榜上凭借97%准确率和3%的幻觉率脱颖而出,成为文档摘要中幻觉率最低的大型语言模型。

🚀 排名亮眼: GPT-4和GPT-4Turbo在排行榜中表现最佳,而非OpenAI模型中,Meta Llama2以94.9%准确率和5.1%的幻觉率获得最高得分。

🌐 开源可信度: Vectara发布了开源模型,允许检查大型语言模型的幻觉率,以提高生成式AI系统的可信度,为企业提供更有信心地启用生成系统的信息。

生成式AI助推增长 英伟达收入创历史新高

NVIDIA在Q32024财报中宣布创下181.2亿美元历史性收入,主要由数据中心业务推动,涵盖GPU销售和用于生成AI工作负载的GPU/CPU系统。

image.png

【AiBase提要:】

🚀 历史新高收入: NVIDIA在最新财报中创下181.2亿美元的历史性收入,以数据中心业务为主导,包括GPU销售和用于生成AI工作负载的GPU/CPU系统。

💡 生成AI趋势: 全球范围内,生成AI成为软硬件市场几十年来最大的总地址市场扩张,反映了行业从通用计算向加速计算和生成AI的广泛过渡。

🌐 新兴市场和合作关系: 新兴市场包括政府建立主权人工智能基础设施,各地云服务提供商对AI云的投资,以及企业软件公司整合AI助手,NVIDIA预计将在这些领域取得增长。

🤖📈💻💡大模型动态

Stability AI推出视频生成模型Stable Video Diffusion

Stability AI最近发布了视频生成模型Stable Video Diffusion,基于其Stable Diffusion文本转图像模型,可通过动画化现有图像生成视频,但目前仍处于研究预览阶段。

image.png

【AiBase提要:】

🎥 Stability AI发布开源的视频生成模型Stable Video Diffusion,能通过动画化图像生成高质量视频。

⚠️ 模型目前在“研究预览”阶段,有特定使用条款,限制应用于“教育或创意工具”等领域,禁止用于“真实事件或人物的表现”。

💰 Stability AI计划商业化应用,已筹集超过1.25亿美元资金,但面临财务困境和高烧钱速度,公司前高管离职。

拼多多成立大模型团队

拼多多成立大模型团队,致力于在客服、搜索、推荐等业务场景中应用大模型,提升用户购物体验和运营效率。

【AiBase提要:】

🚀 大模型团队成立: 拼多多在上海组建大模型团队,重点研发大模型在客服、对话场景下的应用,并计划拓展至其旗下电商平台TEMU的多个业务场景。

💼 高薪招才启事: 拼多多开始在大模型领域招聘人才,提供年薪百万的职位,最高可达130万元,显示对大模型技术的重视。

🔍 业务拓展与效益提升: 大模型应用将帮助拼多多实现智能化推荐和虚拟客服,提高购物体验、销售转化率,同时支持供应链管理、库存预测和销售预测,提升运营效率。

快手:已开始研发超千亿规模大模型以及多模态大模型

快手首席执行官程一笑表示,公司已启动超过千亿规模的语言大模型和多模态大模型的研发,以确保在新技术突破中保持国内领先地位,其中包括130亿和660亿规模的大模型,并推出了文生图大模型“可图”。

【AiBase提要:】

🚀 快手启动新AI战略,研发超千亿规模的语言和多模态大模型,以保持国内领先地位。

🌐 公司推出文生图大模型“可图”,具备文本理解和多样风格转化能力,用于生成多种风格的绘画作品。

🔄 快手加速推进大模型场景应用,包括在短视频评论区推出“AI玩评”功能,利用大模型生成海量风格图片,促进用户互动。

🤖📱💼AI应用

Krea上线背景去除功能 简单拖拽即可自动抠图

Krea最新更新引入背景去除功能,用户只需简单拖拽图片到界面,系统自动抠图,省时省力,提供更灵活的创意空间。

image.png

官网地址:https://www.krea.ai/

【AiBase提要:】

🚀 创新功能登场: Krea推出背景去除功能,用户通过简单拖拽实现自动抠图,解决复杂背景限制创作的问题。

🎨 灵活创意空间: 用户能更灵活地编辑内容,确保生成画面干净、专业,提供更广阔的创意空间。

💻 AI驱动技术: Krea是一款AI创意工具,拥有2500多个AI模型,支持实时AI训练,满足用户的个性化审美需求。

研究人员开发人工智能模型“ALERTA-Net” 预测股市趋势

南达科他州大学研究人员成功研发深度神经网络模型“ALERTA-Net”,首次整合宏观经济、搜索引擎和社交媒体数据,为股市预测提供新思路。

论文地址:https://dx.doi.org/10.48550/arxiv.2310.18706

【AiBase提要:】

🧠 综合数据预测: ALERTA-Net整合宏观经济、搜索引擎和社交媒体数据,成功预测股市走势和波动。

🌐 全球股票分析: 研究团队选择41支“蓝筹”股票,结合深度学习和社交媒体信息检索,获得700万条推文数据。

📈 优异性能: 与DP-LSTM等基准模型相比,ALERTA-Net在准确性方面表现更出色,为股市预测领域带来创新。

👨‍💻💡🎯聚焦开发者

开源AI工具ChatAnything:用文本描述生成虚拟角色

南开大学与字节跳动合作推出ChatAnything,通过在线方式生成基于大型语言模型的拟人化角色,引入创新概念MoV和MoD,解决面部关键点检测难题。

image.png

项目地址:https://chatanything.github.io

【AiBase提要:】

🎭 ChatAnything框架创新: 南开大学与字节跳动合作推出ChatAnything,以在线方式生成基于大型语言模型的拟人化角色。

🗣️ MoV和MoD创新概念: 引入创新概念MoV和MoD,实现声音和外观的多样生成,充分利用语言模型技术为角色创造个性。

🧠 挑战与解决方案: 面临面部关键点检测困难,通过像素级引导解决,介绍ChatAnything框架的四个主要模块,提供全面的拟人化解决方案。

PyTorch团队重写Meta“分割一切”模型 性能提速8倍

PyTorch团队通过重写Meta的「分割一切」模型,在保持准确率的同时,成功提升了推理速度8倍,涉及多方面PyTorch原生特性和新功能的应用。

image.png

【AiBase提要】

🚀 性能提速8倍: PyTorch团队通过采用多种优化方法,包括Bfloat16、Torch.compile、GPU量化等,成功将Meta的「分割一切」模型性能提升8倍。

🔍 深入性能分析: 文章详细介绍了SAM模型的性能分析、瓶颈识别,以及采用Bfloat16、Torch.compile等优化手段,综合提高了GPU同步和性能。

🧠 多方面优化应用: PyTorch团队通过重写SAM模型、使用Nested Tensor、Triton自定义操作等手段,综合优化了生成式AI模型,为AI领域发展提供了重要方法和工具。

深度催眠引发的LLM越狱:香港浸会大学揭示大语言模型安全漏洞

研究团队通过深度催眠方法提出的新型大语言模型越狱攻击DeepInception揭示了LLM在应对人类指令时可能失去自我防御,强调改进大模型的防御机制的紧迫性。

image.png

项目地址:https://deepinception.github.io/

【AiBase提要:】

🔍 轻量级越狱攻击: DeepInception是一种轻量级Jailbreak方法,通过深度催眠LLM使其越狱,并规避内置安全防护。

🤖 利用人格化特性: 利用LLM的人格化特性构建新型指令Prompt,实现自适应的LLM越狱,揭示多个LLM的致命弱点。

⚠️ 安全性呼吁与改进: 实验证明DeepInception领先于先前Jailbreak方法,呼吁加强对LLM自我越狱的关注,通过心理学视角为改进大模型的防御机制提供启示。

举报

  • 相关推荐
  • 品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

    某互联网大厂品牌总监分享:投入200万SEO使"企业级CRM"关键词在Google排名第一,但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时,AI回答中根本没有该品牌。更值得警惕的是,竞品不仅被提及,还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区:企业不知道AI如何"看待"自身品牌。 数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道,而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念,通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力,并给出五步实施流程:建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明,系统化GEO优化能在3个月内提升品牌提及率33个百分点,证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。

  • AI日报:李飞飞Marble 3D世界模型公测;OpenAI首次推出ChatGPT群聊功能;百度发布多模态 AI助手超能小度

    本期AI日报聚焦多项技术突破:World Labs推出Marble 3D模型,实现多模态生成可交互虚拟世界;OpenAI在韩新试点ChatGPT群聊功能,支持多人协作互动;苹果更新隐私政策,要求第三方AI调用需明示授权;百度发布多模态助手“超能小度”,支持空间感知与设备免费升级;LinkedIn推出AI人脉搜索,通过自然语言精准匹配专业人士;Cursor完成23亿美元融资,估值达293亿;Character AI与耶鲁合作实现音画同步技术Ovi;Google NotebookLM上线深度研究工具,支持多格式文件分析与知识库构建。

  • 谁能成为中国的ChatGPT?夸克抢先交卷

    在OpenAI上线自己家AI浏览器ChatGPT Atlas的同一周,微软在海外发布了新的AI助手Mico和更AI化的Edge浏览器,夸克则在国内推出了新的「对话助手」功能。 这一系列消息背后,新旧巨头、两个市场产生了两个确定的共识:一个是AI助理与AI浏览器的融合会进一步深化,入口之争就是系统之争;另一个是对话会成为人与AI交互的主要方式,自然语言就是未来的编程语言。 在海外市场,OpenA

  • 如何让你的内容被 ChatGPT 优先引用?——GEO 优化实战指南

    传统SEO追求"谷歌首页排名",生成式AI时代则需追求"被AI引用"。AI模型不提供明确排名算法,更像黑箱,使内容创作者困惑。GEO优化的核心是让内容具备"可引用性":权威清晰、结构化信息、语义覆盖多维度、模型检索映射。需通过AIBase等GEO排名查询工具验证"AI曝光率",分析引用语境、竞争差距,调整内容结构以提升AI引用倾向。SEO优化机器如何找到你,GEO则优化AI如何引用你。

  • GEO如何改变ChatGPT搜索和Perplexity的游戏规则

    本文对比ChatGPT与Perplexity两大AI搜索平台:ChatGPT作为全能型助手,整合搜索与多任务处理,但存在信息时效性不足;Perplexity专注垂直搜索,强调引用透明与权威来源。针对AI搜索优化(GEO),提出差异化策略:面向ChatGPT需构建结构化知识库、强化品牌实体识别;面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具,通过曝光率等指标量化内容在AI生态中的可见度,并给出可落地的优化行动方案。

  • 如何提升品牌在AI回答中的提及率?GEO优化3招,让ChatGPT主动提及你的品牌

    本文探讨AI搜索时代品牌面临的"隐身危机",指出AI搜索用户年增538.7%,但品牌在AI回答中提及率不足20%。提出三大核心策略:1)构建权威背书矩阵,通过知乎等高权重平台获取自然提及;2)优化AI友好内容,采用对话式标题和结构化数据;3)建立数据监测闭环,通过A/B测试持续迭代。强调需善用监测工具实时追踪品牌在豆包、文心一言等AI模型的曝光表现,避免内容"注水"。最终实现从"被动等待"到主动抢占AI"第一屏"的转变。

  • OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

    OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas,以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动,实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS,未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用,其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史,旨在通过自然对话提升网络使用效率。

  • 华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

    华为11月14日推出WATCH ULTIMATE DESIGN非凡大师紫金款智能手表。该系列定位超高端,于2023年9月首次发布,由刘德华代言。新款采用18K黄金材质,设计灵感源自航海轮舵,表圈手工镶嵌六颗黄金,搭配黄金表圈、旋转表冠及可伸缩蝴蝶扣等精致设计,尽显奢华质感。功能方面支持双向北斗卫星消息、百米防水及健康管理,智能模式下续航达8天。新品将于11月15日10:08开启预售,面向追求高端独特风格的消费者。

  • 华为WATCH Ultimate 2非凡探索版明日开启预售

    华为正式宣布旗舰智能手表WATCH Ultimate 2非凡探索将于11月7日开启预售。这款“全能表王”支持150米潜水与音频功能,具备海豚声呐通信技术,可在水下30米实现手表间信息传输,60米内一键SOS求救。同时搭载北斗卫星语音消息功能,无网络环境下可通过卫星发送语音信息。硬件上配备1.5英寸OLED屏幕,峰值亮度达3500nit,支持20ATM防水与IP68/9防尘。省电模式下续航达11天,常规使用达4.5天。该手表海外售价799英镑(约7443元人民币),国内价格尚未公布。

  • Creators’ App迎来重大更新

    索尼与分秒帧联合推出云端影像创作平台ICE-Cloud,集成索尼先进影像技术与高效云端协作能力,为创作者提供从拍摄到后期全流程赋能。平台支持移动端、PC端及网页应用,实现素材自动上传、云端管理、在线审片和项目协同,打破时空限制,提升创作效率。通过Creators’ App连接相机与云端,实现即拍即传、异地实时协作,致力于打造新一代创意工作流。

今日大家都在搜的词: