首页 > 业界 > 关键词  > ChatGPT最新资讯  > 正文

AI视野:自定义ChatGPT商店下周上线;小冰克隆人正式上线;美图大模型上线;普林斯顿大学提出GEO;英伟达发布文生图模型TrailBlazer

2024-01-05 15:37 · 稿源:站长之家

新鲜AI产品点击了解https://top.aibase.com/

📰🤖📢AI新鲜事

自定义ChatGPT商店下周上线

OpenAI宣布将上线自定义GPT商店,用户可以将自己开发的自定义ChatGPT助手进行分享的平台。这一商店的功能类似于苹果的App Store,在大模型领域提供了新的商业机会。

图片

【AiBase提要:】

💡 OpenAI将上线自定义GPT商店,用户可以将自己开发的自定义ChatGPT助手进行分享。

💡 用户可以通过可视化点击操作,快速开发特定领域的ChatGPT助手,并选择是否对外开放以获取付费收入。

💡 商店中的自定义GPT助手可以是私有模型,只与自己的同事或公司内部分享,也可以对全球用户开放。

小冰克隆人正式上线,有网红靠它年入破百万

小冰公司宣布将一系列测试产品转为正式发布,测试期间部分大V网红年收入已破百万。小冰克隆人通过小冰框架技术克隆创作者,具备创作者本人的性格、记忆、知识、声音与容貌。

【AiBase 提要】

💰小冰克隆人正式上线,允许创作者克隆自己,并向粉丝发布;

💰克隆人具备创作者本人的性格、记忆、知识、声音和容貌

👍小冰公司的数字员工产品已构建丰富的完整产品体系,数字互动名片和数字员工直播解决方案都已上线。

AI搜索引擎Perplexity再吸金5.28亿

Perplexity宣布完成B轮融资,筹得7360万美元,由IVP、NEA、NVIDIA、Jeff Bezos等多家知名投资机构参与,估值达5.2亿美元。

【AiBase提要:】

🚀 B轮融资完成: Perplexity完成B轮融资,筹得7360万美元,估值达5.2亿美元,由IVP、NEA、NVIDIA、Jeff Bezos等多家投资机构参与。

🔍 AI原生搜索服务: Perplexity提供人工智能搜索服务,具有即时、可靠的答案,并附带完整的来源和引用。

🌐 用户规模扩大: 过去一年,Perplexity获得了1000万的活跃用户,回答了超过50亿个查询,致力于解决信息泛滥和人工智能幻觉问题。

科学期刊将引入AI工具Proofig检测图片欺诈

科学期刊Science宣布采用商业软件Proofig,通过AI检测图像篡改,以预防科学研究中的欺诈行为。尽管被视为重要举措,但软件仍存在规避可能性,特别是对于了解其运作方式的欺诈者。科学研究中的图像篡改是一种常见的欺诈手段,而使用Proofig作为一种自动检测工具具有一定局限性。

【AiBase提要:】

🔍 自动检测图像篡改: Science期刊宣布采用商业软件Proofig,通过AI自动检测不当篡改的图像,防范科学研究中的欺诈行为。

🚨 软件局限性: 尽管Proofig能够捕捉一些严重的图像篡改案例,但对了解其运作方式的欺诈者仍有规避可能,且对于精心制作的欺诈图像可能无法防范。

🧪 科学研究欺诈挑战: 预防科学研究中的欺诈行为仍是一个复杂问题,对已发表可能存在问题的论文,期刊尚未公开其处理方式。

东京大学开发仿人机器人Alter3能执行ChatGPT指令

东京大学的Alter3仿人机器人成功与GPT-4连接,通过将书面指令转化为可执行代码,实现了机器人模仿各种人类行为,包括弹奏吉他、自拍、扮演角色等。这一实验为人机交互研究提供了新的方向,但也引发了一些伦理和道德问题的争议。

QQ截图20240105103104.png

项目地址:https://tnoinkwms.github.io/ALTER-LLM/

【AiBase提要:】

🤖 Alter3与GPT-4连接: 东京大学成功将仿人机器人Alter3与GPT-4连接,通过语言模型将书面指令转化为可执行代码,实现机器人模仿人类行为。

🎭 “哑剧游戏”实验: 实验被看作是一场现代化的“哑剧游戏”,语言模型在其中扮演关键角色,让机器人Alter3模仿各种人类动作。

🌐 人机交互研究新方向: 这项研究为人工智能领域带来新的可能性,但也引发了伦理和道德问题的争议,涉及机器人的自主性和行为对人类社会的潜在影响。

普林斯顿大学和艾伦科技研究所提出生成引擎优化GEO

为了帮助内容创作者更好地理解他们的内容在生成引擎中的表现,并提供了优化这些内容以提高其在生成引擎中可见性和有效性的策略,普林斯顿大学和艾伦科技研究所提出了GEO的概念:生成引擎优化。

【AiBase提要:】

🔸 GEO是一种针对生成引擎的印象度量标准,衡量内容在生成引擎回答中的可见性和有效性。

🔸 GEO的优化策略包括结构化内容、关键信息突出和增强语义相关性。

🔸 GEO引入了GEO-BENCH基准测试,用于评估和比较不同优化方法的效果。

🤖📈💻💡大模型动态

英伟达发布文生图模型TrailBlazer

TrailBlazer是基于预训练的T2V模型,通过引入边界框概念,实现对视频对象运动方向、速度和行为的可控性,无需使用现有视频或进行神经网络训练。支持多对象控制、关键帧动画设置,生成高效且自然的运动效果,为非专业用户提供了可行的视频叙事流程。

image.png

项目演示网址:https://top.aibase.com/tool/trailblazer

论文网址:arxiv.org/abs/2401.00896

【AiBase提要:】

🚀 TrailBlazer发布: 英伟达推出TrailBlazer,基于预训练的T2V模型,通过边界框实现文本到视频生成的可控性。

🔄 无需视频指导: 无需提供低级别的每帧指导,通过边界框控制视频对象运动方向、速度和行为,无需神经网络训练。

🎨 多对象控制与关键帧动画: 支持同时控制多个对象,通过关键帧设置定义对象的位置和动作,生成高效且自然的运动效果。

美图大模型上线

MiracleVision(奇想智能)正式上线,用户可在美图旗下产品和官网体验,同时,公司向行业客户开放模型能力,通过API、SDK、SaaS等形式助力多场景工作流。

【AiBase提要:】

🚀 MiracleVision上线: 美图公司推出自研AI视觉大模型MiracleVision,可在美图产品和官网体验。

🌐 用户体验功能: 用户可在美图秀秀和WHEE中尝试文生图、图生图、模型训练等多项功能。

💼 开放模型能力: 公司向行业客户全面开放MiracleVision的模型能力,通过API、SDK、SaaS助力企业降本增效。

谷歌多模态图像生成模型Instruct-Imagen 整合LLM和SD生态

Instruct-Imagen引入多模态指令,支持多种模态任务。模型能够更好地理解和执行任务。

image.png

论文地址:https://browse.arxiv.org/html/2401.01952v1

【AiBase提要:】

🧠谷歌Instruct-Imagen模型整合LLM和SD生态系统。

🔗Instruct-Imagen引入多模态指令,支持多种模态任务。

💡Instruct-Imagen调整多模态指令,适应各种任务。

腾讯推出语音识别大模型

腾讯云ASR最新升级增强了方言处理、噪声过滤和语义识别能力,能够识别23种地方言、处理方言混战、提高读音相似词准确性,并在噪声环境中提高识别精准度。已广泛应用于多场景,包括录音质检、会议实时转写和语音输入法等。

体验地址:https://cloud.tencent.com/product/asr

【AiBase提要:】

🗣️ 方言处理升级: 腾讯云ASR可识别23种地方言,通过多语言混合识别引擎处理方言混战,包括少数民族小方言。

🔍 语义识别提升: 使用大语言模型LLM,上下文语义和大数据提取意图,增强对读音相似词和专业术语的准确识别。

🎙️ 噪声过滤改进: 通过自主学习和优化算法,提升抗干扰能力,自动过滤噪声,提高识别精准度。

Hugging Face文生成图模型aMUSEd

Hugging Face团队开发的aMUSEd模型在AI图像生成方面具有较快的速度,能在几秒钟内生成图像。

image.png

aMUSEd 项目体验网址:https://top.aibase.com/tool/aamused

【AiBase提要:】

🔍 aMUSEd是Hugging Face开发的一款AI图像生成模型,能在几秒钟内生成图像,比其他竞争对手更快。

🔍 aMUSEd采用了轻量级的文本到图像模型,基于Google的MUSE模型,并使用了Masked Image Model(MIM)架构,提高了生成速度和可解释性。

🔍 aMUSEd还可以进行零样本的图像修复,具有很高的定制性和控制性。

南洋理工开源创新性文生视频模型FreeInit

他们发现视频扩散模型在生成视频时存在时间一致性不足和不自然的动态效果。FreeInit通过多次迭代重复采样优化过程,提升低频信息质量,改善生成视频质量。

image.png

开源地址:https://top.aibase.com/tool/freeinit

论文地址:https://arxiv.org/abs/2312.07537v1

【AiBase提要】

创新性文生视频模型FreeInit通过重新初始化噪声,改进时间的一致性。

研究人员发现视频扩散模型的推理初始化噪声中低频信息很难被完全移除。

FreeInit通过多次迭代重复采样优化过程,提升低频信息质量,改善生成视频质量。

🤖📱💼AI应用

谷歌似乎正在开发一款需要付费的 “高级版” Bard

根据开发者的分享,谷歌似乎正在开发"Bard Advanced",该版本整合了Gemini Ultra语言模型,具备高级数学和推理能力。

【AiBase提要:】

🚀 Bard Advanced开发: 谷歌可能推出"Bard Advanced",整合Gemini Ultra语言模型,具备高级数学和推理能力。

🤖 自定义机器人功能: 发现名为Motoko的功能,允许用户创建自定义机器人,尚不清楚是否需要付费或能否分享。

🔄 Power Up和Gallery功能: 谷歌可能推出"Power Up"功能,利用AI扩展和改进用户输入给Bard的提示。还可能推出Gallery部分,用于探索不同主题。功能尚未正式推出,谷歌未回应是否发布。

👨‍💻💡🎯聚焦开发者

Activepieces:开源全能自动化工具,可定制且易用

Activepieces是一个开源的全能自动化工具,被视为流行的自动化平台Zapier的替代品。具备用户友好的工作流构建器、广泛的集成、开放的生态系统和无限的使用案例。

image.png

在线地址:https://www.activepieces.com/

项目地址:https://top.aibase.com/tool/activepieces

【AiBase提要:】

🛠️ 全能自动化工具: 支持分支、循环和拖放功能,可轻松创建和管理自动化工作流。

🌐 广泛集成支持: 拥有80多种集成,包括Google Sheets、OpenAI、Discord、RSS等,支持持续增长,用户可方便整合其他应用和服务。

🔄 开放生态系统: 所有集成源代码公开,用户和开发者可查看、修改和扩展集成,版本直接发布到https://npmjs.com,提供灵活、易用、可定制的自动化解决方案。

举报

  • 相关推荐
  • 谁能成为中国的ChatGPT?夸克抢先交卷

    在OpenAI上线自己家AI浏览器ChatGPT Atlas的同一周,微软在海外发布了新的AI助手Mico和更AI化的Edge浏览器,夸克则在国内推出了新的「对话助手」功能。 这一系列消息背后,新旧巨头、两个市场产生了两个确定的共识:一个是AI助理与AI浏览器的融合会进一步深化,入口之争就是系统之争;另一个是对话会成为人与AI交互的主要方式,自然语言就是未来的编程语言。 在海外市场,OpenA

  • 如何让你的内容被 ChatGPT 优先引用?——GEO 优化实战指南

    传统SEO追求"谷歌首页排名",生成式AI时代则需追求"被AI引用"。AI模型不提供明确排名算法,更像黑箱,使内容创作者困惑。GEO优化的核心是让内容具备"可引用性":权威清晰、结构化信息、语义覆盖多维度、模型检索映射。需通过AIBase等GEO排名查询工具验证"AI曝光率",分析引用语境、竞争差距,调整内容结构以提升AI引用倾向。SEO优化机器如何找到你,GEO则优化AI如何引用你。

  • GEO如何改变ChatGPT搜索和Perplexity的游戏规则

    本文对比ChatGPT与Perplexity两大AI搜索平台:ChatGPT作为全能型助手,整合搜索与多任务处理,但存在信息时效性不足;Perplexity专注垂直搜索,强调引用透明与权威来源。针对AI搜索优化(GEO),提出差异化策略:面向ChatGPT需构建结构化知识库、强化品牌实体识别;面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具,通过曝光率等指标量化内容在AI生态中的可见度,并给出可落地的优化行动方案。

  • 如何提升品牌在AI回答中的提及率?GEO优化3招,让ChatGPT主动提及你的品牌

    本文探讨AI搜索时代品牌面临的"隐身危机",指出AI搜索用户年增538.7%,但品牌在AI回答中提及率不足20%。提出三大核心策略:1)构建权威背书矩阵,通过知乎等高权重平台获取自然提及;2)优化AI友好内容,采用对话式标题和结构化数据;3)建立数据监测闭环,通过A/B测试持续迭代。强调需善用监测工具实时追踪品牌在豆包、文心一言等AI模型的曝光表现,避免内容"注水"。最终实现从"被动等待"到主动抢占AI"第一屏"的转变。

  • OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

    OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas,以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动,实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS,未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用,其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史,旨在通过自然对话提升网络使用效率。

  • vivo WATCH GT 2已支持开通移动/联通eSIM服务

    vivo WATCH GT2智能手表正式支持中国移动与联通的eSIM服务,提供一号双终端和独立终端两种模式,售价699元。配备2.07英寸大屏、2400nits峰值亮度,续航达33天。支持全天心率、血氧、睡眠监测及多种运动模式,搭载自研蓝河操作系统3.0与智能助手,可跨设备连接vivo和iPhone,实现双机通知同步。

  • AI日报:可复刻音色的MiniMax Speech 2.6发布;TikTok推AI剪辑新工具“Smart Split”;Cursor 2.0发布

    本期AI日报聚焦多项技术突破:MiniMax发布低延迟语音合成系统Speech 2.6,实现实时交互;蚂蚁数科与宁波银行打造的金融AI方案入选国际标准;智源推出具身操作能力的Emu3.5多模态模型;Cursor 2.0通过自研模型实现多智能体协同编程;xAI升级Grok新增视频生成功能;OpenAI推出可定制安全模型;TikTok推出AI剪辑工具Smart Split;微软发布强化学习框架Agent Lightning提升大模型训练效率。

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • 双十一智能手表怎么选?这几款三星Galaxy Watch千万别错过

    双十一选购智能手表时,三星Galaxy Watch系列提供多样选择:Galaxy Watch8设计轻盈简约,适合日常佩戴;Watch8 Classic采用经典旋转表圈,风格优雅百搭;Watch Ultra则主打坚固耐用,专为户外运动设计。三款均搭载全面健康监测功能,包括睡眠分析、跑步教练指导及身体成分测量,帮助用户提升生活质量。根据个人审美与需求,可轻松挑选心仪款式。

  • 燃爆蓉城!快手王者之战暨街霸6CPT亚洲白金赛圆满收官

    10月31日至11月2日,“快手王者之战VI暨CAPCOM PRO TOUR 2025亚洲白金赛”在成都成功举办。日本选手HINAO从566名选手中脱颖而出,决赛中以3:2逆转夺冠,成为CPT史上最年轻白金赛冠军。赛事汇聚全球顶尖选手,覆盖亚太多赛区,冠军直通CAPCOM CUP总决赛。快手通过独家内容策划与线上线下联动,打造“电竞+文旅”融合模式,结合成都本地文化,推动电竞赛事破圈传播,彰显游戏生态布局优势。

今日大家都在搜的词: