首页 > 业界 > 关键词  > ChatGPT最新资讯  > 正文

AI视野:ChatGPT模型大更新;阿里云发布多模态大模型;Runway视频生成输给Pixverse;百度推多模态模型UNIMO-G

2024-01-26 15:35 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📱💼AI应用

ChatGPT模型大更新

【AiBase提要:】

⭐发布了两款全新大、小文本嵌入模型,

⭐全新的GPT-4Turbo模型(修复懒惰行为)和GPT-3.5Turbo模型,3.5还降价。

⭐更新了最新的审核模型text-moderation-007

⭐还有可以单独控制API访问的权限,不怕API被盗了

详情:https://www.chinaz.com/2024/0126/1593267.shtml

Runway竟然完败Pixverse?3款AI视频生成模型测试

QQ截图20240126093410.png

【AiBase提要:】

👉 Pixverse和Pika的视频生成质量接近

👉 Pixverse模型最平衡,能处理运动幅度和保持一致性

👉 Pika在动漫和2.5D风格上有优势

Pixverse产品地址:https://top.aibase.com/tool/pixverse

AI图像高清修复工具SUPIR 可根据文本提示智能修复

image.png

【AiBase提要:】

⭐ SUPIR通过增加模型规模提升图像修复能力

⭐ SUPIR主要功能包括图像修复和文本引导的修复

⭐ 在多个图像修复任务中表现出色

项目页地址:https://top.aibase.com/tool/supir

阿里云发布多模态大模型Qwen-VL-Max版本 性能比肩GPT-4V

微信截图_20240126110056.png

【AiBase提要:】

⭐ Qwen-VL-Max模型在视觉推理方面展现出卓越的能力

⭐ 在基础能力方面,Qwen-VL-Max能够准确描述和识别图片信息

⭐ Qwen-VL-Max在文档分析和图像文本处理方面取得显著进步

孟子大模型开放服务上线四款大模型产品

【AiBase提要:】

⭐ 孟子大模型包括轻量、标准、金融和编程

⭐ 支持多种任务,如聊天对话、文案写作

⭐ 专为金融编程任务优化,新增软件开发需求文档写作能力

体验地址:https://www.langboat.com/product/mchat

AI应用自动化构建平台VectorShift 通过无代码界面构建自动化工作流

【AiBase提要:】

⭐ 利用人工智能搜索知识库、生成文档并部署聊天机器人和助手

⭐ 支持拖放支持组件完成任务,创建数据知识库

⭐ 提供Python SDK,支持直接访问平台功能

百度推多模态模型UNIMO-G 支持还原图片ID

【AiBase提要:】

💡 传统模型主要根据简洁的文本提示生成图像

💡 UNIMO-G包含多模态大语言模型和基于编码的多模态输入生成图像的条件去噪扩散网络

💡 UNIMO-G在文本到图像生成和零样本主题驱动合成方面表现出色

项目地址:https://top.aibase.com/tool/unimo-g

谷歌推出AMIE模型,用大模型为病人提供医疗咨询

【AiBase提要:】

😷 医疗资源匮乏,患者与医生深度咨询不易

💻 谷歌推出医疗咨询大语言模型AMIE

📈 AMIE在多方面优于初级保健医生

论文地址:https://arxiv.org/abs/2401.05654

📰🤖📢AI新鲜事

前谷歌AI工程师徐鹏领导蚂蚁AGI部门

【AiBase提要:】

👤 徐鹏加入蚂蚁集团,领导AI部门

🤖 蚂蚁集团设立AI创新研发与应用部门NextEvo

📈 徐鹏将推动蚂蚁集团在AI领域取得突破

OpenAI 首席执行官将会见三星电子和 SK 海力士高管

【AiBase提要:】

💡 探讨 AI 技术在芯片领域的应用

💡 三星电子和 SK 海力士作为全球领先的芯片制造商

💡 OpenAI首席执行官SamAltman计划访问首尔

IBM 股价飙升,人工智能需求推动收入超预期

【AiBase提要:】

💼 IBM营收增长了4%,人工智能和混合云需求增加

💼 人工智能产品带来的收入将会逐年增加

💼 咨询业务增长最快,生成式人工智能的业务量翻了一番

全世界机器人共用一个大脑,谷歌DeepMind已经完成了第一

图片

【AiBase提要:】

🧠 生成式人工智能发展的核心关键词是「大」

👥34个机器人实验室共同启动了RT-X项目

🤖 RT-X 模型能借鉴其他机器人的经验,提高不同环境中的机器人鲁棒性。

正交微调解锁文本创建逼真图像新能力 实现对生成图像的精确控制

【AiBase提要:】

👉 正交微调增强模型控制能力

👉 使用正交变换方法保持模型语义生成能力

👉 在生成质量和效率方面表现出色

举报

  • 相关推荐
  • 谁能成为中国的ChatGPT?夸克抢先交卷

    在OpenAI上线自己家AI浏览器ChatGPT Atlas的同一周,微软在海外发布了新的AI助手Mico和更AI化的Edge浏览器,夸克则在国内推出了新的「对话助手」功能。 这一系列消息背后,新旧巨头、两个市场产生了两个确定的共识:一个是AI助理与AI浏览器的融合会进一步深化,入口之争就是系统之争;另一个是对话会成为人与AI交互的主要方式,自然语言就是未来的编程语言。 在海外市场,OpenA

  • 如何让你的内容被 ChatGPT 优先引用?——GEO 优化实战指南

    传统SEO追求"谷歌首页排名",生成式AI时代则需追求"被AI引用"。AI模型不提供明确排名算法,更像黑箱,使内容创作者困惑。GEO优化的核心是让内容具备"可引用性":权威清晰、结构化信息、语义覆盖多维度、模型检索映射。需通过AIBase等GEO排名查询工具验证"AI曝光率",分析引用语境、竞争差距,调整内容结构以提升AI引用倾向。SEO优化机器如何找到你,GEO则优化AI如何引用你。

  • GEO如何改变ChatGPT搜索和Perplexity的游戏规则

    本文对比ChatGPT与Perplexity两大AI搜索平台:ChatGPT作为全能型助手,整合搜索与多任务处理,但存在信息时效性不足;Perplexity专注垂直搜索,强调引用透明与权威来源。针对AI搜索优化(GEO),提出差异化策略:面向ChatGPT需构建结构化知识库、强化品牌实体识别;面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具,通过曝光率等指标量化内容在AI生态中的可见度,并给出可落地的优化行动方案。

  • 如何提升品牌在AI回答中的提及率?GEO优化3招,让ChatGPT主动提及你的品牌

    本文探讨AI搜索时代品牌面临的"隐身危机",指出AI搜索用户年增538.7%,但品牌在AI回答中提及率不足20%。提出三大核心策略:1)构建权威背书矩阵,通过知乎等高权重平台获取自然提及;2)优化AI友好内容,采用对话式标题和结构化数据;3)建立数据监测闭环,通过A/B测试持续迭代。强调需善用监测工具实时追踪品牌在豆包、文心一言等AI模型的曝光表现,避免内容"注水"。最终实现从"被动等待"到主动抢占AI"第一屏"的转变。

  • OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

    OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas,以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动,实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS,未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用,其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史,旨在通过自然对话提升网络使用效率。

  • 华为WATCH Ultimate 2非凡探索版明日开启预售

    华为正式宣布旗舰智能手表WATCH Ultimate 2非凡探索将于11月7日开启预售。这款“全能表王”支持150米潜水与音频功能,具备海豚声呐通信技术,可在水下30米实现手表间信息传输,60米内一键SOS求救。同时搭载北斗卫星语音消息功能,无网络环境下可通过卫星发送语音信息。硬件上配备1.5英寸OLED屏幕,峰值亮度达3500nit,支持20ATM防水与IP68/9防尘。省电模式下续航达11天,常规使用达4.5天。该手表海外售价799英镑(约7443元人民币),国内价格尚未公布。

  • vivo WATCH GT 2已支持开通移动/联通eSIM服务

    vivo WATCH GT2智能手表正式支持中国移动与联通的eSIM服务,提供一号双终端和独立终端两种模式,售价699元。配备2.07英寸大屏、2400nits峰值亮度,续航达33天。支持全天心率、血氧、睡眠监测及多种运动模式,搭载自研蓝河操作系统3.0与智能助手,可跨设备连接vivo和iPhone,实现双机通知同步。

  • AI日报:可复刻音色的MiniMax Speech 2.6发布;TikTok推AI剪辑新工具“Smart Split”;Cursor 2.0发布

    本期AI日报聚焦多项技术突破:MiniMax发布低延迟语音合成系统Speech 2.6,实现实时交互;蚂蚁数科与宁波银行打造的金融AI方案入选国际标准;智源推出具身操作能力的Emu3.5多模态模型;Cursor 2.0通过自研模型实现多智能体协同编程;xAI升级Grok新增视频生成功能;OpenAI推出可定制安全模型;TikTok推出AI剪辑工具Smart Split;微软发布强化学习框架Agent Lightning提升大模型训练效率。

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • 燃爆蓉城!快手王者之战暨街霸6CPT亚洲白金赛圆满收官

    10月31日至11月2日,“快手王者之战VI暨CAPCOM PRO TOUR 2025亚洲白金赛”在成都成功举办。日本选手HINAO从566名选手中脱颖而出,决赛中以3:2逆转夺冠,成为CPT史上最年轻白金赛冠军。赛事汇聚全球顶尖选手,覆盖亚太多赛区,冠军直通CAPCOM CUP总决赛。快手通过独家内容策划与线上线下联动,打造“电竞+文旅”融合模式,结合成都本地文化,推动电竞赛事破圈传播,彰显游戏生态布局优势。

今日大家都在搜的词: