首页 > 业界 > 关键词  > ChatGPT最新资讯  > 正文

AI视野:ChatGPT模型大更新;阿里云发布多模态大模型;Runway视频生成输给Pixverse;百度推多模态模型UNIMO-G

2024-01-26 15:35 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📱💼AI应用

ChatGPT模型大更新

【AiBase提要:】

⭐发布了两款全新大、小文本嵌入模型,

⭐全新的GPT-4Turbo模型(修复懒惰行为)和GPT-3.5Turbo模型,3.5还降价。

⭐更新了最新的审核模型text-moderation-007

⭐还有可以单独控制API访问的权限,不怕API被盗了

详情:https://www.chinaz.com/2024/0126/1593267.shtml

Runway竟然完败Pixverse?3款AI视频生成模型测试

QQ截图20240126093410.png

【AiBase提要:】

👉 Pixverse和Pika的视频生成质量接近

👉 Pixverse模型最平衡,能处理运动幅度和保持一致性

👉 Pika在动漫和2.5D风格上有优势

Pixverse产品地址:https://top.aibase.com/tool/pixverse

AI图像高清修复工具SUPIR 可根据文本提示智能修复

image.png

【AiBase提要:】

⭐ SUPIR通过增加模型规模提升图像修复能力

⭐ SUPIR主要功能包括图像修复和文本引导的修复

⭐ 在多个图像修复任务中表现出色

项目页地址:https://top.aibase.com/tool/supir

阿里云发布多模态大模型Qwen-VL-Max版本 性能比肩GPT-4V

微信截图_20240126110056.png

【AiBase提要:】

⭐ Qwen-VL-Max模型在视觉推理方面展现出卓越的能力

⭐ 在基础能力方面,Qwen-VL-Max能够准确描述和识别图片信息

⭐ Qwen-VL-Max在文档分析和图像文本处理方面取得显著进步

孟子大模型开放服务上线四款大模型产品

【AiBase提要:】

⭐ 孟子大模型包括轻量、标准、金融和编程

⭐ 支持多种任务,如聊天对话、文案写作

⭐ 专为金融编程任务优化,新增软件开发需求文档写作能力

体验地址:https://www.langboat.com/product/mchat

AI应用自动化构建平台VectorShift 通过无代码界面构建自动化工作流

【AiBase提要:】

⭐ 利用人工智能搜索知识库、生成文档并部署聊天机器人和助手

⭐ 支持拖放支持组件完成任务,创建数据知识库

⭐ 提供Python SDK,支持直接访问平台功能

百度推多模态模型UNIMO-G 支持还原图片ID

【AiBase提要:】

💡 传统模型主要根据简洁的文本提示生成图像

💡 UNIMO-G包含多模态大语言模型和基于编码的多模态输入生成图像的条件去噪扩散网络

💡 UNIMO-G在文本到图像生成和零样本主题驱动合成方面表现出色

项目地址:https://top.aibase.com/tool/unimo-g

谷歌推出AMIE模型,用大模型为病人提供医疗咨询

【AiBase提要:】

😷 医疗资源匮乏,患者与医生深度咨询不易

💻 谷歌推出医疗咨询大语言模型AMIE

📈 AMIE在多方面优于初级保健医生

论文地址:https://arxiv.org/abs/2401.05654

📰🤖📢AI新鲜事

前谷歌AI工程师徐鹏领导蚂蚁AGI部门

【AiBase提要:】

👤 徐鹏加入蚂蚁集团,领导AI部门

🤖 蚂蚁集团设立AI创新研发与应用部门NextEvo

📈 徐鹏将推动蚂蚁集团在AI领域取得突破

OpenAI 首席执行官将会见三星电子和 SK 海力士高管

【AiBase提要:】

💡 探讨 AI 技术在芯片领域的应用

💡 三星电子和 SK 海力士作为全球领先的芯片制造商

💡 OpenAI首席执行官SamAltman计划访问首尔

IBM 股价飙升,人工智能需求推动收入超预期

【AiBase提要:】

💼 IBM营收增长了4%,人工智能和混合云需求增加

💼 人工智能产品带来的收入将会逐年增加

💼 咨询业务增长最快,生成式人工智能的业务量翻了一番

全世界机器人共用一个大脑,谷歌DeepMind已经完成了第一

图片

【AiBase提要:】

🧠 生成式人工智能发展的核心关键词是「大」

👥34个机器人实验室共同启动了RT-X项目

🤖 RT-X 模型能借鉴其他机器人的经验,提高不同环境中的机器人鲁棒性。

正交微调解锁文本创建逼真图像新能力 实现对生成图像的精确控制

【AiBase提要:】

👉 正交微调增强模型控制能力

👉 使用正交变换方法保持模型语义生成能力

👉 在生成质量和效率方面表现出色

举报

  • 相关推荐
  • AI日报:阿里云通义灵码AI IDE上线;小米多模态大模型Xiaomi MiMo-VL开源;黑森林实验室推出FLUX.1Kontext

    【AI日报】今日AI领域重要动态:1)阿里云推出通义灵码AI IDE,集成千问3模型,显著提升编程效率;2)小米开源多模态大模型MiMo-VL-7B,性能超越更大规模闭源模型;3)黑森林实验室发布FLUX.1Kontext图像生成模型,支持文本和参考图像多次编辑;4)Midjourney V7渲染速度提升40%,新增用户投票功能;5)DeepSeek R1-0528大模型在AGI领域取得突破,性能超越xAI等公司;6)Hugging Face进军机器人市场,推出开源人形机器人HopeJR;7)字节跳动火山方舟接入DeepSeek最新大模型;8)Anthropic开源"电路追踪"工具,揭示大模型决策过程;9)阿里巴巴开源自主搜索AI智能体WebAgent;10)Hume发布低延迟语音语言模型EVI3;11)Manus Slides支持一键生成专业幻灯片;12)Runway Gen-4 References支持手机照片艺术化处理。

  • 多模态2025:技术路线“神仙打架”,视频生成冲上云霄

    一场大会,聚集了中国多模态大模型的“半壁江山”。 智源大会2025为期两天的论坛中,汇集了学界、创业公司和大厂等三方的热门选手,关于多模态的集中讨论达到了前所未有的热度。其中,创业公司就有爱诗科技、生数科技、Sand.ai、智象未来、Luma AI、智谱等六家公司创始人、CEO分享心得;隶属大厂队的字节、腾讯、百度的多模态技术负责人,以及学术界的人大和MIT(麻省�

  • AI日报:昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

    本文介绍了AI领域最新动态:1)昆仑万维推出全球首款AI+Agent架构的Office智能体应用;2)研究显示ChatGPT能提升K12学生成绩近87%;3)谷歌视频生成工具Veo3扩展至更多地区;4)谷歌发布三款Gemma模型变体,覆盖医疗、手语翻译和海豚语言研究;5)VideoTutor实现一句话生成定制教学视频;6)字节跳动开源多模态模型BAGEL;7)Rork支持无代码开发iOS/Android应用;8)AingDesk降低AI助手开发门槛;9)Claude4登陆亚马逊Bedrock平台;10)Youware通过MCP协议提升网页生成能力。这些创新展示了AI技术在各领域的快速发展和应用潜力。

  • OpenAI 提升o3多模态模型推理实力,微美全息(WIMI.US)加速引领产业新变革征程

    OpenAI推出突破性的o3推理模型,首次实现图像直接融入推理过程,在多模态基准测试V* Bench上准确率达95.7%。DeepSeek完成R1模型升级,上下文窗口从12K扩展至23K,幻觉率降低45%-50%。行业呈现开源趋势,DeepSeek开源策略促使多家企业跟进,OpenAI也考虑开源。微美全息加速布局多模态大模型,计划提供实时多模态AI体验。专家指出AI发展重心正从大模型向智能体演进,开源技术显著降低训练门槛,提升泛化能力,为多模态智能探索开辟新路径。企业需紧跟趋势把握机遇,在大模型驱动的新时代找准定位。

  • 慧科讯业AI赋能数据标签化,破局多模态数据治理难题

    文章探讨了数字化浪潮下数据标签化的重要性及其商业应用。数据标签化作为大数据分析的基础,能帮助企业实现精准营销和智能决策。然而,多模态数据处理复杂、人工标注成本高、业务理解不足等问题制约了数据价值的释放。文章提出数据标签化在构建用户画像、舆情监控、市场趋势预测等场景中的核心价值,并分析了当前面临的挑战:包括传统NLP算法不精准、大语言模型成本高且不稳定等。慧科讯业通过TDaaS服务模式,结合行业领先的数据源、NLP技术和垂直知识图谱,为企业提供高效的数据标注解决方案,显著提升数据处理效率。未来,随着AI技术发展,知识图谱驱动的TDaaS模式将重新定义数据价值变现方式。

  • AI日报:MiniMax推视频生成模型Hailuo 02;Cursor Pro取消500次请求限制;谷歌发布AI模型 Gemini 2.5 Flash-Lite

    本文汇总了AI领域最新动态:1)Cursor Pro取消500次请求限制;2)稀宇科技推出视频生成模型Hailuo02;3)谷歌发布轻量级AI模型Gemini2.5Flash-Lite;4)科大讯飞星火X1升级版7月上线;5)腾讯元宝推出AI编程模式;6)OpenAI将下架GPT-4.5 API;7)苹果Speech API转录速度超Whisper 55%;8)百度推出数字人互动直播间;9)Meta曾试图高薪挖角OpenAI人才;10)Krea1公测开放,解决"AI感"问题;11)特斯拉Grok车载AI助手即将上线;12)谷歌Gemini新增视频分析功能。

  • AI触控云台浩瀚V3 Ultra发布,首发AI多模态追踪模块,定义手机云台轻旗舰标准!

    6月6日,浩翰V3 Ultra智能影像稳定器正式发布。作为旗舰级产品,它搭载行业首创AI多模态万物原生跟拍技术,支持10米远程触控彩屏、AI可视化构图、360°无死角跟拍及三轴稳拍等功能。新品采用第九代iSteady增稳系统,折叠后体积小巧便携。配备22英寸触控彩屏,支持5米手势控制和隔空补光功能。售价999元起,同步推出含无线麦克风的创作者套装。浩翰深耕稳定器行业11年,产�

  • 破局多模态数据治理难点,数据标注重构企业营销新基建

    文章探讨了AI数据标注行业的发展现状与未来趋势。主要内容包括:1)AI数据标注已成为企业数字化转型的核心基础设施,92.9%数据为非结构化形态;2)营销领域多模态数据融合正在重塑商业决策模式;3)慧科讯业等企业通过TDaaS服务帮助客户构建数据资产;4)数据标注服务商分为国际头部、自有生态型、垂直领域型和综合营销数字化型四类;5)未来趋势包括AI驱动的自动化标注、数据合规升级和人机协同模式创新。文章强调,高质量数据标注服务将助力企业实现从"可用"到"可信高效"的数字化转型。

  • AI日报: ChatGPT免费开放记忆功能;华为WATCH 5智能手表接入双大模型;Claude Pro升级重磅功能

    本期AI日报主要报道了多项AI领域重要进展:1)OpenAI向所有ChatGPT用户免费开放记忆功能;2)蚂蚁集团推出"AI健康管家",服务4000万用户;3)Anthropic与DeepLearning.AI合作推出免费MCP课程;4)谷歌DeepMind开发无需3D模型即可生成逼真运动视频的新技术;5)Exa与OpenRouter合作为400+大模型提供实时网络搜索功能;6)中国知网推出CNKI AI学术研究助手;7)Anthropic推出Claude Explains博客项目;8)Claude Pro新增研究模式和远程MCP整合功能;9)Fish Audio发布基于200万小时数据训练的OpenAudio S1语音模型;10)OpenAI升级Codex编程工具;11)华为WATCH5接入盘古和DeepSeek双大模型。

  • Meta拟百亿美元投资Scale AI,微美全息(WIMI.US)端侧多模态AI加速开启科技新局

    Meta正与AI初创企业Scale AI洽谈数十亿美元投资,估值或超100亿美元,有望创下私营企业融资纪录。Scale AI为微软、OpenAI等提供数据标注服务,是生成式AI热潮主要受益者。这将是Meta史上最大规模外部AI投资,标志其战略转向。Meta CEO扎克伯格宣布将AI确立为战略重心,2024年将投入650亿美元推进相关项目,重点打造Llama模型成为行业标准。同时,谷歌推出Gemini助手"计划操作"新功能,支持任务自动化管理。科技巨头纷纷重金布局AI,微软向OpenAI注资逾130亿美元,亚马逊投资Anthropic数十亿美元。行业观察认为AI技术普及将推动效率革命,微美全息等企业正通过技术创新赋能产业转型,共同探讨人工智能技术突破新动态。AI正以前所未有的速度重塑全球发展格局。