首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:百川智能深度思考模型Baichuan-M1-preview;OpenAI发布首个AI智能体Operator;HeyGen新增数字人运动控制功能

2025-01-24 15:31 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、百川智能发布全场景深度思考模型Baichuan-M1-preview 已在百小应上线

百川公司今日推出了Baichuan-M1系列模型,其中包括全场景深度思考模型Baichuan-M1-preview和开源医疗增强大模型Baichuan-M1-14B。这两款模型在技术创新和性能上均表现出色,尤其是Baichuan-M1-preview在多个权威评测中超越了竞争对手,展现出强大的深度思考能力和医疗循证模式,为医疗领域的应用提供了强有力的支持。

image.png

【AiBase提要:】

🧬 Baichuan-M1-preview是国内首个具备语言、视觉和搜索推理能力的模型,表现优异。

🏥 Baichuan-M1-14B在医学知识和临床能力评测中超越了更大参数量的模型,医疗能力强大。

🚀 百川公司通过开源Baichuan-M1-14B,旨在激发创新力量,推动医疗技术的广泛应用。

2、OpenAI发布首个AI智能体Operator,首批面向ChatGPT Pro用户

OpenAI最新推出的AI代理Operator旨在帮助用户在网络上执行多种任务,初步面向ChatGPT Pro用户。该工具结合了先进的视觉能力和强化学习,能够与网页进行交互并具备自我纠正功能。Operator在设计上注重安全性,确保用户在处理敏感信息时能保持控制。

image.png

【AiBase提要:】

🌐 OpenAI 推出 “Operator” AI 智能体,帮助用户在线执行任务,首批面向 ChatGPT Pro 用户。

🖱️ Operator 可以通过浏览器与网页交互,具备自我纠正和用户控制的功能,确保安全性。

🤝 OpenAI 与多个知名公司合作,致力于满足现实需求,同时计划未来扩展至更多用户。

详情链接:https://openai.com/index/introducing-operator/

3、HeyGen推出数字人运动控制功能 能弹乐器还能跳舞

HeyGen最新发布的数字人运动控制系统实现了虚拟形象的大幅度肢体动作操控。这项技术突破使得数字人不仅能够完成基础的微表情,更能流畅地执行复杂的肢体动作,如弹奏乐器和舞蹈表演。通过引入运动学控制算法,动作响应延迟降低至12毫秒,极大提升了视频制作效率。

【AiBase提要:】

🎹 HeyGen的数字人运动控制系统实现了虚拟形象的复杂肢体动作操控,能够流畅执行弹奏乐器和舞蹈表演。

💡 该系统通过深度神经网络生成虚拟形象,支持实时生成超过200个关节点位数据,展现类生物力学特征。

🚀 视频制作效率提升约47%,动态场景制作成本降低至传统方式的1/8,未来将整合触觉反馈模拟。

详情链接:https://app.heygen.com/

4、Perplexity 推出Android移动助手 可写电子邮件、预订晚餐

Perplexity最近推出了一款新的AI助手,专为Android用户设计,能够执行多种任务,如撰写电子邮件、设置提醒和预订晚餐。该助手具备多模态功能,能够识别屏幕内容和通过相机识别周围事物,提升了用户的操作便利性。在实际体验中,助手的反应速度和准确性都令人印象深刻,虽然目前仍在扩展支持的应用程序和功能,但其潜力已显而易见。

【AiBase提要:】

🌟 助手支持撰写邮件、设置提醒和预订餐厅等多种功能。

📱 具备多模态功能,能够识别屏幕内容和通过相机识别周围事物。

🚀 目前支持Spotify、YouTube和Uber等应用,功能仍在不断扩展中。

5、元象推出智能数字人平台「元象日播」

深圳元象信息科技有限公司推出的智能数字人平台“元象日播”以其高自然度的定制能力和实时交互功能,为品牌展示和内容生产提供了创新解决方案。该平台的集成工具使用户能够快速搭建直播空间,并通过自研大模型实现观众互动,显著提升用户体验。

image.png

【AiBase提要:】

🎥 元象日播平台提供一站式直播工具,用户可快速搭建专业直播空间。

🗣️ 通过音色克隆技术,用户可轻松定制个性化的数字人形象和声音。

📈 该平台已在多个行业广泛应用,显著提高了客户的销售转化率。

6、300倍体积缩减!Hugging Face推SmolVLM模型:小巧智能,手机也能跑

Hugging Face推出的SmolVLM模型以其小巧的体积和卓越的性能,引领了AI技术的新潮流。该模型不仅能在手机等小型设备上运行,其性能更是超越了需要大型数据中心支持的前辈模型Idefics80B,标志着实用AI部署的重大进展。

image.png

【AiBase提要:】

🌟 SmolVLM模型能在手机上运行,性能超越300倍大的Idefics80B模型。

💰 SmolVLM模型帮助企业显著降低计算成本,处理速度达到每秒16个实例。

🚀 该模型的技术创新让小型企业和初创公司能够在短时间内推出复杂的计算机视觉产品。

详情链接:https://huggingface.co/blog/smolervlm

7、中国联通发布元景思维链大模型:性能超越GPT-4

中国联通近日推出了元景思维链大模型,标志着其在人工智能领域的重要进展。这款央企开源的通用思维链大模型展现了卓越的慢思考能力和多场景推理能力,其性能在多个测评中超越了目前最好的通用语言模型,如OpenAI的GPT-4。

业界首款!中国联通发布元景思维链大模型:性能比肩OpenAI

【AiBase提要:】

🚀 元景思维链大模型是中国联通首款央企开源的通用思维链大模型,具有强大的慢思考和推理能力。

📊 在主流榜单测评中,该模型表现超越了OpenAI GPT-4和其他顶尖语言模型,显示出其竞争力。

🔍 模型实现了任务和难度自适应,提升了回答效率和准确性,已成功应用于多个领域。

详情链接:https://github.com/UnicomAI/Unichat-32B-c1.git

8、发烧友!一国外软件工程师买下OGOpenAI.com域名并重定向至DeepSeek

最近,软件工程师安纳奈・阿罗拉以极低的价格购买了域名OGOpenAI.com,并将其重定向至中国AI实验室DeepSeek。DeepSeek在开源AI领域的突破性进展引发了广泛关注,其AI模型在某些基准测试中表现优于OpenAI的o1模型。与此形成对比的是,OpenAI在发布强大模型时显得相对谨慎,面临来自行业的批评。

【AiBase提要:】

🌐 安纳奈・阿罗拉购买OGOpenAI.com域名,并重定向至DeepSeek。

📊 DeepSeek的AI模型在某些基准测试中表现优于OpenAI的o1模型。

🔍 OpenAI因未能发布强大模型而受到批评,面临来自行业的质疑。

9、OpenAI CEO宣布ChatGPT免费版将引入o3-mini,效率翻倍!

OpenAI首席执行官山姆·奥特曼宣布,ChatGPT的免费版将升级为全新的o3-mini模型,旨在提升用户体验并满足日常需求。付费用户将获得更多使用机会,增强生产力。此举不仅推动了人工智能的民主化,也为数百万用户提供了前沿技术的接入,同时确保了付费用户的价值体验。

【AiBase提要:】

🌟 免费用户将享受到新升级的o3-mini模型,提供更快的响应速度。

💼 付费用户将获得更多的o3-mini使用机会,提升生产力。

📈 OpenAI致力于推动人工智能的民主化,确保更多用户享受前沿技术。

举报

  • 相关推荐
  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • AI日报:昆仑万维天工超级智能体发布;OpenAI核心API支持MCP;百度飞桨PaddleOCR 3.0开源

    【AI日报】汇总了近期AI领域重要动态:1)百度飞桨发布PaddleOCR3.0,提升文字识别精度13%;2)昆仑万维发布天工超级智能体,AI办公成本仅为OpenAI的40%;3)OpenAI API新增MCP支持简化开发流程;4)xAI推出实时网页搜索API;5)谷歌Sparkify可将问题秒变动画;6)Mistral发布高效代码模型Devstral;7)Video Ocean推出4K视频生成工具;8)谷歌推出AI内容识别工具SynthID;9)谷歌NotebookLM使用量半年增长56%;10)硅基流动升级128K长文本模型;11)DeepMind发布音乐生成模型Lyria2;12)多模态大模型MMaDA实现跨模态推理;13)微软发布网页智能体Magentic-UI;14)Framer推出AI建站套件。

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • AI日报:昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

    本文介绍了AI领域最新动态:1)昆仑万维推出全球首款AI+Agent架构的Office智能体应用;2)研究显示ChatGPT能提升K12学生成绩近87%;3)谷歌视频生成工具Veo3扩展至更多地区;4)谷歌发布三款Gemma模型变体,覆盖医疗、手语翻译和海豚语言研究;5)VideoTutor实现一句话生成定制教学视频;6)字节跳动开源多模态模型BAGEL;7)Rork支持无代码开发iOS/Android应用;8)AingDesk降低AI助手开发门槛;9)Claude4登陆亚马逊Bedrock平台;10)Youware通过MCP协议提升网页生成能力。这些创新展示了AI技术在各领域的快速发展和应用潜力。

  • OpenAI发布云端AI编程智能体Codex:代码准确率高达90%

    OpenAI于5月19日正式推出基于Codex-1模型的云端AI编程智能体Codex。该工具具备强大的代码生成与理解能力,支持Python、JavaScript、C等主流语言,覆盖前后端开发、算法实现等多个领域。测试显示其处理常规编程任务的速度远超人工,代码准确率达90%以上,能显著提升开发效率。Codex深度集成GitHub,支持智能代码补全和结构化代码自动生成,使开发者平均编码时间缩短30%。目前该服务已面向ChatGPT+Pro等高级用户开放,未来有望成为软件开发领域的标配工具,推动AI辅助编程进入新阶段。

  • AI日报:Anthropic推最强编码AI模型Claude4;苹果计划推AI智能眼镜;QQ浏览器上线首个高考Agent

    【AI日报】今日AI领域重要动态:1)Anthropic发布Claude4系列AI模型,编程能力超越竞争对手;2)苹果计划2026年推出集成AI技术的智能眼镜;3)字节跳动与清华合作推出时序多模态大模型ChatTS;4)3DTown框架实现单张照片生成逼真3D场景;5)OpenAI秘密开发无屏幕AI设备;6)商汤科技推出儿童AI下棋机器人;7)微软记事本新增AI写作功能;8)深圳设立70亿元基金支持AI硬件初创企业;9)谷歌发布3D视频通信平台Beam;10)阿联酋推出"星际之门"计划,免费提供ChatGPT服务;11)法国Mistral推出开源模型Devstral;12)Anthropic API新增四大功能;13)美国众议院通过法案限制各州监管AI;14)QQ浏览器推出高考AI助手。

  • 网易数智发布CoreAgent智能体开发平台及多款行业智能体

    5月23日,网易在杭州举办"万象新生"2025创新企业大会。网易数智宣布品牌升级,LOGO颜色从"科技蓝"变为"网易红",展现拥抱AI时代的决心。会上发布一站式智能体开发平台CoreAgent,整合知识库、运行沙箱等功能,助力企业智能化转型。同时成立AI生态联盟,首批成员包括英特尔、人民中科等上下游企业。网易数智还推出导购数字员工、智能外呼数字员工等多款行业智能体产品,加速企业数字化进程。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • AI日报:阿里开源3D数字人项目MNN TaoAvatar;MiniMax Agent上线;罗永浩数字人直播再探“AI+IP”带货模式

    本文汇总了AI领域最新动态:1)阿里开源MNN+TaoAvatar技术,实现手机端3D数字人实时交互;2)MiniMax升级AI工具Agent,新增智能图像搜索和多语言支持;3)罗永浩数字人将登陆百度电商直播;4)OpenAI员工套现近30亿美元,软银成最大接盘方;5)ChatGPT推出深度研究和语音模式升级;6)Meta发布V-JEPA2模型,提升机器人环境适应能力;7)AMD与OpenAI合作推出新一代AI芯片;8)Google Gemini集成Imagen4图像生成模型;9)谷歌AI实现10公里级精准天气预报;10)Gartner预测到2028年80%的AI应用开发时间将缩短50%。

  • AI日报: ChatGPT免费开放记忆功能;华为WATCH 5智能手表接入双大模型;Claude Pro升级重磅功能

    本期AI日报主要报道了多项AI领域重要进展:1)OpenAI向所有ChatGPT用户免费开放记忆功能;2)蚂蚁集团推出"AI健康管家",服务4000万用户;3)Anthropic与DeepLearning.AI合作推出免费MCP课程;4)谷歌DeepMind开发无需3D模型即可生成逼真运动视频的新技术;5)Exa与OpenRouter合作为400+大模型提供实时网络搜索功能;6)中国知网推出CNKI AI学术研究助手;7)Anthropic推出Claude Explains博客项目;8)Claude Pro新增研究模式和远程MCP整合功能;9)Fish Audio发布基于200万小时数据训练的OpenAudio S1语音模型;10)OpenAI升级Codex编程工具;11)华为WATCH5接入盘古和DeepSeek双大模型。