首页 > 原创 > 关键词  > OpenAI最新资讯  > 正文

AI日报:OpenAI下周或发布GPT-4.1系列;Pika全新AI视频功能Twists;商汤科技日日新V6震撼发布

2025-04-11 15:40 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用

新鲜AI产品点击了解:https://top.aibase.com/

1、报道称OpenAI下周重磅发布GPT-4.1系列,包含Mini版和Nano版

OpenAI即将发布GPT-4.1系列及o3系列,标志着其在多模态和推理能力上的重大进展。GPT-4.1将提升文本、图像和音频处理能力,并推出轻量化版本以适应不同应用场景。同时,o3系列将通过独特的推理技术进一步增强逻辑处理能力。这些更新不仅展示了OpenAI的创新雄心,也为用户带来更智能的AI工具。

image.png

【AiBase提要:】

🧠 GPT-4.1系列将提升多模态处理能力,推出Mini和Nano版以适应资源受限场景。

🔍 o3系列将展示卓越的推理能力,采用独特的“私有推理链”技术解决复杂逻辑任务。

📱 升级后的模型将为开发者和用户提供更智能的AI助手,改善写作、编程和日常交互体验。

2、Pika推出全新AI视频功能Pika Twists,可以操控编辑视频中的任何角色或物体

Pika最近推出了Pika Twists,一个创新的AI视频编辑功能,允许用户通过简单的文本提示为视频添加意想不到的剧情转折。这一功能不仅提升了视频创作的灵活性和趣味性,还降低了制作高质量视频的门槛。用户无需专业技能,只需上传视频并输入想要的效果,AI便能迅速生成惊艳的结果。

【AiBase提要:】

🎬 Pika Twists允许用户通过简单提示动态修改视频内容,创造戏剧性和幽默效果。

🌟 该功能对所有用户开放,免费用户可体验Turbo模式,Pro用户享有完整权限。

🚀 Pika Twists简化了视频特效制作流程,树立了AI视频生成行业的新标杆。

3、华为诺亚方舟实验室携手港大发布最强开源扩散语言模型 Dream7B,打破文本生成格局

华为诺亚方舟实验室与香港大学自然语言处理组联合推出的Dream7B语言模型,标志着扩散模型在文本生成领域的重大突破。这一模型在性能上超越了现有的扩散语言模型,并在通用能力、数学、代码及规划能力上与顶尖自回归模型相媲美,甚至有时超越它们。

image.png

【AiBase提要:】

🌟 Dream7B被誉为最强开源扩散语言模型,超越现有模型的性能。

🔍 采用离散扩散模型架构,双向语境建模实现更强的文本生成能力。

⚙️ 开源基础模型和微调模型,促进扩散模型在NLP领域的研究与应用。

详情链接:https://top.aibase.com/tool/dream-7b

4、商汤科技日日新V6震撼发布:多模态AI再升级,API明日开放!

商汤科技发布了其最新一代人工智能大模型“日日新V6”,在多模态能力上取得了显著突破,进一步巩固了其在AI领域的领先地位。该模型不仅能够处理文本、图像和视频等多种数据类型,还将在API开放后为开发者提供强大的技术支持,推动AI应用的快速落地。

image.png

【AiBase提要:】

🚀 日日新V6在多模态能力上实现了重大突破,能够处理文本、图像、视频等多种数据类型。

🌍 商汤科技的AI大模型在推理速度和生成质量上进一步提升,对标国际领先模型,展现强大竞争力。

💻 API将于明日开放,赋能开发者生态,助力多样化应用的快速构建。

5、宇树G1人形机器人拳击技能展示:摔倒后4秒内可自主站立

宇树科技近日发布的G1人形机器人搏击视频引发了广泛关注,展示了其在动态运动控制与智能交互方面的突破。视频中,G1不仅能精准击打固定目标,还能与人类拳手和其他机器人进行实战对打。尽管在对抗中多次被击倒,G1展现了出色的恢复能力,能在4秒内自主站立,体现了其灵活性与鲁棒性。

【AiBase提要:】

🤜 G1机器人展示了精准的拳击、闪避和平衡调整等复杂动作,展现出高水平的动态性能。

🤖 尽管在与人类拳手的对抗中存在反应速度和攻击准确性不足的问题,G1仍能迅速恢复并重新站立。

🎥 宇树科技即将推出机器人格斗直播活动,为机器人技术爱好者提供全新的观赏体验。

6、ChatGPT正式推出长期记忆功能,AI交互迈向新高度

OpenAI最新推出的ChatGPT长期记忆功能,标志着其在个性化交互方面的重要升级。此功能允许ChatGPT自动存储用户的聊天记录,从而提供更精准的个性化回应,提升用户体验。同时,用户对记忆功能拥有完全的控制权,确保隐私安全。

【AiBase提要:】

🗣️ 长期记忆功能允许ChatGPT自动存储用户聊天记录,从而提供个性化回应。

🔒 用户可以灵活控制记忆功能,确保隐私安全,无需担心历史数据被滥用。

🚀 Plus与Pro用户率先体验新功能,反馈显示系统在处理复杂任务时更具理解力。

7、Krea发布全新工具Krea Stage:从图片到3D场景:一键构建沉浸式世界

Krea Stage的发布标志着3D创作和视频生成领域的一次重大变革。该工具通过强大的AI技术,用户只需上传一张图片即可快速生成可编辑的3D场景,极大地简化了创作流程并降低了技术门槛。同时,Krea Stage还具备跨场景视频生成能力,确保视觉一致性,为创作者提供了更大的艺术表达空间。

【AiBase提要:】

🌟 Krea Stage通过AI技术实现从2D图片到3D场景的快速转换,降低了创作的技术门槛。

🎥 该工具支持跨场景视频生成,确保每一帧与原始场景保持一致,适合高视觉连贯性的内容创作。

🎨 Krea Stage的低门槛设计促进了创作的民主化,使更多非专业用户能够参与到高品质内容创作中。

8、Canva发布全新AI功能:涵盖AI助手、指令生成应用、动态表格等

Canva近期推出了一系列创新AI功能,旨在简化设计流程并提升用户创意表达的效率。这些新功能包括AI助手、指令生成应用和动态电子表格等,用户可以通过自然语言与AI互动,实现多样化的设计需求。此外,Canva对用户体验和内容安全性给予了高度重视,确保即使是零设计经验的用户也能轻松上手。

image.png

【AiBase提要:】

🤖 Canva AI助手提供智能化设计建议,帮助用户快速生成多样化内容。

🛠️ 指令生成应用允许用户通过自然语言创建交互式设计,无需编程经验。

📊 Canva Sheets实现数据与设计的深度融合,支持实时数据导入与可视化。

9、OpenAI开源BrowseComp,衡量 AI 代理浏览网页能力的新基准

OpenAI近期推出BrowseComp,一个全新的开源基准测试,旨在评估AI代理在网络浏览中的能力。该测试包含1266道高难度问题,专注于复杂信息的定位与整合,推动AI研究的透明性和协作。BrowseComp的开源将为开发者提供直接参与的机会,促进AI技术的进步,并为行业应用提供新的可能性,尤其是在信息爆炸的时代。

image.png

【AiBase提要:】

🔍 BrowseComp是一个包含1266道高难度问题的基准测试,专注于AI代理在复杂信息中的定位能力。

💻 OpenAI将BrowseComp完全开源,降低了研究门槛,鼓励全球开发者参与AI代理的优化。

🚀 该基准测试为AI代理的实际应用提供了新想象空间,尤其在市场调研和个性化推荐等领域。

详情链接:https://openai.com/index/browsecomp/

10、LinkedIn数据:全球AI人才最集中的十个国家,以色列居首

根据LinkedIn最新发布的数据,全球对人工智能人才的需求正在迅速上升。以色列以1.98%的AI人才比例位居全球第一,新加坡和卢森堡紧随其后。尽管印度未能进入前十,但其AI人才浓度在2016年至2024年间增长了252%。新加坡在AI技能学习上投入的时间显著高于其他亚太国家,显示出其在AI人才培养方面的竞争力。

【AiBase提要:】

🌍2024年,全球AI人才最集中的国家分别是以色列、新加坡和卢森堡。

📈 印度的AI人才集中度在2016年至2024年间增加了252%,显示出强劲的技能提升趋势。

💡 新加坡的专业人士在学习AI技能上投入的时间,比亚太地区其他国家多出40%。

举报

  • 相关推荐
  • AI日报:腾讯发布设计智能体Ardot;千问5月20日将发布重大模型;OpenAI推出ChatGPT个人理财工具

    本期AI日报聚焦八大热点:腾讯发布AI设计平台Ardot,一句话生成可编辑设计稿并一键转代码;通义千问“重量级”大模型将于5月20日阿里云峰会亮相,实现全面升级;AI大模型在基层警务中落地,豆包助力破获柴油盗窃案;Google I/O大会将推出Gemini 4.0等创新产品;索尼澄清Xperia 1XIII的AI相机助手仅提供拍摄建议;OpenAI推出ChatGPT个人理财工具,结合GPT-5.5支持连接银行账户;中国大模型周调用量连续三周超越美国,腾讯Hy3 preview以2.66万亿Token领先;红果短剧回应取消AI仿真人剧本保底传闻,称部分剧本仍保留保底政策。

  • 多模态训练提速45% 百度智能云推出开源全模态训练框架

    多模态大模型时代,训练基础设施正面临结构性错位。传统框架基于“数据同质、结构单一、平台固定”设计,难以应对多模态异构数据、模型组件协同及跨平台算力需求。百度百舸开源的全模态训练框架LoongForge,以Megatron为核心引擎,通过统一模型抽象、系统层优化和硬件插件化设计,实现“一套代码多平台运行”。其CCT通算传并行、ChunkPipe流水线并行、自适应FP8等技术,在主流模型上实现15%-45%端到端训练加速,在DeepSeek等前沿架构上实现倍级性能提升,并在5000+卡昆仑P800集群上达到90%+线性扩展效率。

  • 现场没看够?一文“云”逛智微智能AI全栈产品发布会硬核展区

    近日,智微智能举办“智启·万象”AI全栈产品发布会,展示覆盖感知AI、生成式AI、代理AI到物理AI的技术广度,以及通用与专用型产品的纵深布局。展区亮点包括:基于Jetson平台的视觉AI方案、支持大模型推理的SYS系列AI服务器、搭载JWiClaw平台的智能体工作站、人形机器人控制器及智元灵犀X2机器人等。此外,AI PC、智慧教育终端、工业机器视觉及穿戴式AI产品也悉数亮相,体现AI从概念走向现实,赋能千行百业智能化升级。

  • 出门问问CodeBanana入选36氪「2026 AI最佳场景渗透案例」:AI协作从工具走向组织操作系统出

    36氪公布“2026 AI最佳场景渗透案例”评选结果,出门问问的AI原生协作平台CodeBanana(CB)凭借在企业协作中的深度实践入选。该评选历时3个月,从场景渗透度、商业价值力、技术创新力、可复制性四个维度,覆盖10余个领域,从数百案例中精选出标杆。CB以“项目”为核心,实现多角色实时并行协作、技能市场、A2A跨项目协作、Cron Job主动工作及企业级可控可审计五大能力,将《超级组织》理念落地,研发实现100% AI Coding,产研效率提升4倍,Token成本仅占人力成本约15%。

  • 一场精彩的AI成果“阅兵式”,智微AI全栈产品发布会圆满收官!

    近日,智微智能以“智启·万象”为主题举办AI全栈产品发布会,展示从云端算力到AI硬件、智能体到具身智能的全栈成果。英特尔与英伟达两大算力巨头助阵,强调混合AI趋势。智微发布覆盖“云-边-端”架构的AI服务器、工作站、边缘AI BOX、具身智能机器人控制器等核心产品,并推出面向大模型落地的HAT智算云平台,通过自研推理优化引擎实现降本增效。同时,其AI PC方案支持

  • AI日报:OpenAI发布三款实时语音模型;苹果首款AI硬件曝光;美团入局AI社交赛道

    今日AI热点:OpenAI发布三款实时语音模型,覆盖推理对话、翻译和转录场景;苹果首款AI硬件AirPods进入DVT阶段,内置摄像头;宇树科技UniStore平台开放,开启人形机器人应用商店时代;阶跃星辰完成25亿美元融资,冲刺香港IPO;美团推出首个数字生命共生社区“鲸游”公测;OpenAI推出GPT-5.5-Cyber预览版,专攻网络安全;Mozilla借助AI发现Firefox 271个安全漏洞;OpenAI发布Codex Chrome扩展,优化浏览器工作流。

  • 人声接近真人!OpenAI一口气更新三款超强语音AI

    OpenAI正式宣布对其实时API接口进行重大升级,一次性推出三款全新高阶语音智能模型,全面强化AI在实时听觉、口语交互、翻译与转录方面的能力,并大幅降低企业开发智能语音应用的技术门槛。 本次更新的核心产品包括:GPT-Realtime-2、实时翻译模型以及实时转写模型。其中,GPT-Realtime-2搭载了GPT-5级别的推理能力,人声仿真度进一步提升。 相比前代产品,它能够更精准地理�

  • AI日报:豆包披露付费订阅方案;OpenAI发布GPT-5.5Instant;苹果手机支持第三方AI模型

    今日AI领域动态:豆包推出月费68-500元三档付费订阅,推进商业化;OpenAI发布GPT-5.5 Instant,取代5.3成为ChatGPT默认模型;苹果iOS 27或支持第三方AI模型,打破封闭生态;淘宝“答题免单”上线,首次加入AI试穿玩法;魔形智能完成数亿元Pre-A轮融资,布局Token基础设施;谷歌神秘项目“Remy”曝光,打造24小时AI助教;谷歌推出Gemini Ultra Lite新订阅服务,填补中高端市场空白;ChatGPT上线广告主平台,AI商业化迎来分水岭。

  • AI新王诞生!Anthropic估值冲爆1.2万亿 首次反超OpenAI

    长期笼罩在OpenAI阴影下的二号选手”Anthropic,近期在链上Pre-IPO市场的隐含估值骤然飙升至1.2万亿美元(约合人民币8.7万亿元)。 若Anthropic以这一估值顺利完成首次公开募股,它将直接跃升为全球第11大上市公司,缔造商业史上的新神话。 最新链上Pre-IPO交易数据显示,短短七天内,Anthropic估值暴涨20%,单周涨幅已相当于一家头部上市公司的体量。而自2025年10月以来,其估值曲

  • AI日报:GPT5.6开始内测;阿里2026财年Q4财报AI收入激增;MiniMax Agent正式更名Mavis

    今日AI领域动态:OpenAI与Anthropic展开AI编程工具补贴大战,GPT-5.6已内测,开发者受益;阿里巴巴发布财报,AI云业务爆发,百炼平台ARR将破百亿;MiniMax升级Agent产品为Mavis,支持多智能体协作;腾讯辟谣姚顺雨离职传言;谷歌与SpaceX合作开发太空太阳能数据中心;Anthropic提升Claude Code额度50%;Meta推出WhatsApp AI隐身模式;OpenAI回应供应链攻击,称未发现用户数据泄露。

今日大家都在搜的词: