首页 > 原创 > 关键词  > OpenAI最新资讯  > 正文

AI日报:OpenAI下周或发布GPT-4.1系列;Pika全新AI视频功能Twists;商汤科技日日新V6震撼发布

2025-04-11 15:40 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用

新鲜AI产品点击了解:https://top.aibase.com/

1、报道称OpenAI下周重磅发布GPT-4.1系列,包含Mini版和Nano版

OpenAI即将发布GPT-4.1系列及o3系列,标志着其在多模态和推理能力上的重大进展。GPT-4.1将提升文本、图像和音频处理能力,并推出轻量化版本以适应不同应用场景。同时,o3系列将通过独特的推理技术进一步增强逻辑处理能力。这些更新不仅展示了OpenAI的创新雄心,也为用户带来更智能的AI工具。

image.png

【AiBase提要:】

🧠 GPT-4.1系列将提升多模态处理能力,推出Mini和Nano版以适应资源受限场景。

🔍 o3系列将展示卓越的推理能力,采用独特的“私有推理链”技术解决复杂逻辑任务。

📱 升级后的模型将为开发者和用户提供更智能的AI助手,改善写作、编程和日常交互体验。

2、Pika推出全新AI视频功能Pika Twists,可以操控编辑视频中的任何角色或物体

Pika最近推出了Pika Twists,一个创新的AI视频编辑功能,允许用户通过简单的文本提示为视频添加意想不到的剧情转折。这一功能不仅提升了视频创作的灵活性和趣味性,还降低了制作高质量视频的门槛。用户无需专业技能,只需上传视频并输入想要的效果,AI便能迅速生成惊艳的结果。

【AiBase提要:】

🎬 Pika Twists允许用户通过简单提示动态修改视频内容,创造戏剧性和幽默效果。

🌟 该功能对所有用户开放,免费用户可体验Turbo模式,Pro用户享有完整权限。

🚀 Pika Twists简化了视频特效制作流程,树立了AI视频生成行业的新标杆。

3、华为诺亚方舟实验室携手港大发布最强开源扩散语言模型 Dream7B,打破文本生成格局

华为诺亚方舟实验室与香港大学自然语言处理组联合推出的Dream7B语言模型,标志着扩散模型在文本生成领域的重大突破。这一模型在性能上超越了现有的扩散语言模型,并在通用能力、数学、代码及规划能力上与顶尖自回归模型相媲美,甚至有时超越它们。

image.png

【AiBase提要:】

🌟 Dream7B被誉为最强开源扩散语言模型,超越现有模型的性能。

🔍 采用离散扩散模型架构,双向语境建模实现更强的文本生成能力。

⚙️ 开源基础模型和微调模型,促进扩散模型在NLP领域的研究与应用。

详情链接:https://top.aibase.com/tool/dream-7b

4、商汤科技日日新V6震撼发布:多模态AI再升级,API明日开放!

商汤科技发布了其最新一代人工智能大模型“日日新V6”,在多模态能力上取得了显著突破,进一步巩固了其在AI领域的领先地位。该模型不仅能够处理文本、图像和视频等多种数据类型,还将在API开放后为开发者提供强大的技术支持,推动AI应用的快速落地。

image.png

【AiBase提要:】

🚀 日日新V6在多模态能力上实现了重大突破,能够处理文本、图像、视频等多种数据类型。

🌍 商汤科技的AI大模型在推理速度和生成质量上进一步提升,对标国际领先模型,展现强大竞争力。

💻 API将于明日开放,赋能开发者生态,助力多样化应用的快速构建。

5、宇树G1人形机器人拳击技能展示:摔倒后4秒内可自主站立

宇树科技近日发布的G1人形机器人搏击视频引发了广泛关注,展示了其在动态运动控制与智能交互方面的突破。视频中,G1不仅能精准击打固定目标,还能与人类拳手和其他机器人进行实战对打。尽管在对抗中多次被击倒,G1展现了出色的恢复能力,能在4秒内自主站立,体现了其灵活性与鲁棒性。

【AiBase提要:】

🤜 G1机器人展示了精准的拳击、闪避和平衡调整等复杂动作,展现出高水平的动态性能。

🤖 尽管在与人类拳手的对抗中存在反应速度和攻击准确性不足的问题,G1仍能迅速恢复并重新站立。

🎥 宇树科技即将推出机器人格斗直播活动,为机器人技术爱好者提供全新的观赏体验。

6、ChatGPT正式推出长期记忆功能,AI交互迈向新高度

OpenAI最新推出的ChatGPT长期记忆功能,标志着其在个性化交互方面的重要升级。此功能允许ChatGPT自动存储用户的聊天记录,从而提供更精准的个性化回应,提升用户体验。同时,用户对记忆功能拥有完全的控制权,确保隐私安全。

【AiBase提要:】

🗣️ 长期记忆功能允许ChatGPT自动存储用户聊天记录,从而提供个性化回应。

🔒 用户可以灵活控制记忆功能,确保隐私安全,无需担心历史数据被滥用。

🚀 Plus与Pro用户率先体验新功能,反馈显示系统在处理复杂任务时更具理解力。

7、Krea发布全新工具Krea Stage:从图片到3D场景:一键构建沉浸式世界

Krea Stage的发布标志着3D创作和视频生成领域的一次重大变革。该工具通过强大的AI技术,用户只需上传一张图片即可快速生成可编辑的3D场景,极大地简化了创作流程并降低了技术门槛。同时,Krea Stage还具备跨场景视频生成能力,确保视觉一致性,为创作者提供了更大的艺术表达空间。

【AiBase提要:】

🌟 Krea Stage通过AI技术实现从2D图片到3D场景的快速转换,降低了创作的技术门槛。

🎥 该工具支持跨场景视频生成,确保每一帧与原始场景保持一致,适合高视觉连贯性的内容创作。

🎨 Krea Stage的低门槛设计促进了创作的民主化,使更多非专业用户能够参与到高品质内容创作中。

8、Canva发布全新AI功能:涵盖AI助手、指令生成应用、动态表格等

Canva近期推出了一系列创新AI功能,旨在简化设计流程并提升用户创意表达的效率。这些新功能包括AI助手、指令生成应用和动态电子表格等,用户可以通过自然语言与AI互动,实现多样化的设计需求。此外,Canva对用户体验和内容安全性给予了高度重视,确保即使是零设计经验的用户也能轻松上手。

image.png

【AiBase提要:】

🤖 Canva AI助手提供智能化设计建议,帮助用户快速生成多样化内容。

🛠️ 指令生成应用允许用户通过自然语言创建交互式设计,无需编程经验。

📊 Canva Sheets实现数据与设计的深度融合,支持实时数据导入与可视化。

9、OpenAI开源BrowseComp,衡量 AI 代理浏览网页能力的新基准

OpenAI近期推出BrowseComp,一个全新的开源基准测试,旨在评估AI代理在网络浏览中的能力。该测试包含1266道高难度问题,专注于复杂信息的定位与整合,推动AI研究的透明性和协作。BrowseComp的开源将为开发者提供直接参与的机会,促进AI技术的进步,并为行业应用提供新的可能性,尤其是在信息爆炸的时代。

image.png

【AiBase提要:】

🔍 BrowseComp是一个包含1266道高难度问题的基准测试,专注于AI代理在复杂信息中的定位能力。

💻 OpenAI将BrowseComp完全开源,降低了研究门槛,鼓励全球开发者参与AI代理的优化。

🚀 该基准测试为AI代理的实际应用提供了新想象空间,尤其在市场调研和个性化推荐等领域。

详情链接:https://openai.com/index/browsecomp/

10、LinkedIn数据:全球AI人才最集中的十个国家,以色列居首

根据LinkedIn最新发布的数据,全球对人工智能人才的需求正在迅速上升。以色列以1.98%的AI人才比例位居全球第一,新加坡和卢森堡紧随其后。尽管印度未能进入前十,但其AI人才浓度在2016年至2024年间增长了252%。新加坡在AI技能学习上投入的时间显著高于其他亚太国家,显示出其在AI人才培养方面的竞争力。

【AiBase提要:】

🌍2024年,全球AI人才最集中的国家分别是以色列、新加坡和卢森堡。

📈 印度的AI人才集中度在2016年至2024年间增加了252%,显示出强劲的技能提升趋势。

💡 新加坡的专业人士在学习AI技能上投入的时间,比亚太地区其他国家多出40%。

举报

  • 相关推荐
  • 微软发布AI截图工具,截图一键转PPT

    微软电脑管家推出全新“智能圈选”功能,通过AI技术实现截图内容的智能识别与重构。用户只需圈选截图区域,即可一键完成文字提取、多语言翻译及PPT转换等操作,大幅提升办公和学习效率。该功能支持100多种语言,保留原始格式,并能智能修复遮挡内容,彻底改变了传统截图处理方式。

  • OpenAI CEO:GPT-6将具备个性化记忆 记住用户偏好习惯

    OpenAI的首席执行官萨姆奥尔特曼(Sam Altman)在近日的一次专访中,透露了下一代大模GPT-6的最新进展。他表示,GPT-6 的开发正在积极推进中,其发布节奏将比从GPT-4到GPT-5的周期更快。 奥尔特曼特别强调,GPT-6将不再局限于单纯回答问题,而是朝着与用户深度适配”的方向演进。他举例描述

  • 博士水平的GPT-5依然翻车 OpenAI奥特曼:AGI已失去意义

    上周末OpenAI公司发布了传闻已久的GPT-5大模型,号称迄今为止最先进的人工智能模型,具备博士级别的智能水平。 GPT-5发布之后在多个榜单上确实刷榜了,包括编程、数学等,总计拿到了25个榜单的第一,评分表现很震撼。 然而上线之后,GPT-5的实际表现引发质疑,跑分第一不代表实际体验第一,甚至被不少用户认为表现倒退了,反应也变慢,这可能是OpenAI翻车最快的旗舰大�

  • OpenAI的开源模型现已在IBM watsonx.ai上提供

    OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B,允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台,采用专家混合架构,支持本地或云端部署,不受商业用途限制。模型具备高透明度,输出完整推理链,在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态,IBM强调其开放战略,为企业提供灵活、安全的AI开发选择。

  • AI日报:B站测试AI视频工具花生AI;腾讯发布多模态模型Large-Vision;昆仑万维开源Skywork UniPic 2.0

    【AI日报】主要内容: 1. B站测试"花生AI"视频工具,3分钟可成片,同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0,实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI,苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐,仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新:恢复GPT-4o默认模式,为GPT-5引入多模式选择,优化交互体验

  • 寒武纪智能芯片赋能多模态大模型应用

    大模型快速发展推动人工智能技术迈向新阶段,从解决特定任务的弱人工智能向处理通用复杂任务的强人工智能演进。IDC报告显示,2024年中国大模型开发平台市场规模达16.9亿元,人工智能算力市场约190亿美元,预计2025年将达259亿美元。寒武纪等企业专注AI芯片研发,推出多款处理器及加速卡产品,支持大模型训练推理及多模态任务,并与产业链合作共同推进人工智能产业发展。

  • GPT5上线大翻车!用户强烈呼吁使用旧版 OpenAI重新上线GPT4o

    OpenAI发布最强AI模型GPT-5,但引发用户强烈不满。新模型上线后反应速度变慢、回答质量下降,且官方突然下架GPT-4o等8个旧模型,导致付费用户抗议。部分用户对旧版产生情感依赖,认为GPT-4o更具人性化温暖。第三方测试显示GPT-5在复杂任务上虽有提升,但交互体验明显退步。CEO承认低估用户对旧版的喜爱,承诺将恢复部分旧模型并提供更多定制服务。专家指出大模型边际效益递减,面临数据质量和算力成本限制。总体而言,GPT-5在技术指标进步的同时,牺牲了情感交互体验。

  • 2025年大模型选型核心指南:Beyond GPT-4,如何理性评估Qwen、DeepSeek等强者?

    大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架,强调需超越单一指标崇拜,基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析,展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程,采用专业工具进行多维度评估,通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型,而非盲目追求流行模型。

  • GPT-5有望明天发布 OpenAI:免费无限使用

    OpenAI宣布将于太平洋时间7月4日上午10点(北京时间7月5日凌晨1点)举办重要直播活动。官方预告中"LIVESTREAM"误写为"LIVE5TREAM",引发网友猜测可能暗示GPT-5即将发布。消息称免费版ChatGPT将在标准设置下开放GPT-5对话功能,但会设置防滥用阈值;Plus和Pro用户则可享受更智能的GPT-5服务,包括语音交互、绘图创作等高级功能。此前CEO奥特曼曾透露GPT-5将整合多项前沿技术。若属实,这将是AI爱好者的重大福利,也将进一步提升ChatGPT的实用性和用户体验。

  • 豆包1.5 Vision Lite 对比 GPT-5-min,谁更适合你?实测AI模型选型利器|AIBase

    文章探讨了企业选择AI大模型时面临的实际决策难题,指出单纯比较学术参数无法满足业务需求。AIBase模型对比平台(https://model.aibase.cn/compare)通过三大核心价值解决痛点:1)聚焦业务场景而非参数堆砌,突出价格、语言支持、上下文长度等实用维度;2)透明化成本计算,标注长文本溢价规则和多模态附加费;3)一键生成对比报告。平台特别强调中文场景的特殊性(如豆包1.5在中文处理成本的优势),并揭示厂商宣传中容易忽略的隐藏成本(如GPT-5-min超5000字符的30%溢价)。典型电商客服案例显示,需综合中文理解、多模态、性价比等维度决策,最终选择取决于具体业务需求而非绝对性能排名。

今日大家都在搜的词: