首页 > 业界 > 关键词  > GPT-4.5最新资讯  > 正文

今日AI:GPT-4.5意外曝光可能6月发布、UP主借AI识别情绪播放量186万、全球首个AI程序员诞生

2024-03-13 14:54 · 稿源:站长之家

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

📢一分钟速看版

▶OpenAI的GPT-4.5Turbo意外曝光,可能6月发布

▶全球首个AI程序员诞生 码农饭碗被砸

▶become-image:人物照片+参考照片可生成目标风格人物照

▶Paper-Piano纸上钢琴:只需一纸就能演奏钢琴

▶全球首部AI生成长电影首映门票售罄

▶B站UP主借AI识别情绪整活《亮剑》名场面播放量186万

▶DragAnything:拖动锚点精准控制视频物体和镜头运动

▶Llama-3基础训练设施公开,用了4.9万个H100

📰🤖📢AI新鲜事

OpenAI的GPT-4.5Turbo意外曝光,可能6月发布

image.png

【AiBase提要:】

- 💡 OpenAI 的 GPT-4.5Turbo 被泄露,搜索引擎如 Bing 和 DuckDuck Go 在官方公告前索引了产品页面。

- 💡 GPT-4.5Turbo 被描述为 OpenAI 迄今最快、最准确、最可扩展的模型,具有256,000个token的上下文窗口。

- 💡 传言GPT-4.5Turbo 可能具有视频或3D 功能,但泄露的信息并未提及。

详情:https://www.chinaz.com/2024/0313/1603010.shtml

全球首个AI程序员诞生 码农饭碗被砸

【AiBase 提要:】

⚡ 全球首位 AI 软件工程师 Devin 诞生,掌握全栈技能,云端部署、底层代码、训练和微调 AI 模型。

⚡ Cognition 公司打造 Devin,开发团队拥有10块 IOI 金牌,震撼全网,影响深远。

⚡ Devin 的能力强大,能规划复杂工程任务、构建应用程序、自主查找代码库错误、训练微调 AI 模型。

详情:https://www.chinaz.com/2024/0313/1603012.shtml

谷歌限制Gemini回答与选举相关的查询

【AiBase提要:】

- 🤖 Google 限制 AI 聊天机器人 Gemini 回答与今年将在多个国家举行的选举有关的查询。

- 🌍 这一决定是为了减少在技术部署中潜在的错误。

- 🇺🇸 除美国外,还有几个大国计划进行全国选举,包括南非、俄罗斯和印度。

详情:https://www.chinaz.com/2024/0313/1603006.shtml

全球首部AI生成长电影首映门票售罄

image.png

【AiBase提要:】

🎬 "Our T2Remake":全球首部完全由AI生成的电影,翻拍《终结者2》,在洛杉矶首映,引起热议。

🤖 电影内容:AI电影以OpenAI、ChatGPT和AGI为主题,由50位艺术家合作创作,使用多种AIGC工具完成。

🔄 网友反应:社交平台上网友对电影评价较少,一些人评论讽刺,用AI制作反AI的电影,具有讽刺意味。

详情:https://www.chinaz.com/2024/0313/1602989.shtml

B站UP主借AI识别情绪整活《亮剑》名场面播放量186万

image.png

【AiBase 提要:】

⭐️ B 站 UP 主 “佛辣西威” 用《亮剑》片段制作 AI 识别情绪视频。

⭐️ 视频播放量达186万,吸引众多网友关注,形成 “梗上加梗” 场面。

⭐️ 利用AI情绪识别技术,UP主在经典剧场面中加入戏剧性和幽默感,增加了视频趣味性。

详情:https://www.chinaz.com/2024/0313/1602977.shtml

Llama-3基础训练设施公开,用了4.9万个H100

image.png

【AiBase提要:】

⭐️ Meta 发布两个24KH100GPU 集群,也就是用了49152个H100用于 Llama-3大模型训练

⭐️ Llama-3采用 RoCEv2网络和 Tectonic/Hammerspace 的 NFS/FUSE 网络存储

⭐️ 预计 Llama-3将于4月末或5月中旬上线,将拥有600,000个 H100算力

详情:https://www.chinaz.com/2024/0313/1602961.shtml

2024生成式AI及AIGC应用洞察报告 国内前十AI应用月活用户5000万

【AiBase提要:】

📊 国内前十AI应用月活用户达5000万,相当于ChatGPT日活用户量;

👫 用户性别失衡,男性占比超75%,年龄主要25-35岁;

📈 抖音豆包三个月超越百度文心,月活用户增长40%;

📉 头部AI应用用户活跃率仅约10%,3日留存率平均30%;

🌟 微博和B站在AI内容平台表现突出,TGI接近200。

报告地址:https://qqi2gjmnk4.feishu.cn/wiki/WW53wXigRiEYwvklDCzc3iZVnUh

🤖📱💼AI应用

become-image:人物照片+参考照片可生成目标风格人物照

image.png

【AiBase 提要:】

⭐️ 只要上传一张人物照片和一张参考风格的照片就可以将任何人脸图片转换成另一种风格的图像。

⭐️ 可调节生成图片的相关参数,包括保留原始人脸图像的程度、强度控制以及样式应用等。

⭐️ 可以选择添加一些特殊效果,如控制生成图片的噪声程度、固定随机种子以确保再现性等。

项目入口:https://top.aibase.com/tool/cog-become-image

试玩地址:https://replicate.com/fofr/become-image

Deepgram Aura:实时文本转语音API,低于 250 毫秒

image.png

【AiBase 提要:】

⏰ 低延迟:响应不超过 250 毫秒。

💬 自然对话:人类般流畅自然,动态调整音调和情绪。

🔄 实时互动:支持与人类的实时信息交换。

体验入口:https://aura-tts-demo.deepgram.com/

项目网址:https://github.com/deepgram-devs/deepgram-conversational-demo

快手出品!DragAnything:拖动锚点精准控制视频物体和镜头运动

image.png

⭐️ 快手科技联合浙大研究团队提出了 DragAnything 方法,利用实体表示实现了对任何物体的运动控制。

⭐️ 可以精确控制物体的运动,生成高质量视频,用户只需在交互过程中绘制一条轨迹。

⭐️该技术技术还可以同时对多个对象实现不同的运动控制。

项目入口:https://top.aibase.com/tool/draganything

Paper-Piano纸上钢琴:只需一纸就能演奏钢琴

image.png

【AiBase提要:】

🎹 纸上钢琴,不需要购买真实钢琴,只需一张纸就能演奏音乐。

📹 项目支持最多2个手指,未来将支持更多手指及高度敏感的训练模型。

🛠️ 利用网络摄像头跟踪用户的手指移动,通过识别手指在纸上的位置来模拟钢琴键的按压。

项目入口:https://top.aibase.com/tool/paper-piano

MDTv2开源,Sora 核心组件 DiT 训练提速10倍

【AiBase 提要:】

⭐️ 颜水成 / 程明明团队发布最新版本的论文和代码,开源 Masked Diffusion Transformer V2。

⭐️ 提出 Masked Diffusion Transformer V2在 ImageNet 上达到1.58的 FID score。

⭐️ 利用 mask modeling 表征学习策略大幅加速 DiT 的训练速度。

论文地址:https://arxiv.org/abs/2303.14389

项目入口:https://top.aibase.com/tool/masked-diffusion-transformer-mdt-

AI 图片橡皮擦来了!SPM实现精准擦除特定内容,还能改头换面

image.png

【AiBase 提要:】

⭐️ AI 图片橡皮擦技术,可以精准擦除特定概念,保留其他生成内容。

⭐️ 概念半透膜模型 (SPM),可在 Diffusion 架构的 AI 作图模型中实现概念擦除。

⭐️ SPM 技术框架包括轻量化 Adapter、微调策略和动态适配,提高模型擦除效果。

项目入口:https://top.aibase.com/tool/spm

今AI绘画提示词:自拍少女

3_1710308272314_ai2023_Photography_photo_collectionA_beautiful_18-year-old_Chin_e2359193-09fc-4533-bbed-096310acfb7b.png

图源备注:图片由AI生成,图片授权服务商Midjourney

提示词:Photography photo collection,A beautiful18-year-old Chinese girl is holding her phone and taking selfies in front of the camera. She is wearing a Korean white college style sweater, paired with a light blue checkered skirt, and wearing a light blue felt beret on her head, with a well-designed layout --ar16:9--v6.0--style raw

举报

  • 相关推荐
  • 年薪15万程序员下班送外卖称解压:乐在其中 像在寻宝一样

    ​27岁的麻先生作为河南郑州某央企的程序员,他年薪约15万元,却选择在下班后化身外卖骑手,用这种方式来释放工作压力。 麻先生表示,由于工作性质需要经常进行复杂的逻辑思考,下班后他渴望一种简单直接的放松方式。跑外卖对他而言,就像一场轻松的寻

  • AI日报:海螺AI首尾帧功能上线;元石科技发布问小白5;OpenAI发布全新语音模型GPT-Realtime

    AI日报栏目每日提供人工智能领域热点内容,聚焦开发者,帮助洞悉技术趋势、了解创新AI产品应用。最新动态包括:MiniMax海螺AI首尾帧功能上线;元石科技发布问小白5挑战GPT-5;OpenAI推出语音模型GPT-Realtime;谷歌Gemini AI优化表格处理;腾讯黑科技实现AI配音;百度计划培养千万AI人才;MathGPT.ai反作弊功能推广;苹果Xcode集成Claude Sonnet4;微软发布自研AI模型MAI系列;xAI推出高效编码模型Grok Code Fast1;SuperCLUE多模态评测Gemini-2.5-Pro居首;9月1日起AI内容标识新规实施,违规将承担法律风险。

  • OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

    OpenAI正式发布语音模型GPT-realtime。 据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。 官方表示,新模型在复杂指令遵循、工具精确调用以及生成更自然、�

  • 2025年大模型选型核心指南:Beyond GPT-4,如何理性评估Qwen、DeepSeek等强者?

    大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架,强调需超越单一指标崇拜,基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析,展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程,采用专业工具进行多维度评估,通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型,而非盲目追求流行模型。

  • 当GPT-5遇上Gemini 2.5,谁更适合你的业务?这份对比报告说了算

    某跨境电商CTO复盘会上展示:GPT-5 Standard处理百万级商品描述时,费用比Gemini 2.5 Flash-Lite高35%,响应速度慢0.8秒。大模型选型面临参数迷雾、场景错配、隐藏成本三重困境。AIbase选型对比平台通过真实数据测试,提供透明价格拆解和性能雷达图,帮助规避预算陷阱。实测显示GPT-5在合同逻辑分析准确率高3.2%,而Gemini表格解析速度快40%、月总成本低26%。工具可动态追踪官方调价,生成定制化决策报告,用数据替代经验主义,提升技术选型效率。

  • OpenAI CEO:GPT-6将具备个性化记忆 记住用户偏好习惯

    OpenAI的首席执行官萨姆奥尔特曼(Sam Altman)在近日的一次专访中,透露了下一代大模GPT-6的最新进展。他表示,GPT-6 的开发正在积极推进中,其发布节奏将比从GPT-4到GPT-5的周期更快。 奥尔特曼特别强调,GPT-6将不再局限于单纯回答问题,而是朝着与用户深度适配”的方向演进。他举例描述

  • 从1920TPS到2400TPS,华为云Tokens服务全面接入384超节点

    华为云在2025年8月27日宣布其Tokens服务全面接入CloudMatrix384超节点,通过xDeepServe架构创新,实现单芯片最高2400TPS吞吐量和50ms低延迟,性能超越业界水平。该服务基于MaaS模式,提供多种规格选择,支持大模型和AI工具,助力企业快速开发AI应用。同时,华为云与超100家伙伴合作,深入行业场景,共建智能生态,加速各行业AI落地。

  • 推荐2025年必种草的AI一键ppt转视频创作工具

    文章介绍了三款AI工具(课件帮、Visionstory、Fliki),可将静态PPT快速转换为动态视频微课。这些工具操作简便,支持自动生成口播稿、多语言配音、智能字幕及动画效果,适用于教育、企业培训等多种场景,无需专业技能即可上手,大幅提升视频制作效率。

  • 中国冰箱业TOP5型号4款是海尔

    2025年7月冰箱行业零售额、零售量增速放缓,环比下降34.5%和29.1%。行业承压加剧,多数品牌负增长,仅海尔冰箱逆势增长9.1%。海尔凭借爆款产品带动增长,TOP5型号中占4款,均为主打高端十字门冰箱。其磁控全空间保鲜技术获国家科技奖,显著延长食材保鲜期。通过全流程数字化升级,海尔实现运营效率提升,以科技驱动和用户体验赢得市场,为行业提供增长启示。

  • 腾讯回应被米哈游起诉:没正式程序 不能违规提供QQ用户资料

    近日,“米哈游告腾讯”一事登上热搜,引发广泛关注。 据公开信息显示,上海米哈游影铁科技有限公司与深圳市腾讯计算机系统有限公司之间新增一起其他民事诉讼案件,案号为(2025)粤0305民初47660号,该案将于9月5日在广东省深圳市南山区人民法院第1018审判庭开庭审理。

今日大家都在搜的词: