首页 > 业界 > 关键词  > GPT-4.5最新资讯  > 正文

今日AI:GPT-4.5意外曝光可能6月发布、UP主借AI识别情绪播放量186万、全球首个AI程序员诞生

2024-03-13 14:54 · 稿源:站长之家

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

📢一分钟速看版

▶OpenAI的GPT-4.5Turbo意外曝光,可能6月发布

▶全球首个AI程序员诞生 码农饭碗被砸

▶become-image:人物照片+参考照片可生成目标风格人物照

▶Paper-Piano纸上钢琴:只需一纸就能演奏钢琴

▶全球首部AI生成长电影首映门票售罄

▶B站UP主借AI识别情绪整活《亮剑》名场面播放量186万

▶DragAnything:拖动锚点精准控制视频物体和镜头运动

▶Llama-3基础训练设施公开,用了4.9万个H100

📰🤖📢AI新鲜事

OpenAI的GPT-4.5Turbo意外曝光,可能6月发布

image.png

【AiBase提要:】

- 💡 OpenAI 的 GPT-4.5Turbo 被泄露,搜索引擎如 Bing 和 DuckDuck Go 在官方公告前索引了产品页面。

- 💡 GPT-4.5Turbo 被描述为 OpenAI 迄今最快、最准确、最可扩展的模型,具有256,000个token的上下文窗口。

- 💡 传言GPT-4.5Turbo 可能具有视频或3D 功能,但泄露的信息并未提及。

详情:https://www.chinaz.com/2024/0313/1603010.shtml

全球首个AI程序员诞生 码农饭碗被砸

【AiBase 提要:】

⚡ 全球首位 AI 软件工程师 Devin 诞生,掌握全栈技能,云端部署、底层代码、训练和微调 AI 模型。

⚡ Cognition 公司打造 Devin,开发团队拥有10块 IOI 金牌,震撼全网,影响深远。

⚡ Devin 的能力强大,能规划复杂工程任务、构建应用程序、自主查找代码库错误、训练微调 AI 模型。

详情:https://www.chinaz.com/2024/0313/1603012.shtml

谷歌限制Gemini回答与选举相关的查询

【AiBase提要:】

- 🤖 Google 限制 AI 聊天机器人 Gemini 回答与今年将在多个国家举行的选举有关的查询。

- 🌍 这一决定是为了减少在技术部署中潜在的错误。

- 🇺🇸 除美国外,还有几个大国计划进行全国选举,包括南非、俄罗斯和印度。

详情:https://www.chinaz.com/2024/0313/1603006.shtml

全球首部AI生成长电影首映门票售罄

image.png

【AiBase提要:】

🎬 "Our T2Remake":全球首部完全由AI生成的电影,翻拍《终结者2》,在洛杉矶首映,引起热议。

🤖 电影内容:AI电影以OpenAI、ChatGPT和AGI为主题,由50位艺术家合作创作,使用多种AIGC工具完成。

🔄 网友反应:社交平台上网友对电影评价较少,一些人评论讽刺,用AI制作反AI的电影,具有讽刺意味。

详情:https://www.chinaz.com/2024/0313/1602989.shtml

B站UP主借AI识别情绪整活《亮剑》名场面播放量186万

image.png

【AiBase 提要:】

⭐️ B 站 UP 主 “佛辣西威” 用《亮剑》片段制作 AI 识别情绪视频。

⭐️ 视频播放量达186万,吸引众多网友关注,形成 “梗上加梗” 场面。

⭐️ 利用AI情绪识别技术,UP主在经典剧场面中加入戏剧性和幽默感,增加了视频趣味性。

详情:https://www.chinaz.com/2024/0313/1602977.shtml

Llama-3基础训练设施公开,用了4.9万个H100

image.png

【AiBase提要:】

⭐️ Meta 发布两个24KH100GPU 集群,也就是用了49152个H100用于 Llama-3大模型训练

⭐️ Llama-3采用 RoCEv2网络和 Tectonic/Hammerspace 的 NFS/FUSE 网络存储

⭐️ 预计 Llama-3将于4月末或5月中旬上线,将拥有600,000个 H100算力

详情:https://www.chinaz.com/2024/0313/1602961.shtml

2024生成式AI及AIGC应用洞察报告 国内前十AI应用月活用户5000万

【AiBase提要:】

📊 国内前十AI应用月活用户达5000万,相当于ChatGPT日活用户量;

👫 用户性别失衡,男性占比超75%,年龄主要25-35岁;

📈 抖音豆包三个月超越百度文心,月活用户增长40%;

📉 头部AI应用用户活跃率仅约10%,3日留存率平均30%;

🌟 微博和B站在AI内容平台表现突出,TGI接近200。

报告地址:https://qqi2gjmnk4.feishu.cn/wiki/WW53wXigRiEYwvklDCzc3iZVnUh

🤖📱💼AI应用

become-image:人物照片+参考照片可生成目标风格人物照

image.png

【AiBase 提要:】

⭐️ 只要上传一张人物照片和一张参考风格的照片就可以将任何人脸图片转换成另一种风格的图像。

⭐️ 可调节生成图片的相关参数,包括保留原始人脸图像的程度、强度控制以及样式应用等。

⭐️ 可以选择添加一些特殊效果,如控制生成图片的噪声程度、固定随机种子以确保再现性等。

项目入口:https://top.aibase.com/tool/cog-become-image

试玩地址:https://replicate.com/fofr/become-image

Deepgram Aura:实时文本转语音API,低于 250 毫秒

image.png

【AiBase 提要:】

⏰ 低延迟:响应不超过 250 毫秒。

💬 自然对话:人类般流畅自然,动态调整音调和情绪。

🔄 实时互动:支持与人类的实时信息交换。

体验入口:https://aura-tts-demo.deepgram.com/

项目网址:https://github.com/deepgram-devs/deepgram-conversational-demo

快手出品!DragAnything:拖动锚点精准控制视频物体和镜头运动

image.png

⭐️ 快手科技联合浙大研究团队提出了 DragAnything 方法,利用实体表示实现了对任何物体的运动控制。

⭐️ 可以精确控制物体的运动,生成高质量视频,用户只需在交互过程中绘制一条轨迹。

⭐️该技术技术还可以同时对多个对象实现不同的运动控制。

项目入口:https://top.aibase.com/tool/draganything

Paper-Piano纸上钢琴:只需一纸就能演奏钢琴

image.png

【AiBase提要:】

🎹 纸上钢琴,不需要购买真实钢琴,只需一张纸就能演奏音乐。

📹 项目支持最多2个手指,未来将支持更多手指及高度敏感的训练模型。

🛠️ 利用网络摄像头跟踪用户的手指移动,通过识别手指在纸上的位置来模拟钢琴键的按压。

项目入口:https://top.aibase.com/tool/paper-piano

MDTv2开源,Sora 核心组件 DiT 训练提速10倍

【AiBase 提要:】

⭐️ 颜水成 / 程明明团队发布最新版本的论文和代码,开源 Masked Diffusion Transformer V2。

⭐️ 提出 Masked Diffusion Transformer V2在 ImageNet 上达到1.58的 FID score。

⭐️ 利用 mask modeling 表征学习策略大幅加速 DiT 的训练速度。

论文地址:https://arxiv.org/abs/2303.14389

项目入口:https://top.aibase.com/tool/masked-diffusion-transformer-mdt-

AI 图片橡皮擦来了!SPM实现精准擦除特定内容,还能改头换面

image.png

【AiBase 提要:】

⭐️ AI 图片橡皮擦技术,可以精准擦除特定概念,保留其他生成内容。

⭐️ 概念半透膜模型 (SPM),可在 Diffusion 架构的 AI 作图模型中实现概念擦除。

⭐️ SPM 技术框架包括轻量化 Adapter、微调策略和动态适配,提高模型擦除效果。

项目入口:https://top.aibase.com/tool/spm

今AI绘画提示词:自拍少女

3_1710308272314_ai2023_Photography_photo_collectionA_beautiful_18-year-old_Chin_e2359193-09fc-4533-bbed-096310acfb7b.png

图源备注:图片由AI生成,图片授权服务商Midjourney

提示词:Photography photo collection,A beautiful18-year-old Chinese girl is holding her phone and taking selfies in front of the camera. She is wearing a Korean white college style sweater, paired with a light blue checkered skirt, and wearing a light blue felt beret on her head, with a well-designed layout --ar16:9--v6.0--style raw

举报

  • 相关推荐
  • 阿里巴巴发布全球首个胃癌影像筛查AI模型:CT就能识别早期胃癌

    浙江省肿瘤医院联合阿里巴巴达摩院,发布了全球首个胃癌影像筛查AI模型DAMO GRAPE。 该模型首次利用平扫CT影像识别早期胃癌病灶,并联合全国20家医院,在近10万人的大规模临床研究中大幅提升胃癌检出率。 相关论文在24日登上了国际顶级期刊《自然医学》(Nature Medicine)。 据国家癌症中心统计,我国每年新发胃癌约36万例,死亡26万例,死亡人数在所有恶性肿瘤中位列第�

  • 「6月26日AI日报」可灵AI推全球首部AIGC单元剧;谷歌开源AI智能体Gemini CLI

    AI行业近期动态汇总:1)豆包AI编程升级为"应用创作1.0",支持可视化编辑和实时预览,降低开发门槛;2)谷歌开源Gemini CLI工具,集成Gemini 2.5 Pro模型,提供免费编程助手;3)Anthropic推出"Artifacts"功能,用户无需编程即可在Claude中创建AI应用;4)出门问问发布TicNote+硬件产品,内置Shadow AI技术;5)OpenAI将Codex CLI重构为Rust语言以提升性能;6)谷歌发布Imagen4文生图模型,突�

  • 2025年国外AI工具排名TOP10|全球热门AI工具全面解析 + 最全AI工具库推荐

    文章介绍了2025年国外AI工具Top10榜单,包括ChatGPT(对话生成)、Claude(长文本处理)、Midjourney(图像生成)、Gemini(多模态生成)、GitHub C opilot(编程辅助)、Notion AI(知识管理)、Perplexity AI(智能搜索)、Runway ML(视频编辑)、ElevenLabs(语音合成)和Descript(音视频编辑)。推荐使用AIbase平台一站式查找和管理AI工具,该平台收录上千款工具,支持智能搜索分类,提供中文界面和实时更新。建议用户关�

  • 最好用的AI生成PPT工具全球横评:谁才是用户效率与专业的首选?

    文章对比评测了5款主流AI驱动的PPT生成工具,重点从生成速度、内容逻辑、模板质量、国际化体验等维度进行分析。PPT.AI综合表现最佳,其极速响应、强大逻辑架构、海量国际模板库和无缝全球化体验尤为突出,特别适合跨境专业人士;Gamma以交互体验和设计感见长;Presentations.AI生成速度最快;ChatPPT对中文用户最友好;iSlide则依托强大设计资源库更适合团队协作。总体而言,P

  • 2025最新国外AI工具排名|全球热门AI工具前十榜单

    文章介绍了2025年国外最受欢迎的10款AI工具:1.ChatGPT(对话/写作/编程);2.Claude(企业安全对话);3.Midjourney(艺术图像生成);4.Gemini(多模态处理);5.Notion AI(智能笔记);6.C opilot(代码辅助);7.Runway ML(视频编辑);8.Perplexity(智能搜索);9.Replika(情感陪伴);10.Descript(音视频编辑)。推荐使用AIbase平台(https://app.aibase.cn)快速查找和体验这些工具,并给出使用建议:注意注册限制、多工具组合�

  • 硬核评测UP主,正在成为这届网友的“赛博导购”

    ​每年6月,B站UP主“笔吧评测室”(下称“笔吧”)的评论区就准时热闹起来。 高考结束的学生们急切地留下各种关于笔记本电脑的选购问题,“笔吧”随之跟进,推出电脑“横评”选购指南,在一条视频中对多款同类型产品进行评测。 今年618选购指南里,“笔吧”就一口气横评了9档价位的50台笔记本电脑。这几乎成了B站数码区的固定节目,被观众称为“笔吧春晚”。 每

  • 「6月25日AI日报」支付宝推 “AI 打赏” 服务;QQ浏览器上线高考志愿报告功能

    AI日报精选:1)Claudia开源图形界面工具发布,简化Claude Code编程体验;2)QQ浏览器推出"AI高考通"志愿填报功能;3)秘塔AI搜索新增"听讲解"语音功能;4)iOS26将升级图乐园AI图像生成功能;5)支付宝推出国内首个"AI打赏"服务;6)小米AI眼镜即将发布,支持物品识别和语音交互;7)奥比中光发布天工Pro机器人,搭载深度相机;8)DeepMind推出新一代机器人AI模型Gemini Robotics;9)字节跳动推出ProtoReasoning框架提升大模型逻辑推理能力;10)Clikka AI革新产品摄影,一键生成专业级效果图。

  • 「6月30日AI日报」百度开源文心大模型4.5系列;通义千问发布多模态生成模型Qwen VLo

    AI日报精选:1)百度开源文心大模型4.5系列,含10款新模型,性能优异;2)通义千问发布多模态模型Qwen-VL,支持图文交互;3)阿里开源3亿参数多模态模型Ovis-U1;4)华为开源盘古7B稠密和72B混合专家模型;5)美图MOKI推出AI创意广告功能,一键生成专业视频;6)谷歌Gemini 2.5 Pro API重新免费开放;7)豆瓣上线"深入研究"AI功能;8)小米"AI百宝箱"结束内测;9)北京智研院开源多模态系统OmniGen2;10)知乎升级"直答"知识库功能。

  • AI智能生成2万封邮件,全球首款外贸信AI Agent亮相

    2025年印尼雅加达国际工业周于6月4-7日盛大开幕,米奥兰特推出全球首个展会场景外贸AI+Agent系统,实现"沟通即生成"的智能贸易新模式。展会吸引超4.5万专业买家,AI预展平台和智能体技术驱动下,买卖对接率突破50%。核心亮点包括:1)AI眼镜支持128种语言实时翻译,打破语言壁垒;2)外贸信AI Agent自动生成含产品参数、运输条款等定制邮件,10分钟完成传统需通宵的工

  • “增收、降本、提效”,这些品牌用AI抢赢天猫618

    “整个5月份,我们单个部门有600小时以上的工作由AI来完成。” 说这话的是渊虹,森马旗下童装品牌“巴拉巴拉”线上运营总监。他的另一重身份是森创启睿CEO,这家公司致力于为品牌提供AI驱动的智能解决方案。 渊虹已在电商行业深耕10余年。在他看来,AI早已不是一件可有可无的半成品,而是所有商家的必修课,能在“增收、降本、提效、内控”四个维度带来切实可见的�