首页 > 业界 > 关键词  > GPT-4o最新资讯  > 正文

AI日报:GPT-4o可自动生成Figma设计稿;视频换衣被I2VEdit搞定了;抖音“AI证件照”爆火;和GPT4玩狼人杀,人类因太蠢出局

2024-05-29 15:35 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、又炸!GPT-4o可自动生成Figma设计稿

这篇文章介绍了一项由GPT-4o技术支持的新技术,能够根据产品需求文档(PRD)自动生成Figma设计稿,为设计师们提供全新的设计方式。这项技术革新被认为是设计行业的一大突破,将极大地提高设计效率和准确性。全球设计师和科技爱好者对此表现出极大关注和期待。

【AiBase提要:】

🚀 自动化设计生成:根据PRD自动生成Figma设计稿,支持高质量设计系统。

💡 理解PRD需求:能解析产品需求文档,填充样式、图标库和文本内容。

🌐 全球关注与期待:引起设计行业关注,被认为将改变设计行业格局。

详情:https://www.chinaz.com/2024/0529/1619838.shtml

2、I2VEdit:修改单帧即可编辑整个视频 搞定虚拟试妆、风格转换

这篇文章介绍了利用预训练的图像到视频模型进行视频编辑的新方法I2VEdit。通过粗略运动提取和外观细化两个关键过程,实现编辑从单帧传播到整个视频,保持视觉和运动完整性,减少质量损失。

image.png

【AiBase提要:】

⭐ 利用预训练的图像到视频模型,编辑单帧就能扩散到整个视频

⭐ 包括粗略运动提取和外观细化两个关键过程

⭐ 通过跳帧策略减轻质量下降,实现高质量、时间上连贯的视频编辑输出

详情链接:https://top.aibase.com/tool/i2vedit

3、腾讯智影AI绘画平台上线黏土风、琉璃玉石风新模型

智影AI绘画平台推出黏土风和琉璃玉石风两款全新模型,为用户带来全新的艺术创作之旅。黏土风模型质朴自然,让作品充满魅力和趣味;琉璃玉石风模型结合AI技术与传统琉璃艺术,展现现代科技创新能力。

image.png

【AiBase提要:】

🎨 黏土风模型赋予作品独特魅力,仿佛回到童年手工捏制黏土的乐趣。

💎 琉璃玉石风模型展现传统韵味与现代科技创新,生成图片效果特效,细节精致。

🔗 用户可在智影AI绘画web端及小程序选择使用两款模型,开启艺术创作之旅。

详情链接:https://top.aibase.com/tool/zhiying

4、抖音“AI证件照”特效爆火

抖音平台推出的“AI证件照”特效引起了广泛关注,用户制作证件照需等待时间长,但效果良好。AI生成的证件照与本人相似度高,磨皮提亮效果自然。韩系证件照特效也备受好评,证件照仍是刚需,但需注意照片细节。

image.png

【AiBase提要:】

🔥 抖音平台推出的“AI证件照”特效受到用户热捧,使用人数超过120万。

📸 制作证件照需上传人像照片制作数字形象,等待时间长达28小时,但效果与本人相似度高,美颜效果自然。

⚠️ AI生成的证件照不一定可作为合格的证件照使用,特别是头发遮住耳朵、妆感明显的照片。

5、AI爆改网络热曲 大香蕉变大蟑螂获赞超23万

这篇文章介绍了近期网络上重新走红的歌曲《大香蕉》被AI技术改编成《大蟑螂》,并获得超过23万的点赞。同时探讨了原作者龙智祥利用AI辅助创作新歌的现象,引发了人们对工业化创作方式与原生态作品的讨论。在人类和AI之间的较量中,抽象整活的时代似乎仍在持续。

QQ截图20240529094053.jpg

【AiBase提要:】

🍌 抖音博主“玛珂娜”利用AI技术将《大香蕉》改编成《大蟑螂》,歌词内容令人哭笑不得,视频获赞超23万。

🐜 原作者龙智祥利用App“歌歌AI写歌”创作新歌《不要熬夜》,在B站播放量超过352万,引发网友对工业化创作方式的讨论。

🤖 人类与AI之间的创作较量仍在继续,工业化创作方式与原生态作品之争令人思考。

详情链接:https://www.douyin.com/search/%E7%8E%9B%E7%8F%82%E5%A8%9C?aid=f460c445-7357-491b-a3b8-ee580b3d73c6&

6、小红书博主用AI制作音乐MV获赞1. 4 万 网友:这是吃了多少德芙

这篇文章介绍了小红书博主利用AI技术制作的音乐MV在社交平台上获得高度认可的案例。通过AI工具辅助创作,创作者成功打造出高质量的音乐视频,展现了AI技术在音乐视频制作领域的应用前景。观众对内容的质量和创意仍然保持高期待,这表明AI技术能够帮助创作者以更高效的方式制作优质作品。

image.png

【AiBase提要:】

🎵 AI技术在音乐视频制作领域应用广泛,小红书博主发布的AI音乐MV获得1.4万点赞。

📽️ 视频采用2D动漫风格,画面高清,运镜流畅,情感表达动人,展现歌手唱出失忆感受。

💡 AI技术辅助创作降低成本,但内容质量仍是观众认可关键。未来AI技术将带来更多创意作品。

视频点此查看:https://www.xiaohongshu.com/explore/664ec6ff000000001401aecf

7、网信办等三部门:加快推进大模型、生成式人工智能标准研制

这篇文章介绍了中央网信办、市场监管总局、工业和信息化部联合印发的《信息化标准建设行动计划(2024—2027年)》,强调加强信息化标准体系建设,推动网络强国建设。计划围绕创新信息化标准工作机制、推进重点领域标准研制、推进信息化标准国际化、提升信息化标准基础能力等方面展开。

【AiBase提要:】

🔍 信息化标准建设行动计划:加强国家信息化标准体系,推动网络强国建设。

🚀 推进重点领域标准研制:包括人工智能、区块链、云计算等领域的标准研制。

💡 提升信息化标准基础能力:优化标准供给结构,加强标准化人才培养,推动标准数字化发展。

8、商汤日日新大模型5.0粤语版发布

商汤科技正式发布了全新的“日日新大模型5.0粤语版”,定价亲民,支持最大128K窗口,提供流畅、高效的体验。该版本基于大装置及日日新大模型5.0的强大能力,在语言对话质量、语料质量和信息密度方面实现了显著提升。

【AiBase提要:】

✨ 定价亲民,30港元提供1M tokens的优质服务,输入与输出均同价

⚙️ 支持最大128K窗口,确保用户获得流畅、高效体验

🚀 基于大装置及日日新大模型5.0的能力,在语言对话质量、语料质量和信息密度方面实现显著提升

9、和GPT4等大模型玩狼人杀 人类因讲话没深度被3票出局

本文介绍了一场模拟狼人杀游戏,其中AI NPC与人类参与者一起互相试探,展现了AI在文本生成和对话方面的潜力和挑战。人类因讲话缺乏深度而被淘汰,AI NPC展现出深厚的历史知识和洞察力。未来发展方向包括减少幻觉产生、理解游戏世界模型、角色知识管理和理解游戏机制。游戏开发者和玩家对AI NPC充满期待,认为其将带来新颖的游戏玩法和提升NPC水平。

image.png

【AiBase提要:】

🤖 AI NPC与人类参与者一起玩狼人杀,展示了AI在文本生成和对话方面的潜力和挑战。

🔍 人类因讲话缺乏深度而被淘汰,AI NPC展现出深厚的历史知识和洞察力。

🚀 未来发展方向包括减少幻觉产生、理解游戏世界模型、角色知识管理和理解游戏机制。

10、OpenAI研究员因安全问题辞职后加入Anthropic

Jan Leike因安全问题离职OpenAI,加入竞争对手Anthropic。Leike的加入与Anthropic的价值观一致,注重确保智能系统与人类价值观相一致。

【AiBase提要:】

🚀 Jan Leike离职OpenAI,加入Anthropic从事研究。

🌱 Anthropic是公益公司,致力于谨慎推进人工智能技术发展。

💼 Anthropic注重确保智能系统与人类价值观一致。

11、OpenAI正训练GPT-4的继任者,GPT-5或将带来三个重大升级

OpenAI正在研发GPT-5,预计将带来更高准确性、增加多模态支持以及实现自主行动能力(AGI)。该公司已成立安全和保障委员会,为下一代模型提供建议。GPT-5的发布可能需要一段时间,但预期将带来革命性变化。

【AiBase提要:】

🎯 更高准确性: GPT-5将通过更多数据训练提高回答准确性。

🌟 增加多模态: GPT-5有望支持视频输出,处理更多种类输入输出。

🤖 实现自主行动能力(AGI): GPT-5有望具备人工通用智能,能理解用户意图并自主完成任务。

12、Chromebook Plus新增内置AI功能,Gemini为照片和写作提供支持

Chromebook Plus最新推出的Gemini内置AI功能为用户带来了写作和照片编辑的全新体验。用户可以通过"Help me write"功能撰写文字,利用Magic Editor优化照片,以及通过Gemini Chat获得快速AI答案。所有Chromebook用户都将受益于这些新功能,包括与Android手机的简易设置、内置任务查看和屏幕截图工具。

image.png

【AiBase提要:】

⭐ Chromebook Plus新增Gemini内置AI功能,助力用户写作和照片编辑。

⭐ 新功能包括"Help me write"功能帮助用户撰写文字、Magic Editor优化照片、Gemini Chat提供快速AI答案。

⭐ 所有Chromebook用户将获得新功能,包括与Android手机的简易设置、内置任务查看和屏幕截图工具。

13、ChatGPT成知名度最高生成式AI产品,使用频率却不高

本文介绍了牛津大学和路透社新闻研究所联合发布的关于生成式AI调查报告,重点分析了ChatGPT在多个国家的知名度和使用情况。调查结果显示,虽然ChatGPT是知名度最高的生成式AI产品,但用户对其使用频率并不高,尤其在日本、法国和英国。同时,年轻人是生成式AI的主要用户群,而生成式AI的应用场景主要包括文本、代码、音频、图像和视频生成等。

【AiBase提要:】

🔍 ChatGPT成为知名度最高的生成式AI产品,但用户使用频率低

👥 年轻人是生成式AI的主要用户群

🌐 生成式AI的应用场景包括文本、代码、音频、图像和视频生成

14、腾讯推甲骨文AI协同平台殷契文渊2.0

本文介绍了腾讯推出的甲骨文AI协同平台“殷契文渊2.0”,该平台利用AI技术助力甲骨文破译,提供数据采集、存储、计算能力,并具备甲骨文自动识别、AI摹本生成等辅助工具,方便古文字处理和使用。平台旨在实现离散的甲骨学论著的互联分析,促进专家学者协同破解甲骨学研究难题。

image.png

【AiBase提要:】

🔍 腾讯推出甲骨文AI协同平台“殷契文渊2.0”,利用AI技术助力甲骨文破译,提供数据采集、存储、计算能力。

📚 平台具备甲骨文自动识别、AI摹本生成等辅助工具,方便古文字处理和使用。

🤝 平台旨在实现离散的甲骨学论著的互联分析,促进专家学者协同破解甲骨学研究难题。

详情链接:https://top.aibase.com/tool/jiaguwenaixietongpingtai

15、AI模型竟然也有偏好的数字

这篇文章揭示了人工智能模型在选择数字时展现出类似人类的偏好和行为,虽然模型本身并不具备认知能力。人们需要意识到模型只是模仿人类行为,而非真正思考或理解。

image.png

【AiBase提要:】

🤖 AI模型选择数字展现人类偏好和行为

🧠 人类在随机选择数字时存在固定偏好和局限性

🔍 AI模型行为源于训练数据,而非意识或思考能力

举报

  • 相关推荐
  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • AI日报GPT-4.1正式上线ChatGPT;阿里通义万相Wan2.1-VACE开源;可灵大模型视频生成量约占30%份额

    本文报道了AI领域最新动态:1)阿里通义万相开源视频编辑统一模型VACE;2)OpenAI发布GPT-4.1增强编码能力;3)Stability AI推出超轻量341M文字转语音模型;4)快手可灵视频生成模型占据30%市场份额;5)微软WizardLM团队整体加入腾讯混元大模型研发体系;6)腾讯宣布混元图像2.0将于5月16日发布;7)上海成立人工智能标识生态联盟;8)Lightricks发布13B参数视频生成模型LTX-Video;9)谷歌DeepMind推出AlphaEvolve优化AI训练速度;10)腾讯元宝浏览器插件上线Chrome平台。这些进展展示了AI技术在视频处理、大模型、语音合成等领域的快速发展。

  • AI日报Manus面向所有人开放注册;全球首款设计Agent Lovart内测;教育部划清AI使用边界

    【AI日报】今日AI领域重要动态:1)国产AI平台Manus开放注册,无需邀请码即可使用;2)Lovart推出全球首款设计Agent,支持全链路自动化设计;3)教育部发布AI教育指南,禁止学生直接复制AI生成内容;4)昆仑万维开源Matrix-Game大模型,专注交互式世界生成;5)Google Gemma模型下载量突破1.5亿次;6)OpenAI新增一键导出PDF功能;7)字节跳动推出图像编辑框架DreamO;8)Kimi智能助手界面升级;9)阿里MNN更新支持通义千问2.5;10)ChatGPT新增SharePoint连接器;11)OpenVision视觉编码器发布;12)福布斯中国AI企业TOP50榜单发布;13)腾讯"元宝"工具上线,基于混元T1-Vision模型实现图片深度理解。

  • Reddit 起诉 Anthropic,称其未支付AI训练数据费用

    OpenAI 首席执行官山姆·奥特曼(Sam Altman)持有 Reddit 8.7% 的股份,是该公司第三大股东,并曾是 Reddit 董事会成员……

  • ChatGPT重磅升级GPT-4.1:编程专家模型登场

    OpenAI于5月15日正式推出GPT-4.1模型,采用差异化推送策略:付费用户可体验完整版,普通用户使用轻量级GPT-4.1 mini。新版模型在编程任务表现突出,能精准遵循指令,避免冗长输出。测试显示其响应速度提升30%,输出稳定性提高40%,部分性能超越GPT-4o。同时OpenAI宣布将斥资30亿美元收购编程工具Windsurf,强化开发者生态,与Google同日发布的Gemini-GitHub形成直接竞争。两大巨头的动作标志着AI编程助手进入生态竞争新阶段。

  • AI日报:Anthropic推最强编码AI模型Claude4;苹果计划推AI智能眼镜;QQ浏览器上线首个高考Agent

    【AI日报】今日AI领域重要动态:1)Anthropic发布Claude4系列AI模型,编程能力超越竞争对手;2)苹果计划2026年推出集成AI技术的智能眼镜;3)字节跳动与清华合作推出时序多模态大模型ChatTS;4)3DTown框架实现单张照片生成逼真3D场景;5)OpenAI秘密开发无屏幕AI设备;6)商汤科技推出儿童AI下棋机器人;7)微软记事本新增AI写作功能;8)深圳设立70亿元基金支持AI硬件初创企业;9)谷歌发布3D视频通信平台Beam;10)阿联酋推出"星际之门"计划,免费提供ChatGPT服务;11)法国Mistral推出开源模型Devstral;12)Anthropic API新增四大功能;13)美国众议院通过法案限制各州监管AI;14)QQ浏览器推出高考AI助手。

  • AI日报:ChatGPT支持MCP和会议记录功能;Cursor 1.0 版本重磅发布;Midjourney视频功能将在本月上线

    本期AI日报聚焦多项AI领域突破:1)OpenAI为ChatGPT新增企业数据连接和会议记录功能;2)Cursor 1.0发布集成BugBot等开发工具;3)Midjourney即将推出视频生成功能;4)秘塔AI搜索新增PPT导出功能;5)Manus推出文本生成视频工具挑战Sora;6)法国Mistral发布企业级编程助手;7)英伟达推出文档处理专用AI模型;8)腾讯公益引入大模型提升互动体验;9)Firecrawl推出网页抓取API工具;10)Bland AI实现超真实语音克隆;11)报告显示AI训练成本逼近百亿美元;12)开源设计工具Jaaz支持批量图像生成;13)《逆水寒》手游接入AI实现图片动效玩法。

  • Anthropic首席执行官:AI 模型的“幻觉”比人类少!

    Anthropic 首席执行官达里奥·阿莫代伊(Dario Amodei)表示,他认为当前的 AI 模型出现“幻觉”(即编造虚假事实并将其当作真实信息呈现)的频率,比人类还要低……

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • AI日报:DeepSeek开源新版R1-0528;字节发布图像Agent小云雀AI;可灵2.1重磅上线

    本期AI日报聚焦多项AI领域突破:1)DeepSeek发布R1-0528模型,支持128K上下文且性能媲美GPT-4;2)字节推出"小云雀AI"图像创作工具;3)可画2.1版本价格降65%性能提升;4)Opera发布全球首款AI浏览器Neon;5)Meta推出多模态空间理解模型;6)北大团队研发ZeroSearch框架降低大模型训练成本88%;7)字节推出AI视频剪辑应用"剪小映";8)MotionPro实现40ms/帧精准视频控制;9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人;10)OpenAI重组架构为IPO铺路;11)像素蛋糕"方糖大模型"获国内首个影像行业备案;12)Paper2Poster实现论文自动转海报;13)Resemble AI开源TTS模型性能比肩ElevenLabs;14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。