AI日报：讯飞星火Lite API免费；李开复称大模型疯狂降价是双输；AI末日滤镜抖音爆火；AI音乐Suno 融资1.25亿美元

2024-05-22 15:23 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

科大讯飞宣布讯飞星火API能力正式免费开放，降低开发者调用成本，推动AI技术普惠化进程。

【AiBase提要:】
🚀 降低开发者调用成本，Pro/Max API费用低至0.21元/万tokens，1token相当于1.5个中文汉字
💡 讯飞星火Lite API永久免费开放，开发者仅需2.1元即可调用“讯飞星火3.5Max”生成内容
🌍 科大讯飞全面开放API能力，聚集全球开发者，推动AI技术在各领域应用

2、李开复称大模型疯狂降价是双输推理大模型成本将每年降10倍

李开复认为中国大模型与美国大模型的差距已经缩小到6个月，展示了中国技术实力的追赶和成就。然而，他对大模型市场的价格战表示忧虑，认为疯狂降价可能导致短期内的双输局面。他强调降价并非商业成功的唯一途径，零一万物将继续推出性能最高的大模型。

【AiBase提要:】
🚀 中国大模型与美国大模型差距缩小到6个月，展示技术实力追赶和成就。
💰 大模型市场价格战引发忧虑，疯狂降价或导致短期内双输局面。
🔮 零一万物计划推出各尺寸模型，致力于做中国最好，强调大尺寸模型在复杂难题中表现优异。

3、百度发布 Comate 代码知识增强2.0

作为基于百度文心大模型打造的代码智能补全和推荐工具，Comate代码知识增强2.0具有全面检索和问答、Web在线检索以及自动生成调用代码和测试用例等三大优势。它为代码编写、学习、面试和测试提供全方位支持，能够加速知识获取，提高编程效率，并生成更贴合业务的代码。

【AiBase提要:】
⚙️ Comate代码知识增强2.0基于百度文心大模型，实时解析开发者编程意图，推荐最佳代码片段和库函数。
🔍 Comate2.0支持全面检索和问答，帮助开发者获取开源框架中具体业务解释，提升编程技能。
💻 Comate2.0能够自动生成调用代码和测试用例，极大提高代码质量和效率。

4、微软发布Phi-3 Vision等最新大模型系列

微软发布了Phi-3系列大型语言模型，展示出强大性能和灵活性，为研究人员和开发者提供了新的工具和可能性。这些模型在特定领域具有独特优势，支持不同上下文长度和拥有不同规模参数。

【AiBase提要:】
🔍 Phi-3Medium14B型号性能强大，竞争力突出，超过了其他大型模型如Command R+104B和GPT3.5。
🔍 Phi-3Small7B型号在资源有限场景下具有潜在应用价值，性能超过了Mistral7B和Llama38B。
🔍 Phi-3系列模型训练使用了4.8T令牌，持续42天，支持长文本数据处理，引入新的分词器和权重兼容性。
详情链接:https://top.aibase.com/tool/phi-3-vision-128k-instruct

5、Windows 11 新增基于AI的复制和粘贴功能

微软在 Windows 11 中引入了新的高级粘贴功能，利用 AI 技术实现剪贴板内容的即时转换。这一功能让用户可以更快地转换剪贴内容为纯文本、Markdown、JSON 等格式，甚至进行摘要、翻译、生成代码等操作，提升工作效率。

【AiBase提要:】
⭐ Windows 11 引入新的高级粘贴功能，利用 AI 技术实现剪贴板内容即时转换。
⭐ PowerToys 的 Advanced Paste 功能允许用户将剪贴内容转换为纯文本、Markdown、JSON 等格式，甚至使用 OpenAI 进行摘要、翻译、生成代码等操作。
⭐ 使用该功能需要添加 OpenAI API 密钥，并购买相应的 OpenAI 积分，以进行转换操作。

6、Adobe Lightroom新增AI魔术橡皮擦功能

Adobe Lightroom最近推出了新增的生成式AI工具，包括对象移除和AI镜头模糊效果，为用户提供了更简单和便捷的照片编辑体验。这些新功能使得背景虚化更自然，删除不需要的物体或人物更轻松。Adobe持续将Firefly AI模型应用于创意软件中，为用户带来更多便利和可能性。

【AiBase提要:】
🎨 “Generative Remove”功能可轻松删除照片中的不需要的物体或人物。
📸 AI镜头模糊工具可一键应用多种模糊效果，提升背景虚化的自然度。
📱 新功能使得使用Lightroom进行照片编辑更加简单和便捷，为新用户提供更友好的操作体验。

7、音乐 AI 初创公司 Suno 完成1.25亿美元融资

Suno 完成1.25亿美元融资，旨在通过其生成式 AI 平台彻底改变音乐行业，引发了人们的激动和版权担忧。随着 AI 在音乐领域的广泛应用，如何平衡技术进步与保护艺术家权益将成为关键问题。

【AiBase提要:】
⭐️ Suno 的 AI 平台有望降低音乐创作门槛，为音乐创作者提供强大工具，挑战传统音乐产业模式。
⭐️ Suno 的创新平台允许任何人通过输入文本提示或歌词来创作原创歌曲，AI 则会根据此生成旋律、和声和完整作曲。
⭐️ Suno 的快速崛起和大额融资发生在关于未经艺术家和权利持有人明确同意使用受版权保护音乐录音来训练 AI 模型的激烈辩论之际。

8、英伟达 GH200超级芯片部署到全球9个超级计算机中

英伟达的GH200超级芯片在全球9台超级计算机中展现出惊人的计算能力，推动高性能计算产业向AI驱动转变。GH200采用了Grace Hopper的异构计算框架，融合了高性能GPU和多功能CPU，具备高性能计算和AI模型处理能力。英伟达在近两年不断布局服务器和高性能计算领域，GH200系列展现出强大的AI和高性能计算能力，加速科学研究进程。

【AiBase提要:】
⭐ 英伟达GH200超级芯片在全球9台超级计算机中实现每秒两百亿亿次浮点数计算的惊人能力
⭐ GH200采用了Grace Hopper的异构计算框架，融合了高性能GPU和多功能CPU，成为AI超算的首选硬件
⭐ GH200系列芯片展现出强大的AI和高性能计算能力，加速科学研究进程

9、ChatGPT改进的数据分析功能开始推送：速度与交互体验大提升

OpenAI推出了最新的ChatGPT数据分析优化功能，提升了处理速度，加入了可交互的图表和表格，使数据分析工具更完备和强大。用户现在更方便进行数据上传、分析和可视化探索，获得更深刻的数据洞察。这种集成了人工智能和高级数据可视化的解决方案，将为数据分析师和业务用户提供巨大帮助。

【AiBase提要:】
🚀 速度提升: GPT-4o的速度优势使数据分析更迅速。
💬 可交互图表和表格: 用户可与数据可视化组件交互，提高工具实用性和灵活性。
📊 直接展示数据: 上传的表格数据直接展示在界面上，用户可直观查看并操作。

10、FIFO-Diffusion：无需额外训练即可生成无限长视频

FIFO-Diffusion 项目展示了在无需额外训练的情况下生成无限长视频的强大能力，通过对角去噪技术实现了高质量且具有一致性的长视频生成。该技术在视频生成领域具有明显优势，尽管在复杂画面下可能出现闪烁问题，整体效果令人印象深刻。未来有望解决闪烁问题，提升视频生成质量和稳定性。

【AiBase提要:】
✨ 无需额外训练使得FIFO-Diffusion具有明显优势
⚙️ 核心技术为独特的对角去噪方法
🔗 FIFO-Diffusion展示了生成长视频的巨大潜力
详情链接:https://top.aibase.com/tool/fifo-diffusion

11、末日滤镜下真人和AI傻傻分不清

这篇文章介绍了抖音博主“速速來電”发布的末日游戏滤镜视频，在AI特效生成的图像与真人原图对比下，效果逼真到让人难以分辨。网友热议该视频，称赞其逼真效果。博主分享了制作教程，使用美图秀秀App生成末日特效的方法，强调原图质量对效果重要。

【AiBase提要:】
🔍 视频展示逼真效果，难以分辨真伪。
📈 视频点赞数高达17万，转发2.4万，成为博主历史最佳作品。
💡 制作教程分享技巧，强调原图质量对最终效果至关重要。
详情：https://www.chinaz.com/2024/0522/1618351.shtml

12、B站UP主花式整活：为了教你学英语 AI都开始讲谐音梗了

这篇文章介绍了B站UP主利用AI技术合成明星声音和形象来教授英语，引发了广泛关注。通过谐音梗的方式，视频在B站上获得了超过100万的播放量。UP主结合娱乐和教育，创造出独特的学习体验，借助AI技术提升了视频制作频率和粉丝数量。然而，使用明星或影视剧素材也存在侵权风险。

【AiBase提要:】
🤖 利用AI技术合成明星声音和形象进行英语教学，吸引大量粉丝关注。
🎬 视频通过谐音梗方式，获得超过100万的播放量，增强学习的趣味性和互动性。
💡 UP主结合娱乐和教育，创造出别具一格的学习体验，借助AI技术提升视频制作频率和粉丝数量。
详情：https://www.chinaz.com/2024/0522/1618359.shtml

13、谷歌推出的“Say What You See”游戏助力图像阅读和AI提示写作

谷歌推出的“Say What You See”游戏旨在帮助玩家提高图像阅读技能和AI提示写作能力。通过参与游戏，玩家可以锻炼创造力、观察力，体验AI技术在图像生成领域的应用。游戏不仅提供娱乐，还作为学习工具，帮助玩家理解和利用AI技术。总体而言，这款游戏为玩家提供了锻炼图像阅读和AI提示写作能力的平台，是一种寓教于乐的学习方式。

【AiBase提要:】
🎮 游戏旨在帮助玩家提高图像阅读技能和AI提示写作能力。
🧠 参与游戏可锻炼创造力、观察力，体验AI技术在图像生成领域的应用。
📚 游戏不仅提供娱乐，还作为学习工具，帮助玩家理解和利用AI技术。
详情链接:https://artsandculture.google.com/experiment/say-what-you-see/jwG3m7wQShZngw

14、大模型数据标注平台Scale AI融资10亿美元，估值达138亿美元

Scale AI最近获得10亿美元的F轮融资，估值达138亿美元，成为大模型领域独角兽。该公司主要提供数据标注服务，合作伙伴包括OpenAI、微软、Meta等知名公司。另外，Suno也获得1.25亿美元融资，引起关注。

【AiBase提要:】
⭐ Scale AI获得10亿美元F轮融资，估值达138亿美元，成为大模型领域独角兽。
⭐ Scale AI主要提供数据标注服务，合作伙伴包括OpenAI、微软、Meta等知名公司。
⭐ Suno也获得1.25亿美元融资，两笔超过1亿美元的融资事件引发关注。
详情链接:https://top.aibase.com/tool/scale

15、Gabby World V2:融合AI和区块链技术的全新龙与地下城风格游戏问世

Gabby World V2是一款融合了人工智能和区块链技术的创新游戏，提供了独特的角色创建、故事探索和战斗体验。游戏处于Alpha测试阶段，仅对白名单成员开放，参与者有机会赢取奖励。通过融合AI和区块链技术，Gabby World V2打造了创意十足、充满挑战的游戏世界。

QQ截图20240522100328.png

【AiBase提要:】
🎮 创新游戏体验，融合AI和区块链技术
🔓 Alpha测试阶段，白名单成员独享，赢取奖励机会
💡 通过独特奖励机制激励玩家积极参与
详情链接:https://medium.com/@Gabby_World/gabby-world-v2-alpha-newbie-guide-72b8ceb97584

16、马斯克的xAI正努力实现Grok多模态化

埃隆・马斯克的人工智能公司xAI正在为其Grok聊天机器人增加多模态输入功能，开发者文档显示了新模型发布进展，Grok1.5V将支持用户上传照片获取文本回复。xAI在缩小与竞争对手差距方面取得进展，尽管相对较新，但在基准测试中表现出潜力。

【AiBase提要:】
⭐ 埃隆・马斯克的xAI公司正为Grok聊天机器人添加多模态输入功能
⭐ 最新的开发者文档显示了xAI在推出新模型方面的进展
⭐ Grok1.5V将允许用户上传照片并获得基于文本的答案

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
Apple Intelligence不会永久免费！苹果AI未来会收费

在WWDC24上，苹果推出自己的AIAppleIntelligence。目前AppleIntelligence还处于测试阶段，用户可以免费使用，但是未来苹果将会收费。对于iPhone15系列的其他机型以及更早的iPhone，苹果并未提供AI支持。

苹果 AI Apple
估值5亿美元了，抓住日韩，AI语言学习产品跻身赛道Top3（下）

日本:本土产品重应试，AI产品帮“正音”总体来看，能够登上日本畅销榜的产品有两类，一是备考App，另一类是能够练口语的产品。上榜的三个日本本土开发者的产品来自日本开发者的产品有三款SpeakBUDDY、abceed、Mikan-TOEIC。这篇是日本AI语言学习篇，结合上篇《估值5亿美元了，抓住日韩，AI语言学习产品跻身赛道Top3》，是我们对于AI语言学习产品在日韩市场表现的整体观察，以

日本应试产品 AI产品
荐估值5亿美元了，抓住日韩，AI语言学习产品跻身赛道Top3（上）

AI语言学习产品Speak又融资了，完成了2000万美金B-3轮融资，由BuckleyVentures领投，之前领投了2700万美金轮次的OpenAIStartupFund这次也跟投了。完成本轮融资之后，Speak的总融资额达到8400万美金，光2023年就融了两轮，现在估值达到5亿美金，相比去年估值翻倍。找到了“培养能力有趣”的价值点，可能也是Speak在韩国能做得不错的原因。

AI语言
荐估值5亿美元了，抓住日韩，AI语言学习产品跻身赛道Top3

AI语言学习产品Speak又融资了，完成了2000万美金B-3轮融资，由BuckleyVentures领投，之前领投了2700万美金轮次的OpenAIStartupFund这次也跟投了。完成本轮融资之后，Speak的总融资额达到8400万美金，光2023年就融了两轮，现在估值达到5亿美金，相比去年估值翻倍。找到了“培养能力有趣”的价值点，可能也是Speak在韩国能做得不错的原因。

Speak
荐AI日报：谷歌发布最强开源语言模型Gemma2；讯飞星火V4炸场；Glif作者创建meme梗图生成器风靡推特

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、谷歌发布最强开源语言模型Gemma2性能超越Llama3谷歌在最近的I/O柏林大会上宣布开源最新语言模型Gemma2，该模型性能超越Llama3，同时具有高效推理和广泛的硬件支持。CIR的首席执�

Gemma
讯飞星火再进化！科大讯飞AI学习机又一“超省妈”功能出炉

2024年6月27日，科大讯飞在北京国家会议中心发布了讯飞星火大模型的最新进展，推出了与GPT-4Turbo全面对标的讯飞星火V4.0。本次发布会以“懂你的AI助手”为主题，不仅展示了升级版的讯飞星火APP和Desk全新升级了讯飞旗下教育、医疗、车载、办公等领域多款智能产品，这其中就包括备受瞩目的科大讯飞AI学习机。科大讯飞AI学习机AI1对1答疑辅导，开创了一种全新的互动讲题方式

科大讯飞讯飞星火大模型
对标GPT-4 Turbo！OpenAI断供后科大讯飞星火API调用量大增

今年6月，OpenA宣布终止对中国提供API服务，有业内人士分析，这将打击部分借助OpenAI大模型套壳创业的公司。有投资者在互动平台向科大讯飞提问：OpenAI关停中国地区的API服务，讯飞火星有承接OpenAI国内用户的API业务决策吗？在星火大模型V4.0发布会上，科大讯飞董事长刘庆峰坦言，面对中美科技综合差距，我们必须保持科学理性的态度，不能盲目自信。
荐AI日报：百度文心4.0免费开放；AI lab开源超强多模态大模型；对标GPT-4o！商汤发布日日新5o

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、百度文心智能体平台免费开放文心4.0版本百度文心智能体平台最新推出的文心大模型4.0版本免费开放给公众使用，极大地扩展了平台的功能和应用范围。这一投资有望降低电影�

文心一言4.0
荐AI日报：Runway的Gen-3 Alpha正式开放使用；百度文心大模型4.0 Turbo限时免费；英伟达发布直播神器；爆火Character AI惨遭阉割

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、Runway的Gen-3Alpha所有人都能用了！尽管面临困难，CharacterAI仍然在用户中具有吸引力。

Runway
PaintsUndo完全指南：数字绘画AI模型 - 使用方法教程与免费使用入口

探索PaintsUndo能为你带来哪些改变为什么选择PaintsUndo？PaintsUndo不仅仅是一款产品——它是一项革命性的技术，致力于模拟和重现绘画过程中的笔触和步骤。通过AIbase，您可以轻松发现最适合您需求的人工智能工具，解锁AI的力量。

PaintsUndo

万彩商图:快速更换商品图片背景，提升商品展示效果。

万彩商图是一个在线设计工具，专注于帮助用户快速更换商品图片的背景，以提升商品的视觉效果和吸引力。它利用AI技术实现一键式操作，简化了传统图片编辑的复杂流程，使非专业用户也能轻松制作出专业的商品展示图。

AI作图图片编辑一键更换

AIEmoji:快速找到适合你情感的Emoji表情。

AIEmoji是一个基于人工智能技术的Emoji搜索网站，它允许用户通过自然语言描述来搜索和找到匹配的Emoji表情。这项技术简化了Emoji的搜索过程，提高了用户在社交、写作和其他需要表情符号的场合的效率和表达能力。

Emoji 自然语言处理表情搜索

Brev.ai:AI音乐生成器，几秒钟创作高质量音乐。

Brev.ai是一款利用人工智能技术，根据用户输入的文本描述快速生成独特音乐作品的在线音乐创作工具。它基于Suno V3.5技术，支持多种音乐风格和流派，适用于视频、播客、游戏配乐等多场景。Brev.ai的主要优点包括高效率、成本效益高、易于使用，以及能够提供高质量的音乐输出。

AI音乐生成文本转音乐在线音乐创作

知了zKnown:致力于信息降噪 / 阅读提效的个人知识助手

知了 zKnown 是一款 AI-Native 构建的个人知识助手，专注于信息降噪和阅读提效。它通过多端同步、多渠道总结、长文本支持等功能，帮助用户高效地管理和整理信息。产品的主要优点包括：- 多端同步：用户可以在移动app、桌面客户端、网页版、小程序等多个平台同步使用。- 多渠道总结：支持微信公众号、知乎、简书、36Kr、少数派等多个渠道的文章总结。- 长文本支持：最长支持总结3万字的文章内容。- 摘要导出：用户可以将摘要保存到 Notion、Flomo 等平台。- 产品背景：知了 zKnown 致力于通过 AI 技术提升用户的阅读和信息管理效率，适合需要高效处理大量信息的用户。

信息管理阅读提效 AI助手

MBox AI Meet:实时转录与会议总结的谷歌会议扩展

MBox AI Meet是一款免费Chrome扩展，专为Google Meet设计，提供实时转录和自动生成会议总结的功能。它利用AI技术帮助用户在会议中专注于讨论，而无需担心记笔记。该工具通过实时转录捕捉会议的每一个细节，并在会议结束后自动生成总结，确保用户不会错过任何重要信息。MBox AI Meet的隐私优先策略确保会议安全，不存储任何音频或视频内容。此外，该扩展还计划在未来更新中增加更多AI功能，如发言人识别、实时AI助手等。

AI 会议管理实时转录

Klee:本地安全AI，保障数据隐私。

Klee是一款macOS原生的AI助手应用程序，专注于本地处理数据，确保数据安全和隐私。它使用先进的AI技术，如RAG（检索增强生成）和开源大型语言模型，如Llama 3和Mistral，为用户提供高效、智能的笔记、搜索和知识管理功能。Klee的主要优点包括本地运行以保护隐私、支持团队协作、免费使用以及优化的macOS体验。

AI助手 macOS原生数据隐私

Kipps.AI:快速构建AI助手，提升业务效率

Kipps.AI 是一个在线平台，允许用户在短短两分钟内构建自己的AI助手，并将其集成到业务中。该平台支持多种数据源，如PDF、Notion、网站链接和文本，用户只需提供这些数据，Kipps.AI 会处理其余部分。它还与常用的工具如GoDaddy、Wordpress、Drupal、Squarespace、Magento和Wix等进行集成，使得用户可以轻松地将AI助手集成到现有的业务流程中。

AI助手自动化数据处理

CrossPrism for MacOS:图像识别、标注和关键词生成工具

CrossPrism for MacOS 是一款专为摄影师设计的图像识别、标注和关键词生成工具。它利用多核 CPU、GPU 和神经引擎，能够识别物种、生成标题和描述，并支持模型训练的可定制性。用户可以在本地自动标注无限量的原始照片，确保所有照片安全地存储在 Mac 上，无需担心云服务中断、数据锁定或文件传输问题。其20多个专家模型可以对从鸟类到地标的各种内容进行分类，并提供新的视角来整理目录和重新发现旧照片。此外，它还支持视频处理、Lightroom 插件、图像质量评估等功能，使其成为一个强大的筛选工具。

AI日报：讯飞星火Lite API免费；李开复称大模型疯狂降价是双输；AI末日滤镜抖音爆火；AI音乐Suno 融资1.25亿美元

今日大家都在搜的词：

热文

站长商机