今日AI：多模态大模型Claude3发布；Gorq API开放申请；ChatGPT新增朗读功能；Stability AI发布SD3技术报告

2024-03-05 15:28 · 稿源：站长之家

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

🤖📱💼AI应用

Claude3正式发布:号称性能超GPT-4，免费使用、支持中文

【AiBase提要:】
⭐生成式AI平台Anthropic发布Claude3系列多模态大模型，包括Haiku、Sonnet和Opus版本，Opus超越GPT-4。
⭐用户可免费使用Claude3Sonnet模型，支持中文，API覆盖159个国家/地区。
⭐新增多模态图像识别提问功能，Claude3在数学推理、可视化问答等方面超越GPT-4V。
体验网址:https://top.aibase.com/tool/claude-3

GorqAPI正式开放申请文档和Playground页面均已推出

【AiBase提要:】
⭐️现在所有人都可以申请GorqAPI，文档和Playground页面已上线。
⭐️Groq的LPU不依赖高速数据传输，在推理任务中更高效。
⭐️Groq的LPU具有可预测性能和线性扩展性，可能带来巨大性能提升。
Gorq使用入口:https://top.aibase.com/tool/groq
GorqAPI申请地址:https://console.groq.com/keys

ChatGPT新增朗读功能，可以语音播报生成结果

【AiBase提要:】
⭐️新功能支持ChatGPT网络版本、iOS和Android应用程序，37种语言，适用于GPT-4和GPT-3.5。
⭐️语音聊天功能于2023年9月推出，新增功能允许ChatGPT朗读书面回答，提供更多交互体验。
⭐️ReadAloud可自动检测文本语言，并适用于GPT-4和GPT-3.5。

CopyCopter:莫得感情的短视频制造机还能自动配乐加字幕

【AiBase提要:】
⭐️支持输入文章地址，自动提炼文章内容
⭐️自动使用题材相关的素材生成带语音、带字幕的视频。
⭐️输入的文章可以是中文，生成的视频是英文的
排队地址:https://top.aibase.com/tool/copycopter-ai

StabilityAI发布3D生成模型TripoSR不用1秒就能生成高质量3D模型

【AiBase提要:】
⭐️模型TripoSR在不到1秒内生成高质量3D模型
⭐️无需GPU，降低生产成本，允许商业化使用
⭐️在NvidiaA100上测试，性能优于其他开放的图像到3D模型
产品入口:https://top.aibase.com/tool/triposr

谷歌发布可读屏AI模型ScreenAI:可理解用户界面和信息图表

【AiBase提要:】
🧠ScreenAI采用新颖的截图文本表示方法，生成合成训练数据，可回答关于屏幕信息、导航和总结问题。
🚀ScreenAI在数字内容理解方面取得进展，但无法执行生成操作，需要更多研究缩小与更大模型的差距。
📈ScreenAI在基准测试中表现优异，随着模型大小增加性能提高，有望推动智能手机自动化处理进步。

Verce发布AISDK3.0推出生成式UI功能

【AiBase提要:】
⭐引入生成式UI功能，丰富聊天机器人交互体验。
⭐生成式UI功能使聊天机器人回答更丰富生动。
⭐AISDK3.0可生成最适合场景的UI反馈，提升用户交互体验。
体验地址:https://top.aibase.com/tool/vercel-ai-sdk-3-0

📰🤖📢AI新鲜事

StabilityAI发布SD3技术报告，披露SD3更多细节

【AiBase提要:】
🌟SD3在排版、美学、提示词理解上超过开源和商业模型
🌟新的MMDiT架构改进文本理解和拼写能力
🌟SD3使用独特的权重集提高整体理解力和排版质量
详细内容点此查看:https://stability.ai/news/stable-diffusion-3-research-paper

Claude3能察觉研究人员在测试中的行为

【AiBase提要:】
⭐ Anthropics推出的Claude3展现出对研究人员测试的元认知水平。
⭐ Opus在“needle-in-a-haystack”测试中找到相关信息并意识到测试的人工性质。
⭐ LLM的能力令人惊叹，但需要更实际的评估方法来准确评估模型的真实能力和局限性。

微软寻求驳回纽约时报起诉的部分内容

【AiBase提要:】
🔍 纽约时报指责微软及OpenAI侵犯版权，使用文章训练人工智能技术。
🤖 微软表示大型语言模型未替代新闻市场，比较LLMs与录像机合法性。
⚖️ 微软和OpenAI提出驳回起诉动议，称时报未展示实际损害，辩护“公平使用”。

商汤科技用AI“复活”创始人汤晓鸥

【AiBase提要:】
⭐ 商汤年会上，数字人汤老师以幽默方式演讲。
⭐ 数字人技术“如影”再现真人形象，支持多语种和4K视频输出。
⭐ AI技术已用于“复活”亡者，如音乐人包小柏“数字女儿”为家人带来慰藉。

（举报）

相关推荐

关键词：

Claude3

荐AI日报： ChatGPT免费开放记忆功能；华为WATCH 5智能手表接入双大模型；Claude Pro升级重磅功能

本期AI日报主要报道了多项AI领域重要进展：1）OpenAI向所有ChatGPT用户免费开放记忆功能；2）蚂蚁集团推出"AI健康管家"，服务4000万用户；3）Anthropic与DeepLearning.AI合作推出免费MCP课程；4）谷歌DeepMind开发无需3D模型即可生成逼真运动视频的新技术；5）Exa与OpenRouter合作为400+大模型提供实时网络搜索功能；6）中国知网推出CNKI AI学术研究助手；7）Anthropic推出Claude Explains博客项目；8）Claude Pro新增研究模式和远程MCP整合功能；9）Fish Audio发布基于200万小时数据训练的OpenAudio S1语音模型；10）OpenAI升级Codex编程工具；11）华为WATCH5接入盘古和DeepSeek双大模型。

人工智能 ChatGPT 记忆功能
隐藏的AI指令揭示了 Anthropic 是如何控制 Claude 4 的

威利森指出，这些系统提示就像是“模型曾经做过、但现在被禁止做的事件清单”……

Anthropic Claude4系列模型 claude4
Anthropic 开始给 Claude 搞“语音模式”了

默认情况下，该功能由 Anthropic 的 Claude Sonnet 4 模型提供支持，大多数免费用户每天大约可使用 20 到 30 次。此外，只有付费用户才能使用一项 Google Workspace 连接功能……

Anthropic Claude语音模式 Claude
荐AI日报：美团No Code平台免费开放；豆包App升级“一句话P图”功能；苹果Xcode 26内置ChatGPT等AI功能

本文介绍了AI领域多项重要进展：1)美团推出No Code平台和1680个AI应用；2)豆包App升级"一句话P图"功能；3)苹果发布内置ChatGPT的Xcode26开发工具；4)iOS26新增视觉智能功能；5)讯飞星火X1升级版即将发布；6)比亚迪接入阿里通义大模型；7)DeepSeek支持本地工具调用；8)开源框架Rowboat支持快速构建智能助手；9)X平台整合Grok AI优化内容推荐；10)港科大开发进化搜索技术提升小模型图像生成能力；11)硅基流动完成数亿元融资；12)港大与英伟达合作开发新型视觉注意力机制。这些创新展示了AI技术在各领域的快速发展和应用突破。

人工智能 AI产品应用大语言模型
与 ChatGPT 一起“越陷越深”

ChatGPT 似乎正在让一些用户走上妄想甚至阴谋论的道路，或者说，至少在某种程度上强化了这类思维模式……

ChatGPT AI模型 AI聊天机器人
荐AI日报：阿里云通义灵码AI IDE上线；小米多模态大模型Xiaomi MiMo-VL开源；黑森林实验室推出FLUX.1Kontext

【AI日报】今日AI领域重要动态：1)阿里云推出通义灵码AI IDE，集成千问3模型，显著提升编程效率；2)小米开源多模态大模型MiMo-VL-7B，性能超越更大规模闭源模型；3)黑森林实验室发布FLUX.1Kontext图像生成模型，支持文本和参考图像多次编辑；4)Midjourney V7渲染速度提升40%，新增用户投票功能；5)DeepSeek R1-0528大模型在AGI领域取得突破，性能超越xAI等公司；6)Hugging Face进军机器人市场，推出开源人形机器人HopeJR；7)字节跳动火山方舟接入DeepSeek最新大模型；8)Anthropic开源"电路追踪"工具，揭示大模型决策过程；9)阿里巴巴开源自主搜索AI智能体WebAgent；10)Hume发布低延迟语音语言模型EVI3；11)Manus Slides支持一键生成专业幻灯片；12)Runway Gen-4 References支持手机照片艺术化处理。

人工智能 AI开发工具编程效率
算力赋能营销革新，东信云与华为云签约共建多模态大模型应用标杆

6月21日，东信云与华为云在HDC2025大会上签署合作协议，双方将基于昇腾AI云服务深化合作，重点布局多模态大模型应用与数字人技术。合作内容包括：1）构建智能营销系统，整合文本、图像、视频等多元数据，提升市场分析和消费者行为预测能力；2）通过大模型实现营销内容自动化生成，包括新闻稿、社交媒体帖子和广告文案；3）优化大模型架构，提升训练和推理效率。东信云6月发布的"数字人智能引擎"已实现分钟级生成逼真数字人，显著提升推荐转化率。双方还将联合行业伙伴共建营销大模型生态系统，推动营销行业智能化升级。

华为云东信云科技 AI与大数据
荐AI日报：ChatGPT支持MCP和会议记录功能；Cursor 1.0 版本重磅发布；Midjourney视频功能将在本月上线

本期AI日报聚焦多项AI领域突破：1）OpenAI为ChatGPT新增企业数据连接和会议记录功能；2）Cursor 1.0发布集成BugBot等开发工具；3）Midjourney即将推出视频生成功能；4）秘塔AI搜索新增PPT导出功能；5）Manus推出文本生成视频工具挑战Sora；6）法国Mistral发布企业级编程助手；7）英伟达推出文档处理专用AI模型；8）腾讯公益引入大模型提升互动体验；9）Firecrawl推出网页抓取API工具；10）Bland AI实现超真实语音克隆；11）报告显示AI训练成本逼近百亿美元；12）开源设计工具Jaaz支持批量图像生成；13）《逆水寒》手游接入AI实现图片动效玩法。

OpenAI ChatGPT 人工智能
荐AI日报：腾讯语音数字人模型HunyuanVideo-Avatar；Trae国际版开启付费订阅模式；Claude网页搜索功能全面开放

本文汇总了AI领域最新动态：1)腾讯开源数字人模型HunyuanVideo-Avatar，支持图像转视频创作；2)Trae国际版开启付费订阅，首月3美元；3)Claude网页搜索功能向免费用户开放；4)印度AI初创Builder.ai破产，亏损超5亿美元；5)腾讯元宝接入微信读书平台；6)快手计划加大AI投入但预计影响利润率；7)Mistral推出智能代理API；8)Claude移动端上线语音对话测试版；9)OpenAI拟推ChatGPT第三方登录功能；10)掘金发布AI项目一键部署工具；11)多模态模型视觉推理能力评估显示准确率仅25.8%；12)中石油发布3000亿参数昆仑大模型，推动油气产业智能化。

人工智能数字人短视频
OpenAI免费开放ChatGPT记忆功能：用户对话连贯性提升

OpenAI宣布向所有用户免费开放 ChatGPT 记忆功能（Memory），该功能此前仅限付费订阅用户使用。此次升级显著增强了记忆能力，并强化了隐私控制。升级后的记忆功能可保存并智能引用用户的过往对话内容（如偏好设置、特定指令、历史对话），使 AI 回复更具连贯性和上下文关联性。例如，在撰写长篇小说或进行深度金融分析时，ChatGPT能依据此前对话调整风格或提供相关信�

OpenAI ChatGPT 记忆功能

热文

3 天
7天

今日AI：多模态大模型Claude3发布；Gorq API开放申请；ChatGPT新增朗读功能；Stability AI发布SD3技术报告

荐AI日报： ChatGPT免费开放记忆功能；华为WATCH 5智能手表接入双大模型；Claude Pro升级重磅功能

隐藏的AI指令揭示了 Anthropic 是如何控制 Claude 4 的

Anthropic 开始给 Claude 搞“语音模式”了

荐AI日报：美团No Code平台免费开放；豆包App升级“一句话P图”功能；苹果Xcode 26内置ChatGPT等AI功能

与 ChatGPT 一起“越陷越深”

荐AI日报：阿里云通义灵码AI IDE上线；小米多模态大模型Xiaomi MiMo-VL开源；黑森林实验室推出FLUX.1Kontext

算力赋能营销革新，东信云与华为云签约共建多模态大模型应用标杆

荐AI日报：ChatGPT支持MCP和会议记录功能；Cursor 1.0 版本重磅发布；Midjourney视频功能将在本月上线

荐AI日报：腾讯语音数字人模型HunyuanVideo-Avatar；Trae国际版开启付费订阅模式；Claude网页搜索功能全面开放

OpenAI免费开放ChatGPT记忆功能：用户对话连贯性提升

热文

2025新财富500创富榜发布：张一鸣问鼎首富梁文锋进前十

小米MIX Flip 2外观公布：配备骁龙8至尊版、5165mAh电池

中消协发倡议抵制极端吃播：平台应严格识别、及时下架

苹果官网首次支持国补目前仅限北京收货地址及上海线下购买

小米预告AI眼镜雷军：自带小爱同学啥都能直接问

雷军称YU7定价合理：希望大家猜测YU7价格要讲科学

雷军分享小米端到端辅助驾驶进展：YU7全系搭载 SU7下月升级

罗永浩回应为何总能融到钱并回击谩骂