首页 > 业界 > 关键词  > Claude3最新资讯  > 正文

今日AI:多模态大模型Claude3发布;Gorq API开放申请;ChatGPT新增朗读功能;Stability AI发布SD3技术报告

2024-03-05 15:28 · 稿源:站长之家

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📱💼AI应用

Claude3正式发布:号称性能超GPT-4,免费使用、支持中文

image.png

【AiBase提要:】

⭐生成式AI平台Anthropic发布Claude3系列多模态大模型,包括Haiku、Sonnet和Opus版本,Opus超越GPT-4。

⭐用户可免费使用Claude3Sonnet模型,支持中文,API覆盖159个国家/地区。

⭐新增多模态图像识别提问功能,Claude3在数学推理、可视化问答等方面超越GPT-4V。

体验网址:https://top.aibase.com/tool/claude-3

GorqAPI正式开放申请文档和Playground页面均已推出

【AiBase提要:】

⭐️现在所有人都可以申请GorqAPI,文档和Playground页面已上线。

⭐️Groq的LPU不依赖高速数据传输,在推理任务中更高效。

⭐️Groq的LPU具有可预测性能和线性扩展性,可能带来巨大性能提升。

Gorq使用入口:https://top.aibase.com/tool/groq

GorqAPI申请地址:https://console.groq.com/keys

ChatGPT新增朗读功能,可以语音播报生成结果

【AiBase提要:】

⭐️新功能支持ChatGPT网络版本、iOS和Android应用程序,37种语言,适用于GPT-4和GPT-3.5。

⭐️语音聊天功能于2023年9月推出,新增功能允许ChatGPT朗读书面回答,提供更多交互体验。

⭐️ReadAloud可自动检测文本语言,并适用于GPT-4和GPT-3.5。

CopyCopter:莫得感情的短视频制造机还能自动配乐加字幕

image.png

【AiBase提要:】

⭐️支持输入文章地址,自动提炼文章内容

⭐️自动使用题材相关的素材生成带语音、带字幕的视频。

⭐️输入的文章可以是中文,生成的视频是英文的

排队地址:https://top.aibase.com/tool/copycopter-ai

StabilityAI发布3D生成模型TripoSR不用1秒就能生成高质量3D模型

image.png

【AiBase提要:】

⭐️模型TripoSR在不到1秒内生成高质量3D模型

⭐️无需GPU,降低生产成本,允许商业化使用

⭐️在NvidiaA100上测试,性能优于其他开放的图像到3D模型

产品入口:https://top.aibase.com/tool/triposr

谷歌发布可读屏AI模型ScreenAI:可理解用户界面和信息图表

【AiBase提要:】

🧠ScreenAI采用新颖的截图文本表示方法,生成合成训练数据,可回答关于屏幕信息、导航和总结问题。

🚀ScreenAI在数字内容理解方面取得进展,但无法执行生成操作,需要更多研究缩小与更大模型的差距。

📈ScreenAI在基准测试中表现优异,随着模型大小增加性能提高,有望推动智能手机自动化处理进步。

Verce发布AISDK3.0推出生成式UI功能

【AiBase提要:】

⭐引入生成式UI功能,丰富聊天机器人交互体验。

⭐生成式UI功能使聊天机器人回答更丰富生动。

⭐AISDK3.0可生成最适合场景的UI反馈,提升用户交互体验。

体验地址:https://top.aibase.com/tool/vercel-ai-sdk-3-0

📰🤖📢AI新鲜事

StabilityAI发布SD3技术报告,披露SD3更多细节

image.png

【AiBase提要:】

🌟SD3在排版、美学、提示词理解上超过开源和商业模型

🌟新的MMDiT架构改进文本理解和拼写能力

🌟SD3使用独特的权重集提高整体理解力和排版质量

详细内容点此查看:https://stability.ai/news/stable-diffusion-3-research-paper

Claude3能察觉研究人员在测试中的行为

【AiBase提要:】

⭐ Anthropics推出的Claude3展现出对研究人员测试的元认知水平。

⭐ Opus在“needle-in-a-haystack”测试中找到相关信息并意识到测试的人工性质。

⭐ LLM的能力令人惊叹,但需要更实际的评估方法来准确评估模型的真实能力和局限性。

微软寻求驳回纽约时报起诉的部分内容

【AiBase提要:】

🔍 纽约时报指责微软及OpenAI侵犯版权,使用文章训练人工智能技术。

🤖 微软表示大型语言模型未替代新闻市场,比较LLMs与录像机合法性。

⚖️ 微软和OpenAI提出驳回起诉动议,称时报未展示实际损害,辩护“公平使用”。

商汤科技用AI“复活”创始人汤晓鸥

【AiBase提要:】

⭐ 商汤年会上,数字人汤老师以幽默方式演讲。

⭐ 数字人技术“如影”再现真人形象,支持多语种和4K视频输出。

⭐ AI技术已用于“复活”亡者,如音乐人包小柏“数字女儿”为家人带来慰藉。

举报

  • 相关推荐
  • 千问3.6正式发布:最强编程国产模型 接近Claude

    今天,千问发布新一代大语言模型Qwen3.6-Plus。 千问3.6整体性能较3.5进步显著,具备极强的智能体编程能力,在系列编程能力权威评测中,千问3.6成为当下编程能力最强的国产模型,接近全球最强编程模型Claude系列。 在前端网页开发、仓库级复杂任务等实测场景中,千问3.6可自主拆解任务、规划路径、测试修改直至任务完成。 Qwen3.6-Plus展现出卓越的工程落地能力,不仅能实�

  • Claude悄悄更新了Skills生成器,这绝对是一次史诗级升级。

    上周直播的时候,发现Anthropic的skills仓库居然有更新了。 点进去一看,然后居然发现了一个超级刚需的Skills迎来了更新。 图片 就是这个,甚至可以说是整个Skills生态的基石。 Skill-creator。 可以说,现在小龙虾的能力能这么强,有一半的原因都要归功于Skills,而

  • 智微智能联合英特尔发布Gaudi2E四卡液冷工作站,赋能企业私有化AI算力

    英特尔与智微智能联合发布Gaudi2E四卡液冷工作站,为企业AI工作负载提供一站式私有化算力方案。该方案基于Xeon-W平台与四张Gaudi2E加速卡,支持三大“AI工厂”级应用场景:Token工厂实现每日5-10亿级Token生成能力;视频工厂支持电影级视频批量生产;代码工厂提供安全高效的本地化AI编程支持。产品通过一体化液冷设计实现高效散热与静音,适配办公环境,助力企业构建自主可控的AI算力基础设施。

  • openclaw github installation guide:官方安装全流程!

    本文介绍了2026年AI行业已进入注重落地和实际应用的智能体阶段,并推荐了开源智能体框架OpenClaw。文章提供了详细的保姆级部署教程,支持Windows、macOS、Linux全平台,涵盖网关搭建、认证配置、模型对接等步骤,帮助用户快速拥有专属的私有化AI助手,实现隐私自主与强大执行能力。教程包括环境准备、一键安装、模型选择(如Kimi、OpenAI等)、API配置及TUI界面使用,并解答了常见问题。最终目标是让用户轻松部署并开启专属AI的高效应用之旅。

  • AI日报:智谱发布GLM-5V-Turbo多模态Coding大模型;Seedance 2.0 API正式全量开放;美团 LongCat-AudioDiT 开源

    本期AI日报聚焦多领域进展:智谱发布GLM-5V-Turbo多模态编程模型,实现视觉与编程深度融合;字节跳动火山引擎开放Seedance 2.0视频生成API;美团开源LongCat-AudioDiT,刷新语音克隆SOTA;字节豆包大模型日消耗Token破120万亿,国产模型调用量持续增长;蚂蚁数科推出专业级AI智能体DTClaw;Anthropic测试常驻代理Conway,支持独立UI与Webhook;谷歌即将开源120B参数Gemma 4模型;通义实验室发布Qwen3.6-Plus,提升编程智能体稳定性。

  • Leader统帅2025年超千万人下单

    统帅电器坚持“听劝”理念,以用户需求为导向,精准洞察年轻人追求“家务解放”的痛点。从首创“三筒”洗衣机引爆市场,到构建覆盖全场景的“懒人洗护家族”和“懒人套系”,产品持续迭代升级。依托海尔智家平台,通过HOPE创新平台收集用户反馈,结合全球研发资源高效转化需求,形成“用户共创”闭环。2025年新增用户超千万,其中30岁以下占比31%,市场反响热烈。统帅正从单品到全场景,为用户打造“精致懒”生活解决方案。

  • 三星Music Studio画境艺术音响新品开售,双系共筑环绕声场与精致格调体验

    随着“耳朵经济”升级,消费者在追求高品质音效的同时,也注重音响设备与家居美学、情感体验的融合。三星Music+Studio画境艺术音响系列新品于4月13日开售,旨在为家庭带来沉浸式听觉享受与空间表达。其中,7系搭载3.1.1声道架构,支持高解析音频,配合Q交响乐技术,实现电视与音响协同发声,打造影院级环绕声场;5系设计简约,支持无线连接,适合多场景使用,提供便捷的高品质音乐体验。该系列重新定义了音响在家庭中的角色,融合声学科技与艺术设计,满足用户对声音、美学与情感的全方位追求。

  • 元戎启行冲刺百万级交付,前DeepSeek核心成员阮翀将亮相北京车展

    元戎启行CEO周光透在智能电动汽车发展高层论坛上表示,公司正通过基座模型推动辅助驾驶系统规模化落地,计划2026年实现百万辆量产目标。基座模型能显著降低系统开发与部署成本,使辅助驾驶能力在更大规模车型中落地。随着量产规模扩大,系统将获得更多真实数据,形成“规模-数据-模型”的正向循环,持续提升系统稳定性与安全性。目前搭载其城市NOA方案的量产车辆已超30万辆,累计运行里程超13亿公里。业内分析认为,规模化将成为自动驾驶公司竞争的重要壁垒。

  • 特斯拉Model S/X库存见底 马斯克感慨:一个时代的感伤落幕

    特斯拉CEO马斯克在社交平台发文称,特斯拉Model S和Model X的库存已经只剩最后几百台,一个时代迎来感伤的落幕。 这条动态是马斯克回复一位用户的换车分享。有车主表示,在Model S/X停产前,用2020款Model S置换了全新的Plaid版Model X,体验后对FSD完全自动驾驶功能赞不绝口,称在洛杉矶过去一个月里,95%的里程都是自动驾驶完成,远超预期。 马斯克在回复中直接确认,Model S和Mo

  • DeepSeek专家模式上线 此前V4版本已开启灰度测试

    近日,智能交互平台DeepSeek迎来重要更新,正式上线专家模式,旨在为用户在处理复杂问题时提供更为卓越的体验。此次更新是DeepSeek自走红以来,首次在产品端引入模式分层设计,标志着其在功能优化与用户体验提升上迈出了重要一步。 在最新版本的DeepSeek中,用户在输入框上方即可清晰看到新增的“快速模式”与“专家模式”选项。其中,快速模式主要针对日常对话场景设

今日大家都在搜的词: