首页 > 原创 > 关键词  > AI产品最新资讯  > 正文

AI日报:智谱AI发布AutoGLM 2.0;腾讯元宝接入腾讯视频;字节发布开源大语言模型 Seed-OSS

2025-08-21 15:42 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、智谱AI发布革命性产品AutoGLM 2.0 语音一句话即可代替双手操控全网

智谱AI推出的AutoGLM 2.0是一款具有划时代意义的AI代理产品,它通过强大的自然语言理解和多平台操作功能,实现了用户与数字世界的无缝交互。从点外卖到订机票,再到社交媒体内容创作和办公自动化,AutoGLM 2.0展示了其在提升生活和工作效率方面的巨大潜力。

视频来自官方

【AiBase提要:】

🤖 AutoGLM 2.0具备强大的自然语言理解能力,能够执行复杂的跨平台任务。

📊 它支持多个主流应用平台,实现自动化操作,极大提升了用户体验。

🌐 开放API接口,使AutoGLM 2.0可以融入各种智能设备,推动智能化生活的普及。

详情链接:https://autoglm.zhipuai.cn/htdocs/download.html

2、腾讯元宝接入腾讯视频 点击可直接跳转观看

腾讯元宝与腾讯视频合作,用户可通过元宝平台直接跳转至腾讯视频观看影视作品,极大提升了观影便捷性。

image.png

【AiBase提要:】

🎥 用户可在腾讯元宝平台直接搜索并跳转至腾讯视频观看影视作品。

🔍 元宝支持通过片名、情节或台词快速检索影视内容。

💬 用户可与元宝探讨影视作品的创作背景和剧情内涵。

3、字节跳动发布开源大语言模型 Seed-OSS,助力开发者与研究者

字节跳动的 Seed 团队推出了 Seed-OSS 系列开源大型语言模型,专注于长文本理解、推理能力和开发者友好特性。Seed-OSS-36B 模型拥有360亿参数和512K的上下文处理能力,适用于学术研究和实际开发任务。

image.png

【AiBase提要:】

🧠 Seed-OSS 系列模型基于因果语言模型架构,支持长文本理解和推理能力。

⚙️ 提供两种版本:Seed-OSS-36B-Base 和 Seed-OSS-36B-Base-woSyn,满足不同需求。

🚀 支持灵活的“思考预算”控制,提升推理效率并优化推理任务表现。

详情链接:https://github.com/ByteDance-Seed/seed-oss

4、速卖通“新品闪电推”亮相:AI Agent自动整合资源,新品7天破零率翻倍

速卖通推出的‘新品闪电推’AI Agent通过自动化和智能化的营销策略,帮助商家快速实现新品出单。该工具能够自动整合平台内外资源,并匹配最佳推广策略,显著提升了新品转化率。

【AiBase提要:】

🔥 新品闪电推通过AI技术提升新品出单效率。

💡 AI自动整合资源并制定最佳推广策略。

📈 自上线以来,新品7天破零率翻倍,效果显著。

5、微软测试Windows11 Copilot新功能:AI智能搜索文件和图片

微软正在为Copilot应用引入AI驱动的智能文件搜索功能,允许用户通过自然语言描述进行文件检索。该功能基于AI技术,提升了文件管理效率,并扩展了AI在操作系统中的应用范围。

image.png

【AiBase提要:】

✨ 引入自然语言描述搜索功能,提升文件检索体验。

🖼️ 新增家庭体验界面,展示最近使用的应用、文件和对话记录。

🖼️ 支持图片分析功能,实现多媒体内容交互。

6、Liquid AI 推出 LFM2-VL:低延迟的超高效视觉语言模型

Liquid AI 发布了 LFM2-VL 系列,这是一种专为低延迟和设备适应性部署优化的视觉语言基础模型。该系列包括两个高效的变体:LFM2-VL-450M 和 LFM2-VL-1.6B,分别适用于资源受限环境和高端移动设备。其 GPU 推理速度比现有模型快两倍,并在图像描述、视觉问答等任务上保持竞争力。

image.png

【AiBase提要:】

🚀 LFM2-VL 提供超高效的 GPU 推理速度,比现有模型快两倍,适合各种设备使用。

🖼️ 支持原始分辨率处理图像,确保大图像细节不失真。

📦 两种模型均为开放权重,可在 Hugging Face 上下载,适合研究和商业应用。

详情链接:https://huggingface.co/collections/LiquidAI/lfm2-vl-68963bbc84a610f7638d5ffa

7、OpenAI 首次突破月收入10亿美元,算力需求依然紧张

OpenAI 在财务和算力方面面临挑战,但其业务规模迅速扩大,并与多家科技公司展开合作以应对计算资源需求。

【AiBase提要:】

🧠 OpenAI 首次实现月收入突破10亿美元,但算力需求持续紧张。

🤝 与微软的紧密合作推动 AI 产品快速发展。

🚀 最新推出的 ChatGPT-5 引发广泛关注,订阅量加速增长。

8、谷歌Pixel10抢跑AI赛道:搭载情感识别功能,领先苹果两年布局智能手机未来

谷歌在Pixel10系列中全面升级了AI功能,包括Gemini Live的语音识别、Magic Cue主动助手、Camera Coach摄影辅助以及突破性的语音翻译功能。这些创新展示了谷歌在AI驱动智能手机领域的领先地位。

image.png

【AiBase提要:】

🌟 Pixel10系列搭载Tensor G5处理器,支持最新Gemini Nano模型,实现AI能力的质的飞跃。

💡 Magic Cue功能通过AI提供上下文建议,重新定义用户交互体验。

🌐 语音翻译功能支持多种语言互译,为商务和旅行用户提供便利。

9、谷歌Pixel Buds震撼升级:AI手势控制引领耳机革命,130美元就能拥有降噪黑科技

文章详细介绍了谷歌最新发布的Pixel Buds2a和Pixel Buds Pro2耳机,这两款产品在AI技术、功能升级和用户体验方面均有显著提升。特别是Pixel Buds Pro2的AI手势控制和自适应音频功能,展现了谷歌在智能音频设备领域的创新能力。

image.png

【AiBase提要:】

🎧 Pixel Buds2a首次引入主动降噪技术,提升了通话清晰度和用户体验。

🧠 Pixel Buds Pro2支持AI手势控制,实现更便捷的交互方式。

💡 新增的自适应音频和大音量保护功能,进一步优化了用户的听觉体验。

10、ElevenLabs 发布 v3 Alpha API:支持超过 70 种语言和无限数量的虚拟角色

ElevenLabs 推出的 v3 Alpha API 是一款突破性的文本转语音工具,支持超过 70 种语言,并具备对话模式和高级音频标签功能,为开发者提供了更自然、富有情感的语音生成能力。

image.png

【AiBase提要:】

🌟 支持超过 70 种语言,实现多语言语音生成。

🎭 引入对话模式,支持多角色互动和语气变化。

🔊 高级音频标签功能,精确控制语音情感与节奏。

举报

  • 相关推荐
  • 智谱AI发布AutoGLM 2.0 - 首个为手机而生的通用Agent。

    智谱今天,终于发了AutoGLM2.0。 想一想,AutoGLM1.0的版本,距离我第一次首发写他们,已经过去快10个月了。 那个时候,他们掀起了一波Agent热潮,甚至连A股都出现了智谱概念股,他们也开启了Agent的另一条支线,用视觉的方式来操控原有设备。 当时,我对着我的手机说:我29号要去一趟深圳,你帮我定个罗湖地铁站附近的酒店,预算600元以内,大床房。 然后,我的手机,就像

  • 昆仑万维UniPic 2.0“小钢炮”模型炸场,一个模型搞定理解+生成+编辑

    大模型又迎来新一波的迭代周期。 近日,从Open AI发布GPT-5,到国内的昆仑万维、商汤、百川智能、智谱等都陆续发布了自己的新模型。其中昆仑万维更是一口气开启了技术周,连续5天每天发布一个新模型,而8月13日发布的,正是其本周发布的第三款模型——多模态统一模型UniPic2.0。 UniPic2.0主打的是,在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力

  • 重磅!标贝科技推出「十万音色·自然语音数据集」 重构AI语音训练基础设施

    标贝科技发布"十万音色·自然语音数据集",覆盖中英双语,包含10万种音色样本(中文5万、英文5万),基于近百万小时原始数据经智能生产线精细打磨。该数据集在规模、真实性和准确性三大核心指标实现突破,支持多情感表达和跨场景应用,涵盖基础情绪到特定风格,话题涉及多个领域。通过音频质量筛选、文本转写校正、说话人分离等技术,从海量数据中甄选出高质量样本,为语音识别、合成等AI模型训练提供坚实基础,助力实现更自然、真实的语音交互体验。

  • ChatGPT语音模式增添新功能:可调语速 支持0.5到2.0倍速

    OpenAI为其ChatGPT网页应用的语音模式推出新功能,加入语音速度”调节与自定义指令前缀”,同时配合此前升级的模型选择器,进一步提升用户体验。 新增的语音速度”选项让用户可通过滑块自由调整ChatGPT的语速,范围从0.5倍速到2.0倍速,不过该功能目前仍处于隐藏状态,尚未正式开放。 自定义指令前缀”功能则允许语音模式记住用户的特定要求,避免重复输入。系统明确�

  • 不再喊“私域”,企业微信5.0真正的杀手锏是AI和办公!

    企业微信5.0终于来了。 不同于过去版本发布,几乎场场都把“私域”相关能力作为重点,这一次,企微选择把重心放在了AI能力与办公协同。 AI切中的是企业日常协作中最棘手的效率痛点,而办公场景的延伸,则让“连接内外”真正变为现实。 这背后释放了一个信号:企微并不是在弱化私域,而是回到它更底层的定位—— 一个既能打通微信外部客户连接,又

  • “无限量”供应Claude,就是AI IDE们的百亿补贴

    Anthropic于2025年7月28日宣布,将从8月28日起对Claude Code工具新增每周调用限额——因为少数重度用户全天候高频使用,一次使用成本甚至高达数万美元,远远超过普通订阅预期。 同样在上个月,Cursor曾因其“I’ll keep it unlimited”的Pro收费模式悄然变更为计算tokens限制,导致大量用户抱怨“实际上并非无限”,纷纷在社群中吐槽,迫使公司CEO出面道歉、甚至给出退款补偿。 这两�

  • Agentic AI落地加速:迈富时企业级智能体中台2.0,让 AI Agent成为企业 “数字员工”

    Gartner将代理型AI列为2025年十大战略趋势之首,预测到2028年15%的日常工作决策将由自主智能代理完成。迈富时发布的AI-Agentforce2.0企业级智能体中台,通过"技术赋能+场景落地"双轮驱动,构建了从模型能力到业务价值的闭环。该平台具有三大核心优势:1)"模型-应用-开发平台"三位一体架构;2)ChatBox+工作流双开发模式,支持快速部署;3)企业级安全保障,满足金融等敏感行业需求。已在保险、零售、供应链等领域实现规模化应用,最高提升37%销售转化率。该方案让企业能低成本打造专属数字员工团队,真正释放代理型AI的战略价值。

  • 从“手动挡”进入“AI智能挡”:亚数TrustAsia 开启证书管理「服务化」CaaS 新时代

    随着TLS/SSL证书有效期缩短至47天,企业面临信任中断风险加剧、内部系统协同困难及预警监测缺失三大挑战。亚数TrustAsia推出新一代智能证书管理体系TrustAsia CaaS,通过自动化流程实现证书全生命周期管理,提供六大核心能力:资产发现与管理、多CA自动化签发、自动化分发部署、实时监测告警、无缝集成定制及全流程自动化,有效应对加密敏捷性需求,助力企业构建安全可信�

  • 阿里云AI火花大会:规模化前夜,AI务实派靠场景破局

    阿里云在深圳成功举办AI创新应用大会,提出要将"云+AI"技术转化为千行百业的商业动能。大会吸引了近千家企业参与,探讨AI技术从理论走向商业实践的路径。阿里云智能集团副总裁刘湘雯指出,AI不仅是技术演进,更是生产力革命。会议聚焦大模型与AI Agent的融合机遇,提出企业智能化转型需把握四大趋势:技术迭代加速、开源填补鸿沟、智能体从"工具人"变为"决策者"、交互革命重构人机触点。阿里云通过三层落地逻辑(模型API Server、Agent对接层、行业解决方案)助力企业穿透技术迷雾,并发布AI应用先锋计划,联合生态伙伴加速AI应用从概念验证到规模化落地。

  • AI钉铛智造全新发布“钉铛云AI OS”,为制造业数智化转型注入新动能

    红壹科技在第二十届中博会期间发布“钉铼云AI OS”工业操作系统,该系统采用“一体·双翼·三擎”架构,整合AI与工业数字化能力,聚焦中小企业智能制造痛点。已服务全国50余个制造业核心城市的上万家企业,通过AI智能预测、工艺优化等功能显著提升生产效率,降低运营成本。公司核心团队来自阿里、华为等头部企业,致力于构建开放协同的工业生态,助力中国智造走向全球。

今日大家都在搜的词: