首页 > 原创 > 关键词  > AI产品最新资讯  > 正文

AI日报:智谱AI发布AutoGLM 2.0;腾讯元宝接入腾讯视频;字节发布开源大语言模型 Seed-OSS

2025-08-21 15:42 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、智谱AI发布革命性产品AutoGLM 2.0 语音一句话即可代替双手操控全网

智谱AI推出的AutoGLM 2.0是一款具有划时代意义的AI代理产品,它通过强大的自然语言理解和多平台操作功能,实现了用户与数字世界的无缝交互。从点外卖到订机票,再到社交媒体内容创作和办公自动化,AutoGLM 2.0展示了其在提升生活和工作效率方面的巨大潜力。

视频来自官方

【AiBase提要:】

🤖 AutoGLM 2.0具备强大的自然语言理解能力,能够执行复杂的跨平台任务。

📊 它支持多个主流应用平台,实现自动化操作,极大提升了用户体验。

🌐 开放API接口,使AutoGLM 2.0可以融入各种智能设备,推动智能化生活的普及。

详情链接:https://autoglm.zhipuai.cn/htdocs/download.html

2、腾讯元宝接入腾讯视频 点击可直接跳转观看

腾讯元宝与腾讯视频合作,用户可通过元宝平台直接跳转至腾讯视频观看影视作品,极大提升了观影便捷性。

image.png

【AiBase提要:】

🎥 用户可在腾讯元宝平台直接搜索并跳转至腾讯视频观看影视作品。

🔍 元宝支持通过片名、情节或台词快速检索影视内容。

💬 用户可与元宝探讨影视作品的创作背景和剧情内涵。

3、字节跳动发布开源大语言模型 Seed-OSS,助力开发者与研究者

字节跳动的 Seed 团队推出了 Seed-OSS 系列开源大型语言模型,专注于长文本理解、推理能力和开发者友好特性。Seed-OSS-36B 模型拥有360亿参数和512K的上下文处理能力,适用于学术研究和实际开发任务。

image.png

【AiBase提要:】

🧠 Seed-OSS 系列模型基于因果语言模型架构,支持长文本理解和推理能力。

⚙️ 提供两种版本:Seed-OSS-36B-Base 和 Seed-OSS-36B-Base-woSyn,满足不同需求。

🚀 支持灵活的“思考预算”控制,提升推理效率并优化推理任务表现。

详情链接:https://github.com/ByteDance-Seed/seed-oss

4、速卖通“新品闪电推”亮相:AI Agent自动整合资源,新品7天破零率翻倍

速卖通推出的‘新品闪电推’AI Agent通过自动化和智能化的营销策略,帮助商家快速实现新品出单。该工具能够自动整合平台内外资源,并匹配最佳推广策略,显著提升了新品转化率。

【AiBase提要:】

🔥 新品闪电推通过AI技术提升新品出单效率。

💡 AI自动整合资源并制定最佳推广策略。

📈 自上线以来,新品7天破零率翻倍,效果显著。

5、微软测试Windows11 Copilot新功能:AI智能搜索文件和图片

微软正在为Copilot应用引入AI驱动的智能文件搜索功能,允许用户通过自然语言描述进行文件检索。该功能基于AI技术,提升了文件管理效率,并扩展了AI在操作系统中的应用范围。

image.png

【AiBase提要:】

✨ 引入自然语言描述搜索功能,提升文件检索体验。

🖼️ 新增家庭体验界面,展示最近使用的应用、文件和对话记录。

🖼️ 支持图片分析功能,实现多媒体内容交互。

6、Liquid AI 推出 LFM2-VL:低延迟的超高效视觉语言模型

Liquid AI 发布了 LFM2-VL 系列,这是一种专为低延迟和设备适应性部署优化的视觉语言基础模型。该系列包括两个高效的变体:LFM2-VL-450M 和 LFM2-VL-1.6B,分别适用于资源受限环境和高端移动设备。其 GPU 推理速度比现有模型快两倍,并在图像描述、视觉问答等任务上保持竞争力。

image.png

【AiBase提要:】

🚀 LFM2-VL 提供超高效的 GPU 推理速度,比现有模型快两倍,适合各种设备使用。

🖼️ 支持原始分辨率处理图像,确保大图像细节不失真。

📦 两种模型均为开放权重,可在 Hugging Face 上下载,适合研究和商业应用。

详情链接:https://huggingface.co/collections/LiquidAI/lfm2-vl-68963bbc84a610f7638d5ffa

7、OpenAI 首次突破月收入10亿美元,算力需求依然紧张

OpenAI 在财务和算力方面面临挑战,但其业务规模迅速扩大,并与多家科技公司展开合作以应对计算资源需求。

【AiBase提要:】

🧠 OpenAI 首次实现月收入突破10亿美元,但算力需求持续紧张。

🤝 与微软的紧密合作推动 AI 产品快速发展。

🚀 最新推出的 ChatGPT-5 引发广泛关注,订阅量加速增长。

8、谷歌Pixel10抢跑AI赛道:搭载情感识别功能,领先苹果两年布局智能手机未来

谷歌在Pixel10系列中全面升级了AI功能,包括Gemini Live的语音识别、Magic Cue主动助手、Camera Coach摄影辅助以及突破性的语音翻译功能。这些创新展示了谷歌在AI驱动智能手机领域的领先地位。

image.png

【AiBase提要:】

🌟 Pixel10系列搭载Tensor G5处理器,支持最新Gemini Nano模型,实现AI能力的质的飞跃。

💡 Magic Cue功能通过AI提供上下文建议,重新定义用户交互体验。

🌐 语音翻译功能支持多种语言互译,为商务和旅行用户提供便利。

9、谷歌Pixel Buds震撼升级:AI手势控制引领耳机革命,130美元就能拥有降噪黑科技

文章详细介绍了谷歌最新发布的Pixel Buds2a和Pixel Buds Pro2耳机,这两款产品在AI技术、功能升级和用户体验方面均有显著提升。特别是Pixel Buds Pro2的AI手势控制和自适应音频功能,展现了谷歌在智能音频设备领域的创新能力。

image.png

【AiBase提要:】

🎧 Pixel Buds2a首次引入主动降噪技术,提升了通话清晰度和用户体验。

🧠 Pixel Buds Pro2支持AI手势控制,实现更便捷的交互方式。

💡 新增的自适应音频和大音量保护功能,进一步优化了用户的听觉体验。

10、ElevenLabs 发布 v3 Alpha API:支持超过 70 种语言和无限数量的虚拟角色

ElevenLabs 推出的 v3 Alpha API 是一款突破性的文本转语音工具,支持超过 70 种语言,并具备对话模式和高级音频标签功能,为开发者提供了更自然、富有情感的语音生成能力。

image.png

【AiBase提要:】

🌟 支持超过 70 种语言,实现多语言语音生成。

🎭 引入对话模式,支持多角色互动和语气变化。

🔊 高级音频标签功能,精确控制语音情感与节奏。

举报

  • 相关推荐
  • 软件测试的“自动驾驶革命”:从工具自动化到思维智能化

    AI正推动软件测试领域变革,测试团队脚本维护时间减少60%,工作重心转向策略设计与异常监控。行业报告显示,AI驱动的测试效率提升显著,尤其在探索性测试中可发现人工难以预见的边缘场景缺陷。实践案例表明,金融、汽车等行业引入AI测试后,迭代周期缩短,用例自动生成率大幅提升。未来测试工程师将更专注于质量体系设计和风险分析,而非脚本编写,实现从“人工密集型”向“智能驱动型”的转变。

  • 从品牌咨询到语言培训:小鹅通如何助力花花语言艺术实现培训产品数字化落地

    文章介绍小鹅通平台助力语言培训品牌“花花语言艺术”实现数字化转型的案例。创始人任瑞丽从品牌咨询转型,创立“母语应用式”培训体系,通过小鹅通完成产品数字化、私域运营等全链路升级,服务超1万用户。该案例体现了小鹅通以工具赋能为核心理念,帮助培训从业者实现业务可持续增长,未来将继续深化合作,完善表达训练体系并拓展文化传播领域。

  • 构建全场景数字生态:三星商显产品亮相AUTODESK论坛与全球数贸会

    三星近日在上海欧特克论坛及全球数字贸易博览会两大行业展会展示多款商用显示产品。通过汽车设计、智慧会议等高端应用场景的创新矩阵,全面展现其在商用显示领域的前瞻布局与技术底蕴。明星产品The Wall IWB与IAB系列以超高清晰度、精准色彩及高效协同能力吸引专业观众,推动汽车设计乃至高端制造业研发模式变革。同时亮相的智能数字标牌、电子白板及彩色电子纸等产品,覆盖多场景技术路线,彰显三星作为行业引领者通过显示技术赋能各行业数字化转型升级的战略布局。

  • 从边陲到前沿:麒麟软件推动新疆数字化与民族语言信息化

    1955年10月1日新疆维吾尔自治区成立,开启发展新篇章。70年来,新疆各族人民生活水平显著提升,社会事业全面进步,生态环境持续改善。麒麟软件作为国产操作系统核心力量,深度参与新疆数字化建设,覆盖党政、金融、交通、通信、教育等领域,支撑超70家厅局单位及14个地州市用户。其银河麒麟操作系统在维哈柯文等多民族语言版本持续升级,集成智能输入与AI助手,优化本地化体验,助力民族地区信息化发展。未来,麒麟软件将持续以技术创新服务新疆现代化建设,推动区域高质量发展。

  • 月流水上涨数倍、多品类爆发,AI产品在移动端越来越赚钱?

    近日,Sensor Tower 发布《2025年 AI 应用市场调查报告》,报告中提到,移动端 AI 产品 IAP 收入在2025年上半年半年度环比增长率为100%,但具体到产品上,全球 IAP 收入 Top10全部都是 ChatBot,相比于 Web 端的百花齐放,App 端能赚到钱的 AI 原生产品依旧单一。 但如果我们将视角放大,其实在 Chatbot 之外,很多品类借助 AI 实现了收入提升,甚至是数倍的提升。

  • 破局传统办公痛点!思必驰用AI办公本、吸顶麦、信创一体机点亮智慧会议未来

    随着大数据、物联网、AI等数字化技术兴起,传统办公正向智慧办公模式跃迁。思必驰作为对话式AI领域先行者,通过智能语音交互技术为办公场景注入新活力。其推出的AI办公本X5系列搭载全链路智能对话平台,支持多语言转写与实时纪要生成,结合吸顶麦克风等硬件,实现高效会议记录与多设备协同。此外,D1信创一体机采用国产化技术架构,保障政企数据安全,适用于保密会议等场景。思必驰以软硬一体化方案推动办公智能化,助力企业提升效率,重塑移动办公体验。

  • 数贸会今日开幕!每日互动展台人气火爆,GAI Station引领AI办公新体验

    2025全球数字贸易博览会于9月25日在杭州开幕。每日互动公司(展位7A-T022)集中展示了AI产业实践与数据流通领域成果,重点推出10万元级智能工作站GAI+Station,集成写作、会议纪要、智能问答等功能,内置8大模型能力,破解成本与安全痛点。其“发数站”战略打通数据高效流通链路,已在医疗、交通等多领域落地,“数智绿波”应用覆盖全国30多个省市,通行效率提升20%以上。此外,AITA超级营销助手实现升级,机器狗互动表演吸引关注。展会期间将举办10余场专业发布,涵盖数据要素、大模型应用等行业实战,助力企业把握数字化机遇。

  • 捷停车×腾讯乐企:“数字化、自动化、生态化”停车场景电票服务体验升级

    捷顺科技旗下捷停车平台负责人王恒在腾讯全球数字生态大会上分享电子发票创新实践。捷停车基于腾讯乐企平台,实现停车缴费与开票一体化,推出“支付即开票”功能,显著提升用户体验。该合作通过数字化、自动化、生态化理念,降低运营成本,实现秒级开票,并与微信生态深度融合。目前覆盖1.4亿车主和5.9万智慧车场,未来将持续推动电子发票在智慧出行生态的创新应用。

  • 如何正确理解Token经济学?

    去年5月,当大模型厂商卷起价格战时,Tokens大概率是出镜率最高的英文单词。 简单来说,Tokens是大语言模型(LLM)用来切割自然语言文本的基本单位,可以直观的理解为“字”或“词”。 就像工业时代用“千瓦时”度量电力消耗,互联网时代用“GB”度量数据流量,AI时代用“Token”来度量模型的工作量。一个Token可以理解为一个词或词片段(中文里可能是一个字或词语)。

  • 思必驰AI办公本X5系列搭载全新柔彩屏,革新智能办公视觉与书写体验

    2025年9月24日,思必驰推出新一代AI办公本X5系列,主打柔彩屏显示技术,配备10.95英寸2.5K超清大屏、60Hz高刷新率及类纸化书写效果,显著提升视觉观感与书写体验。产品采用L型8麦克风阵列布局,结合DOA声源定位,优化远场拾音准确性。首次在端侧实现多模态大模型完整部署,支持离线语音转写及AI会议纪要,保障数据安全。AI决策洞察功能可深度剖析会议内容,提供风险提醒与行动建议。该系列旨在构建“端侧AI+高端办公”体验,成为高效可靠的生产力工具。

今日大家都在搜的词: