11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
【AI日报】汇总了近期AI领域重要进展:1)月之暗面推出Kimi Playground平台,实现从对话助手到智能助理的转变;2)OpenAI发布ChatGPT Agent,支持自主执行浏览、购物等任务;3)Suno发布v4.5+版本,新增人声替换等音乐创作功能;4)谷歌Veo3视频生成模型上线,支持文本转视频;5)全球首个直播流扩散模型MirageLSD发布,实现实时视频转换;6)VSCode编程助手Traycer提升大型代码库处理效率;7)ART框架支持Python一键训练AI Agent;8)NVIDIA语音识别模型Canary-Qwen-2.5B词错率创新低;9)Mistral AI推出Le Chat挑战ChatGPT;10)百度小度上线首个支持物理交互的MCP Server;11)Lightricks的LTXV模型实现60秒高质量视频生成;12)开源模型LTX-Video13B支持30倍速高清视频生成。
Agent AI 时代,比我们想象中来得要早一些。 北京时间周五凌晨,OpenAI 突然开启了新产品直播。 本次发布的是全新的 ChatGPT Agent,它实现了通用智能体(Agent)能力的关键升级。
OpenAI推出ChatGPT智能体,整合网页交互、数据搜索与多模态协作功能,可完成代码生成、PPT制作、金融分析等复杂任务。该智能体融合Operator的网页自动化操作、Deep Research的数据分析能力及优化后的GPT-4对话引擎三大核心模块。目前面向付费用户开放,Pro版近乎无限使用,其他版本每月限50次任务。OpenAI承认其仍存在金融建模需人工验证、非英语文本解析准确率低等技术局限,并
2025ChinaJoy将于8月1-4日在上海举办,世纪华通将以"Game for Gamers"为主题参展,强调"回归游戏"和"玩家至上"理念。展台设计融合视觉与听觉元素,呈现键盘、VR头盔等交互设备,展现多元游戏体验。公司连续三年为ChinaJoy创作主题曲,今年推出同名原创音乐《Game for Gamers》,歌词描绘玩家成长轨迹。世纪华通积极布局AI领域,探索原生AI游戏内容,旗下"数龙杯"全球AI创新大赛已进入评审阶段。公司多款游戏展现技术创新,从《Whiteout Survival》到《街头篮球》,持续推动行业创新发展。
【AI日报】今日AI领域重要动态:1)百度推出无广告智能搜索助手Tizzy.ai,整合影视资源与深度思考功能;2)12306开源火车票查询引擎上线,采用FastAPI架构实现秒级响应;3)ChatGPT向Plus用户全面开放录音功能,支持实时记录与内容总结;4)开源SaaS模板FireGEO助力快速构建现代化Web应用;5)国产工具ReadMeX可一键生成高质量GitHub文档;6)百度AI助手新增视频通话功能,支持方言识别;7)Jacky
日前,支付宝宣布,苹果Apple Store教育优惠支持支付宝认证。 大学生和在职教师,在购买Mac、iPad 等产品时,可通过支付宝快速完成教育认证,享受Apple专属教育优惠。 支付宝表示,该认证方式在Apple Store零售店、在线教育商店及天猫官方旗舰店均可使用。 支付宝认证方式很简单,仅需3步就能搞定。 第1步:学生打开支付宝搜学生认证”,教职工可搜索芝麻名片”;
测试完以后,我觉得这玩意,还是值得我将近通宵写一篇的。 深度研究,也就是DeepResearch。 我过去写过很多次秘塔AI了,因为我自己的搜索习惯,现在基本就是,大活上ChatGPT用DeepResearch,常识问答直接找豆包,一般的AI搜索就是秘塔AI。 当然很多ChatBot产品都有AI搜索,但是我自己这两年,还是习惯用秘塔AI和Perplexity这样形态的原生AI搜索产品了,这可能就是习惯的力量吧。
SpaceX已承诺向xAI投资20亿美元,作为其50亿美元股权融资的一部分。在马斯克旗下xAI加速追赶竞争对手OpenAI之际,此举进一步强化了其旗下公司的协同效应。 紧随xAI与X的合并完成,这笔投资使合并后公司估值跃升至1130亿美元。目前,Grok聊天机器人已应用于星链(Starlink)客服业务,并计划未来集成至特斯拉(Tesla)的Optimus人形机器人。 不过,Grok近期因其部分回复内容引发争
一号双终端业务是指用户可以在自己手机号码(主号码)的账户和套餐下,添加手表作为eSIM附属设备(副卡),使手机和手表共用一个号码,共享号码、套餐通话和流量,可分别通话、上网。 如果没有随身携带手机,用户可以通过开通eSIM业务的智能手表进行通话,也不用担心错过重要通话。 这两年国内eSIM业务逐步收紧,很多新的设备已经无法重新开通,现在终于开始重新�
本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括:OpenAI Whisper(多语言识别与翻译)、Google Gemini(情感化语音生成)、Meta AudioCraft(音乐创作与风格转换)。国内讯飞星火(方言识别)、阿里通义(电商客服)、百度文心(车载场景)表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署