11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
豆包输入法iOS版迎来0.9.3版本更新,核心是双拼键盘上线,支持小鹤、自然码等主流方案,提升输入效率。新增公式计算结果推荐、优化英文键盘反斜杠输入问题、数字后全角冒号自动转半角等功能。交互上,删除键支持长按分层清空内容,键盘阴影、候选项背景等细节也得到优化。
想象一下,用一句话生成一个世界,一句话改变一个世界,一句话无限延伸一个世界。 1月13日晚,爱诗科技正式发布 PixVerse R1,它是“全球首个通用实时世界模型”,支持最高1080P 分辨率,基于原生多模态架构、自回归流式生成和瞬时响应引擎构建。
文章以丹尼尔·卡尼曼的“快与慢”思维系统理论为引,介绍了李未可AI智能眼镜如何将AI融入人类最自然的“看、听、说”交互中。该产品通过“超能李未可”系统,结合自研大模型与多智能体协同的“群体智能”模式,实现了从快速直觉响应到深度理性思考的无缝衔接。它能高效处理实时翻译、信息查询等日常任务,并在需要时启动多专家智能体进行复杂规划与创意生成,致力于成为用户随身、随思、随需的“第二大脑”,让技术回归增强人类感知与创造能力的本质。
本期AI日报聚焦多项AI领域突破:爱诗科技发布全球首个通用实时世界模型PixVerse R1,实现虚拟世界实时交互;Vidu推出AI一键生成MV功能,打造“虚拟制片厂”;MiniMax发布编程智能体基准测试OctoCodingBench;快手可灵AI年化收入达2.4亿美元;智谱联合华为开源多模态模型GLM-Image,全链路跑通国产芯片;百川智能发布医疗大模型Baichuan-M3;谷歌重构电商未来,推出Agentic AI购物系统;谷歌开源医疗AI模型MedGemma 1.5与语音识别模型MedASR。
爱诗科技发布全球首个支持1080P实时生成视频模型PixVerse R1,实现“所想即所见、所说即所现”的实时交互体验。该模型基于Omni原生多模态基础模型、自回归流式生成机制和瞬时响应引擎三大核心技术,将视频生成延迟降至“即时”响应,标志着AIGC视频生成从“静态输出”迈入“实时交互”新阶段。
1月8日至11日,海雀科技在阿里云通义千问智能硬件展上发布搭载AI大模型的海雀摄像头。该产品不仅是家用智能摄像头首次在设备端直接使用大模型,更标志着摄像头从被动记录工具向主动服务的AI伙伴转变。海雀摄像头能看、会听、会思考、会执行指令,深入家庭场景,为育儿家庭提供“全能陪聊搭子”与“安心守护者”,为有老人的家庭提供“可对话的养生助手”,并成为所有家庭的“智能管家”。通过千万用户数据,海雀精准切入需求,以“主动智能”引领行业,为AI硬件赛道提供了从技术堆砌到场景融合的参考范本。
AI大模型今年会向更专业的方向发起猛攻,除了AI编程之外,AI医疗也成为一大重点,OpenAI刚收购了一个医疗初创公司,Cluade也推出了AI医疗助手。 今天还有一家国产大模型新品也将目光瞄准了医疗,那就是Baichuan-M3,这是知名大佬王小川投资成立的百川智能发布的AI医疗大模型,号称全球最强。 据百川智能介绍,Baichuan-M3 专为医疗场景深度优化,融合海量医学文献、临床指南�
北京大学张牧涵团队提出TransMLA转化框架,实现无需重训即可将主流大模型(如LLaMA、Qwen)从GQA架构迁移至MLA架构。该框架通过四大核心技术模块解决迁移痛点:结构映射、RoRoPE位置编码适配、频率折叠融合及KV矩阵均衡化,在昇腾算力支持下,成功在LLaMA-2-7B上裁剪68.75%的KV缓存,仅轻微性能损失。昇腾硬件的高效并行架构与存储优化体系为技术落地提供关键支撑,推动TransMLA集成至高性能推理框架生态,大幅降低企业升级成本,为长上下文推理提供自主算力解决方案。
苹果公司宣布将与谷歌展开深度合作,借助谷歌的人工智能技术为今年晚些时候推出的产品功能,尤其是Siri,提供强大的AI支持。 根据合作内容,谷歌将通过其先进的Gemini模型和成熟的云技术,为苹果未来的基础模型注入核心动力。苹果在官方声明中明确表示,经过审慎评估,谷歌的技术为苹果基础模型奠定了最为坚实的基础,公司对即将为用户带来的创新体验充满期待。
苹果将与谷歌合作,为今年晚些时候推出的产品功能(如Siri)提供人工智能支持。 谷歌将通过Gemini模型和云技术,为苹果未来的基础模型提供动力。 苹果在声明中表示:经过仔细评估,我们认为谷歌的技术为苹果基础模型提供了最强大的基础,我们对它将为用户带来的创新体验感到兴奋。” 据悉,苹果拟每年支付谷歌约10亿美元,获取定制化Gemini模型使用权,核心版本为1.