首页 > 原创 > 关键词  > AI最新资讯  > 正文

AI日报:赶超o1!国产大模型DeepSeek R1开源;Kimi多模态思考模型k1.5登场;清影2.0上线智谱清言

2025-01-21 15:30 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、国产大模型再突破!DeepSeek R1开源,性能直逼OpenAI,开启AI平权新时代

DeepSeek最近发布并开源了其最新研发的大型语言模型R1,标志着国产AI技术的一次重大突破。该模型在性能上与OpenAI的o1正式版相媲美,特别是在数学、代码和自然语言推理等关键任务上表现优异。

image.png

【AiBase提要:】

🌟 DeepSeek R1在后训练阶段应用强化学习技术,显著提升推理能力。

📊 开源了660B参数的DeepSeek-R1和DeepSeek-R1-Zero模型,同时提供了6个小模型,丰富了开源生态。

💰 API定价更具竞争力,缓存命中每百万输入tokens仅需1元,鼓励用户商用。

详情链接:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

2、月之暗面发布新一代SOTA模型 k1.5:多模态推理能力再升级

月之暗面公司推出的k1.5多模态思考模型,标志着多模态推理和通用推理领域的重大突破。该模型具备卓越的多模态处理能力,能够同时处理文本、图像和声音等信息,提升了对复杂任务的理解和应对能力。k1.5的强大通用推理能力使其在编程、数学问题求解等多种应用场景中表现出色。

微信截图_20250121082016.png

【AiBase提要:】

🌟 k1.5模型具备卓越的多模态推理能力,能够同时处理文本、图像和声音信息。

🤖 强大的通用推理能力使k1.5适用于编程、数学等多种任务,灵活性极高

📱 目前k1.5模型的预览版已在Kimi.com和Kimi智能助手App上线,用户可体验新功能。

3、免费试用!智谱推出 AI 生视频产品清影2.0已在智谱清言全量上线

北京智谱华章科技有限公司推出了AI生视频产品清影2.0,经过全面升级,显著提升了模型能力和视频生成质量。新版本能够生成自然流畅的动作和精美画面,用户只需简单提示即可实现复杂场景。同时,清影2.0在艺术风格上也有了突破,支持多种风格的视频生成。

微信截图_20250121103843.png

【AiBase提要:】

🚀 清影2.0的基础模型能力提升38%,生成自然流畅的视频内容。

🎨 新版本支持多种艺术风格的视频生成,提升画面美感。

💡 用户通过简单提示词即可实现复杂场景,展现创意与稳定性。

详情链接:https://chatglm.cn/video?lang=zh

4、豆包App推出新语音模式,抢先GPT-4o实现唱歌和角色扮演

豆包 App 最新发布的“端到端”语音大模型在实时语音通话功能上进行了重要更新,标志着其在语音交互领域的重大突破。新模型整合了语音识别、理解和生成能力,具备人类般的表达和情感输出,提升了对话的智能水平。新的人格模式增加了互动的趣味性,使得豆包在情感陪伴和心理咨询等领域的应用场景更为广泛。

image.png

【AiBase提要:】

🎶 新的“端到端”语音大模型整合了语音识别、理解和生成,提升了对话流畅度。

🌟 新增的“灵魂歌手”和“百变大咖”模式使豆包能够唱歌和进行角色扮演,展现独特个性。

🤖 新的人格模式“受气小包”和“夸夸大师”增强了互动趣味性,拓展了AI的应用场景。

5、OpenAI 即将推出能控制电脑的 AI 工具 “Operator”

OpenAI 正在研发一款名为 “Operator” 的 AI 工具,预计将在2025年1月发布。该工具能够自主控制个人电脑,执行包括编写代码和预定旅行在内的多项任务。尽管在某些安全评估中表现良好,但其在执行任务的成功率上仍低于人类,专家对其潜在安全隐患表示担忧。市场分析预计,AI 代理市场将在未来几年内迅速增长。

image.png

【AiBase提要:】

🔍 OpenAI 的 “Operator” 工具将具备自主控制电脑的能力,能够执行多种任务。

🛠️ 尽管 “Operator” 在某些任务上表现不如人类,其成功率相对较低。

⚠️ 专家对 “Operator” 的潜在安全隐患表示关注,尽管其在安全评估中表现良好。

6、支持中文字体!美图WHEE「AI海报」功能即将上线

美图公司近日宣布即将推出WHEE应用的「AI海报」功能,旨在通过人工智能技术简化海报制作流程。用户只需输入一句话,即可生成多种风格的海报,特别支持中文字体,满足个性化需求。此外,该功能提供强大的自定义排版能力,涵盖多个核心场景,帮助用户高效设计。

image.png

【AiBase提要:】

🎨 用户可通过简单输入生成多种风格的海报,支持中文字体。

🛠️ 提供强大的自定义排版能力,适用于电影、电商等多个场景。

✨ 「免抠素材」功能已上线,支持生成多种风格的定制化PNG素材。

7、百度文库AI功能月活跃用户突破9000万,付费用户超4000万

在近日的百度AI开放日活动中,百度副总裁王颖分享了百度文库在AI技术应用方面的显著进展。平台的月活跃用户已超过9000万,付费用户数突破4000万,显示出AI功能的强大吸引力。过去一年,百度文库新增了100多项AI功能,涵盖智能PPT、全网搜等创新工具,极大地提升了用户的文档处理和学习体验。

【AiBase提要:】

📈 月活跃用户突破9000万,日活跃用户同比增长230%,显示了平台的强大吸引力。

🛠️ 新增100多项AI功能,包括智能PPT和全网搜,满足用户多样需求,提升文档处理效率。

🎨 '自由画布'功能开启公测,支持多任务并行处理,简化创作流程,增强用户体验。

8、世界首个聊天机器人 ELIZA 复活,源自60年前的代码

最近,一个来自美国和英国的研究团队成功复活了历史上第一个电子聊天机器人 ELIZA 的代码。这段代码最初由麻省理工学院教授约瑟夫・韦岑鲍姆在1960年代编写。研究人员在发现原始代码后,经过技术调整,使其重新运行,尽管存在一些问题,如输入数字时程序崩溃。

image.png

【AiBase提要:】

🗨️ ELIZA 是第一款电子聊天机器人,其代码由约瑟夫・韦岑鲍姆在1960年代编写。

💻 研究团队成功复活了这段代码,并解决了多项技术问题,使其能够正常运行。

📜 ELIZA 在计算机历史上具有重要意义,被认为是聊天机器人的开创者。

9、中国科研团队重磅发布VideoChat-Flash 长视频处理速度提升100倍

中国科研团队推出了VideoChat-Flash系统,利用层次化视频标记压缩技术HiCo,显著提升了长视频处理的效率。该技术通过减少冗余信息,降低了计算需求,同时增强了模型的理解能力。实验结果显示,该系统在多个基准测试中表现优异,成为长视频处理领域的先进模型。

image.png

【AiBase提要:】

🌟 研究人员提出层次化视频标记压缩技术HiCo,显著降低长视频处理的计算需求。

📹 “VideoChat-Flash”系统采用多阶段学习方法,结合短视频和长视频进行训练,提升了模型的理解能力。

🔍 实验结果显示,该方法在多个基准测试中达到了新的性能标准,成为长视频处理领域的先进模型。

详情链接:https://arxiv.org/abs/2501.00574

10、告别传统爬虫!Firecrawl Extract无需编写代码,轻松抓取任何网站的数据

Firecrawl Extract的推出标志着网络爬虫时代的逐渐落幕。借助其自然语言处理和强大功能,用户无需再为编写爬虫脚本而烦恼,而是可以专注于数据分析与应用,显著提高工作效率。这一创新的工具使得数据抓取变得更加智能、简便,推动了数据采集技术的进一步发展。

【AiBase提要:】

🛠️ Firecrawl Extract通过自然语言处理技术,允许用户仅通过文字提示提取网站数据,省去繁琐的编程过程。

🌍 该工具支持多语言和国际网站的数据抓取,能够处理JavaScript渲染的动态页面内容,确保数据的精准获取。

🔗 提供API接口,便于与其他应用集成,支持大规模数据处理,满足大数据分析的需求。

详情链接:https://github.com/mendableai/firecrawl

11、2024年出货的笔记本电脑中,超25%具备生成式AI功能

Counterpoint的最新市场研究报告显示,2024年全球PC市场将显著增长,预计出货量达到2.53亿台,较2023年增长2.6%。这主要受Windows10支持结束和新一代AI笔记本电脑推出的推动。预计2024年第四季度出货量同比增长3.7%,企业IT系统升级需求增加,AI笔记本电脑将改变用户体验,推动市场发展。

image.png

【AiBase提要:】

🌍2024年全球PC出货量预计达到2.53亿台,同比增长2.6%。

💻 超过25%的新笔记本电脑将具备生成式AI功能,推动市场升级。

📈2025年预计AI笔记本电脑将占据市场近60%的份额,商业订单有望增长。

举报

  • 相关推荐
  • 月之暗面放王炸!开源Kimi新模型:超新版DeepSeek R1全球第一

    月之暗面推出了针对软件工程任务的全新开源代码大模型Kimi-Dev-72B。 该模型在SWE-bench Verified编程基准测试中取得了全球最高开源模型水平,以仅72B的参数量,超越了刚发布不就、参数量达671B的新版DeepSeek-R1。

  • MiniMax深夜开源首个推理模型M1,这次是真的卷到DeepSeek了。

    ​不知道还有多少人记得,AI行业的六小虎。 行业内都在说,他们已经寂静好久了。 上一次相关的项目发布,还是前一段时间我写的MiniMax声音模型的更新,Speech-02。 而昨晚凌晨将近12点的时候,又是MiniMax,居然在X上,预告了他们一整周的发布计划。

  • 主流AI多模态大模型有哪些?超全的多模态大模型指南分享

    2024年多模态大模型成为AI领域最具前景的技术方向之一。文章全面分析了主流多模态大模型的特点、应用场景和发展趋势。多模态大模型能同时处理文本、图像、音频、视频等多种数据,实现更智能的人机交互。重点介绍了GPT-4V、Claude3.5、Gemini、通义千问等代表性模型,对比了它们在视觉理解、编程能力、中文处理等方面的优势。应用场景涵盖智能客服、内容创作、教育医疗等领域。未来发展趋势包括模型规模扩大、支持更多模态、实时交互能力提升等。选择模型需考虑应用需求、语言支持、性能成本等因素。

  • 国际一线水准!理想同学接入DeepSeek-R1-0528模型

    理想同学手机、网页端已正式接入DeepSeekR1-0528最新版,切换DeepSeek模型”并开启深度思考”模式即可体验最新的AI问答、创作能力。 据悉,更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。 在复杂逻辑推理、长文本处理稳定性、代码生成质量等多方面能力

  • AI日报:MiniMax-M1开源;阿里Qwen3升级版适配苹果MLX架构;月之暗面发布新模型Kimi-Dev-72B

    《AI日报》汇总了近期AI领域多项重要进展:1)月之暗面推出开源编程模型Kimi-Dev-72B,在软件工程任务测试中创下新纪录;2)MiniMax开源M1模型,支持超长上下文推理且训练成本低;3)腾讯发布AI音乐模型LeVo,支持音色克隆和分轨生成;4)阿里云Qwen3升级版适配苹果MLX架构;5)豆包推出"AI播客"功能,可将PDF转为对话播客;6)夸克App上线个性化AI家教"夸克老师";7)松下发布多模态大模型OmniFlow,实现文本/图像/音频自由切换;8)TikTok推出三款AI视频创作工具;9)极氪与火山引擎合作,将豆包大模型接入智能座舱系统;10)Meta的Llama3.1模型在文本记忆方面表现突出;11)Grok上线定时追踪X热门话题功能;12)Gemini2.5Pro即将更新Deep Think功能;13)谷歌地图引入AI技术升级导航和个性化推荐功能。

  • 「6月30日AI日报」百度开源文心大模型4.5系列;通义千问发布多模态生成模型Qwen VLo

    AI日报精选:1)百度开源文心大模型4.5系列,含10款新模型,性能优异;2)通义千问发布多模态模型Qwen-VL,支持图文交互;3)阿里开源3亿参数多模态模型Ovis-U1;4)华为开源盘古7B稠密和72B混合专家模型;5)美图MOKI推出AI创意广告功能,一键生成专业视频;6)谷歌Gemini 2.5 Pro API重新免费开放;7)豆瓣上线"深入研究"AI功能;8)小米"AI百宝箱"结束内测;9)北京智研院开源多模态系统OmniGen2;10)知乎升级"直答"知识库功能。

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • 难哭了的高考数学题,4家国产大模型表现如何?

    2025年高考数学考试引发热议,多家AI大模型参与测试。腾讯元宝和豆包表现最优,分别获得145分和140分(满分150分),仅错1-2道题。文心一言和QWen3稍逊,得分在120分左右。测试显示,AI在选择题和基础解答题表现良好,但在涉及图像理解、向量分析等复杂题目时仍存在困难。特别是一道包含向量图的"杀手题"让所有AI失分。专家指出,国产大模型数学能力已有显著提升�

  • 高考数学全卷重赛!一道题难倒所有大模型,新选手Gemini夺冠,豆包DeepSeek并列第二

    本次AI高考数学测试评估了7个大模型的表现,包括Doubao、DeepSeek、Qwen3等。测试包含14道客观题和5道解答题,总分150分。结果显示:1)客观题各模型差距不大,最大分差仅3分;2)解答题成为主要失分区,仅Gemini2.5Pro获得满分;3)图像识别题(第6题)难倒所有多模态模型,暴露AI图文理解短板。最终Gemini2.5Pro以145分居首,Doubao和DeepSeek R1以144分并列第二。测试表明大模型在数学推理能力上有进步,但在复杂论证和多步骤计算方面仍需提升。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。