首页 > 原创 > 关键词  > AI最新资讯  > 正文

AI日报:赶超o1!国产大模型DeepSeek R1开源;Kimi多模态思考模型k1.5登场;清影2.0上线智谱清言

2025-01-21 15:30 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、国产大模型再突破!DeepSeek R1开源,性能直逼OpenAI,开启AI平权新时代

DeepSeek最近发布并开源了其最新研发的大型语言模型R1,标志着国产AI技术的一次重大突破。该模型在性能上与OpenAI的o1正式版相媲美,特别是在数学、代码和自然语言推理等关键任务上表现优异。

image.png

【AiBase提要:】

🌟 DeepSeek R1在后训练阶段应用强化学习技术,显著提升推理能力。

📊 开源了660B参数的DeepSeek-R1和DeepSeek-R1-Zero模型,同时提供了6个小模型,丰富了开源生态。

💰 API定价更具竞争力,缓存命中每百万输入tokens仅需1元,鼓励用户商用。

详情链接:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

2、月之暗面发布新一代SOTA模型 k1.5:多模态推理能力再升级

月之暗面公司推出的k1.5多模态思考模型,标志着多模态推理和通用推理领域的重大突破。该模型具备卓越的多模态处理能力,能够同时处理文本、图像和声音等信息,提升了对复杂任务的理解和应对能力。k1.5的强大通用推理能力使其在编程、数学问题求解等多种应用场景中表现出色。

微信截图_20250121082016.png

【AiBase提要:】

🌟 k1.5模型具备卓越的多模态推理能力,能够同时处理文本、图像和声音信息。

🤖 强大的通用推理能力使k1.5适用于编程、数学等多种任务,灵活性极高

📱 目前k1.5模型的预览版已在Kimi.com和Kimi智能助手App上线,用户可体验新功能。

3、免费试用!智谱推出 AI 生视频产品清影2.0已在智谱清言全量上线

北京智谱华章科技有限公司推出了AI生视频产品清影2.0,经过全面升级,显著提升了模型能力和视频生成质量。新版本能够生成自然流畅的动作和精美画面,用户只需简单提示即可实现复杂场景。同时,清影2.0在艺术风格上也有了突破,支持多种风格的视频生成。

微信截图_20250121103843.png

【AiBase提要:】

🚀 清影2.0的基础模型能力提升38%,生成自然流畅的视频内容。

🎨 新版本支持多种艺术风格的视频生成,提升画面美感。

💡 用户通过简单提示词即可实现复杂场景,展现创意与稳定性。

详情链接:https://chatglm.cn/video?lang=zh

4、豆包App推出新语音模式,抢先GPT-4o实现唱歌和角色扮演

豆包 App 最新发布的“端到端”语音大模型在实时语音通话功能上进行了重要更新,标志着其在语音交互领域的重大突破。新模型整合了语音识别、理解和生成能力,具备人类般的表达和情感输出,提升了对话的智能水平。新的人格模式增加了互动的趣味性,使得豆包在情感陪伴和心理咨询等领域的应用场景更为广泛。

image.png

【AiBase提要:】

🎶 新的“端到端”语音大模型整合了语音识别、理解和生成,提升了对话流畅度。

🌟 新增的“灵魂歌手”和“百变大咖”模式使豆包能够唱歌和进行角色扮演,展现独特个性。

🤖 新的人格模式“受气小包”和“夸夸大师”增强了互动趣味性,拓展了AI的应用场景。

5、OpenAI 即将推出能控制电脑的 AI 工具 “Operator”

OpenAI 正在研发一款名为 “Operator” 的 AI 工具,预计将在2025年1月发布。该工具能够自主控制个人电脑,执行包括编写代码和预定旅行在内的多项任务。尽管在某些安全评估中表现良好,但其在执行任务的成功率上仍低于人类,专家对其潜在安全隐患表示担忧。市场分析预计,AI 代理市场将在未来几年内迅速增长。

image.png

【AiBase提要:】

🔍 OpenAI 的 “Operator” 工具将具备自主控制电脑的能力,能够执行多种任务。

🛠️ 尽管 “Operator” 在某些任务上表现不如人类,其成功率相对较低。

⚠️ 专家对 “Operator” 的潜在安全隐患表示关注,尽管其在安全评估中表现良好。

6、支持中文字体!美图WHEE「AI海报」功能即将上线

美图公司近日宣布即将推出WHEE应用的「AI海报」功能,旨在通过人工智能技术简化海报制作流程。用户只需输入一句话,即可生成多种风格的海报,特别支持中文字体,满足个性化需求。此外,该功能提供强大的自定义排版能力,涵盖多个核心场景,帮助用户高效设计。

image.png

【AiBase提要:】

🎨 用户可通过简单输入生成多种风格的海报,支持中文字体。

🛠️ 提供强大的自定义排版能力,适用于电影、电商等多个场景。

✨ 「免抠素材」功能已上线,支持生成多种风格的定制化PNG素材。

7、百度文库AI功能月活跃用户突破9000万,付费用户超4000万

在近日的百度AI开放日活动中,百度副总裁王颖分享了百度文库在AI技术应用方面的显著进展。平台的月活跃用户已超过9000万,付费用户数突破4000万,显示出AI功能的强大吸引力。过去一年,百度文库新增了100多项AI功能,涵盖智能PPT、全网搜等创新工具,极大地提升了用户的文档处理和学习体验。

【AiBase提要:】

📈 月活跃用户突破9000万,日活跃用户同比增长230%,显示了平台的强大吸引力。

🛠️ 新增100多项AI功能,包括智能PPT和全网搜,满足用户多样需求,提升文档处理效率。

🎨 '自由画布'功能开启公测,支持多任务并行处理,简化创作流程,增强用户体验。

8、世界首个聊天机器人 ELIZA 复活,源自60年前的代码

最近,一个来自美国和英国的研究团队成功复活了历史上第一个电子聊天机器人 ELIZA 的代码。这段代码最初由麻省理工学院教授约瑟夫・韦岑鲍姆在1960年代编写。研究人员在发现原始代码后,经过技术调整,使其重新运行,尽管存在一些问题,如输入数字时程序崩溃。

image.png

【AiBase提要:】

🗨️ ELIZA 是第一款电子聊天机器人,其代码由约瑟夫・韦岑鲍姆在1960年代编写。

💻 研究团队成功复活了这段代码,并解决了多项技术问题,使其能够正常运行。

📜 ELIZA 在计算机历史上具有重要意义,被认为是聊天机器人的开创者。

9、中国科研团队重磅发布VideoChat-Flash 长视频处理速度提升100倍

中国科研团队推出了VideoChat-Flash系统,利用层次化视频标记压缩技术HiCo,显著提升了长视频处理的效率。该技术通过减少冗余信息,降低了计算需求,同时增强了模型的理解能力。实验结果显示,该系统在多个基准测试中表现优异,成为长视频处理领域的先进模型。

image.png

【AiBase提要:】

🌟 研究人员提出层次化视频标记压缩技术HiCo,显著降低长视频处理的计算需求。

📹 “VideoChat-Flash”系统采用多阶段学习方法,结合短视频和长视频进行训练,提升了模型的理解能力。

🔍 实验结果显示,该方法在多个基准测试中达到了新的性能标准,成为长视频处理领域的先进模型。

详情链接:https://arxiv.org/abs/2501.00574

10、告别传统爬虫!Firecrawl Extract无需编写代码,轻松抓取任何网站的数据

Firecrawl Extract的推出标志着网络爬虫时代的逐渐落幕。借助其自然语言处理和强大功能,用户无需再为编写爬虫脚本而烦恼,而是可以专注于数据分析与应用,显著提高工作效率。这一创新的工具使得数据抓取变得更加智能、简便,推动了数据采集技术的进一步发展。

【AiBase提要:】

🛠️ Firecrawl Extract通过自然语言处理技术,允许用户仅通过文字提示提取网站数据,省去繁琐的编程过程。

🌍 该工具支持多语言和国际网站的数据抓取,能够处理JavaScript渲染的动态页面内容,确保数据的精准获取。

🔗 提供API接口,便于与其他应用集成,支持大规模数据处理,满足大数据分析的需求。

详情链接:https://github.com/mendableai/firecrawl

11、2024年出货的笔记本电脑中,超25%具备生成式AI功能

Counterpoint的最新市场研究报告显示,2024年全球PC市场将显著增长,预计出货量达到2.53亿台,较2023年增长2.6%。这主要受Windows10支持结束和新一代AI笔记本电脑推出的推动。预计2024年第四季度出货量同比增长3.7%,企业IT系统升级需求增加,AI笔记本电脑将改变用户体验,推动市场发展。

image.png

【AiBase提要:】

🌍2024年全球PC出货量预计达到2.53亿台,同比增长2.6%。

💻 超过25%的新笔记本电脑将具备生成式AI功能,推动市场升级。

📈2025年预计AI笔记本电脑将占据市场近60%的份额,商业订单有望增长。

举报

  • 相关推荐
  • Google Gemini vs Deepseek:谁更适合你的业务场景?AI大模型选型终极对比指南

    企业在选择大模型时面临两难:国际大厂的Gemini技术先进,但国内DeepSeek性价比突出。AIbase平台通过真实场景测试数据指出:1)跨境电商客服场景中,Gemini多语言识别准确率提升12%,但需注意API延迟问题;2)金融研报分析场景下,DeepSeek支持128K长文本且成本仅为Gemini的1/3。决策关键:抛开参数迷雾,聚焦成本、响应速度、语言支持和场景匹配四大维度。AIbase提供可视化对比工具,3分钟生成专属选型报告,让技术决策不再玄学。

  • 免费使用!腾讯地图已接入DeepSeek-V3.1

    DeepSeek V3.1于2025年8月21日发布并开源,腾讯地图率先完成接入。新版AI助手“AI叮当”在三大核心能力显著提升:思考效率更高,响应更快;上下文理解更强,支持多轮连贯对话;智能体调用更精准,尤其在中文网页理解和跨领域搜索方面表现突出。依托升级,AI叮当可提供个性化行程规划、周边推荐及景点知识问答等智能出行服务,让导航升级为全程智能生活陪伴。

  • AI日报:DeepSeek V3.1正式发布;企业微信5.0推出全新AI能力;快手 Klear-Reasoner 模型成功登顶

    AI日报栏目聚焦人工智能领域最新动态。DeepSeek V3.1发布,大幅增强长文档分析和代码理解能力;企业微信5.0集成智能搜索、总结和机器人功能;快手Klear-Reasoner模型数学推理准确率超90%;谷歌Docs新增AI语音朗读功能;Firecrawl完成1450万美元融资并推出V2版本API;Meta上线AI语音翻译功能;微软Excel集成Copilot实现一键数据分析;Claude桌面客户端推动AI编程可视化;苹果Xcode将原生集成Cl

  • 别再猜了!手把手教你用数据选择AI模型,我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

    开发者分享模型选择心路历程:从盲目试错到数据驱动。曾因追求低价模型导致成本飙升,后通过AIbase平台对比Gemini 2.5 Flash-Lite和DeepSeek-V3,基于价格、上下文长度和代码能力等数据,最终选择更适合代码生成任务的DeepSeek-V3。强调没有“最好”的模型,只有“最适合”的模型,建议开发者善用专业工具进行数据驱动决策,避免隐性成本。

  • Gemini 2.5 Flash-Lite与 DeepSeek-V3 深度对比:谁在性价比上更胜一筹?

    面对琳琅满目的大模型API,开发团队常陷入选择困境。文章指出,2024年既是机遇也是挑战的时代,闭源模型选择丰富但性能与成本平衡复杂。通过AIbase等数据驱动平台进行客观对比至关重要。以Gemini 2.5 Flash-Lite和DeepSeek-V3为例,前者综合能力强适合多语言场景,后者在代码生成和成本控制上优势明显。建议开发者明确需求,通过实际测试验证模型表现,理性选择最适合的方案。

  • AI大模型选型决策指南:10分钟数据对比 Gemini 2.5 Flash-Lite 与 DeepSeek R1

    本文探讨大模型选型困境与解决方案。2025年全球可调用大模型超300个,但选型面临三大难题:单位混乱、定价波动快、87%团队无法量化模型价值。提出三层漏斗筛选法:1)场景刚需筛选80%选项;2)验证核心性能;3)评估边际效益。以Gemini和DeepSeek为例,前者适合常规FAQ场景年省$16,000,后者适用于金融计算场景可降低15%人工复核。建议建立动态评估体系,将3小时选型会议压缩至18分钟,错误率下降40%。核心观点:选型应从参数争论转向场景验证,通过自动化工具为工程师节省时间,聚焦提示词优化而非参数对比。

  • 2025年大模型选型核心指南:Beyond GPT-4,如何理性评估Qwen、DeepSeek等强者?

    大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架,强调需超越单一指标崇拜,基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析,展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程,采用专业工具进行多维度评估,通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型,而非盲目追求流行模型。

  • AI日报:智谱AI发布AutoGLM 2.0;腾讯元宝接入腾讯视频;字节发布开源大语言模型 Seed-OSS

    本期AI日报聚焦多项AI技术突破:智谱发布革命性语音代理AutoGLM 2.0,实现全平台语音操控;腾讯元宝接入视频平台提升观影便捷性;字节跳动开源大模型Seed-OSS专注长文本处理;速卖通AI代理助力新品推广效率翻倍;微软测试Copilot智能文件搜索功能;Liquid AI推出低延迟视觉语言模型LFM2-VL;OpenAI月收入首破10亿美元;谷歌Pixel 10系列全面升级AI功能,包括情感识别和实时翻译;Pixel Buds Pro 2引入AI手势控制;ElevenLabs发布支持70+语言的文本转语音API。

  • 智能体迎来“DeepSeek时刻”,为何主角是纳米AI?

    大模型重塑了人工智能的产业格局,但却没有彻底颠覆人类的生产模式。 在这背后,并非其技术力量不足,而是当前的应用形态仍停留在“工具赋能”的初级阶段,大模型的潜力被束缚在碎片化场景中,未能转化为重构生产逻辑的核心动能。 正如360集团创始人、董事长周鸿祎所言,大模型的能力其实已经相当强大,甚至超越了我们中的许多人。只是其潜力尚未被挖掘。 而�

  • MCP模型库深度解析:AI智能体工具调用生态的多元化与规模化发展

    AIbase旗下MCP模型库收录服务数量突破12万,标志着AI智能体生态迈向成熟。MCP协议为AI工具调用提供标准化蓝图,其成功取决于生态规模与活力。平台覆盖工具、知识库、数据源、控制系统等多元领域,展现高度多样性。一站式整合平台降低开发成本,助力企业快速构建复杂应用,成为感知AI技术风向的重要窗口。

今日大家都在搜的词: