首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:快手可灵AI全面接入DeepSeek-R1;百度发布文心4.5与X1大模型;小米大模型团队登顶音频推理MMAU榜

2025-03-17 15:20 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、快手可灵AI全面接入DeepSeek-R1,DeepSeek灵感版已上线

快手旗下的可灵AI近期全面接入DeepSeek-R1,为用户在视频和图片生成方面带来了显著便利。通过DeepSeek-R1,用户能够轻松将灵感转化为专业提示词,从而降低创作门槛并提升效率。此外,DeepSeek灵感版与可灵AI的灵感词库功能联动,帮助用户更好地掌控视频细节,使得即使是普通用户也能创作出高质量的内容。这一系列创新举措使得可灵AI在行业中继续保持领先地位。

image.png

【AiBase提要:】

🌟快手可灵AI全面接入DeepSeek-R1,助力用户将灵感转化为专业提示词。

🔥可灵AI持续迭代升级,接入DeepSeek-R1后进一步降低创作门槛。

🎬DeepSeek灵感版与“灵感词库”联动,提升用户掌控视频细节的能力。

2、百度发布文心4.5与X1大模型,价格大幅降低引关注

百度最新推出的文心大模型4.5和X1,标志着其在多模态理解和逻辑推理领域的重大进展。文心4.5以其显著的价格优势和卓越的性能超越了GPT-4.5,吸引了众多开发者的关注。而X1则专注于中文知识问答和文学创作,具备强大的推理能力和多模态功能。

【AiBase提要:】

💡 文心4.5是百度首个原生多模态大模型,性能超越GPT-4.5,API调用价格仅为后者的1%。

🧠 文心大模型X1专注于中文知识问答和逻辑推理,具备长思维链和多模态能力,能理解和生成图片。

💰 文心4.5和X1的输入输出价格极具竞争力,标志着百度在大模型领域的强劲布局。

3、小米大模型团队登顶音频推理 MMAU 榜,受到DeepSeek-R1启发

小米大模型团队在音频推理领域取得了显著进展,利用强化学习算法成功提升了模型的准确率至64.5%,在国际权威的MMAU评测榜上名列前茅。该团队的研究表明,强化学习的实时反馈机制在模型训练中更为有效,并且开源了相关技术,推动了学术界和产业界的进一步研究。

image.png

【AiBase提要:】

🔍 小米大模型团队通过强化学习算法在音频推理领域取得突破,准确率达到64.5%。

📈 MMAU 评测集是音频推理能力的重要标准,当前人类专家准确率为82.23%。

💡 研究结果表明,强化学习的实时反馈机制对模型训练更为有效,未来研究仍需深入探索。

详情链接:https://github.com/xiaomi-research/r1-aqa

4、钉钉推出AI客服助理 可自动接入企业官网、公众号等平台

钉钉于2025年3月17日推出了AI客服助理,旨在提升企业客户服务效率。该功能能够自动接入企业官网及公众号,支持多轮对话,精准理解用户需求并提供专业回复。自推出以来,已有700多家企业接入,具备7×24小时在线服务,响应速度快,且可通过多平台部署,极大便利了企业与用户的沟通。

image.png

【AiBase提要:】

💡 AI客服助理可自动接入官网和公众号,提升企业服务能力。

🛠️ 只需三步配置,企业可快速上线AI助理,简化知识体系构建。

🌐 支持多平台部署,企业可通过多渠道为用户提供服务。

5、图像效果转换技术LBM:一键移除路人甲,还可调整光照

LBM(潜在桥梁匹配)是一款由gojasper团队开发的图像处理工具,能够高效地实现图像效果转换。它不仅具备强大的对象移除能力,使得用户能够轻松去除照片中的不必要元素,还能灵活调整光线,营造出理想的氛围。LBM的创新理念在于潜在空间的操作,使得图像编辑变得更加简单和高效,适合摄影爱好者和专业人士使用。

image.png

【AiBase提要:】

🖌️ LBM具备强大的对象移除能力,用户只需轻点即可去除照片中的干扰元素,简化了图像编辑流程。

☀️ 该工具支持光照调整,用户可以在阴天拍摄的照片中创造出阳光明媚的效果,提升照片的视觉吸引力。

🔧 LBM在法线和深度估计等多种图像转换任务中表现卓越,展现出其广泛的应用潜力和可扩展性。

详情链接:https://top.aibase.com/tool/lbm

6、Anthropic将发布 Harmony 功能:让 AI 助手无缝接入本地文件

Anthropic正在开发名为Harmony的新功能,旨在将本地文件目录集成到Claude的工作环境中。这一创新将使用户能够与文件进行更流畅的互动,AI助手可以直接读取、索引和分析目录中的内容。Harmony不仅支持文件的分析和修改,还提供基于关键词的搜索功能,展现了强大的AI编码助手潜力。

【AiBase提要:】

✅ Harmony功能将使用户能够无缝接入本地文件,提升AI的交互能力。

🔍 Claude在测试中成功识别了多个代码安全漏洞,显示出其强大的分析能力。

🧭 Anthropic还在开发Compass功能,可能会支持深度研究和信息整合。

7、开源图片超分模型Thera:可以提升图片清晰度,让模糊从此“下岗”

Thera是一款由苏黎世联邦理工学院和苏黎世大学开发的开源超分辨率模型,能够以任意倍数提升图片清晰度。它不仅能让模糊照片恢复生机,还通过内置的物理观测模型,减少图像失真,呈现更自然的细节。

image.png

【AiBase提要:】

✨ Thera支持任意尺度的超分辨率放大,用户可以自定义放大倍数,灵活应对各种需求。

🔍 内置物理观测模型,模拟真实图像形成过程,减少失真,呈现更真实细节。

🌍 作为开源项目,Thera以Apache-2.0许可证提供,促进技术共享与发展,提供预训练模型便于用户使用。

详情链接:https://top.aibase.com/tool/thera

8、谷歌Gemini2.0Flash去除图片水印功能引版权担忧

谷歌新推出的Gemini2.0Flash模型引发了关于去除图片水印的争议,尤其是涉及到Getty Images等知名图片库的内容。尽管该模型在图像生成和编辑方面表现出色,但其缺乏使用限制引发了版权方面的担忧。Gemini2.0Flash的功能似乎更为强大,但在美国版权法下,未经同意去除水印的行为仍然可能被视为违法。

image.png

【AiBase提要:】

🚫Gemini2.0Flash可去除图片水印,功能强大但引发版权争议。

💬其他AI模型如Claude3.7Sonnet和GPT-4o拒绝去除水印,认为此举不道德且可能违法。

⚖️美国版权法下,未经原所有者同意去除水印通常被视为违法,谷歌未对质疑作出及时回应。

9、Cohere 发布AI模型Command A,两块GPU就能高效运转,企业部署成本降50%

Cohere推出的Command A模型以其仅需两块GPU的低硬件需求和高达50%的成本节省,打破了高性能AI的传统门槛。其1110亿参数的设计结合优化的Transformer架构,使得企业能够在处理复杂任务时,享受超长的上下文窗口和多语种支持。

image.png

【AiBase提要:】

💻 Command A模型仅需两块GPU即可高效运转,显著降低了企业的硬件需求。

🌍 支持多达23种语言及地区方言,助力企业拓展全球市场。

💰 私有部署成本降低高达50%,为企业带来显著的财务优势。

详情链接:https://huggingface.co/CohereForAI/c4ai-command-a-03-2025

10、首个国产Agent开发框架!仓颉社区发布Cangjie Magic,原生支持鸿蒙等全平台!

Cangjie Magic是一个创新的智能体开发框架,基于华为自研的仓颉编程语言,旨在重塑智能体开发的方式。该框架通过独特的Agent DSL架构、原生支持MCP通信协议和智能调度引擎,提供了全面的智能体生命周期管理。

image.png

【AiBase提要:】

🛠️ 独创的Agent DSL架构,实现智能体建模的声明式编程,提升开发效率。

🌐 原生支持MCP通信协议,确保智能体之间的高效通信与协作。

📱 计划在第三季度实现对Android和iOS的智能体调用能力,拓展移动端应用场景。

详情链接:https://gitcode.com/Cangjie-TPC/CangjieMagic

11、OpenAI 高管预测:AI 将于2025年底超越人类程序员

在最近的播客中,OpenAI 的首席产品官凯文・维尔表示,人工智能预计将在2025年底之前超越人类程序员,尤其是在编码基准测试中。他强调了AI编码模型的快速进步,并提到Anthropic及OpenAI的先进模型正在推动编码的自动化。随着推理能力的提升,AI在编程领域的表现也在不断改善,未来几乎所有代码可能由AI生成。

【AiBase提要:】

🌟 AI预计将在2025年底超越人类程序员,成为更优秀的编码者。

💻 Anthropic和OpenAI的先进模型正在推动编码自动化,未来几乎所有代码可能由AI生成。

🚀 OpenAI即将推出的新模型在竞争性编码排名中不断上升,标志着AI在编程领域的持续进步。

举报

  • 相关推荐
  • 三星电视接入DeepSeek-R1 AI本土化交互能力再升级

    近日,三星电视正式接入DeepSeek-R1,AI能力进一步得到强化。据悉,用户无需复杂的操作步骤,唤醒智能语音助手三星小贝,在对应的语音助手对话页面内,即可便捷体验深度思考功能。三星电视融合DeepSeek大模型矩阵,通过强化学习、蒸馏技术等提升深度思考与推理能力,使得电视能够更准确地理解用户深层的意图和需求,为用户提供更流畅、更简单、更自然的交互与服务体�

  • AI日报百度大招!发布文心大模型X1Turbo和AI开放计划;OpenAI免费开放轻量版Deep Research;即梦视频3.0内测

    【AI日报】主要报道了AI领域的最新动态:1)百度发布文心大模型X1Turbo和4.5Turbo,性能价格优势显著;2)百度推出AI开放计划,降低开发者门槛;3)OpenAI免费开放轻量版Deep Research研究工具;4)即梦视频3.0内测展示流畅运镜和精准表情捕捉能力;5)百度发布全球首个内容操作系统"沧舟OS";6)百度文库与网盘联合推出GenFlow超能搭子和AI笔记工具;7)Pixverse推出MCP协议简化AI视频创作;8)Tavus发布突破性唇形同步模型Hummingbird-0;9)豆包1.5深度思考模型上线,提供免费额度;10)Adobe整合OpenAI和Google模型升级Firefly创意平台;11)ImageSlider2.0即将加入Gradio核心产品线;12)李彦宏谈DeepSeek现存痛点,强调多模态能力与降本需求。

  • DeepSeek领航大模型普惠化浪潮,xAI/微美息加速开源AI布局打造新格局

    DeepSeek 作为当前最受关注的大模型之一,凭借其技术创新正在加速 AI 普惠化进程。根据机构新报告显示,DeepSeek已经成为全球增长最快的AI工具,其每月新增网站访问量已经超过OpenAI的ChatGPT。DeepSeek市场份额全球第三目前,DeepSeek市场份额6.58%,仅次于ChatGPT和Canva。DeepSeek是继ChatGPT之后的又一现象级AI产品,它的市场份额从2.34%快速增长至6.58%,展现出强劲的增长态势。全球著名�

  • IQ 过AI 模型名单发布:ChatGPT、Deepseek等上榜

    人工智能IQ哪家强?o3 智商高达 132、Gemini 2.5 Pro Exp. 拿下 128 分、Claude 凭借 3.7 Sonnet Extended 位列第四、Deepsee R 1……

  • Llama 4大模型跌落神坛:作弊刷榜、代码能力极差、和DeepSeek比就是伪开源

    被寄予厚望的美国Meta公司的最新开源大模型Llama4发布不到2天时间,口碑急转直下,被质疑为刷榜作弊实际效果差、开源条件多部署门槛高是伪开源等。大模型评测平台LMArena亲自下场发文,打脸Meta提供给平台的Llama4是“特供版”。Meta若继续在商业控制与技术开放之间摇摆,恐将在AI竞赛中进一步失去开发者支持。

  • 时空壶接入DeepSeek、豆包等大语言模型,翻译准确再次跃升

    在全球跨语言沟通需求持续攀升的当下,时空壶再次以创新之举震撼行业。时空壶正式宣布接入DeepSeek、豆包等大语言模型,为其同传耳机产品带来了前所未有的体验升级,彻底改写了同传翻译的游戏规则,也让传统机翻模式成为历史。这一创新举措不仅满足了当下各行业对高质量跨语言沟通的迫切需求,更为未来跨语言交流的发展指明了方向,有望推动整个行业向更加智能、精准、自然的方向迈进,助力全球交流合作开启全新篇章。

  • 科大讯飞星火X1“火箭”升级:性能对标OpenAI o1DeepSeek R1

    今日,科大讯飞高级副总裁于继栋在上海AI无界智营全球”2025科大讯飞全球智能营销产品发布会上透露,讯飞星火X1将于近期再次升级。升级后的讯飞星火X1在保持原有数学任务国内领先优势的基础上,推理能力、文本生成和语言理解等通用任务方面的效果将对标业界领先的OpenAIo1和DeepSeekR1模型。科大讯飞曾宣称:这一新版本的发布,预期就可以实现数学答题和过程思维链能力全面对标甚至超过OpenAIo1。

  • 142页长文揭秘DeepSeek-R1「思维大脑」,开启新「思维链学」研究

    DeepSeek-R1是一款开创性的大型推理模型(LRM),其研究揭示了AI推理能力的质变。该模型通过多阶段训练流程,将推理过程内嵌于模型本身,实现了从"提示驱动"到"内生推理"的模式转变。研究团队通过142页报告详细分析了R1的思维链,发现其推理过程具有高度结构化特征,包含问题定义、绽放周期、重构周期和最终决策四个阶段。模型展现出类人推理能力,能通过分

  • 《流浪地球3》自研AI问答应用WEi:基于DeepSeek R1开发

    快科技4月15日消息,今日,电影《流浪地球 3》官宣开机,导演郭帆,吴京、沈腾等主演参加开机仪式。在开机仪式上,吴京表示,希望自己在戏里能多演喜剧,沈腾多演动作戏。据新浪电影官微,《流浪地球3》开机现场还介绍了一位新同事”自主研发的专属AI问答应用WEi。WEi基于国产大模型DeepSeek R1开发,通过整合多元化知识库资源,包括在线信息源的专业资料、图像和影视�

  • 宝马中国将接入DeepSeek!爆新世代车型搭载AI智能体

    宝马中国4月27日宣布接入深度求索(DeepSeek)AI大模型,深化本土AI生态布局。这是继宝马与阿里巴巴达成AI大语言模型合作后,再次联手中国科技企业。从今年三季度起,搭载第九代宝马操作系统的多款国产新车将率先应用该技术,通过智能个人助理提升人机交互体验。宝马还计划将DeepSeek功能应用于新一代国产车型。此前3月,宝马已与阿里云合作开发车载AI引擎,双方在上海车展展示了识别率达99%的智能语音交互系统。此次合作将突破车载场景限制,实现车辆与外部世界的智能连接,为用户提供个性化出行体验。