首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:快手可灵AI全面接入DeepSeek-R1;百度发布文心4.5与X1大模型;小米大模型团队登顶音频推理MMAU榜

2025-03-17 15:20 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、快手可灵AI全面接入DeepSeek-R1,DeepSeek灵感版已上线

快手旗下的可灵AI近期全面接入DeepSeek-R1,为用户在视频和图片生成方面带来了显著便利。通过DeepSeek-R1,用户能够轻松将灵感转化为专业提示词,从而降低创作门槛并提升效率。此外,DeepSeek灵感版与可灵AI的灵感词库功能联动,帮助用户更好地掌控视频细节,使得即使是普通用户也能创作出高质量的内容。这一系列创新举措使得可灵AI在行业中继续保持领先地位。

image.png

【AiBase提要:】

🌟快手可灵AI全面接入DeepSeek-R1,助力用户将灵感转化为专业提示词。

🔥可灵AI持续迭代升级,接入DeepSeek-R1后进一步降低创作门槛。

🎬DeepSeek灵感版与“灵感词库”联动,提升用户掌控视频细节的能力。

2、百度发布文心4.5与X1大模型,价格大幅降低引关注

百度最新推出的文心大模型4.5和X1,标志着其在多模态理解和逻辑推理领域的重大进展。文心4.5以其显著的价格优势和卓越的性能超越了GPT-4.5,吸引了众多开发者的关注。而X1则专注于中文知识问答和文学创作,具备强大的推理能力和多模态功能。

【AiBase提要:】

💡 文心4.5是百度首个原生多模态大模型,性能超越GPT-4.5,API调用价格仅为后者的1%。

🧠 文心大模型X1专注于中文知识问答和逻辑推理,具备长思维链和多模态能力,能理解和生成图片。

💰 文心4.5和X1的输入输出价格极具竞争力,标志着百度在大模型领域的强劲布局。

3、小米大模型团队登顶音频推理 MMAU 榜,受到DeepSeek-R1启发

小米大模型团队在音频推理领域取得了显著进展,利用强化学习算法成功提升了模型的准确率至64.5%,在国际权威的MMAU评测榜上名列前茅。该团队的研究表明,强化学习的实时反馈机制在模型训练中更为有效,并且开源了相关技术,推动了学术界和产业界的进一步研究。

image.png

【AiBase提要:】

🔍 小米大模型团队通过强化学习算法在音频推理领域取得突破,准确率达到64.5%。

📈 MMAU 评测集是音频推理能力的重要标准,当前人类专家准确率为82.23%。

💡 研究结果表明,强化学习的实时反馈机制对模型训练更为有效,未来研究仍需深入探索。

详情链接:https://github.com/xiaomi-research/r1-aqa

4、钉钉推出AI客服助理 可自动接入企业官网、公众号等平台

钉钉于2025年3月17日推出了AI客服助理,旨在提升企业客户服务效率。该功能能够自动接入企业官网及公众号,支持多轮对话,精准理解用户需求并提供专业回复。自推出以来,已有700多家企业接入,具备7×24小时在线服务,响应速度快,且可通过多平台部署,极大便利了企业与用户的沟通。

image.png

【AiBase提要:】

💡 AI客服助理可自动接入官网和公众号,提升企业服务能力。

🛠️ 只需三步配置,企业可快速上线AI助理,简化知识体系构建。

🌐 支持多平台部署,企业可通过多渠道为用户提供服务。

5、图像效果转换技术LBM:一键移除路人甲,还可调整光照

LBM(潜在桥梁匹配)是一款由gojasper团队开发的图像处理工具,能够高效地实现图像效果转换。它不仅具备强大的对象移除能力,使得用户能够轻松去除照片中的不必要元素,还能灵活调整光线,营造出理想的氛围。LBM的创新理念在于潜在空间的操作,使得图像编辑变得更加简单和高效,适合摄影爱好者和专业人士使用。

image.png

【AiBase提要:】

🖌️ LBM具备强大的对象移除能力,用户只需轻点即可去除照片中的干扰元素,简化了图像编辑流程。

☀️ 该工具支持光照调整,用户可以在阴天拍摄的照片中创造出阳光明媚的效果,提升照片的视觉吸引力。

🔧 LBM在法线和深度估计等多种图像转换任务中表现卓越,展现出其广泛的应用潜力和可扩展性。

详情链接:https://top.aibase.com/tool/lbm

6、Anthropic将发布 Harmony 功能:让 AI 助手无缝接入本地文件

Anthropic正在开发名为Harmony的新功能,旨在将本地文件目录集成到Claude的工作环境中。这一创新将使用户能够与文件进行更流畅的互动,AI助手可以直接读取、索引和分析目录中的内容。Harmony不仅支持文件的分析和修改,还提供基于关键词的搜索功能,展现了强大的AI编码助手潜力。

【AiBase提要:】

✅ Harmony功能将使用户能够无缝接入本地文件,提升AI的交互能力。

🔍 Claude在测试中成功识别了多个代码安全漏洞,显示出其强大的分析能力。

🧭 Anthropic还在开发Compass功能,可能会支持深度研究和信息整合。

7、开源图片超分模型Thera:可以提升图片清晰度,让模糊从此“下岗”

Thera是一款由苏黎世联邦理工学院和苏黎世大学开发的开源超分辨率模型,能够以任意倍数提升图片清晰度。它不仅能让模糊照片恢复生机,还通过内置的物理观测模型,减少图像失真,呈现更自然的细节。

image.png

【AiBase提要:】

✨ Thera支持任意尺度的超分辨率放大,用户可以自定义放大倍数,灵活应对各种需求。

🔍 内置物理观测模型,模拟真实图像形成过程,减少失真,呈现更真实细节。

🌍 作为开源项目,Thera以Apache-2.0许可证提供,促进技术共享与发展,提供预训练模型便于用户使用。

详情链接:https://top.aibase.com/tool/thera

8、谷歌Gemini2.0Flash去除图片水印功能引版权担忧

谷歌新推出的Gemini2.0Flash模型引发了关于去除图片水印的争议,尤其是涉及到Getty Images等知名图片库的内容。尽管该模型在图像生成和编辑方面表现出色,但其缺乏使用限制引发了版权方面的担忧。Gemini2.0Flash的功能似乎更为强大,但在美国版权法下,未经同意去除水印的行为仍然可能被视为违法。

image.png

【AiBase提要:】

🚫Gemini2.0Flash可去除图片水印,功能强大但引发版权争议。

💬其他AI模型如Claude3.7Sonnet和GPT-4o拒绝去除水印,认为此举不道德且可能违法。

⚖️美国版权法下,未经原所有者同意去除水印通常被视为违法,谷歌未对质疑作出及时回应。

9、Cohere 发布AI模型Command A,两块GPU就能高效运转,企业部署成本降50%

Cohere推出的Command A模型以其仅需两块GPU的低硬件需求和高达50%的成本节省,打破了高性能AI的传统门槛。其1110亿参数的设计结合优化的Transformer架构,使得企业能够在处理复杂任务时,享受超长的上下文窗口和多语种支持。

image.png

【AiBase提要:】

💻 Command A模型仅需两块GPU即可高效运转,显著降低了企业的硬件需求。

🌍 支持多达23种语言及地区方言,助力企业拓展全球市场。

💰 私有部署成本降低高达50%,为企业带来显著的财务优势。

详情链接:https://huggingface.co/CohereForAI/c4ai-command-a-03-2025

10、首个国产Agent开发框架!仓颉社区发布Cangjie Magic,原生支持鸿蒙等全平台!

Cangjie Magic是一个创新的智能体开发框架,基于华为自研的仓颉编程语言,旨在重塑智能体开发的方式。该框架通过独特的Agent DSL架构、原生支持MCP通信协议和智能调度引擎,提供了全面的智能体生命周期管理。

image.png

【AiBase提要:】

🛠️ 独创的Agent DSL架构,实现智能体建模的声明式编程,提升开发效率。

🌐 原生支持MCP通信协议,确保智能体之间的高效通信与协作。

📱 计划在第三季度实现对Android和iOS的智能体调用能力,拓展移动端应用场景。

详情链接:https://gitcode.com/Cangjie-TPC/CangjieMagic

11、OpenAI 高管预测:AI 将于2025年底超越人类程序员

在最近的播客中,OpenAI 的首席产品官凯文・维尔表示,人工智能预计将在2025年底之前超越人类程序员,尤其是在编码基准测试中。他强调了AI编码模型的快速进步,并提到Anthropic及OpenAI的先进模型正在推动编码的自动化。随着推理能力的提升,AI在编程领域的表现也在不断改善,未来几乎所有代码可能由AI生成。

【AiBase提要:】

🌟 AI预计将在2025年底超越人类程序员,成为更优秀的编码者。

💻 Anthropic和OpenAI的先进模型正在推动编码自动化,未来几乎所有代码可能由AI生成。

🚀 OpenAI即将推出的新模型在竞争性编码排名中不断上升,标志着AI在编程领域的持续进步。

举报

  • 相关推荐
  • 迎“人工智能+”政策东风!2025中国智能产业大会&吴文俊人工智能创新大会即将落地常州

    在全球AI竞争加剧背景下,国务院印发《关于深入实施“人工智能+”行动的意见》,推动AI与经济社会深度融合。中国人工智能学会主办的“2025第十四届中国智能产业大会暨吴文俊人工智能创新大会”将于8月30-31日在常州举行,聚焦破解AI产业“卡脖子”难题。大会设置15场专题会议和3场特色活动,覆盖基础技术突破、核心应用落地、交叉学科融合等领域,为产学研各界搭建高

  • 北电数智亮相世界人工智能大会,“四链融合”推动AI产业落地

    2025世界人工智能大会“人工智能+”战略领军人才与创新发展论坛圆满落幕。论坛聚焦“人才领航智启未来”主题,汇聚中科院、社科院专家及中国联通、腾讯云等机构代表,围绕“人工智能+”行动分享经验,为AI高质量发展筑牢人才根基、激发创新动能。北电数智CMO杨震出席并发表演讲,分享AI行业落地实践,强调紧跟国家战略,推进产业、创新、人才、资本四链融合,打造面向不同场景的AI解决方案,全方位助力AI产业发展。

  • 海尔冰箱唯一获批“制冷家电人工智能技术山东省工程研究中心”

    海尔冰箱在人工智能领域取得新突破,主导建设的"制冷家电人工智能技术山东省工程研究中心"成为2025年山东省工程研究中心认定名单中唯一入选的冰箱品牌。该中心聚焦人工智能、物联网、大数据等技术方向,开发了全空间智慧保鲜舱冰箱等140多项行业首创产品,近三年获授权发明专利803件。海尔冰箱还推出行业首款接入DeepSeek的AI全空间保鲜冰箱,具备方言识别、降噪技术等功能,显著提升用户体验。市场数据显示,2023年1-7月海尔冰箱以47%市场份额稳居行业第一。通过AI技术赋能,海尔冰箱正引领行业向精准、智能保鲜时代跨越。

  • Google Gemini vs Deepseek:谁更适合你的业务场景?AI大模型选型终极对比指南

    企业在选择大模型时面临两难:国际大厂的Gemini技术先进,但国内DeepSeek性价比突出。AIbase平台通过真实场景测试数据指出:1)跨境电商客服场景中,Gemini多语言识别准确率提升12%,但需注意API延迟问题;2)金融研报分析场景下,DeepSeek支持128K长文本且成本仅为Gemini的1/3。决策关键:抛开参数迷雾,聚焦成本、响应速度、语言支持和场景匹配四大维度。AIbase提供可视化对比工具,3分钟生成专属选型报告,让技术决策不再玄学。

  • 下一个爆款在哪儿?2025英特尔人工智能创新应用大赛获奖名单揭晓

    8月16日,2025英特尔人工智能创新应用大赛总决赛在深圳落幕。40支优秀团队从2817支队伍中脱颖而出,围绕工业、教育、心理健康、游戏等领域展开对决。大赛展示了AI从云端走向边缘的趋势,依托酷睿Ultra处理器和低代码开发工具,推动AI应用本地化落地。获奖作品包括动力电池机器人协作拆卸系统和AI生成PPT服务,体现AI与产业需求的深度融合。英特尔与联想、惠普等合作伙伴共同为开发者提供全栈支持,加速AI技术普及和商业化进程。

  • 免费使用!腾讯地图已接入DeepSeek-V3.1

    DeepSeek V3.1于2025年8月21日发布并开源,腾讯地图率先完成接入。新版AI助手“AI叮当”在三大核心能力显著提升:思考效率更高,响应更快;上下文理解更强,支持多轮连贯对话;智能体调用更精准,尤其在中文网页理解和跨领域搜索方面表现突出。依托升级,AI叮当可提供个性化行程规划、周边推荐及景点知识问答等智能出行服务,让导航升级为全程智能生活陪伴。

  • 微算法科技(NASDAQ:MLGO)基于人工智能优化构建混合ARIMA模型,提高比特币价格预测准确性

    随着数字资产市场兴起,比特币等加密货币价格预测成为焦点。传统模型难以准确捕捉其非线性波动,微算法科技引入AI技术优化ARIMA模型,结合LSTM网络构建混合模型,提升预测准确性。通过AI算法自动处理数据缺失、异常值检测及参数优化,实现更可靠的比特币价格预测,为投资者提供决策支持。

  • 降低创作门槛!爱诗科技新一代生成式大模型加速AI视频大众化

    爱诗科技8月27日发布新一代AI视频生成模型PixVerse V5,实现秒级高质量视频生成,支持360P至1080P分辨率。新模型在真实度、灵活性及生成速度上显著提升,覆盖人物、二次元、商业广告等多场景创作。同步上线Agent创作助手,降低使用门槛,用户无需专业技巧即可一键生成专业级视频。该技术推动AI视频从专业工具走向大众化应用,加速行业落地。

  • 2025年大模型选型核心指南:Beyond GPT-4,如何理性评估Qwen、DeepSeek等强者?

    大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架,强调需超越单一指标崇拜,基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析,展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程,采用专业工具进行多维度评估,通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型,而非盲目追求流行模型。

  • 智能体迎来“DeepSeek时刻”,为何主角是纳米AI?

    大模型重塑了人工智能的产业格局,但却没有彻底颠覆人类的生产模式。 在这背后,并非其技术力量不足,而是当前的应用形态仍停留在“工具赋能”的初级阶段,大模型的潜力被束缚在碎片化场景中,未能转化为重构生产逻辑的核心动能。 正如360集团创始人、董事长周鸿祎所言,大模型的能力其实已经相当强大,甚至超越了我们中的许多人。只是其潜力尚未被挖掘。 而�

今日大家都在搜的词: