首页 > 业界 > 关键词  > 星火大模型最新资讯  > 正文

AI视野:星火大模型V3.0发布;B站测试推出“AI视频总结”功能;高通发布骁龙8Gen3;苹果计划每年砸10亿美元搞AI

2023-10-24 15:09 · 稿源:站长之家

🤖📈💻💡大模型动态

科大讯飞星火认知大模型V3.0正式发布

在今日的2023科大讯飞全球1024开发者节上,科大讯飞宣布,讯飞星火认知大模型V3.0正式发布,目前星火大模型已整体超越ChatGPT。

【AiBase 提要】

1.科大讯飞宣布发布讯飞星火认知大模型 V3.0,超越 ChatGPT。

2.讯飞星火3.0标志着通用模型,要对标 ChatGPT3.5,中文超越,英文相当。

3.文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大能力持续提升。

🤖📱💼AI应用

B站测试推出“AI视频总结”功能

近日B站开始测试推出“AI视频总结”功能。获得测试资格的用户将在视频播放页面的右下角显示“AI视频总结”测试版按钮,点击即可生成视频总结,用户可以通过总结点击跳转到视频的相关定位。

微信截图_20231024083014.png

【AiBase 提要:】

🚀 B 站开始测试推出 “AI 视频总结” 功能,由 bilibili index 大模型提供支持。

💡 用户可通过点击 “AI 视频总结” 按钮生成视频总结,以便快速了解视频内容。

🔍 目前功能仅支持部分视频,总结内容准确性尚不完善,仅供参考。

AI视频后期制作神器ProPainter 一键即可完成视频抠图

近日,基于深度学习的视频修复技术 ProPainter 问世。该技术利用画家风格的笔触填补视频中的缺失区域,提高修复的视觉效果和自然度。ProPainter 具备时空连续性,可以预测缺失区域的光流,保证修复的连续性和一致性。

image.png

项目地址:https://github.com/sczhou/ProPainter

【AiBase 提要:】

🎨 AI 视频后期制作神器 ProPainter 可以用画家风格的笔触来填补视频中的缺失区域。

🌌 ProPainter 由两个模块组成,可以预测缺失区域的光流并生成具有画家风格的笔触。

🎥 ProPainter 在多个视频修复任务上表现出优异性能,包括对象移除、视频补全和水印去除。

AI技术插件BlurOn:自动给视频添加马赛克和模糊效果

BlurOn 是一款使用 NTT Data 的 AI 技术的插件,可以在视频中自动添加马赛克和模糊效果,为电视节目制作、自动驾驶开发、医疗影像等领域提供便捷的解决方案。该插件操作简便,被广泛采用。

image.png

体验地址:https://blur-on.com/

【AiBase 提要】

🔍 AI 技术插件 BlurOn:自动给视频添加马赛克和模糊效果

📹 BlurOn 是一款使用 NTT Data 的 AI 技术的插件,能够在视频中自动识别脸部、头部、全身、车牌等元素,并以高达99.7% 的精度自动添加马赛克和模糊效果。

💡 该插件操作简便,安装后即可使用,即使是新手也可以轻松上手。

📰🤖📢AI新鲜事

OpenAI高管称AI将在10年内能胜任任何工作

OpenAI的高管预测,未来10年内,人工智能将具备胜任人类各种工作的能力,标志着通用人工智能时代的到来。他们强调了对AI发展过程中潜在风险的谨慎处理,以及确保监管和社会基础设施跟得上技术的步伐。AI的改变可能引发不平等,但也有望提高生产力和创造力,将带来工作领域的大规模变革。

【AiBase 提要】

1. OpenAI高管表示,未来10年内,人工智能将具备胜任人类各种工作的能力。

2. 他们谈到AI发展需要谨慎对待风险,确保监管和社会基础设施与技术同步。

3. AI的改变可能引发不平等,但也有望提高生产力和创造力。

高通发布骁龙8Gen3专注于生成式 AI 功能

根据内部文件泄漏信息显示,高通计划发布骁龙8Gen3移动平台,专为生成式人工智能设计。该芯片可运行超过100亿参数的 AI 模型,预计将为三星 Galaxy S24提供动力。

【AiBase 提要】

1. 高通计划发布最新旗舰移动平台骁龙8Gen3,专注于生成式人工智能设计。

2. 新芯片可以运行拥有超过100亿参数的 AI 模型,运行稳定且高效。

3. 预计该芯片将为三星的 Galaxy S24提供动力。

4. 骁龙8Gen3将于2024年2月发布。

5. 高通使用 Stable Diffusion 技术用于生成式 AI 背景。

面部识别搜索引擎PimEyes禁止搜索儿童面部照片

公共面部识别搜索引擎 PimEyes 已禁止搜索未成年人的面部,以保护儿童安全。PimEyes 的年龄检测 AI 系统存在识别问题。该保护机制经过计划,并在媒体报道后全面部署。PimEyes 已封禁了200多个违规账户。面部识别引擎滥用问题引发了监管和隐私权的讨论。

【AiBase 提要:】

🔍 面部识别搜索引擎 PimEyes 禁止搜索儿童面部照片。

🚫 该决定是出于对儿童安全的担忧,但年龄检测 AI 系统仍在改进中。

🔒 PimEyes 成为备受关注的面部识别引擎之一,引发了对技术和隐私问题的担忧。

苹果的 AI 计划:每年砸10亿美元,要把生成式AI塞入全系设备

苹果对 AI 热潮措手不及,3位高管被选为生成式 AI 项目执行发起人,每年有10亿美元预算支出。苹果团队正用 AI 技术改版 Siri,新版本 Siri 有望在明年正式推出。苹果有可能采用组合方式,在本地和云端部署生成式人工智能功能。

【AiBase 提要】

1. 苹果高层任命3名管理者为生成式AI项目负责人,每年预算10亿美元投入。

2. 苹果正在利用AI技术重塑Siri,新版Siri可能明年面世。

3. 苹果考虑在设备端和云端结合应用生成式AI。

比尔·盖茨对 GPT-5没有太高期望

最近,比尔盖茨在采访中表达了对GPT-5的保守预期。他认为从GPT-2到GPT-4的进步已经相当惊人,GPT-5不太可能还有极大的提升空间。但他仍看好当前AI技术应用于药物研发等领域的发展潜力。

【AiBase 提要:】

1. 尽管OpenAI预计GPT-5会较GPT-4进步明显,但比尔盖茨对此持怀疑态度。

2. 盖茨认为GPT系列从2升级到4的进步已相当惊人,5未必还能有太大提升。

3. 但盖茨仍看好当前AI系统应用于药物研发等领域的潜力。

艺术家通过 Nightshade 来反击 AI:保护作品免受模型训练的侵犯

新工具 Nightshade 赋予艺术家一种全新的力量,让他们能够在上传作品之前,对其像素进行不可见的修改,从而在作品被 AI 公司用于训练模型时,令生成的模型陷入混乱和不可预测的状态。

【AiBase 提要:】

🤖 艺术家可以使用一种名为 Nightshade 的新工具,向他们的图像注入隐形的像素,使 AI 模型产生错误的认知。

📜 AI 公司依赖大量的训练数据,包括来自艺术家的创作,引发了一系列法律诉讼。

💡 Nightshade 的开发者希望通过这一工具重塑 AI 与艺术家之间的权力平衡,但也承认可能被滥用。

三星Galaxy S24系列手机将成为史上最智能的AI手机

据报道,三星即将发布的Galaxy S24系列手机,将成为史上最智能的AI手机。这主要体现在语音助手、对话功能等人工智能方面。

【AiBase 提要:】

📱三星 Galaxy S24系列手机将推出更先进的人工智能技术,预计明年1月正式亮相。

📱这三款新机将成为「史上最智能的 AI 手机」,技术领先于 Google 的 Pixel8和 Pixel8Pro。

📱新机将具备类似 ChatGPT 和 Google Bard 的特性,还有文本到图像的生成 AI 和更准确的语音转文本功能。三星的语音助手 Bixby 也将提供更人性化和智能的对话体验。

研究显示:AI可提升维基百科可靠性

最新研究指出,伦敦的一家AI公司使用名为SIDE的系统,通过检查维基百科的信息来源,识别其准确性,以提升维基百科的可靠性。SIDE系统的工作流程包括将维基百科的声明发送给Sphere检索引擎,该引擎产生潜在的候选文档,然后由验证引擎对这些文档和原始引用进行排名。

image.png

【AiBase 提要】

1. 一项伦敦AI公司研究显示,通过SIDE系统,AI有望提高维基百科的可靠性。

2. SIDE系统通过检查信息来源和验证引用排名,提供可靠性建议。

3. 用户在70%情况下接受SIDE系统的建议,加强信息准确性。

👨‍💻💡🎯聚焦开发者

新图像合成模型LCM SD生成图片推导步骤减少至4步!

图像合成是计算机视觉领域的重要研究方向,研究人员提出了一种新的图像合成模型 LCM,可以在少步推理的情况下生成高分辨率的图像。LCM 是从预训练的潜在扩散模型 LDM 中提取出来的,可以直接预测潜在空间中的概率流 ODE 的解,减少迭代次数和计算量。

image.png

项目地址:https://latent-consistency-models.github.io/

【AiBase 提要:】

🔍研究人员提出了一种新的图像合成模型,称为潜在一致性模型(LCM),可以在少步推理的情况下生成高分辨率的图像。

LCM 是从预训练的潜在扩散模型(LDM)中提取出来的,可以直接预测潜在空间中的概率流 ODE 的解,避免了多次迭代的需要。

LCM 还引入了一种新的微调方法,称为潜在一致性微调(LCF),可以在定制的图像数据集上进行快速的少步推理,实现了文本到图像的生成。

Vercel推出AI前端工具V0 支持自然语言描述生成前端代码

Vercel 推出了名为 V0的 AI 生成前端工具,集成了 React、Tailwind CSS、Shadow UI 等开源方案,通过自然语言描述可以自动生成前端代码。该工具目前处于内测阶段,已有10万用户申请试用。它代表了 AI 在辅助开发、提升效率方面的潜力,但生成代码的质量仍需开发者监督,AI 当前主要发挥辅助作用。

【AiBase 提要:】

🚀Vercel 推出生成式 UI 工具 V0,帮助用户用自然语言描述需求生成前端代码。

🔥V0将前端开发实践与生成式 AI 相结合,帮助开发者构建产品的第一个版本。

💡AI 在辅助开发方面的潜力逐渐发挥,但生成的代码质量仍需开发者监督和校正。

SolidGPT:基于GitHub的AI工具 让代码仓库更智能

SolidGPT 是一款基于 GitHub 的人工智能工具,利用 OpenAI 的 GPT 技术与代码仓库进行交互式对话。它能够生成注释和文档,提高代码的可读性和开发效率。

【AiBase 提要:】

🚀 SolidGPT 是一款基于 GitHub 的 AI 工具,利用 OpenAI 的 GPT 技术,能够与代码仓库进行交互式对话,提供代码建议和指导,自动生成注释和文档,以及识别和修复代码中的错误。

💡 SolidGPT 的推出提高了代码仓库的智能程度,帮助开发者更好地理解和学习代码,提高代码质量和减少错误率。

🌟 这款工具的推出将为开发者带来更高效的工作体验,并推动软件开发领域的进一步发展。

举报

  • 相关推荐
  • 登榜LMArena!文心大模型5.0-Preview文本能力国内第一

    11月8日,文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出,超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容;复杂长问题理解适用于学术问答、报告分析等任务;指令遵循能力支持智能助理、代码生成等场景,为多领域内容生产提供高效支撑。

  • 大模型+反诈+算力三重突破 腾讯云三项成果闪耀金融科技应用场景大赛

    10月30日,2025金融街论坛年会金融科技大会公布“金融科技应用场景大赛”终评结果。腾讯云“金融反电诈治理方案”与“基于TCS的AI异构算力管理平台”凭借技术创新性与场景落地能力,从全国89家机构的280个项目中脱颖而出,双双荣获“十佳应用奖”。腾讯混元大模型信贷助手方案获“探索实践奖”。三大方案在金融风控、算力基座及大模型应用三个关键领域展现突出优势,获专家团高度认可。大赛自2021年启动,已成为金融科技领域极具影响力的赛事平台。

  • 易鑫正式发布汽车金融行业首个Agentic大模型

    易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿,响应延迟低于200毫秒,支持语音实时交互,单卡吞吐达370 tokens/秒,可提升获客、风控与运营效率,解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台,研发投入超20亿元,率先实现AI全场景应用,将持续推动智能汽车金融生态建设。

  • 机器人“全能导航大脑”来了!银河通用发布NavFoM大模型

    银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM,实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用,通过统一“视频流+文本指令→动作轨迹”范式,融合800万条跨任务导航数据,在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施,为规模化商业落地奠定关键基础。

  • 如何检查你的网站是否被大模型引用?AI排名查询工具推荐

    本文探讨AI搜索时代网站流量获取新逻辑:传统SEO因Google搜索"零点击"现象失效,而71%用户通过AI工具研究购买决策。文章指出被大语言模型引用成为新流量入口,并推荐使用AIBase等GEO工具监测网站在豆包、DeepSeek等国内主流AI平台的曝光情况。提出三步操作法和三个优化建议:建立监控基线、定期检查变化、聚焦高转化场景。强调在AI搜索时代,内容被LLM引用已成为新的流量生命线。

  • 何小鹏首次披露物理AI巨大进展 发布第二代VLA大模型

    小鹏汽车在2025科技日发布第二代VLA大模型,颠覆传统“视觉-语言-动作”架构,实现端到端直接输出动作指令,开创物理模型新范式。该模型具备动作生成与物理世界理解能力,参数规模达数十亿级,训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载,推动智驾技术显著进化,同步发布“小径NGP”功能,复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示,大模型将成为物理AI世界的操作系统,并宣布与大众汽车达成战略合作,共同推进智能出行发展。

  • 寒武纪:构建大模型开发到部署的全流程开放服务能力

    华鑫证券研报显示,寒武纪2025年上半年业绩亮眼,营收28.81亿元,同比增长4347.82%;归母净利润10.38亿元,增长295.82%。公司募资39.85亿元,重点投向大模型芯片及软件平台建设,以增强AI算力芯片综合实力。凭借云边端一体、软硬协同等技术优势,其产品已获多领域客户认可,覆盖金融、互联网等行业。未来随着技术迭代与生态完善,业绩有望持续提升。

  • 新Siri或明年春季发布 苹果公司或引入谷歌Gemini大模型 AI技术

    苹果因自研大模型项目遇瓶颈,决定引入谷歌Gemini大模型升级Siri,计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数,将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能,支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送,后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

  • 简知科技“简智AI大模型”通过国家生成式人工智能服务备案,助力兴趣教育迈向智能化新阶段

    广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案,标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑,该模型围绕用户兴趣成长周期设计,提供个性化学习支持:可为未明确兴趣方向的用户智能推荐内容,为入门用户规划学习路径,为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖,并通过社群互动增强学习动力。公司未来将持续优化模型能力,联合行业伙伴构建完整培养体系,推动兴趣教育向个性化、高质量方向发展。

  • 【AI 智惠季】全模态大模型齐发优惠,GPU新客包月2.8折起

    阿里云启动双十一“AI智慧季”大型优惠活动,聚焦企业多元AI场景落地需求,推出7000万tokens大模型免费体验、GPU新客特惠等政策,助力企业降低开发成本。同时提供标准化AI产品与解决方案,覆盖内容创作、智能客服等高频应用场景,并举办系列技术分享活动,携手企业拥抱AI新时代。

今日大家都在搜的词: