首页 > 业界 > 关键词  > 星火大模型最新资讯  > 正文

AI视野:星火大模型V3.0发布;B站测试推出“AI视频总结”功能;高通发布骁龙8Gen3;苹果计划每年砸10亿美元搞AI

2023-10-24 15:09 · 稿源:站长之家

🤖📈💻💡大模型动态

科大讯飞星火认知大模型V3.0正式发布

在今日的2023科大讯飞全球1024开发者节上,科大讯飞宣布,讯飞星火认知大模型V3.0正式发布,目前星火大模型已整体超越ChatGPT。

【AiBase 提要】

1.科大讯飞宣布发布讯飞星火认知大模型 V3.0,超越 ChatGPT。

2.讯飞星火3.0标志着通用模型,要对标 ChatGPT3.5,中文超越,英文相当。

3.文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大能力持续提升。

🤖📱💼AI应用

B站测试推出“AI视频总结”功能

近日B站开始测试推出“AI视频总结”功能。获得测试资格的用户将在视频播放页面的右下角显示“AI视频总结”测试版按钮,点击即可生成视频总结,用户可以通过总结点击跳转到视频的相关定位。

微信截图_20231024083014.png

【AiBase 提要:】

🚀 B 站开始测试推出 “AI 视频总结” 功能,由 bilibili index 大模型提供支持。

💡 用户可通过点击 “AI 视频总结” 按钮生成视频总结,以便快速了解视频内容。

🔍 目前功能仅支持部分视频,总结内容准确性尚不完善,仅供参考。

AI视频后期制作神器ProPainter 一键即可完成视频抠图

近日,基于深度学习的视频修复技术 ProPainter 问世。该技术利用画家风格的笔触填补视频中的缺失区域,提高修复的视觉效果和自然度。ProPainter 具备时空连续性,可以预测缺失区域的光流,保证修复的连续性和一致性。

image.png

项目地址:https://github.com/sczhou/ProPainter

【AiBase 提要:】

🎨 AI 视频后期制作神器 ProPainter 可以用画家风格的笔触来填补视频中的缺失区域。

🌌 ProPainter 由两个模块组成,可以预测缺失区域的光流并生成具有画家风格的笔触。

🎥 ProPainter 在多个视频修复任务上表现出优异性能,包括对象移除、视频补全和水印去除。

AI技术插件BlurOn:自动给视频添加马赛克和模糊效果

BlurOn 是一款使用 NTT Data 的 AI 技术的插件,可以在视频中自动添加马赛克和模糊效果,为电视节目制作、自动驾驶开发、医疗影像等领域提供便捷的解决方案。该插件操作简便,被广泛采用。

image.png

体验地址:https://blur-on.com/

【AiBase 提要】

🔍 AI 技术插件 BlurOn:自动给视频添加马赛克和模糊效果

📹 BlurOn 是一款使用 NTT Data 的 AI 技术的插件,能够在视频中自动识别脸部、头部、全身、车牌等元素,并以高达99.7% 的精度自动添加马赛克和模糊效果。

💡 该插件操作简便,安装后即可使用,即使是新手也可以轻松上手。

📰🤖📢AI新鲜事

OpenAI高管称AI将在10年内能胜任任何工作

OpenAI的高管预测,未来10年内,人工智能将具备胜任人类各种工作的能力,标志着通用人工智能时代的到来。他们强调了对AI发展过程中潜在风险的谨慎处理,以及确保监管和社会基础设施跟得上技术的步伐。AI的改变可能引发不平等,但也有望提高生产力和创造力,将带来工作领域的大规模变革。

【AiBase 提要】

1. OpenAI高管表示,未来10年内,人工智能将具备胜任人类各种工作的能力。

2. 他们谈到AI发展需要谨慎对待风险,确保监管和社会基础设施与技术同步。

3. AI的改变可能引发不平等,但也有望提高生产力和创造力。

高通发布骁龙8Gen3专注于生成式 AI 功能

根据内部文件泄漏信息显示,高通计划发布骁龙8Gen3移动平台,专为生成式人工智能设计。该芯片可运行超过100亿参数的 AI 模型,预计将为三星 Galaxy S24提供动力。

【AiBase 提要】

1. 高通计划发布最新旗舰移动平台骁龙8Gen3,专注于生成式人工智能设计。

2. 新芯片可以运行拥有超过100亿参数的 AI 模型,运行稳定且高效。

3. 预计该芯片将为三星的 Galaxy S24提供动力。

4. 骁龙8Gen3将于2024年2月发布。

5. 高通使用 Stable Diffusion 技术用于生成式 AI 背景。

面部识别搜索引擎PimEyes禁止搜索儿童面部照片

公共面部识别搜索引擎 PimEyes 已禁止搜索未成年人的面部,以保护儿童安全。PimEyes 的年龄检测 AI 系统存在识别问题。该保护机制经过计划,并在媒体报道后全面部署。PimEyes 已封禁了200多个违规账户。面部识别引擎滥用问题引发了监管和隐私权的讨论。

【AiBase 提要:】

🔍 面部识别搜索引擎 PimEyes 禁止搜索儿童面部照片。

🚫 该决定是出于对儿童安全的担忧,但年龄检测 AI 系统仍在改进中。

🔒 PimEyes 成为备受关注的面部识别引擎之一,引发了对技术和隐私问题的担忧。

苹果的 AI 计划:每年砸10亿美元,要把生成式AI塞入全系设备

苹果对 AI 热潮措手不及,3位高管被选为生成式 AI 项目执行发起人,每年有10亿美元预算支出。苹果团队正用 AI 技术改版 Siri,新版本 Siri 有望在明年正式推出。苹果有可能采用组合方式,在本地和云端部署生成式人工智能功能。

【AiBase 提要】

1. 苹果高层任命3名管理者为生成式AI项目负责人,每年预算10亿美元投入。

2. 苹果正在利用AI技术重塑Siri,新版Siri可能明年面世。

3. 苹果考虑在设备端和云端结合应用生成式AI。

比尔·盖茨对 GPT-5没有太高期望

最近,比尔盖茨在采访中表达了对GPT-5的保守预期。他认为从GPT-2到GPT-4的进步已经相当惊人,GPT-5不太可能还有极大的提升空间。但他仍看好当前AI技术应用于药物研发等领域的发展潜力。

【AiBase 提要:】

1. 尽管OpenAI预计GPT-5会较GPT-4进步明显,但比尔盖茨对此持怀疑态度。

2. 盖茨认为GPT系列从2升级到4的进步已相当惊人,5未必还能有太大提升。

3. 但盖茨仍看好当前AI系统应用于药物研发等领域的潜力。

艺术家通过 Nightshade 来反击 AI:保护作品免受模型训练的侵犯

新工具 Nightshade 赋予艺术家一种全新的力量,让他们能够在上传作品之前,对其像素进行不可见的修改,从而在作品被 AI 公司用于训练模型时,令生成的模型陷入混乱和不可预测的状态。

【AiBase 提要:】

🤖 艺术家可以使用一种名为 Nightshade 的新工具,向他们的图像注入隐形的像素,使 AI 模型产生错误的认知。

📜 AI 公司依赖大量的训练数据,包括来自艺术家的创作,引发了一系列法律诉讼。

💡 Nightshade 的开发者希望通过这一工具重塑 AI 与艺术家之间的权力平衡,但也承认可能被滥用。

三星Galaxy S24系列手机将成为史上最智能的AI手机

据报道,三星即将发布的Galaxy S24系列手机,将成为史上最智能的AI手机。这主要体现在语音助手、对话功能等人工智能方面。

【AiBase 提要:】

📱三星 Galaxy S24系列手机将推出更先进的人工智能技术,预计明年1月正式亮相。

📱这三款新机将成为「史上最智能的 AI 手机」,技术领先于 Google 的 Pixel8和 Pixel8Pro。

📱新机将具备类似 ChatGPT 和 Google Bard 的特性,还有文本到图像的生成 AI 和更准确的语音转文本功能。三星的语音助手 Bixby 也将提供更人性化和智能的对话体验。

研究显示:AI可提升维基百科可靠性

最新研究指出,伦敦的一家AI公司使用名为SIDE的系统,通过检查维基百科的信息来源,识别其准确性,以提升维基百科的可靠性。SIDE系统的工作流程包括将维基百科的声明发送给Sphere检索引擎,该引擎产生潜在的候选文档,然后由验证引擎对这些文档和原始引用进行排名。

image.png

【AiBase 提要】

1. 一项伦敦AI公司研究显示,通过SIDE系统,AI有望提高维基百科的可靠性。

2. SIDE系统通过检查信息来源和验证引用排名,提供可靠性建议。

3. 用户在70%情况下接受SIDE系统的建议,加强信息准确性。

👨‍💻💡🎯聚焦开发者

新图像合成模型LCM SD生成图片推导步骤减少至4步!

图像合成是计算机视觉领域的重要研究方向,研究人员提出了一种新的图像合成模型 LCM,可以在少步推理的情况下生成高分辨率的图像。LCM 是从预训练的潜在扩散模型 LDM 中提取出来的,可以直接预测潜在空间中的概率流 ODE 的解,减少迭代次数和计算量。

image.png

项目地址:https://latent-consistency-models.github.io/

【AiBase 提要:】

🔍研究人员提出了一种新的图像合成模型,称为潜在一致性模型(LCM),可以在少步推理的情况下生成高分辨率的图像。

LCM 是从预训练的潜在扩散模型(LDM)中提取出来的,可以直接预测潜在空间中的概率流 ODE 的解,避免了多次迭代的需要。

LCM 还引入了一种新的微调方法,称为潜在一致性微调(LCF),可以在定制的图像数据集上进行快速的少步推理,实现了文本到图像的生成。

Vercel推出AI前端工具V0 支持自然语言描述生成前端代码

Vercel 推出了名为 V0的 AI 生成前端工具,集成了 React、Tailwind CSS、Shadow UI 等开源方案,通过自然语言描述可以自动生成前端代码。该工具目前处于内测阶段,已有10万用户申请试用。它代表了 AI 在辅助开发、提升效率方面的潜力,但生成代码的质量仍需开发者监督,AI 当前主要发挥辅助作用。

【AiBase 提要:】

🚀Vercel 推出生成式 UI 工具 V0,帮助用户用自然语言描述需求生成前端代码。

🔥V0将前端开发实践与生成式 AI 相结合,帮助开发者构建产品的第一个版本。

💡AI 在辅助开发方面的潜力逐渐发挥,但生成的代码质量仍需开发者监督和校正。

SolidGPT:基于GitHub的AI工具 让代码仓库更智能

SolidGPT 是一款基于 GitHub 的人工智能工具,利用 OpenAI 的 GPT 技术与代码仓库进行交互式对话。它能够生成注释和文档,提高代码的可读性和开发效率。

【AiBase 提要:】

🚀 SolidGPT 是一款基于 GitHub 的 AI 工具,利用 OpenAI 的 GPT 技术,能够与代码仓库进行交互式对话,提供代码建议和指导,自动生成注释和文档,以及识别和修复代码中的错误。

💡 SolidGPT 的推出提高了代码仓库的智能程度,帮助开发者更好地理解和学习代码,提高代码质量和减少错误率。

🌟 这款工具的推出将为开发者带来更高效的工作体验,并推动软件开发领域的进一步发展。

举报

  • 相关推荐
  • 荣耀400Pro正式发布:满血骁龙8Gen3加持 起售价2899元

    荣耀400Pro在核心配置上表现出色,采用了一块6.55英寸全面屏,为用户带来沉浸式的视觉体验。该机搭载了满血版骁龙8Gen3芯片,确保了强大的运算能力和流畅的多任务处理能力。在影像方面,荣耀400Pro前置5000万像素摄像头,后置则配备了2亿AI超清主摄、5000万长焦镜头以及112度超广角镜头,无论是人像摄影还是风景拍摄,都能轻松应对。

  • 荣耀MagicPad 3入网:13英寸LCD大屏+骁龙8 Gen3

    荣耀旗下一款型号为CGA-W00的新机获得认证,支持66W快充,爆料称该机正式命名为荣耀MagicPad3。 预计该机会与荣耀Magic V5同台发布,在本月下旬正式登场。

  • 苹果开放 AI 模型……计划于下个月在 WWDC 上发布

    尽管“Apple Intelligence”的首次亮相反响平平,但通过向开发者开放模型,苹果希望激发更多创新使用场景,提升平台的吸引力……

  • AI日报:Anthropic推最强编码AI模型Claude4;苹果计划AI智能眼镜;QQ浏览器上线首个考Agent

    【AI日报】今日AI领域重要动态:1)Anthropic发布Claude4系列AI模型,编程能力超越竞争对手;2)苹果计划2026年推出集成AI技术的智能眼镜;3)字节跳动与清华合作推出时序多模态大模型ChatTS;4)3DTown框架实现单张照片生成逼真3D场景;5)OpenAI秘密开发无屏幕AI设备;6)商汤科技推出儿童AI下棋机器人;7)微软记事本新增AI写作功能;8)深圳设立70亿元基金支持AI硬件初创企业;9)谷歌发布3D视频通信平台Beam;10)阿联酋推出"星际之门"计划,免费提供ChatGPT服务;11)法国Mistral推出开源模型Devstral;12)Anthropic API新增四大功能;13)美国众议院通过法案限制各州监管AI;14)QQ浏览器推出高考AI助手。

  • 发布AI Agent开发平台,做强AI生态… 网易数智接下来这么干

    AI时代正从AIGC转向AI Agent发展。微软CEO纳德拉预测AI Agent将成为新应用,Gartner预计到2028年超1/3企业软件将集成AI Agent功能。网易数智发布CoreAgent智能体开发平台及多款行业智能体,助力企业快速落地AI应用。文章指出当前AI Agent面临技术门槛高、场景适配难等挑战,网易提出"技术共生、市场共拓、利润共享"的生态协同理念,强调AI需要与行业know-how结合才能创造真实价值。网易数智宣布品牌升级,从"科技蓝"变为"网易红",展现拥抱AI时代的决心。

  • 或有多个版本!又有小米自研芯跑分曝光:103nm设计、超骁龙8 Gen 3

    小米自研芯片"玄戒O1"跑分曝光,采用3nm工艺和ARM Cortex-X925架构,最高主频3.9GHz。Geekbench测试显示其单核2709分、多核8125分,超越骁龙8Gen3。芯片采用"2422"核心配置:2个3.9GHz大核+4个3.4GHz中核+2个1.89GHz小核+2个1.8GHz小核,搭配Immortalis-G925 GPU。此前雷军透露该芯片可能只是代号,最终产品或有多个版本。值得注意的是,这与早期传闻的"134"架构方案不同,可能是被弃用或并行开发的另一个版本。

  • AI日报:通义千问3大模型全球爆火;即梦图片3.0智能参考全量上线;智谱AI企业级超级助手Agent CoCo上线

    【AI日报】今日AI领域重要动态:1.通义千问3大模型全球下载量超1250万,衍生模型13万+;2.即梦图片3.0上线,AI设计进入"零门槛"时代;3.智谱AI发布企业级超级助手Agent CoCo;4.百度推出金融行业大模型"千帆慧金";5.小红书开源首个大模型dots.llm1,含1420亿参数;6.Hugging Face开源LeRobot项目,降低机器人研发门槛;7.ChatGPT语音功能升级,支持更自然对话翻译;8.Google Gemini应用下载量超ChatGPT但活跃度不足;9.轻量级文档解析模型MonkeyOCR表现优异;10.Google Veo3推出高速视频生成模式;11.Google调整AI Studio政策,限制Gemini2.5Pro免费访问。

  • 骁龙7Gen4发布 AI性能比前代提升65%

    高通正式推出骁龙7系列新成员——第四代骁龙7(骁龙7Gen4),旨在为高端手机用户提供准旗舰级的性能、连接性与娱乐体验。 全新的第四代骁龙7在多媒体体验上表现出色,多个IP模块协同工作,配合台积电4nm工艺,整体能效优异。CPU部分首次采用1+4+3的全新架构组合,包含一个2.8GHz的超级核心A720、四个2.4GHz的性能核心A720以及三个1.8GHz的能效核心A520,还搭配了更大的三级缓存

  • 一场文心大模型的「AI马拉松」

    对于百度而言,既要保持长期主义的战略定力,也要在技术路径上灵活应变,这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。 2025年,模型能力的重要性依然无需多言。 从预训练的角度来看,虽然连 OpenAI 前首席科学家 Ilya Sutskever 都说,预训练数据即将用尽,但海量的图像、视频等多模态数据资源依然有待挖掘。 从后训练的角度来看,强化学习新范式正�

  • 免登录AI聚合!当贝AI宣告新一轮技术迭代:五大模型9种形态

    当贝AI宣布完成新一轮技术迭代,整合DeepSeek-R1671B和DeepSeek v3大模型,推出覆盖办公、娱乐、生活等多场景的智能解决方案。此次升级从单一工具向"超级AI中枢"转型,以隐私安全、技术普惠与场景融合为核心,新增9种模型形态,支持语音播报、附件上传、知识库等功能。平台首创"无痕模式"实现端侧数据处理,保障隐私安全;个人知识库支持本地文档智能解析。�